电子信息产业发展基金(2008B0026) 作品数:9 被引量:50 H指数:3 相关作者: 张化祥 王至超 张云涛 张雯 李明方 更多>> 相关机构: 山东师范大学 山东省分布式计算机软件新技术重点实验室 更多>> 发文基金: 山东省自然科学基金 山东省科技攻关计划 电子信息产业发展基金 更多>> 相关领域: 自动化与计算机技术 更多>>
针对不平衡数据集的Bagging改进算法 被引量:12 2010年 传统的Bagging分类方法对不平衡数据集进行分类时,虽然能够达到很高的分类精度,但是对其中少数类的分类准确率不高。为提高其对少数类数据的分类精度,利用SMOTE算法对样例集中的少数类样例进行加工,在Bagging算法中根据类值对各个样例的权重进行调整。混淆矩阵和ROC曲线表明改进算法达到了既能保证整体的分类准确率,又能提高少数类分类精度的目的。 李明方 张化祥关键词:BAGGING算法 子模式局部保持映射人脸识别 2012年 研究表明基于整体思想的人脸识别方法由于忽略图像的局部信息,在识别性能方面不如局部信息特征保持较好的基于子模块思想的识别算法。基于应用流形技术对图像降维后能够较好保持非线性子流形中的局部数据流形结构,提出了一种改进的子模式局部保持映射人脸识别算法。其主要思想是将同类的不同图像一并划分子集,由同位置子图组成子模块,并对子模块运用LPP算法学习其流形结构,与将不同类图像一并划分子集学习流形的方法不同。实验表明,该算法能更好地保持人脸图像的局部流形结构和信息特征,提高了识别率。 曹林林 张化祥 王至超关键词:人脸识别 子模式 局部保持映射 流形学习 支持向量回归参数调节及应用研究 被引量:2 2011年 为有效解决支持向量回归中的参数选择问题,提出了一种新算法——AGA-SVR。在该算法中,通过适时增加染色体变异的概率来提高染色体的多样性,克服了标准遗传算法存在个体容易早熟的缺陷,从而增加学习到全局最优的几率。通过将AGA-SVR应用于上证开盘指数预测,结果验证了该算法优于标准遗传算法及经典梯度下降算法。 王至超 张化祥关键词:遗传算法 支持向量机 核函数 上证指数 参数选择 最值间距支持向量机 被引量:2 2012年 GEPSVM(Proximal Support Vector Machine Classification via Generalized Eigenvalues)是近年提出来的一种新的二分类SVM,其核心思想是通过求解广义特征方程得到两个最优超平面,然后通过计算样本到超平面的距离来决定样本所属类别。与传统SVM相比,GEPSVM降低了时间复杂度,但仍存在奇异性等问题。提出了一种新的算法TDMSVM(Twin Distance of Minimum and Maximum Support Vector Machine),其通过求解标准特征方程得到两个最优超平面,使超平面满足到本类样例的平均距离最小化,同时到另一类样例的平均距离最大化。通过理论分析和实验证明,与GEPSVM相比,TDMSVM有以下优势:进一步降低了时间复杂度;不需引入正则项,从而提高了泛化性能;克服了奇异性。 王至超 张化祥关键词:模式识别 特征向量 支持向量机 基于场论的聚类算法 2010年 传统经典的欧几里得距离、曼哈坦距离、明考斯基距离不能很好地描述对象间固有的差异,使得在聚类过程中不能很好地区分对象,在此借用相对论中质量——速率公式提出了一种新的相异度的度量方法,结合场论提出了一个新的聚类算法。通过把每个对象看作一个场源,每个场源通过两个不同的参数进行描述,最后通过每个场源对类中心的作用进行聚类。实验结果表明,该方法能有效改善聚类效果。 遇铁龄 张化祥关键词:数据质量 场论 场源 聚类 属性加权的朴素贝叶斯集成分类器 被引量:13 2010年 为提高朴素贝叶斯分类器的分类精度和泛化能力,提出了基于属性相关性的加权贝叶斯集成方法(WEBNC)。根据每个条件属性与决策属性的相关度对其赋以相应的权值,然后用AdaBoost训练属性加权后的BNC。该分类方法在16个UCI标准数据集上进行了测试,并与BNC、贝叶斯网和由AdaBoost训练出的BNC进行比较,实验结果表明,该分类器具有更高的分类精度与泛化能力。 张雯 张化祥关键词:朴素贝叶斯分类器 相关度 属性加权 ADABOOST 标记错分样本的AdaBoost算法 被引量:2 2010年 提出一种新的标记迭代过程中错分样本的AdaBoost算法(MWBoost),该算法通过在提升过程中,把上一个分类器错分的样本全部参入到下一个分类器的训练中,并在分类正确的样本中进行重采样,从而使得后一轮提升中分类器能够更快速地关注那些难以分类的样本。该算法在UCI的多个数据集上进行了测试,并且与传统的AdaBoost算法进行了比较,实验结果表明,新的算法具有更好的分类精度。 张家红 张化祥 刘伟关键词:ADABOOST算法 重采样 基于分类的半监督聚类方法 被引量:1 2011年 提出一种基于分类的半监督聚类算法。充分利用了数据集中的少量标记对象对原始数据集进行粗分类,在传统k均值算法的基础上扩展了聚类中心点的选择方法;用k-meansGuider方法对数据集进行粗聚类,在此基础上对粗聚类结果进行集成。在多个UCI标准数据集上进行实验,结果表明提出的算法能有效改善聚类质量。 李杉 张化祥关键词:半监督学习 均值聚类 关联规则中频繁项集高效挖掘的研究 被引量:18 2011年 针对Apriori时间性能较低的缺陷,结合二项集支持度矩阵提出了Apriori改进算法Apriori-M。在扫描数据库时生成一个二项集支持度矩阵,利用矩阵的性质提高了连接和剪枝的效率;通过第二次扫描数据库就能正确地获取所有的频繁项集,并很好地解决了Apriori生成无效二项集的问题。实验结果表明Apriori-M的性能优于Apriori。 张云涛 于治楼 张化祥关键词:关联规则 APRIORI算法 事务数据库 频繁项