山东省优秀中青年科学家科研奖励基金(2006BS01020)
- 作品数:15 被引量:96H指数:5
- 相关作者:张化祥齐淼陈冰邱潇钰赵斌更多>>
- 相关机构:山东师范大学山东财政学院信息技术有限公司更多>>
- 发文基金:山东省优秀中青年科学家科研奖励基金山东省科技攻关计划山东省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 数据集动态重构的集成迁移学习被引量:5
- 2010年
- 目前很多数据挖掘和机器学习方法都有一个基本假设:训练数据和测试数据必须服从相同的分布。但是在很多情况下这种假设不成立,没有考虑分布差异的传统机器学习方法就不能正确分类了。提出了一种新的迁移学习方法DRTAT,对原训练数据进行动态分割重组,适时地淘汰冗余数据,并进行分类器的集成。通过在多个文本数据集和UCI数据集上进行测试,并与TrAdaboost算法进行比较,表明了算法的先进性。
- 刘伟张化祥
- 关键词:知识迁移分类器集成
- 基于Bagging的聚类集成方法被引量:5
- 2010年
- 提出一种基于Bagging的集成聚类方法,采用一种新的数据集采样技术生成数据子集,尽可能的保持了子样本的多样性和最大相关性,然后应用一种改进的k均值聚类算法生成个体学习器,根据互信息对数据集的不同聚类结果进行处理,最后通过计算有争议的数据对象与各个聚类中心的距离将其重新划分到新的聚类结果中。在多个UCI标准数据集上的实验结果表明,该方法能有效改善聚类质量。
- 李杉张化祥
- 关键词:聚类K均值聚类互信息
- 一种挖掘频繁项的新方法
- 2008年
- 介绍了关联规则挖掘的情况,然后对关联规则挖掘算法进行分析,并在此分析的基础上对经典的Apriori算法作出了进一步的改进,从而提出了这种改进的关联规则挖掘算法——Apriori-New算法。Apriori-New算法只需对数据库扫描一次,并在扫描过程中通过不断将被标记为频繁项的项集提取出来,最终找出所有的频繁项集。通过一个简单的实例说明了该算法的扫描过程,从而体现了该Apriori-New算法的效率及其所具有的实用性。
- 陈冰张化祥
- 关键词:数据挖掘关联规则APRIORI算法
- 集成学习的多分类器动态组合方法被引量:9
- 2008年
- 为了提高数据的分类性能,提出一种集成学习的多分类器动态组合方法(DEA)。该方法在多个UCI标准数据集上进行测试,并与文中使用的基于Adaboost算法训练出的各个成员分类器的分类效果进行比较,证明了DEA的有效性。
- 陈冰张化祥
- 关键词:多分类器聚类ADABOOST算法
- 一种基于核函数分割数据集的分类器组合算法
- 2008年
- 组合分类器通过在输入空间中依据一定的规则生成数据集来训练成员分类器。提出一种新的基于核函数的模糊隶属度方法用来分隔数据集,并依据数据集中样本的模糊隶属度将它们分为相对难分和相对易分的数据子集,根据两个数据子集的难易程度训练不同的分类器。并用得到的两类分类器作为成员分类器生成组合分类器。将该组合分类器应用到UCI的标准数据集,实验表明该方法比Bagging和AdaBoost算法具有更好的性能。
- 康凯张化祥赵斌
- 关键词:核函数组合分类器
- 改进的模糊C-均值聚类算法研究被引量:47
- 2009年
- 为解决模糊C-均值(FCM)聚类算法对噪声和孤立点数据敏感、样本分布不均衡的问题,提出了具体的改进和提高的方法:改进隶属度函数,以消除孤立点对聚类结果的影响;为每个样本点赋予一个定量的权值,以区分不同的样本点对于知识发现的不同作用,改善噪音和分布不均衡的样本集的聚类结果。实验结果表明该算法具有更好的健壮性和聚类效果。
- 齐淼张化祥
- 关键词:模糊C-均值权值聚类
- 基于感知器的SVM自学习模型
- 2010年
- 提出了一种基于感知器的SVM分类模型(PSVM)。该模型在对分类器的训练中,引入感知器分类思想,其先利用SVM的核函数进行核计算,判断其分类性能,分类正确则不作任何修改,反之则转化成感知器分类问题。实验结果表明该模型不但能提高SVM的分类性能,而且还可以降低SVM分类性能对核函数及参数选择的依赖。
- 宋营军张化祥
- 关键词:支持向量机核函数感知器
- 概论核方法及核参数的选择被引量:4
- 2007年
- 本文介绍支持向量机分类非线性数据集的优越性,讨论了基于核的方法,并对核的方法的实质进行了论述。通过matlab制作的图像可知:核方法的参数的选择对于基于核的分类法具有重要作用。对现有的选择核参数的方式效果进行了归纳与比较,从而分析得出了各种选择参数方式的优缺点。
- 邱潇钰张化祥
- 关键词:支持向量机核参数
- 一种新的基于模糊聚类的组合分类器算法被引量:3
- 2008年
- 提出一种新的基于模糊聚类的组合分类器算法,该算法利用模糊聚类技术产生训练样本的分布特征,据此为每一个样本赋予一个权值,来确定它们被采样的概率,利用采样样本训练的分类器调整训练集的采样概率,依次生成新的分类器直至达到一定的精度。该组合分类器算法在UCI的多个标准数据集上进行了测试,并与Bagging和AdaBoost算法进行了比较,实验结果表明新的算法具有更好的健壮性和更高的分类精度。
- 范莹计华张化祥
- 关键词:分类器组合模糊聚类多样性
- 主题Web挖掘研究被引量:8
- 2008年
- 网络已经成为人们获取知识的一个重要途径。然而面对巨大的Web资源库,用户若想获得所需要信息已不再是一件简单的事情。通用搜索引擎返回大量的无关信息,不能满足用户的特定信息检索需求。针对这个问题,Web信息检索领域出现了一个新的研究方向——主题驱动的Web资源发现。介绍了通用搜索引擎的基本结构、工作原理及现状。阐述了主题Web挖掘的研究背景、任务及目前研究技术的进展,并对其未来的发展方向进行了探讨。对通用搜索引擎和主题Web挖掘的关系进行了分析。
- 杜光芹张化祥赵瑞东
- 关键词:搜索引擎信息检索聚焦爬虫本体论