陈奇明
- 作品数:3 被引量:4H指数:1
- 供职机构:安徽工业大学计算机学院更多>>
- 发文基金:安徽省高校省级自然科学研究项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于投票策略聚类融合算法的研究和实现
- 聚类是数据挖掘中一项非常重要的技术,越来越受到广泛的关注和研究。目前,已经出现了一些比较成熟的聚类算法,如k-means算法、k-medoids算法、BIRCH算法、CURE算法、DBSCAN算法和STING算法等。这些...
- 陈奇明
- 关键词:聚类聚类融合投票客户细分
- 文献传递
- 聚类融合算法研究被引量:3
- 2010年
- 聚类是发现数据分布和隐含模式的一项重要技术,但单一聚类算法却很难达到预期的效果。在缺乏样本集先验知识的前提下,目前的分类融合技术很难应用到聚类技术中,导致聚类融合技术起步很晚。近几年的研究发现,聚类融合方法对提高聚类算法的稳定性和高效性发挥了重要的作用。文中对近年来聚类融合的方法和国内外研究现状进行了简单综述,并且以基于投票的聚类融合算法为例,实验证明了其比单一聚类算法的优越性,展望了聚类融合算法的未来。
- 秦锋陈奇明程泽凯
- 关键词:聚类融合技术差异度投票
- 基于词条数学期望的词条权重计算方法被引量:1
- 2011年
- 文本的形式化表示一直是文本挖掘的基础性问题,向量空间模型中的TFIDF计算方法是文本表示中一种效果较好的经典词条权重计算方法。在分析传统TFIDF计算方法存在问题的基础上,针对TFIDF方法中没有考虑包含词条的文档在各个类别的分布情况以及各个类别中所含的文档数的不同。提出了将词条的数学期望(TFIDF-E)作为一个文本因子来进行改进上述问题。实验结果表明,TFIDF-E计算方法表示的文本分类效果好于TFIDF,验证了TFIDF-E方法的有效性和可行性。
- 秦锋赵彦军程泽凯陈奇明
- 关键词:文本分类区分度数学期望