唐剑波
- 作品数:6 被引量:87H指数:3
- 供职机构:湖南大学信息科学与工程学院(软件学院)更多>>
- 发文基金:国家自然科学基金湖南省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于信息熵的改进TFIDF特征选择算法
- 文本特征的选择对文本分类的精确性有着非常重要的影响、本文针对传统的TFIDF没有考虑特征词条在各个类之间的分布的不足, 对TFIDF特征选择算法进行了深入的分析, 并结合信息熵的概念提出了一种新的TFIDF特征选择算法、...
- 周炎涛唐剑波王家琴
- 关键词:数据挖掘文本分类
- 文献传递
- 基于信息熵的改进TFIDF特征选择算法被引量:31
- 2007年
- 特征的选择对文本分类的精确性有着非常重要的影响。针对传统的TFIDF没有考虑特征词条在各个类之间的分布的不足,对TFIDF特征选择算法进行了深入的分析,并结合信息熵的概念提出了一种新的TFIDF特征选择算法。实验结果表明,改进后的算法可以有效地提高文本分类的精确度。
- 周炎涛唐剑波王家琴
- 关键词:TFIDF数据挖掘
- 基于向量空间模型的多主题Web文本分类方法被引量:14
- 2008年
- 对给定的网页,提取其特征向量,计算网页特征向量与分类特征向量的相似度,使用K-means聚类方法寻找归属类得到动态阈值,提出了一种基于动态阈值的向量空间模型多主题Web文本分类方法。该方法通过网页与每个类的相似度和动态阈值的比较,实现了将包含多个主题的网页划分到相应的多个类中。实验证明,这种方法具有较好的精确度和召回率。
- 周炎涛唐剑波吴正国
- 关键词:向量空间模型文本分类多主题数据挖掘
- Web文本挖掘中的文本分类研究
- 随着Internet网络的高速发展,信息爆炸时代也随之到来。由于Internet的开放性、动态性、异构性使得用户很难快速、准确的从WWW上获取所需的信息,因此如何有效的从网络上获取有价值的信息成为当前研究的热点。Web文...
- 唐剑波
- 关键词:文本分类信息熵TFIDF
- 文献传递
- 基于信息熵的改进TFIDF特征选择算法
- 文本特征的选择对文本分类的精确性有着非常重要的影响.本文针对传统的TFIDF没有考虑特征词条在各个类之间的分布的不足,对TFIDF特征选择算法进行了深入的分析,并结合信息熵的概念提出了一种新的TFIDF特征选择算法.实验...
- 周炎涛唐剑波王家琴
- 关键词:TFIDF数据挖掘
- 文献传递
- 一种基于本体的概念语义相似度方法的研究被引量:40
- 2007年
- 提出了一种计算不同本体中概念间语义相似度的方法,该方法通过比较实例间的相似度获得初始概念间语义相似度,结合影响概念间语义相似度的两个系数,计算出最终的概念间语义相似度。与概率统计方法进行比较,验证了该方法的有效性。该研究工作可以应用于面向Web的知识检索领域。
- 王家琴李仁发李仲生唐剑波
- 关键词:语义网本体语义相似度主观判断