您的位置: 专家智库 > >

林啓峰

作品数:1 被引量:8H指数:1
供职机构:广西大学计算机与电子信息学院更多>>
发文基金:广西教育厅科研项目国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇信息增益
  • 1篇语义
  • 1篇语义关联
  • 1篇特征提取
  • 1篇文本分类
  • 1篇TFIDF

机构

  • 1篇广西大学

作者

  • 1篇许珂
  • 1篇蒙祖强
  • 1篇林啓峰

传媒

  • 1篇计算机应用研...

年份

  • 1篇2012
1 条 记 录,以下是 1-1
排序方式:
基于语义关联和信息增益的TFIDF改进算法研究被引量:8
2012年
基于词频反文档频率(term frequency inverse document frequency,TFIDF)的现有文本特征提取算法及其改进算法未能考虑类别内部词语之间的语义关联,如果脱离语义,提取出的特征不能很好地刻画文档的内容。为准确提取特征,在信息熵与信息增益的基础上,加入词语的语义关联因素,实现融合语义信息的特征提取,进而提出语义和信息增益相结合的TFIDF改进算法,该算法弥补了统计方法丢失语义信息的弊端。实验结果表明,该算法有效地提高了文本分类的精准率。
许珂蒙祖强林啓峰
关键词:特征提取语义关联信息增益文本分类
共1页<1>
聚类工具0