倪茂树
- 作品数:7 被引量:17H指数:3
- 供职机构:大连理工大学电子科学与技术学院计算机科学与工程系更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于粗糙集属性约简的文本分类被引量:8
- 2007年
- 基于属性约简的方法,放弃以往复杂的规则匹配算法,提出将约简后的多种属性组进行析取,筛选特征项,并构造分类器.实验结果表明,此算法不仅简单,还能降低维数和提高分类结果.
- 倪茂树时达明林鸿飞
- 关键词:文本分类向量空间模型粗糙集属性约简
- 基于语义理解的观点评论挖掘研究
- 随着互联网技术的迅速发展,网上文本数量呈指数级增长,如何从这些海量的文本中挖掘有用的信息成为当前研究的重要课题。本文立足于文本挖掘技术的研究,从商品的观点评论中挖掘信息,反馈给商家和消费者。
本文第一部分详细地...
- 倪茂树
- 关键词:计算机网络网络服务数据挖掘网络评论语义理解
- 文献传递
- 一种基于粗糙集的Web文本分类方法
- 2009年
- 随着Web信息容量迅速膨胀,对Web文本分类已经是目前研究的热点。传统的Web文本分类对网页的预处理基本上没有考虑网页中的大量噪音,因此对分类结果有一定的影响;另一方面,文本的向量空间模型维数过高,对分类效果也存在很大的影响。提出一种基于粗糙集理论的Web文本分类方法,首先对网页进行去噪,然后对向量空间模型进行属性约简,之后构造分类器,实验表明,此方法不仅降低了维数,还提高了分类结果。
- 阚言东倪茂树刘国庆
- 关键词:文本分类向量空间模型粗糙集
- 基于关联规则和极性分析的商品评论挖掘
- 随着电了商务的迅速发展,消费者在网络上发表的关于商品的评价变得越来越多。但对于潜在的消费者或者商家来说,完全阅读这些评论十分困难。本文针对这一问题,提出一种基于关联规则和极性分析的商品评论挖掘算法。首先确定评论中消费者经...
- 倪茂树林鸿飞
- 关键词:关联规则极性分析句法分析
- 文献传递
- 生物医学文本分类方法比较研究被引量:4
- 2007年
- 文本分类技术对处理海量的生物医学文献起着重要的作用。TREC(The Text Retrieval Conference)2005 Genomics Track的测评结果显示,支持向量机(Surport Vector Machine,SVM)在生物医学文本分类问题上,比其他模型具有明显的优势。在TREC的测评语料上,使用简单向量距离分类法与SVM进行比较,同时讨论了使用命名实体识别的预处理对不同算法的影响。得出结论:简单向量距离分类法在该领域的效果与SVM不相上下,并且命名实体识别会使结果有一定提高。
- 倪茂树赵晶林鸿飞
- 关键词:文本分类支持向量机命名实体识别
- 基于词共现概念的文本分类研究
- 传统的文本分类的特征选择都是以词为单位,根据计算特征词的权重建立向量空间模型,进而表示所有文档。但这种向量空间模型中的每个词之间是相互独立的,词和词之间的语义关系没有体现出来。本文基于数据挖掘里的关联规则理论,提出一种将...
- 倪茂树林鸿飞
- 关键词:文本分类向量空间模型
- 基于语义理解和极性分析的商品评论挖掘
- 随着电子商务的迅速发展,消费者在网络上发表的关于商品的评价变得越来越多。但对于潜在的消费者或者商家来说,完全阅读这些评论十分困难。本文针对这一问题,提出一种基于语义理解和极性分析的商品评论挖掘算法。首先确定评论中消费者经...
- 倪茂树林鸿飞
- 关键词:语义理解极性分析
- 文献传递