您的位置: 专家智库 > >

重庆市教育委员会科学技术研究项目(KJ070519)

作品数:8 被引量:107H指数:5
相关作者:樊兴华王鹏吴渝宁亚辉赵军更多>>
相关机构:重庆邮电大学重庆工商大学更多>>
发文基金:重庆市教育委员会科学技术研究项目国家自然科学基金重庆市自然科学基金更多>>
相关领域:自动化与计算机技术理学更多>>

文献类型

  • 8篇期刊文章
  • 1篇会议论文

领域

  • 8篇自动化与计算...
  • 1篇理学

主题

  • 6篇文本分类
  • 3篇中文
  • 3篇文本
  • 3篇贝叶斯
  • 2篇朴素贝叶斯
  • 2篇中文文本
  • 2篇中文文本分类
  • 1篇信息处理
  • 1篇隐马尔可夫模...
  • 1篇语义
  • 1篇知网
  • 1篇拟阵
  • 1篇拼音
  • 1篇中文信息
  • 1篇中文信息处理
  • 1篇文本倾向性
  • 1篇马尔可夫
  • 1篇马尔可夫模型
  • 1篇命名实体识别
  • 1篇模糊拟阵

机构

  • 9篇重庆邮电大学
  • 1篇重庆工商大学

作者

  • 8篇樊兴华
  • 4篇王鹏
  • 1篇宁亚辉
  • 1篇周鹏
  • 1篇李永红
  • 1篇王丹
  • 1篇石庆喜
  • 1篇马后锋
  • 1篇刘宴兵
  • 1篇王细薇
  • 1篇赵军
  • 1篇吴渝
  • 1篇陈集

传媒

  • 2篇计算机应用
  • 2篇计算机工程与...
  • 1篇大连海事大学...
  • 1篇计算机辅助工...
  • 1篇西南师范大学...
  • 1篇计算机科学

年份

  • 1篇2012
  • 1篇2010
  • 4篇2009
  • 2篇2008
  • 1篇2007
8 条 记 录,以下是 1-9
排序方式:
基于领域词语本体的短文本分类被引量:43
2009年
短文本自身长度较短,描述概念能力弱,常用文本分类方法都不太适用于短文本分类。提出了基于领域词语本体的短文本分类方法。首先抽取领域高频词作为特征词,借助知网从语义方面将特征词扩展为概念和义元,通过计算不同概念所包含相同义元的信息量来衡量词的相似度,从而进行分类。对比实验表明,该方法在一定程度上弥补了短文本特征不足的缺点,且提高了准确率和召回率。
宁亚辉樊兴华吴渝
关键词:本体知网文本分类语义
基于两步策略的中文短文本分类研究被引量:8
2008年
为更好地挖掘文本信息,研究了将两步策略用于中文短文本分类的3个关键问题,提出了基于组合朴素贝叶斯(NB)和K近邻(KNN)分类器的两步中文短文本分类方法:(1)直接利用NB和KNN的输出构造其对应的二维空间,根据该空间内错误文本的分布将测试文本集分为3部分:能被KNN可靠分类的文本集A,不能被KNN可靠分类但能被NB可靠分类的文本集B,其他文本集C.(2)用KNN、NB分别对文本集A和B进行分类,根据训练语料的类别分布,直接给属于文本集C的文本分配标签.与NB、KNN和支持向量机(SVM)的对比实验表明,该方法可获得较高的分类性能.
樊兴华王鹏
关键词:文本分类
面向短文本的命名实体识别被引量:18
2009年
针对短文本命名实体识别这项紧缺任务,提出了一种面向短文本的快速有效的命名实体识别方法。该方法主要分成三步:第一步,针对短文本表达不规范特性对命名实体识别的干扰,采取去干扰字符,化繁为简等规范化操作。第二步,针对短文本语意不完整特性,提出用HMM(隐马尔可夫模型)以词性做观察值进行初步命名实体识别。第三步,据初步识别结果,构建拼音同指关系库来识别潜在实体。在由8464篇短文本构成的测试集上运行的实验表明,该方法能较好地进行短文本命名实体识别。
王丹樊兴华
关键词:隐马尔可夫模型命名实体识别词性
一种基于扩展的两步文本倾向性分析方法被引量:4
2012年
提出一种基于扩展的两步文本倾向性分析方法,该方法利用包含倾向性词表、否定词表、程度词表在内的情感词语对训练文本进行特征扩展,按照将情感词语和内容词语是否同等对待来构造两个分类器CF1和CF2;在分类时,对测试文本进行和训练文本类似的特征扩展,使用分类器CF1对其进行分类,对分类结果中的可靠部分直接做出判定,对分类结果中的不可靠部分利用分类器CF2进行二次分类并做出判定。实验结果验证了该方法的有效性。
樊兴华王鹏周鹏
关键词:中文信息处理
中文文本分类中利用依存关系的实验研究被引量:16
2010年
为了利用依存关系进行短文本分类,研究了利用依存关系进行短文本分类存在的四个关键问题。分别在长文本语料集和两个短文本语料集上,抽取具有依存关系的词对,并利用这些词对作为特征进行分类实验。实验结果表明:依存关系能够作为有效的特征进行文本分类,并能够改善文本分类的性能;单独把依存关系作为特征,不能提高短文本的分类性能;可以利用依存关系作为特征扩充的手段,增加短文本的特征,增强短文本的描述能力,进而进行有效的短文本分类。
王鹏樊兴华
关键词:文本分类
中文文本分类的两步特征选择法被引量:4
2008年
针对从文集全局角度评价特征重要性的传统特征选择方法可能忽略某些重要分类特征的问题,提出两步特征选择方法.该方法首先过滤掉类别关联性不强的特征;然后根据词的统计信息将词归为各个类别的区分词,找出每个类的分类特征的最优子集;最后,将各个类别的最优子集组合起来形成最终分类特征.实验采用朴素贝叶斯作为分类器,使用IG,ECE,CC,MI和CHI等5种特征选择公式对该方法与传统方法进行比较,得到分类性能宏平均指标对比分别为91.075%对86.971%,91.122%对86.992%,91.160%对87.470%,90.253%对86.061%,90.881%对87.006%.该方法在考虑分类特征信息的同时,尽量保留传统特征选择方法中好的特征,能更好地捕获分类信息.
陈集樊兴华王鹏
关键词:中文文本分类朴素贝叶斯
一种改进的增量贝叶斯分类算法
贝叶斯分类器在知识储备不足的情况下,容易对新增未标注的训练文本(新增训练集)产生分类错误,若这些分类错误的文本过早地加入到分类器中会降低其分类性能;另外,新增训练集的规模过大将会降低增量学习的速度。为了解决这些问题本文提...
马后锋樊兴华
关键词:贝叶斯文本分类
文献传递
一种基于特征扩展的中文短文本分类方法被引量:36
2009年
针对短文本所描述信号弱的特点,提出一种基于特征扩展的中文短文本分类方法。该方法首先利用FP-Growth算法挖掘训练集特征项与测试集特征项之间的共现关系,然后用得到的关联规则对短文本测试文档中的概念词语进行特征扩展。同时,引入语义信息并且改进了知网中DEF词条的描述能力公式,在此基础上对中文短文本进行分类。实验证明,这种方法具有高的分类性能,其微平均和宏平均值都高于常规的文本分类方法。
王细薇樊兴华赵军
关键词:关联规则挖掘
模糊圈的秩被引量:3
2009年
研究了闭模糊拟阵的模糊圈的秩,得到了一个计算模糊圈的秩的一种方法和闭正规模糊拟阵模糊圈的秩相等的一个充分条件;找到了具有最大秩或最小秩的模糊圈的一个充分条件.
李永红刘宴兵石庆喜
关键词:拟阵模糊拟阵
共1页<1>
聚类工具0