杨安娜
- 作品数:6 被引量:48H指数:3
- 供职机构:山西大学数学科学学院更多>>
- 发文基金:山西省自然科学基金教育部科学技术研究重点项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于支持向量机的文本倾向性分类研究被引量:6
- 2008年
- 文本倾向性分类可以广泛应用到信息检索,产品质量在线跟踪,民情民意调查分析以及聊天系统等.本文提出了基于限定词性词语与信息增益、基于情感倾向词汇与信息增益的两种混合特征选择方法,并设计了基于支持向量机的分类器.以汽车产品、篮球赛事以及中日关系3种中文评论文本为训练与测试语料,对本文所提方法进行了实验验证,结果表明:限定词性词语与信息增益的混合特征选择优于信息增益与情感倾向词汇混合特征选择方法.
- 王素格杨安娜李德玉魏英杰李伟张武
- 关键词:支持向量机信息增益
- 基于混合语言信息的词语搭配倾向判别方法被引量:8
- 2010年
- 具有较强褒贬倾向的词语搭配对于文本的情感分析具有重要的价值。该文提出了一种混合语言信息的词语搭配的倾向判别方法。该方法首先根据词语搭配六种模式的特点,确定出各模式的概率潜在语义模型,然后利用这些语义模型判别搭配的情感倾向。最后对部分包含情感词的搭配再利用规则修正其先前标注的情感倾向。基于汽车语料的实验结果表明,基于混合语言信息的词语搭配情感倾向判别方法优于单纯基于概率潜在语义模型或规则的方法。
- 王素格杨安娜
- 关键词:计算机应用中文信息处理词语搭配
- 基于汉语情感词表的句子情感倾向分类研究被引量:35
- 2009年
- 提出了一种基于汉语情感词词表的加权线性组合的句子情感分类方法。该方法通过已有的五种资源构建了中文情感词词表,并采用加权线性组合的句子情感分类方法对句子进行情感类别判断。实验结果表明,直接利用词汇语言粒度的句子情感分类综合F值为78.62%,若加入了否定短语语言粒度后,句子情感分类的综合F值提高了4.14%。
- 王素格杨安娜李德玉
- 一种混合语言信息的词语搭配倾向判别方法
- 具有较强褒贬倾向的二元词语搭配对于文本的情感分析具有重要的价值。本文提出了一种融合语言信息的二元词语搭配的情感倾向判别方法。该方法首先根据六种模式的词语搭配特点,确定出各模式的潜在语义模型,然后采用了概率潜在语义模型判别...
- 王素格杨安娜
- 关键词:词语搭配
- 文献传递
- 基于二元词语搭配的句子情感分类研究
- 随着Internet的迅猛发展,互联网迎来了前所未有的新局面,人们将互联网当作自己发表评论或获取信息的媒介。面对网上不断涌现的大量主观性文本,如何有效的组织、管理和利用这些信息,成为智能信息检索领域面临的一大挑战。主观性...
- 杨安娜
- 关键词:情感分类
- 文献传递
- 一种混合语言信息的词语搭配倾向判别方法
- 具有较强褒贬倾向的二元词语搭配对于文本的情感分析具有重要的价值。本文提出了一种融合语言信息的二元词语搭配的情感倾向判别方法。该方法首先根据六种模式的词语搭配特点,确定出各模式的潜在语义模型,然后采用了概率潜在语义模型判别...
- 王素格杨安娜
- 关键词:词语搭配语言信息
- 文献传递