苏艳
- 作品数:3 被引量:52H指数:2
- 供职机构:苏州大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于随机特征子空间的半监督情感分类方法研究被引量:16
- 2012年
- 情感分类是目前自然语言处理领域的一个热点研究问题。该文关注情感分类中的半监督学习方法(即基于少量标注样本和大量未标注样本进行学习的方式),提出了一种新的基于动态随机特征子空间的半监督学习方法。首先,动态生成多个随机特征子空间;然后,基于协同训练(Co-training)在每个特征子空间中挑选置信度高的未标注样本;最后使用这些挑选出的样本更新训练模型。实验结果表明我们的方法明显优于传统的静态产生方式及其他现有的半监督方法。此外该文还探索了特征子空间的划分数目问题。
- 苏艳居胜峰王中卿李寿山周国栋
- 关键词:情感分类特征子空间
- 双语情感分类方法研究
- 近年来,随着互联网技术的高速发展,网络上产生了大量评论文本信息,这些观点信息蕴藏着巨大的利用价值。如何自动化、智能化处理这些主观信息文本显得愈发重要,情感分析正是在这样的背景下产生并取得迅猛发展的一个研究方向。其中,文本...
- 苏艳
- 关键词:情感分类多语言情感词典
- 文献传递网络资源链接
- 基于双语信息和标签传播算法的中文情感词典构建方法被引量:35
- 2013年
- 文本情感分析是目前自然语言处理领域的一个热点研究问题,具有广泛的实用价值和理论研究意义。情感词典构建则是文本情感分析的一项基础任务,即将词语按照情感倾向分为褒义、中性或者贬义。然而,中文情感词典构建存在两个主要问题:1)许多情感词存在多义、歧义的现象,即一个词语在不同语境中它的语义倾向也不尽相同,这给词语的情感计算带来困难;2)由国内外相关研究现状可知,中文情感字典建设的可用资源相对较少。考虑到英文情感分析研究中存在大量语料和词典,该文借助机器翻译系统,结合双语言资源的约束信息,利用标签传播算法(LP)计算词语的情感信息。在四个领域的实验结果显示我们的方法能获得一个分类精度高、覆盖领域语境的中文情感词典。
- 李寿山李逸薇黄居仁苏艳
- 关键词:情感分析