夏睿
- 作品数:2 被引量:4H指数:1
- 供职机构:中国科学院自动化研究所更多>>
- 发文基金:黑龙江省杰出青年科学基金国家高技术研究发展计划哈尔滨市科技创新人才研究专项资金更多>>
- 相关领域:自动化与计算机技术更多>>
- 汉英双向时间和数字命名实体的识别与翻译系统
- 时间和数字命名实体的识别与翻译是统计机器翻译中语料预处理任务的一个重要步骤,对后续的模型训练和系统性能有重要的影响.本文在考虑汉英两种语言中时间和数字命名实体构成规律的基础上,将其进行了类别划分并分别制定了相应的识别和翻...
- 翟飞飞夏睿周玉宗成庆
- 关键词:机器翻译识别技术翻译原则
- 文献传递
- 情感文本分类混合模型及特征扩展策略被引量:4
- 2011年
- 针对篇章级别情感文本分类问题,分析了传统的生成式模型和判别式模型的性能,提出了一种级联式情感文本分类混合模型以及句法结构特征扩展策略.在该模型中,生成式模型(朴素贝叶斯分类器)和判别式模型(支持向量机)以级联的方式进行组合,旨在消除对于分类临界样本,模型判决置信度不足引起的误差.在混合模型的基础上,提出了一种高效扩展依存句法特征的策略.该策略既提高了系统的正确率,又避免了传统特征扩展方法所带来的计算量增加的问题.实验结果表明,混合模型及特征扩展策略与传统方法相比,在算法准确性和效率上,都有显著的提高.
- 夏睿宗成庆
- 关键词:文本分类情感分类混合模型