山西高校科技研究开发项目(20091001)
- 作品数:3 被引量:27H指数:3
- 相关作者:王风娥谭红叶钱揖丽李君婵冯志茹更多>>
- 相关机构:山西大学更多>>
- 发文基金:山西高校科技研究开发项目山西省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术自然科学总论更多>>
- 中文时间表达式及类型识别被引量:9
- 2012年
- 目前,时间信息识别在信息抽取、问答系统、摘要生成、话题跟踪和检测等领域中有着广泛应用,同时也是自然语言处理的重要研究任务之一。针对TempEval-2会议评测任务中的时间表达式识别和类型识别任务:1)句内时间表达式识别,2)时间表达式类型识别,分别提出了基于词性构建时间单元规则库的识别方法以及基于最大熵的类型识别方法。实验对象为中文,结果显示时间表达式识别的准确率为85.16%,时间表达式类型识别的准确率为93.02%。
- 李君婵谭红叶王风娥
- 关键词:最大熵自然语言处理
- 基于语块和条件随机场(CRFs)的韵律短语识别被引量:6
- 2014年
- 该文提出一种基于汉语语块这一浅层句法信息,并利用条件随机场模型的中文文本韵律短语边界预测方法。首先介绍语块的定义和标注算法,然后在进行了语块结构标注以及归并处理的语料上,利用CRFs算法生成相应模型对韵律短语进行识别。实验结果表明,基于语块信息的CRFs韵律短语识别模型的识别效果优于不利用语块结构的模型,其F值平均能够提高约十个百分点。
- 钱揖丽冯志茹
- 关键词:韵律短语条件随机场
- 基于最大熵的句内时间关系识别被引量:12
- 2012年
- 分别对句内事件-时间对关系以及事件对之间的时间关系识别进行研究。分析影响时间关系识别的语言特征,如时间关系对之间的依存关系序列、间隔词数、信号词及其位置等,并使用基于最大熵的方法进行识别。实验结果表明,运用该方法获得的事件-时间对关系识别准确率为87.83%,事件对之间的时间关系识别准确率为80.79%。
- 王风娥谭红叶钱揖丽
- 关键词:最大熵依存分析自然语言处理