代翠
- 作品数:5 被引量:17H指数:1
- 供职机构:沈阳航空工业学院更多>>
- 发文基金:教育部科学技术研究重点项目国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 基于TeztRank的多文档关键词抽取技术
- 本文提出一种基于TextRank的多文档关键词抽取方法,该方法利用ATF*PDF方法计算文档集中的词语权重,抽取权重较大的实词为候选关键词,并根据候选关键词之间的语义相似关系建立TextRank模型,递归计算至收敛,最后...
- 杨洁季铎蔡东风代翠
- 关键词:多文档语义相似度关键词抽取词语权重
- 文献传递
- 基于TextRank的多文档关键词抽取技术
- 本文提出一种基于TextRaak的多文档关键词抽取方法,该方法利用ATFPDF方法计算文档集中的词语权重,抽取权重较大的实词为候选关键词,并根据候选关键诃之问的语义相似关系建立TextRank模型,递归计算至收敛,最后生...
- 杨洁季铎蔡东风代翠
- 关键词:多文档语义相似度
- 文献传递
- 统计和规则相结合的汉语最长名词短语自动识别被引量:17
- 2008年
- 在分析汉语最长名词短语特点的基础上,提出了一种统计和规则相结合的汉语最长名词短语自动识别方法:通过实验词及词性的不同组合选择特征集合,基于该特征训练得到条件随机场(CRF)识别模型;分析错误识别结果,结合最长名词短语的边界信息和内部结构信息构建规则库对识别结果进行后处理,弥补了机器学习模型获取知识不够全面的不足。实验结果表明,用统计和规则相结合的方法识别最长名词短语是有效的,系统开放测试结果F值达到了90.2%。
- 代翠周俏丽蔡东风杨洁
- 关键词:计算机应用中文信息处理条件随机场
- 统计和规则相结合的汉语最长名词短语自动识别
- 本文提出了一种基于统计和规则相结合的汉语最长名词短语识别方法。首先使用条件随机场模型进行标注识别,再结合最长名词短语的边界信息和内部结构信息对错误识别结果进行后处理。实验结果表明,本文提出的统计和规则相结合的自动识别方法...
- 代翠周俏丽蔡东风
- 关键词:汉字处理短语识别条件随机场数理语言学
- 文献传递
- 统计和规则相结合的汉语最长名词短语自动识别
- 本文提出了一种基于统计和规则相结合的汉语最长名词短语识别方法,首先使用条件随机场模型进行标注识别,再结合最长名词短语的边界信息和内部结构信息对错误识别结果进行后处理。实验结果表明,本文提出的统计和规则相结合的自动识别方法...
- 代翠周俏丽蔡东风
- 关键词:条件随机场名词短语
- 文献传递