您的位置: 专家智库 > >

代翠

作品数:5 被引量:17H指数:1
供职机构:沈阳航空工业学院更多>>
发文基金:教育部科学技术研究重点项目国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 4篇会议论文
  • 1篇期刊文章

领域

  • 5篇自动化与计算...
  • 1篇语言文字

主题

  • 3篇短语
  • 3篇随机场
  • 3篇条件随机场
  • 3篇名词
  • 3篇名词短语
  • 3篇规则相
  • 2篇多文档
  • 2篇语义相似
  • 2篇语义相似度
  • 2篇自动识别
  • 2篇文档
  • 2篇相似度
  • 2篇关键词
  • 2篇抽取
  • 2篇抽取技术
  • 1篇短语识别
  • 1篇信息处理
  • 1篇语言学
  • 1篇数理语言学
  • 1篇中文

机构

  • 5篇沈阳航空工业...

作者

  • 5篇代翠
  • 5篇蔡东风
  • 3篇杨洁
  • 3篇周俏丽
  • 2篇季铎

传媒

  • 1篇中文信息学报
  • 1篇第四届全国信...
  • 1篇第四届全国学...
  • 1篇第四届全国信...

年份

  • 5篇2008
5 条 记 录,以下是 1-5
排序方式:
基于TeztRank的多文档关键词抽取技术
本文提出一种基于TextRank的多文档关键词抽取方法,该方法利用ATF*PDF方法计算文档集中的词语权重,抽取权重较大的实词为候选关键词,并根据候选关键词之间的语义相似关系建立TextRank模型,递归计算至收敛,最后...
杨洁季铎蔡东风代翠
关键词:多文档语义相似度关键词抽取词语权重
文献传递
基于TextRank的多文档关键词抽取技术
本文提出一种基于TextRaak的多文档关键词抽取方法,该方法利用ATFPDF方法计算文档集中的词语权重,抽取权重较大的实词为候选关键词,并根据候选关键诃之问的语义相似关系建立TextRank模型,递归计算至收敛,最后生...
杨洁季铎蔡东风代翠
关键词:多文档语义相似度
文献传递
统计和规则相结合的汉语最长名词短语自动识别被引量:17
2008年
在分析汉语最长名词短语特点的基础上,提出了一种统计和规则相结合的汉语最长名词短语自动识别方法:通过实验词及词性的不同组合选择特征集合,基于该特征训练得到条件随机场(CRF)识别模型;分析错误识别结果,结合最长名词短语的边界信息和内部结构信息构建规则库对识别结果进行后处理,弥补了机器学习模型获取知识不够全面的不足。实验结果表明,用统计和规则相结合的方法识别最长名词短语是有效的,系统开放测试结果F值达到了90.2%。
代翠周俏丽蔡东风杨洁
关键词:计算机应用中文信息处理条件随机场
统计和规则相结合的汉语最长名词短语自动识别
本文提出了一种基于统计和规则相结合的汉语最长名词短语识别方法。首先使用条件随机场模型进行标注识别,再结合最长名词短语的边界信息和内部结构信息对错误识别结果进行后处理。实验结果表明,本文提出的统计和规则相结合的自动识别方法...
代翠周俏丽蔡东风
关键词:汉字处理短语识别条件随机场数理语言学
文献传递
统计和规则相结合的汉语最长名词短语自动识别
本文提出了一种基于统计和规则相结合的汉语最长名词短语识别方法,首先使用条件随机场模型进行标注识别,再结合最长名词短语的边界信息和内部结构信息对错误识别结果进行后处理。实验结果表明,本文提出的统计和规则相结合的自动识别方法...
代翠周俏丽蔡东风
关键词:条件随机场名词短语
文献传递
共1页<1>
聚类工具0