您的位置: 专家智库 > >

文娟

作品数:4 被引量:16H指数:2
供职机构:北京邮电大学更多>>
发文基金:国家高技术研究发展计划国家科技支撑计划高等学校学科创新引智计划更多>>
相关领域:自动化与计算机技术理学更多>>

文献类型

  • 2篇期刊文章
  • 1篇学位论文
  • 1篇会议论文

领域

  • 4篇自动化与计算...
  • 1篇理学

主题

  • 4篇抽取
  • 2篇语言模型
  • 2篇实体关系抽取
  • 2篇自动抽取
  • 2篇关系抽取
  • 1篇音字转换
  • 1篇语料
  • 1篇语义
  • 1篇语义框架
  • 1篇元模型
  • 1篇统计语言模型
  • 1篇评测
  • 1篇区分度
  • 1篇极大熵
  • 1篇N元模型
  • 1篇BOOTST...
  • 1篇抽取算法

机构

  • 4篇北京邮电大学
  • 2篇华北电力大学

作者

  • 4篇文娟
  • 2篇秦颖
  • 2篇张素香
  • 1篇袁彩霞
  • 1篇钟义信
  • 1篇王小捷

传媒

  • 1篇北京邮电大学...
  • 1篇哈尔滨工程大...
  • 1篇第十六届中国...

年份

  • 2篇2009
  • 2篇2006
4 条 记 录,以下是 1-4
排序方式:
统计语言模型的研究与应用
统计语言模型在自然语言处理技术中占有重要地位,在语音识别、光学字符识别、机器翻译、汉语拼音输入、信息检索等许多系统中都得到了成功的应用。   然而,现有的统计语言模型还存着一些缺陷,其中,对语言中常见的长距相依现象的描...
文娟
关键词:统计语言模型语料语义框架
文献传递
实体关系的自动抽取研究被引量:10
2006年
针对实体关系的自动获取难题,将极大熵算法和Bootstrapping算法相结合,利用Bootstrapping算法和标量聚类的思想,通过设置种子模板和种子词获取了极大熵算法中所需的特征词.结合极大熵算法,从语言的形态学、语法、语义等方面系统地设计了9个特征,尽可能全方位地描述文实体的真实情况.搭建了实验所需的系统框架,实现了实体关系的自动抽取.实验结果表明:该方法能够有效地解决实体关系的自动生成问题.
张素香文娟秦颖袁彩霞钟义信
关键词:极大熵BOOTSTRAPPING实体关系抽取评测
实体关系的自动抽取研究
针对实体关系的自动获取难题,将极大熵算法和Bootstrapping算法相结合,利用Bootstrapping算法和标量聚类的思想,通过设置种子模板和种子词获取了极大熵算法中所需的特征词.结合极大熵算法,从语言的形态学、...
张素香文娟秦颖袁彩霞钟义信
关键词:实体关系抽取
文献传递
中文高频词串的抽取及其在语言模型中的应用被引量:2
2009年
为准确抽取语料库中的高频词串,使其能更好地应用于语言模型中,提出了一种基于字串切分度的中文高频词串(CFS)抽取算法,并用该算法抽取出的CFS分别建立一元和二元语言模型.实验表明,基于CFS的语言模型能有效克服现有基于字和词的n元语法模型长距离相依性能较差的缺陷;同时,在模型困惑度、音字转换正确率上均优于已有基于净频次的CFS语言模型.
文娟王小捷
关键词:N元模型音字转换
共1页<1>
聚类工具0