您的位置: 专家智库 > >

余祖波

作品数:6 被引量:7H指数:1
供职机构:大连理工大学电子科学与技术学院计算机科学与工程系更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 4篇期刊文章
  • 1篇学位论文
  • 1篇会议论文

领域

  • 5篇自动化与计算...
  • 1篇语言文字

主题

  • 5篇中文
  • 3篇姓名
  • 3篇中文姓名
  • 3篇自动识别
  • 2篇登录
  • 2篇姓名识别
  • 2篇姓氏
  • 2篇语言处理
  • 2篇语义单元
  • 2篇人名识别
  • 2篇中文人名
  • 2篇中文人名识别
  • 2篇中文姓名识别
  • 2篇自然语言
  • 2篇自然语言处理
  • 2篇未登录词
  • 2篇未登录词识别
  • 1篇信息处理
  • 1篇语义
  • 1篇中文信息

机构

  • 6篇大连理工大学
  • 2篇北京科技大学

作者

  • 6篇余祖波
  • 4篇高庆狮
  • 2篇方淼
  • 2篇马建军

传媒

  • 2篇计算机工程与...
  • 1篇华中科技大学...
  • 1篇小型微型计算...
  • 1篇2005中国...

年份

  • 2篇2008
  • 1篇2007
  • 1篇2006
  • 2篇2005
6 条 记 录,以下是 1-6
排序方式:
语义单元表示库的半自动构建技术
2005年
提出了一种高效的半自动构建语义单元表示库(英汉)的方法.该方法不是使用分词和词性标注等工具,而是直接对组成双语句子的基本字符进行处理,采用语义单元实量匹配和重构语义单元树的算法,对其产生的结果运用规则进行推断,规则独立于其他模块并且可扩充.经人工检查正确的语义单元加入语义单元表示库中.实验表明,该方法能保证结果的正确性,达到实用的水平.
方淼高庆狮余祖波
关键词:机器翻译语义单元
中文姓名自动识别系统的设计与实现被引量:4
2006年
论文在对大规模姓名样本库、姓名语料库进行统计的基础上,将姓氏库中的姓氏按优先级分类,并研究了前300个姓氏作普通单字时其上下文用字规律,将确定真姓氏并识别姓名的过程看作对句子的姓氏用字集进行划分的过程,设计实现了一个中文姓名自动识别试验系统。同时提出多级阈值的概念,即姓名右边界阈值和识别阈值均是优先级的函数。对系统的开放测试召回率和准确率分别为80.62%、89.27%。
余祖波高庆狮方淼
关键词:中文姓名识别
基于姓氏优先级的中文姓名自动识别
该文针对姓名样本库和姓名语料库统计姓氏的各种概率信息,得到了姓氏的三组数据 X(i)、Y(i)、Z(i),分别表示姓氏的常用程度、姓氏字的常用程度、该姓氏字在真实文本中成为真姓氏的概率。利用这三组数据,我们提出了基于姓氏...
余祖波高庆狮方淼
关键词:中文姓名识别未登录词识别
文献传递
一种利用统计语义单元识别中文人名的方法被引量:1
2008年
从语义语言的角度提出一种利用统计语义单元识别中文人名的方法.在该方法中没有词的概念,一切单位都是语义单元,语义单元有参数和类型等属性.通过语义单元对句子进行语义切分,获得句子的语义单元图,并利用联合概率模型求得语义单元图中概率最大的路径,然后根据人名模式集在该路径上识别人名.初步实验表明,该方法是一种值得探索的新方法.
余祖波马建军
关键词:自然语言处理中文人名识别语义单元
基于多级阈值的中文人名识别被引量:1
2007年
在对大规模姓名样本库统计的基础上,研究了各种中文人名的姓氏、名字用字规律,并通过对大规模语料库的统计分析,得到了每个姓氏用字在真实文本中用作真实姓氏的概率及其上下文规律;针对汉族人名和少数民族人名及音译人名,分别提出了多级姓氏阈值和多级首字阈值的概念,并使用3σ法则确定阈值。实验结果表明,基于多级阈值的中文人名识别模型是有效的。
余祖波高庆狮马建军
关键词:自然语言处理未登录词识别中文人名识别
中文姓名自动识别系统的设计与实现
中文命名实体或未登录词识别是中文信息处理的基础研究课题,是文本理解、文本校对、文本主题自动抽取、文本聚类、文本挖掘、文本过滤、信息抽取、机器翻译等多种自然语言处理技术的重要基础。因此,研究中文命名实体识别对提高词法分析、...
余祖波
关键词:中文姓名自动识别中文信息处理自动抽取文本聚类词法分析
文献传递
共1页<1>
聚类工具0