您的位置: 专家智库 > >

张大奎

作品数:3 被引量:4H指数:2
供职机构:北京理工大学计算机学院更多>>
发文基金:国家重点基础研究发展计划国家自然科学基金北京市优秀人才培养资助更多>>
相关领域:自动化与计算机技术语言文字更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 2篇自动化与计算...
  • 1篇语言文字

主题

  • 3篇中文
  • 2篇语义
  • 2篇语义表征
  • 2篇中文问答
  • 1篇用户
  • 1篇投票机制
  • 1篇中文分词
  • 1篇中文问答系统
  • 1篇问答系统
  • 1篇相似度
  • 1篇相似度计算
  • 1篇相似度计算方...
  • 1篇分词

机构

  • 3篇北京理工大学
  • 2篇北京建筑大学
  • 1篇中国人民公安...

作者

  • 3篇樊孝忠
  • 3篇毛煜
  • 3篇张大奎
  • 2篇魏楚元
  • 2篇湛强
  • 1篇汤世平

传媒

  • 2篇中文信息学报
  • 1篇情报学报

年份

  • 1篇2018
  • 1篇2015
  • 1篇2014
3 条 记 录,以下是 1-3
排序方式:
探索用户自然输入标记及其在构建分词语料库中的作用被引量:2
2018年
当分词算法优化到接近极限时,分词器的性能指标就较多地取决于训练语料的覆盖度和完备程度。因此,如何快速、省力、自动化地构建具有较完备的分词语料库是一个亟待解决的问题。该文对用户输入过程中留下的大量可用且珍贵的自然分词信息进行了探索和研究,为自动构建分词语料库提供了一种新的观点。前人的研究中,对用户在输入过程中留下的自然分词标记信息并没有关注,而该文通过实验验证了这些分词标记信息确实可以用于构建分词语料库,并且具有相当好的效果。其中经过甄别优秀用户在输入时留下的分词标记十分接近标准的分词结果。该文使用分类模型结合投票机制的方法找到三个此类优秀用户,获取了他们带有输入标记的文本,快速构建了分词训练语料库,极大地提升了分词器的精度;更重要的是,揭示并验证了自然输入分词标记信息的有效作用。
张大奎尹德春汤世平毛煜樊孝忠
关键词:中文分词投票机制
融合事件信息的中文问答系统问题语义表征被引量:2
2015年
复杂类问题理解是中文问答系统研究的难点,基于组块的问句分析方法将整个问句转化为若干组块,降低了问句分析的难度和复杂性。针对以含有事件(动作)信息的复杂类问题,提出基于语义组块的中文问答系统问题语义表征模型,采用语义组块的思想将问题的语义成分定义为疑问焦点块、问题主题块和问题事件块三个语义组块,对问句中的事件语义信息,建立了问题事件语义结构,将一个问句表征为一个基于语义组块的问题语义表征结构,用于问答系统的问题理解。通过序列标注学习方法实现问题语义表征中语义组块自动标注。实验结果表明:问题语义组块标注效果较好,问题语义表征模型获取了问题的关键语义信息,为语义层面上的问题理解提供基础。
魏楚元湛强樊孝忠毛煜张大奎
基于问题语义表征的中文问答系统相似度计算方法
2014年
问答系统特别是近年来流行的社区问答系统是信息检索与自然语言领域研究的热点。问题与答案句匹配及相似问题检索是中文问答系统研究的关键问题之一,其本质是基于相似度计算方法,从已解决的历史问答对中找出与查询问题相关的问题。本文以含有事件(动作)信息的复杂类问句为研究对象,提出了一种基于问题语义表征的问题相似度计算方法,问题语义表征结构由疑问焦点块、问题主题块和问题事件块组成,将一个查询问题与历史问题之间的相似度分解为三个主要语义组块之间相似度。实验结果表明,该方法具有一定的有效性。
魏楚元湛强张大奎毛煜樊孝忠
关键词:相似度计算
共1页<1>
聚类工具0