您的位置: 专家智库 > >

陈钰枫

作品数:73 被引量:101H指数:5
供职机构:北京交通大学计算机与信息技术学院更多>>
发文基金:国家自然科学基金中央高校基本科研业务费专项资金国际科技合作与交流专项项目更多>>
相关领域:自动化与计算机技术文化科学语言文字更多>>

文献类型

  • 43篇期刊文章
  • 16篇会议论文
  • 13篇专利
  • 1篇学位论文

领域

  • 52篇自动化与计算...
  • 10篇文化科学
  • 1篇语言文字

主题

  • 24篇翻译
  • 18篇机器翻译
  • 11篇复述
  • 9篇神经网
  • 9篇神经网络
  • 8篇语言处理
  • 8篇自然语言
  • 8篇自然语言处理
  • 8篇汉语
  • 8篇翻译模型
  • 7篇语料
  • 7篇中文
  • 7篇句法
  • 7篇句法分析
  • 7篇抽取
  • 6篇依存
  • 6篇自适
  • 6篇自适应
  • 6篇领域自适应
  • 6篇分词

机构

  • 65篇北京交通大学
  • 8篇中国科学院自...
  • 2篇联想研究院
  • 1篇广东外语外贸...
  • 1篇创新工场
  • 1篇科技公司

作者

  • 73篇陈钰枫
  • 65篇徐金安
  • 51篇张玉洁
  • 7篇宗成庆
  • 5篇明芳
  • 4篇刘健
  • 4篇张家俊
  • 4篇杨晓晖
  • 4篇周玉
  • 4篇王楠
  • 4篇呼啸
  • 4篇马文嘉
  • 4篇黄天立
  • 4篇张子兴
  • 2篇徐凡
  • 2篇韩晓光
  • 2篇肖冰
  • 2篇王丹丹
  • 2篇翟飞飞
  • 2篇王东明

传媒

  • 14篇北京大学学报...
  • 9篇中文信息学报
  • 6篇情报工程
  • 4篇计算机与现代...
  • 2篇工业和信息化...
  • 1篇计算机学报
  • 1篇厦门大学学报...
  • 1篇广西师范大学...
  • 1篇计算机应用
  • 1篇计算机科学
  • 1篇山东大学学报...
  • 1篇智能系统学报
  • 1篇中国科学:信...
  • 1篇第五届全国机...

年份

  • 1篇2024
  • 4篇2023
  • 10篇2022
  • 10篇2021
  • 4篇2020
  • 4篇2019
  • 10篇2018
  • 8篇2017
  • 7篇2016
  • 7篇2015
  • 4篇2011
  • 1篇2009
  • 2篇2008
  • 1篇2007
73 条 记 录,以下是 1-10
排序方式:
获取符号串的方法和装置
本发明公开了一种获取符号串的方法和装置,属于自然语言处理研究领域。所述方法包括:获取输入的信息中包含的第一符号串;根据第二符号串生成与所述第二符号串具有对称性结构的第三符号串,所述第二符号串为所述第一符号串或为所述第一符...
徐金安呼啸黄天立张子兴闫麟阁马文嘉徐乾舜陈钰枫
文献传递
翻译信息的方法和装置
本发明公开了一种翻译信息的方法和装置,属于自然语言处理研究领域。方法包括:获取源语言格式的第一信息中包含的表情符号;在第一信息中将该表情符号置换为用于标识该表情符号的第一标识得到第二信息;将第二信息翻译为目标语言格式的第...
徐金安赵雁榕韩晓光肖冰徐凡陈钰枫
文献传递
一种多源领域自适应命名实体识别方法
2022年
领域自适应是解决低资源问题的一种通用方式,可应用于各种自然语言处理的任务中.当前针对命名实体识别(named entity recognition,NER)任务的领域自适应研究通常从单一的源领域迁移到目标领域,在目标领域和源领域相近的情况下,这种方式能够取得较好的识别效果,但是在目标领域与源领域相关度不高的情况下,单一领域迁移方式存在很大的局限性.针对这一问题,提出一种融合多源领域贡献度加权的自适应NER模型(multi-domain adaptation NER model based on importance weighting,MDAIW).1)通过多个领域的知识迁移来提升目标领域的实体识别性能;2)根据不同领域及其领域内样本对目标领域的重要性,计算领域贡献度;3)将领域贡献度引入到NER模型中,以此来实现更好的模型领域适应性.最终在多个目标领域上进行实验,性能皆优于当前性能最好的方法,验证了模型的有效性.
李佳芮刘健陈钰枫徐金安张玉洁
关键词:命名实体识别领域自适应
识别整体符号串的方法和装置
本发明公开了一种识别整体符号串的方法和装置,属于自然语言处理研究领域。所述方法包括:提取文本信息中包含的符号串;从所述符号串中获取具有对称性的符号对;根据所述获取的符号对计算所述符号串的对称度;如果所述符号串的对称度满足...
徐金安张子兴呼啸马文嘉黄天立闫麟阁徐乾舜陈钰枫
领域自适应的槽位填充方法、装置、设备及存储介质
本申请公开了一种领域自适应的槽位填充方法、装置、设备及存储介质,属于自然语言处理领域。该方法包括:接收用户输入语句;基于目标槽位的槽位元信息,为所述用户输入语句构建与所述目标槽位对应的问句;将所述问句和所述用户输入语句拼...
徐金安于梦诗陈钰枫刘健
文献传递
基于多特征融合编码的神经网络依存句法分析模型
2018年
在基于神经网络的依存句法分析中,对分析栈和决策层信息的表示和利用依然有值得深入研究的空间。针对分析栈的表示,已有工作并没有对单棵依存子树独立编码的表示,导致无法利用各个依存子树的局部特征;也没有对生成的依存弧序列进行编码,导致无法利用依存弧的全局信息。针对决策层的表示,已有工作利用MLP预测转移动作,该结构无法利用历史决策动作的信息。对此,该文提出基于多特征融合编码的神经网络依存句法分析模型,基于依存子树和历史生成的依存弧表示分析栈,利用TreeLSTM网络编码依存子树信息,利用LSTM网络编码历史生成的依存弧序列,以更好地表示分析栈的局部信息和全局信息。进一步提出基于LSTM网络的结构预测转移动作序列,引入历史决策动作信息作为特征辅助当前决策。该文以汉语为具体研究对象,在CTB5汉语依存分析数据上验证所提出的多特征融合编码的神经网络模型。实验结果显示,汉语依存句法分析性能得到改进,在目前公布的基于转移的分析系统中取得最好成绩,在UAS和LAS评价指标上分别达到87.8%和86.8%的精度,表明所提出的对依存子树局部特征及历史依存弧信息和历史决策动作信息的编码方法,在改进依存分析模型性能方面的有效性。
刘明童张玉洁徐金安陈钰枫
关键词:依存句法分析
开放域上基于深度语义计算的复述模板获取方法被引量:4
2018年
利用实体关系从网络大规模单语语料获取复述模板的方法可以规避对单语平行语料或可比语料的依赖,但是后期需要人工对有语义差异的关系模板分类后获取复述模板。针对这一遗留问题,该文提出基于深度语义计算的复述模板自动获取方法,首先设计基于统计特征的模板裁剪方法,从非复述语料中获取高质量的关系模板,然后设计基于深度语义计算的关系模板聚类方法获取高精度的复述模板。我们在四类实体关系数据上的实验结果表明,该方法实现了关系模板的自动获取与自动聚类,可以获得语义相近度更高、表现形式多样的复述模板。
刘明童张玉洁徐金安陈钰枫
关键词:自动聚类
基于任务驱动的“自然语言处理”课程教学探究与实践被引量:2
2021年
“自然语言处理”课程是计算机科学与技术专业的专业核心课程之一。自然语言处理是人工智能领域的前沿热点研究方向,其知识内容新、更新快,因此,国内高校尚未形成统一成熟的教学大纲体系。针对“自然语言处理”课程理论性强、抽象性强、实践性强、系统性强的特点,基于任务驱动设计了层次递进的教学内容,提出了问题引导式和任务驱动式相结合的教学模式,全面提高学生学习兴趣,培养学生研究能力。希望通过教学内容和教学模式的改革,提高自然语言处理研究生教学及学科建设的质量和水平。
陈钰枫徐金安张玉洁
关键词:自然语言处理研究生教学
融合语态特征的日英层次短语翻译模型
针对不同语种的被动和可能语态的句法结构差异影响机器翻译质量的问题,提出融合语态特征的最大熵翻译模型。首先从日语端分出被动语态、可能语态和其他语态,然后从英语端对被动和可能语态进一步分类,抽取双语特征训练最大熵规则分类模型...
王楠徐金安明芳陈钰枫张玉洁
关键词:被动语态统计机器翻译最大熵模型
中文实体关系抽取研究综述被引量:16
2018年
作为信息抽取任务中极为关键的一项子任务,实体关系抽取对于语义知识库的构建和知识图谱的发展都有着重要的意义。对于中文而言,语义关系更加复杂,实体关系抽取的作用也就愈加显著,因此,对中文实体关系抽取的研究方法进行详细考察极为必要。本文从实体关系抽取的产生和发展开始,对目前基于中文的实体关系抽取技术现状作了阐述;按照关系抽取方法对语料的依赖程度分为4类:有监督的实体关系抽取、无监督的实体关系抽取、半监督的实体关系抽取和开放域的实体关系抽取,并对这4类抽取方法进行具体的分析和比较;最后介绍深度学习在中文实体关系抽取上的应用成果和发展前景。
武文雅陈钰枫徐金安张玉洁
关键词:中文实体关系抽取
共8页<12345678>
聚类工具0