您的位置: 专家智库 > >

朱聪慧

作品数:96 被引量:37H指数:4
供职机构:哈尔滨工业大学更多>>
发文基金:国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术文化科学语言文字更多>>

文献类型

  • 84篇专利
  • 11篇期刊文章
  • 1篇学位论文

领域

  • 35篇自动化与计算...
  • 8篇文化科学
  • 4篇语言文字

主题

  • 31篇翻译
  • 22篇机器翻译
  • 15篇向量
  • 14篇语言
  • 13篇语料
  • 13篇文本
  • 13篇句子
  • 12篇自然语言
  • 10篇网络
  • 8篇多语
  • 8篇中文
  • 8篇目标语
  • 8篇翻译系统
  • 8篇抽取
  • 7篇舆情
  • 7篇语言处理
  • 7篇源语
  • 7篇源语言
  • 7篇神经网
  • 7篇神经网络

机构

  • 95篇哈尔滨工业大...
  • 2篇黑龙江大学
  • 2篇教育部
  • 2篇全国组织机构...

作者

  • 96篇朱聪慧
  • 88篇赵铁军
  • 84篇曹海龙
  • 83篇徐冰
  • 79篇杨沐昀
  • 40篇郑德权
  • 5篇朱俊国
  • 4篇张越
  • 4篇李生
  • 3篇黄辉
  • 3篇刘乐茂
  • 2篇朱晓宁
  • 2篇张业
  • 2篇张文文
  • 2篇薛永增
  • 2篇韩习武
  • 2篇韩雪
  • 2篇王亚楠
  • 2篇刘笛
  • 2篇马春鹏

传媒

  • 3篇智能计算机与...
  • 2篇中文信息学报
  • 2篇标准科学
  • 1篇电子与信息学...
  • 1篇高技术通讯
  • 1篇软件学报
  • 1篇指挥信息系统...

年份

  • 9篇2024
  • 11篇2023
  • 16篇2022
  • 10篇2021
  • 9篇2020
  • 9篇2019
  • 7篇2018
  • 9篇2017
  • 2篇2016
  • 2篇2015
  • 4篇2014
  • 1篇2013
  • 3篇2012
  • 3篇2010
  • 1篇2009
96 条 记 录,以下是 1-10
排序方式:
基于无向图序列标注模型的中文分词词性标注一体化系统被引量:12
2010年
在中文词法分析中,分词是词性标注必须经历的阶段。为了能在分词阶段就充分利用词性标注的信息和减少两阶段错误的累计,最好的方法是将两个阶段,整合到一个架构中。该文以无向图模型为基础,将分词和词性标注有机地统一在一个序列标注模型中。由于可以采用更深层次的依赖关系作为特征,一体化系统在1998年人民日报语料上取得了97.19%的分词精确率和95.34%的词性标注精确率,是目前同类系统,在这一语料上取得的最好结果。
朱聪慧赵铁军郑德权
关键词:中文分词词性标注
一种基于自学习策略的专利成果转化推荐方法及装置
一种基于自学习策略的专利成果转化推荐方法及装置,方法包括:获取专利数据集;从每个企业的专利中各抽取一件专利,组成训练集;采用多种方法计算所述训练集中每件专利的摘要文本与所述数据集中剩余专利的摘要文本的相似度;根据采用预设...
杨沐昀吴禹橦徐冰曹海龙朱聪慧赵铁军
一种基于深度学习面向公检法领域的相关事件识别方法
本发明公开一种基于深度学习面向公检法领域的相关事件识别方法。步骤1:采集网络上各种热点信息标题,进行非中文、非英文、非数字字符的清理并存储在数据库中;步骤2:对步骤1数据库中的热点信息标题采用文本分类技术及深度学习进行识...
赵铁军徐冰杨沐昀郭常江朱聪慧曹海龙
一种面向多语言大模型的词语表示学习方法
本发明提出一种面向多语言大模型的词语表示学习方法。所述方法在表示能力上能够显著高于主流的静态和动态词向量模型。本发明突破性地将单语词的向量表示改进为多点的流形表示。这种新的框架有望增加词向量空间的整体容量,更好地应对一词...
曹海龙杨沐昀朱聪慧赵铁军徐冰傅畅
基于多任务学习的篇章级文本连贯性分类方法
本发明提出基于多任务学习的篇章级文本连贯性分类方法,所述方法包括:步骤1、使用预训练模型得到篇章级文本中每一句话的句子向量表示;步骤2、将句子向量作为输入,使用Transformer模型,得到篇章级文本的整体向量表示;步...
赵铁军夏名宏朱聪慧徐冰杨沐昀曹海龙
文献传递
一种面向法律文本的多关系中主要关系的抽取方法
本发明公开了一种面向法律文本的多关系中主要关系的抽取方法。步骤1:根据选定的法律条文文本进行实体及实体间关系的定义;步骤2:根据步骤1的法律实体定义和关系定义,确定对法律原文的序列标注方式;步骤3:根据步骤2对法律原文的...
赵铁军杨沐昀徐冰徐家豫朱聪慧曹海龙
文献传递
一种基于翻译简易度的数据筛选方法
一种基于翻译简易度的数据筛选方法,它涉及一种数据筛选方法。本发明为了解决机器翻译数据增强过程中数据质量不佳的问题。本发明将扩增后的所有平行句对作为筛选的对象,首先,利用原有数据集训练得到一个语言模型,该语言模型用于后续的...
曹海龙杨沐昀徐冰翁兆辰朱聪慧
一种基于深度学习面向公检法领域的舆情等级预测方法
本发明公开一种基于深度学习面向公检法领域的舆情等级预测方法。步骤1:从网络上爬取公检法领域相关的舆情信息,提取其中的文本信息存储至数据库中;步骤2:对采集到文本信息利用深度学习模型进行预测,得到舆情等级预测结果;步骤3:...
赵铁军杨沐昀徐冰郭常江曹海龙朱聪慧
融合多语编码信息的神经机器翻译方法
融合多语编码信息的神经机器翻译方法,本发明涉及神经机器翻译方法。本发明的目的是为了解决现有技术翻译准确率低的问题。过程为:一,得到每种语言各自对应的子字符号序列,建立dic_s<Sub>1</Sub>,dic_s<Sub...
朱聪慧曹海龙赵铁军刘笛杨沐昀郑德权徐冰
文献传递
基于伪反馈的个性化机器翻译系统及方法
本发明涉及一种基于伪反馈的个性化机器翻译系统及方法。现有传统的机器翻译方法无法获得高质量的个性化翻译系统,造成不能满足用户各种翻译需求的问题。本发明翻译系统包括:用短语表过滤模块、输入模块、初步翻译模块、伪反馈检索模块、...
杨沐昀朱俊国赵铁军李生徐冰曹海龙朱聪慧郑德权
文献传递
共10页<12345678910>
聚类工具0