您的位置: 专家智库 > >

段湘煜

作品数:52 被引量:149H指数:6
供职机构:苏州大学计算机科学与技术学院更多>>
发文基金:国家自然科学基金北京市自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术语言文字文化科学轻工技术与工程更多>>

文献类型

  • 24篇期刊文章
  • 23篇专利
  • 4篇会议论文
  • 1篇学位论文

领域

  • 34篇自动化与计算...
  • 3篇语言文字
  • 1篇轻工技术与工...
  • 1篇文化科学

主题

  • 28篇翻译
  • 25篇机器翻译
  • 11篇网络
  • 10篇分类器
  • 8篇文本
  • 5篇短语
  • 5篇神经网
  • 5篇神经网络
  • 5篇最大熵
  • 4篇译文
  • 4篇用户
  • 4篇识别方法
  • 4篇句子
  • 3篇对齐
  • 3篇语言处理
  • 3篇自然语言
  • 3篇自然语言处理
  • 3篇问答系统
  • 3篇向量
  • 2篇电商

机构

  • 46篇苏州大学
  • 6篇中国科学院自...
  • 2篇苏州科技大学
  • 1篇苏州科技学院
  • 1篇西北大学
  • 1篇新疆大学
  • 1篇河南工学院

作者

  • 52篇段湘煜
  • 26篇张民
  • 10篇周国栋
  • 9篇李寿山
  • 5篇赵军
  • 5篇徐波
  • 4篇王坤
  • 4篇王晶晶
  • 4篇龚慧敏
  • 3篇高恩婷
  • 2篇谭敏
  • 2篇汪蓉
  • 1篇巢佳媛
  • 1篇刘欢欢
  • 1篇王中卿
  • 1篇孙挺
  • 1篇戴斌
  • 1篇李军辉
  • 1篇韩冬
  • 1篇吴友政

传媒

  • 7篇厦门大学学报...
  • 5篇中文信息学报
  • 5篇计算机科学
  • 2篇计算机工程
  • 1篇北京大学学报...
  • 1篇江西师范大学...
  • 1篇包装工程
  • 1篇计算机技术与...
  • 1篇学园
  • 1篇第一届全国信...
  • 1篇NCIRCS...

年份

  • 4篇2023
  • 5篇2022
  • 5篇2021
  • 2篇2020
  • 9篇2019
  • 5篇2018
  • 6篇2017
  • 3篇2016
  • 6篇2015
  • 1篇2014
  • 1篇2008
  • 2篇2007
  • 1篇2005
  • 2篇2004
52 条 记 录,以下是 1-10
排序方式:
一种文本翻译方法、装置、设备及计算机可读存储介质
本发明公开了一种文本翻译方法,包括:对接收到的文本翻译请求进行解析,得到待翻译文本、待翻译文本对应的第一语种类别、以及需翻译为的第二语种类别;利用文本翻译模型中第一语种类别对应的目标情感分类器对待翻译文本进行情感分类,得...
段湘煜周孝青张民
短语后验证的无监督领域适应电商机器翻译
2021年
目前机器翻译训练普遍依赖于大规模平行语料,但在电子商务领域中,公开的大规模平行语料几乎不存在且很难构建。为了解决平行资源稀缺的问题,将大量外领域平行数据迁移应用于内领域非平行数据上的方法称为无监督领域适应。但神经网络机器翻译的领域适应内领域中存在词对匹配不佳的问题,为了解决该问题提出了短语后验证的无监督领域适应电商机器翻译。获取了中文和英文电子商务的单语数据,在无监督领域适应的迭代过程中,采取逐步数据混合训练策略,提升翻译性能,在此基础上引入短语后验证改善词对匹配问题。根据大量电商机器翻译基准实验对比,结果表明,短语后验证的无监督领域适应方法在中英双向电子商务领域上较最强基线系统提升约1.5 Bleu点。
宁秋怡史小静段湘煜
基于语法规约指导的神经机器翻译方法
本发明涉及一种基于语法规约指导的神经机器翻译方法,为了得到更加精准的神经翻译模型而设计。本发明基于语法规约指导的神经机器翻译方法,本发明对源端和目标端都进行指导:在源端,添加了注意力损失来指导注意力集中在源端短语上;在目...
段湘煜王坤谭敏骆卫华张民
文献传递
基于掩码机制的非自回归神经机器翻译被引量:3
2021年
当前基于自注意力机制的神经机器翻译模型取得了长足的进展,但是采用自回归的神经机器翻译在解码过程中无法并行计算,耗费时间过长.为此,提出了一个采用非自回归的神经机器翻译模型,可以实现并行解码,并且只使用一个Transformer的编码器模块进行训练,简化了传统的编码器-解码器结构.同时在训练过程中引入了掩码机制,减小了与自回归的神经机器翻译的翻译效果差距.相比于其他非自回归翻译模型,该模型在WMT 2016罗马尼亚语-英语翻译任务上取得了更好的效果,并且在使用跨语言预训练语言模型初始化后,取得了和自回归神经机器翻译模型相当的结果.
贾浩王煦季佰军段湘煜张民
神经机器翻译的词级别正则化
2021年
由于神经机器翻译模型具有大规模参数且其性能极大地依赖大规模高质量平行语料,当训练数据规模小于模型复杂度时,模型易出现过拟合问题而泛化能力不足.针对此问题,研究了词级别的正则化技术,通过对模型输入句子中的单词进行随机干扰,以此削弱数据的特异性,从而抑制模型对于数据的过度学习,防止过拟合,提高模型的泛化能力.通过Transformer模型在标准规模中文-英语数据集和中小规模英语-土耳其语数据集上进行的相关实验,结果证明词级别正则化方法能够使模型在收敛后更加稳定,不易出现过拟合的情况,并且翻译质量也得到了明显的提升.
邱石贵章化奥段湘煜张民
关键词:泛化能力过拟合正则化
翻译规则剪枝与基于半强制解码和变分贝叶斯推理的模型训练
2014年
统计机器翻译一般采用启发式方法训练翻译模型。但启发式方法的理论基础不够完善,因此,会导致翻译模型规模庞大以及模型参数精确率不高。针对以上两个问题,该文提出一种基于变分贝叶斯推理的模型训练方法,形成更精确的精简翻译模型。该方法首先通过强制解码对齐语料,然后利用变分贝叶斯EM算法获得模型参数。该文的实验语料为NIST汉英翻译任务数据,实验结果显示,基于句法(基于短语)的统计机器翻译中,超过95%(76%)的规则被剪枝,且BLEU值显著提高。
高恩婷段湘煜巢佳媛张民
关键词:机器翻译规则剪枝
区域灰度分布耦合相似判定策略的图像匹配算法被引量:2
2017年
目的为了解决当前因图像匹配算法主要依靠提取图像的特征属性矢量进行度量,从而利用其对应的相关系数最大的点进行匹配时导致匹配结果中存在较多的错误匹配点以及匹配误差变大的问题。方法提出区域灰度分布耦合相似判定策略的图像匹配算法,首先利用Forstner算子来提取图像的特征点,以特征点为中心,采取建立极坐标系的方法来确定特征点的主方向,通过特征点邻域的灰度特征来生成低维度的特征描述子;然后引入归一化互相(NCC)函数对特征点之间的相似度进行评估,建立矩形窗口特征点双向匹配规则,完成特征点的匹配,以提高特征点之间的匹配准确度和算法鲁棒性;最后,根据正确匹配特征点组成的三角形具有相似性的特征,设计相似判定策略,对错误匹配点进行剔除,以改善匹配精度。结果实验结果表明,与当前图像匹配技术相比,文中匹配算法具有更高的匹配精度与效率,有效降低了特征点的误匹配率。结论所提图像匹配技术具有较高的配准精度,在图像伪造、包装条码识别等领域具有一定的应用价值。
蔡鹏飞李扬波段湘煜孙挺
关键词:图像匹配FORSTNER算子
一种改进训练语料的平行质量的方法及装置
本发明公开了一种改进训练语料的平行质量的方法及装置。该方法包括:在预先获得的训练语料库中确定待纠正的目标句对,目标句对包括原文句子和相对应的译文句子;从目标句对的所有组合划分点中,选择一个可用组合划分点;利用可用组合划分...
段湘煜龚慧敏张民
一种文本连接词的识别方法及装置
本申请提供的文本连接词的识别方法及装置,在获取的待识别文本中,提取待识别的连接词,利用预先构建的分类器对该识别连接词进行识别,获得识别结果,进而利用识别结果确定待识别连接词的属性,该属性为连接词或非连接词。在本实施例中,...
李寿山汪蓉周国栋段湘煜
文献传递
一种信息判别方法和系统
本发明提供了一种信息判别方法及系统,基于网络爬虫技术,检索并收集传统媒体和社交媒体的热点信息对应的网页信息,并对收集到的网页信息进行处理,得到类别数据标记的、划分有训练集数据和测试集数据的传统媒体和社交媒体数据集合;基于...
龚慧敏段湘煜张民
共6页<123456>
聚类工具0