公共文化服务平台

2024年7月16日星期二

|

欢迎来到南京江宁区图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

张梅山: 作品数：7 被引量：71H指数：4; 供职机构：哈尔滨工业大学更多>>; 发文基金：国家自然科学基金国家高技术研究发展计划哈尔滨工业大学科研创新基金更多>>; 相关领域：自动化与计算机技术更多>>

合作作者

车万翔哈尔滨工业大学计算机科学与技术...
刘挺哈尔滨工业大学计算机科学与技术...
邓知龙哈尔滨工业大学
刘一佳哈尔滨工业大学
丁宇哈尔滨工业大学

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

5篇期刊文章
1篇学位论文
1篇会议论文

领域

7篇自动化与计算...

主题

4篇中文
4篇分词
3篇中文分词
3篇词典
3篇词性
3篇词性标注
2篇自适
2篇自适应
2篇领域自适应
2篇CRF
1篇依存分析
1篇依存句法分析
1篇语义
1篇语义相关
1篇语义相关性
1篇中文语义
1篇句法分析
1篇LEARNI...
1篇众包

机构

7篇哈尔滨工业大...

作者

7篇张梅山
6篇刘挺
6篇车万翔
2篇邓知龙
1篇刘一佳
1篇丁宇

传媒

4篇中文信息学报
1篇智能计算机与...

年份

2篇2014
2篇2013
2篇2012
1篇2011

共 7 条记录，以下是 1-7

全选清除导出

排序方式：

中文词法句法语义联合分析模型研究: 中文句子级别的基本分析技术能为自然语言处理相关应用提供基础的支撑，它主要由词法、句法和语义分析三部分组成。其中词法分析包含分词和词性标注两个级联的任务；句法分析有短语结构和依存结构句法分析两种主流的分析手段；而对于语义分...; 张梅山; 关键词：分词词性标注; 文献传递

统计与词典相结合的领域自适应中文分词: 基于统计的中文分词方法往往不具有良好的领域自适应性。本文通过将外部词典信息融入统计分词模型(本文使用CRF统计模型)来实现领域自适应性。实验表明,这种方法具有良好的领域自适应性。当测试领域和训练领域相同时,分词的F-me...; 张梅山邓知龙车万翔刘挺; 关键词：中文分词 CRF 领域自适应; 文献传递

统计与词典相结合的领域自适应中文分词被引量：44: 2012年; 基于统计的中文分词方法由于训练语料领域的限制,导致其领域自适应性能力较差。相比分词训练语料,领域词典的获取要容易许多,而且能为分词提供丰富的领域信息。该文通过将词典信息以特征的方式融入到统计分词模型(该文使用CRF统计模型)中来实现领域自适应性。实验表明,这种方法显著提高了统计中文分词的领域自适应能力。当测试领域和训练领域相同时,分词的F-measure值提升了2%;当测试领域和训练领域不同时,分词的F-measure值提升了6%。; 张梅山邓知龙车万翔刘挺; 关键词：中文分词 CRF 领域自适应

基于主动学习的中文依存句法分析被引量：10: 2012年; 目前依存句法分析仍主要采用有指导的机器学习方法,即需要大规模高质量的树库作为训练语料,而现阶段中文依存树库资源相对较少,树库标注又是一件费时费力的工作。面对大量未标注语料,该文将主动学习应用到中文依存句法分析,优先选择句法模型预测不准的实例交由人工标注。该文提出并比较了多种衡量依存句法模型预测可信度的准则。实验表明,一方面,与随机选择标注实例相比,当使用相同数目训练实例时,主动学习使中文依存分析性能最高提升0.8%;另一方面,主动学习使依存分析达到相同准确率时只需标注更少量实例,人工标注量最多可减少30%。; 车万翔张梅山刘挺

基于序列标注的中文分词、词性标注模型比较分析被引量：12: 2013年; 该文对三种不同的分词词性标注模型进行了比较。这三种模型分别为一个序列标注串行模型,一个基于字分类的联合模型和一个将这两种模型使用Stacked Learning框架进行集成的融合模型。通过在《人民日报》、CoNLL09、CTB5.0和CTB7.0四个数据集上进行比较分析,最终实验结果表明分类联合模型能取得比较好的速度,融合模型能取得比较好的准确率,而普通串行模型处于速度和准确率的平衡位置。最后该文将准确率最好的融合模型和相关前沿工作在CTB5.0和CTB7.0上进行了对比,该融合模型均取得了最好的结果。; 刘一佳车万翔刘挺张梅山; 关键词：中文分词词性标注 LEARNING

基于众包的词汇联想网络的获取和分析被引量：6: 2013年; 词典是汉语自然语言处理中非常重要的一类资源,它能为汉语词法句法以及语义分析等提供资源支撑。该文采用众包方法构建汉语语义相关性词典,该词典是通过触发词联想的方式间接获取的,因此又称为词汇联想网络。词汇联想网络相比传统词典具有以下特点:(1)获取代价低;(2)面向互联网,易扩展;(3)词语关系从人的认知角度来建立,符合人的直觉。该文详细介绍词汇联想网络的获取方法并对已获取的数据进行分析,另外,将词汇联想网络与《知网》、《同义词词林》以及微博文本ngram进行比较说明其上述特点。; 丁宇车万翔刘挺张梅山; 关键词：众包

使用过训练提升词性标注依存句法联合模型的速度: 2014年; 词性标注和依存句法分析是自然语言处理领域中句子级别基本分析技术的两个重要任务,一般来说词性标注是依存句法分析的一个前提条件。基于联合分析的方法将这两个任务在一个统一的统计模型中联合处理能避免错误传播这类问题的发生,因此这种联合模型能取得比较好的性能。但是这种联合模型会带来算法上的时间复杂度的额外开销,因此导致联合分析的方法,速度非常慢。本文提出一种基于过训练的方法,通过极少量的性能损失,使得联合模型的解码速度提升了6倍。; 张梅山车万翔刘挺; 关键词：词性标注依存句法分析

全选清除导出

共1页<1>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有@南京江宁区图书馆 2015－2016 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张