哈里旦木·阿布都克里木
- 作品数:7 被引量:25H指数:3
- 供职机构:清华大学计算机科学与技术系更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划教育部人文社会科学研究基金更多>>
- 相关领域:自动化与计算机技术哲学宗教语言文字更多>>
- 基于Chart算法的维吾尔语句法分析系统的设计与实现
- 句法分析是自然语言处理中一个很重要的研究内容。对一个语言的分析包括词法分析、句法分析、语义和语用分析几个层面,因此句法分析的好坏直接影响到后继工程的进程。 本论文首先建立了维吾尔语句法树库标注体系,此标注体系包...
- 哈里旦木·阿布都克里木
- 关键词:句法分析规则库
- 文献传递
- 基于自顶向下算法的维吾尔语句法分析初探被引量:3
- 2010年
- 该文通过研究国内外相关的句法分析算法与理论,再结合维吾尔语自身的特点对基于规则的维吾尔语句法分析方法进行讨论,由于维吾尔语作为一种自然语言,具有自然语言所共有的一些规则,发现国外经典的句法分析方法同样适合于维吾尔语的句法分析,本论文主要讨论了自项向下的的自动句法分析方法。
- 阿布都克力木·阿不力孜哈里旦木·阿布都克里木吐尔根·依布拉音帕里旦·吐尔逊艾山·吾买尔
- 关键词:维吾尔句法分析自顶向下
- 基于双向门限递归单元神经网络的维吾尔语形态切分被引量:16
- 2017年
- 以维吾尔语为代表的低资源、形态丰富语言的信息处理对于满足"一带一路"语言互通的战略需求具有重要意义。这类语言通过组合语素来表示句法和语义关系,因而给语言处理带来严重的数据稀疏问题。该文提出基于双向门限递归单元神经网络的维吾尔语形态切分方法,将维吾尔词自动切分为语素序列,从而缓解数据稀疏问题。双向门限递归单元神经网络能够充分利用双向上下文信息进行切分消歧,并通过门限递归单元有效处理长距离依赖。实验结果表明,该方法相比主流统计方法和单向门限递归单元神经网络获得了显著的性能提升。该方法具有良好的语言无关性,能够用于处理更多的形态丰富语言。
- 哈里旦木·阿布都克里木程勇刘洋孙茂松
- 关键词:神经网络维吾尔语
- THUUyMorph:维吾尔语形态切分语料库被引量:5
- 2018年
- THUUyMorph(Tsinghua University Uyghur Morphology Segmentation Corpus)是由清华大学自然语言处理与社会人文计算实验室构建的维吾尔语形态切分语料库。原始语料从2016年的天山网维文版(1)下载,题材内容包含新闻、法律、财经、生活等。语料库构建步骤为:爬虫、校对原始语料、分句、校对分句、人工和自动形态切分结合、人工标注语音和谐变化现象、人工校对形态切分和语音和谐变化现象。语料库包含10 596个文档、69 200个句子,词语类型为89 923个,分为词级和句子级两类标注,开源网址为http://thuuymorph.thunlp.org/。该研究不仅对维吾尔语语料库的建设具有参考意义,而且为维吾尔语自然语言处理的研究提供了有益的资源。
- 哈里旦木·阿布都克里木孙茂松刘洋阿布都克力木·阿布力孜
- 关键词:维吾尔语
- 形态复杂词加工的认知神经机制被引量:4
- 2017年
- 该文使用事件相关电位(event-related potentials,ERPs)以词汇判断的实验范式探讨了维吾尔语形态复杂词加工的认知神经机制。实验刺激材料设计了4个因素,分别为单语素词(没有带任何词缀)、单语素假词(真词中替换2个音构成)、屈折词(单语素名词后加格附加成分构成)、屈折假词(假词干真词缀的词)。实验材料的长度严格控制在平均词长为6个字母。脑电实验数据显示,屈折词和屈折假词在350~550ms时间窗口出现比较明显的N400效应。其中屈折假词的N400效应是被试加工假词时词汇搜索失败的标志,但屈折词的N400效应则反映了词汇通达时词干和词缀之间的交互作用。另外还发现单语素词、屈折词和屈折假词这三者的认知神经基础也不同。在大脑右半球屈折词引发的负波平均振幅比左半球要大。结果表明:母语为维吾尔语者的被试在加工维吾尔语屈折词时按其语素分解加工,但是加工维吾尔语单语素词时是整体加工及存储的。
- 阿布都克力木·阿布力孜江铭虎姚登峰哈里旦木·阿布都克里木
- 关键词:维吾尔语ERPS
- THUUyMorph:维吾尔语形态分析语料库
- 该文介绍了维吾尔语形态分析语料库及其构建过程.从网上搜集了新闻、科技、小说、散文、日常用语和其它等不同领域的语料,采用制定切分规则(带语音变化和不带语音变化)、人工切分、错误分析和校对等过程建立了维吾尔语形态分析语料库....
- 哈里旦木·阿布都克里木阿布都克力木·阿布力孜孙茂松刘洋
- 关键词:维吾尔语形态分析语料库自然语言处理
- 维吾尔语形态词汇解码的频率效应
- 2017年
- 本文从心理语言学的角度,通过事件相关电位(ERP)脑电技术,以词汇判断实验范式来研究维吾尔语屈折词和派生词的加工方式。实验材料由高/低频派生词,高/低频屈折词组成。实验材料的词基频率、词长、音节等因素进行严格控制。实验中主要观察被试在加工不同频率的维吾尔语派生/屈折词加工时的电生理数据和行为数据(反应时间)。实验结果显示维吾尔语派生词和屈折词在加工时间进程上有显著差异,行为数据显示高频屈折词的反应时间比低频词快,但高/低频派生词的反应时间没有差异。总之,维吾尔语派生词是整体加工,但是屈折词是进行分解加工。
- 阿布都克力木·阿布力孜江铭虎姚登峰哈里旦木·阿布都克里木
- 关键词:维吾尔语派生词心理语言学