中央民族大学国家语言资源监测与研究少数民族语言中心
- 作品数:21 被引量:28H指数:2
- 相关机构:渤海大学文学院青海师范大学计算机学院更多>>
- 发文基金:国家自然科学基金国家语委科研项目更多>>
- 相关领域:语言文字自动化与计算机技术文化科学历史地理更多>>
- 现代维吾尔语库车土语的语音特点初探
- 2022年
- 现代维吾尔语根据综合性标准划分为中心方言、和田方言、罗布泊方言等三大方言区。现代维吾尔语标准语是以乌鲁木齐土语音位系统为代表的中心方言的基础上形成和发展起来的。库车土语作为维吾尔语中心方言的一个分支,在现代维吾尔语标准语及方言研究中举足轻重的作用。作为一种语言的地方性变体,具备不同于维吾尔语其他方言土语的一些特点。文章从库车土语的语音演变特点出发,与维吾尔语标准语进行对比,探讨库车土语的语音特点。
- 依斯马依力·艾肯木
- 关键词:现代维吾尔语语音系统语音特点
- 澜沧拉祜族居民的语言态度及其影响因素分析被引量:2
- 2016年
- 语言使用与语言态度密切相关,语言态度在一定程度上制约着语言的变化,语言群体的态度值得关注。该研究从情感态度、理智态度、行为倾向性对拉祜族聚居区居民的语言态度进行分析,并通过使用SPSS工具对影响语言态度的因素进行客观、深入的探讨。
- 陈丽湘杨媛媛
- 关键词:拉祜族语言态度语言保持
- 云南瑞丽缅籍务工者汉语学习需求分析被引量:1
- 2022年
- 外籍务工者汉语学习的需求分析目的在于服务教学。以初级水平的缅籍务工汉语学习者为研究对象,通过调查问卷、观察、访谈等方式,调查分析云南瑞丽缅籍务工者的基本情况和汉语需求情况,包括目标需求和学习需求,并从课程目标、教学内容、教学方式、教师、教学语言、课外学习和活动6个方面提出教学建议,顺应了构建中缅命运共同体的时代需求。
- 庞仙赵小兵
- 关键词:汉语学习
- 面向残片缀合的敦煌文献图像数据集
- 2024年
- 敦煌文献是华夏各民族在漫长的历史中创造和遗留的珍贵遗产。由于年代久远,文献大多有不同程度的残损,缀合由此成为敦煌学研究的关键步骤。传统依靠人工缀合难度大、耗时长。近年来伴随计算机技术的进步,出现了计算机辅助的残片自动缀合技术。该技术的研究依赖于大规模图像数据的支持,而敦煌文献由于残损和收藏情况复杂,十分缺乏可用于缀合目的的高质量图像数据集。本数据集根据已发表的缀合论文收集了一批高质量残片图像数据,并补充了人工分割的图像数据,共计95组,366张。每组数据均包含1张完整的缀合参考图,及2-7张数量不等的残片。图像涉及文种主要为汉文,间有古藏文;涉及的文献收藏机构包括中国国家图书馆、大英图书馆、法国国家图书馆以及敦煌研究院等。数据收集、整理过程规范,经整理的可缀合组中的残片数量及残片来源的分布具备代表性,且图像质量较高,能够支持缀合算法或模型的训练和验证。
- 高歌殷梓轩李雪龙赵小兵翁彧
- 关键词:敦煌文献
- 基于多级注意力融合机制的藏文实体关系抽取被引量:2
- 2021年
- 与中英文相比,藏文实体关系训练语料规模较小,传统有监督的学习方法难以获得较高的准确率。针对基于远程监督的实体关系抽取存在错误标记的问题,利用远程监督方法将知识库与文本对齐,构建藏文实体关系抽取的数据集,提出一个基于多级注意力融合机制的藏文实体关系抽取模型。在词级别引入自注意力机制来提取单词的内部特征,在句子级别引入注意力机制为每个实例分配权重,从而充分利用包含信息的句子,减少噪声实例的权重。同时引入联合评分函数,修正远程监督的错误标签,并将神经网络与支持向量机结合,实现藏文实体关系分类。实验结果表明,提出的模型有效提高了藏文实体关系抽取的准确率,且优于基线模型效果。
- 王丽客孙媛刘思思
- 关键词:藏文实体关系抽取支持向量机
- 维吾尔语库车土语动词中的汉语语素及特点探析被引量:2
- 2022年
- 对库车土语中的动词汉语借词进行分类,对其构词方式、语音特点以及词义演变进行探究,了解到库车土语中的部分动词是由汉语名词附加维吾尔语动词词缀构造而成。进入维吾尔语的动词汉语借词在语音方面发生“替换”“增音”和“减音”现象。词义在原有意义基础上,发生“扩大”“缩小”和“转移”现象。维吾尔语库车土语中出现了大量的新词。
- 马莉马莉
- 关键词:维吾尔语汉语借词
- 计算语用学的研究发展概述
- 2022年
- 计算语用学以语用学为理论基础,是计算语言学的一个分支学科。本文从计算语用学定义和研究范围、理论研究、研究内容和方法、应用实例等梳理计算语用学的研究成果以及国内外相关研究发展动态,为后续本学科的深入研究提供了基础。
- 庞仙赵小兵
- 关键词:言语行为理论
- 基于目标语言预训练和联合解码的低资源语言端到端语音翻译
- 2023年
- 自动语音翻译(AST)是将源语言语音转换为目标语言文字的技术。目前,端到端的语音翻译成为AST的研究主流,但面临数据稀缺问题。该文首先利用机器翻译和人工检验构建了20h的维吾尔语-汉语AST语音翻译数据集。其次,为提高端到端语音翻译模型的性能,使用语料相对丰富的目标语言语音识别数据集预训练模型,不仅解决了数据稀缺造成的模型无法收敛问题,而且能让模型学到目标语言的语言学知识;再次,在预训练解码器前添加映射模块,使其学到源语言到目标语言知识的映射关系,由此构建了端到端语音翻译模型。最后,使用CTC与Attention联合解码,强制语音标签对齐,提高翻译效果。实验结果表明,在维汉语音翻译数据集上达到了61.45 BLEU值。
- 李宁李宁朱丽平仁曾卓玛赵小兵
- 关键词:端到端
- 中国少数民族语文政策知识库的构建及应用
- 2016年
- 本研究对少数民族语文政策知识库的构建过程、主要功能进行介绍;并通过具体实例展示如何利用领域知识库的知识信息进行语文政策扩散分析、历程分析。研究结果期待能在为语言政策和语言规划研究提供良好服务的同时,为语言文字政策的研究提供新的研究视角和方法论的参考。
- 陈丽湘
- 关键词:知识库知识扩散
- 澜沧拉祜族聚居区居民语言能力及其影响因素分析被引量:1
- 2017年
- 本研究对澜沧拉祜族自治县的三个调研点居民的母语、汉语普通话的使用情况及语言能力进行调研,采用SPSS软件对调研数据进行统计分析,得出语言能力主要与年龄、地域、语言态度、教育程度等因素相关的结论,并对结论作出了解释。
- 陈丽湘赵小兵
- 关键词:拉祜族语言使用语言能力