西北民族大学中国民族语言文字信息技术重点实验室 作品数:105 被引量:205 H指数:8 相关作者: 杨阳蕊 丁丽娟 胡妍茹 史菁 韩瑛 更多>> 相关机构: 北京大学中国语言文学系 北京大学中国语言文学系汉语语言学研究中心 周口师范学院计算机科学系 更多>> 发文基金: 国家自然科学基金 中央高校基本科研业务费专项资金 国家社会科学基金 更多>> 相关领域: 自动化与计算机技术 语言文字 电子电信 一般工业技术 更多>>
多模态语音实验室在语言研究中的应用 被引量:1 2012年 各学科借助现代设备和方法,促进自身的发展,是目前科学研究工作的趋势.文章就多模态语音实验室建立的方法及所需的软硬件设备作了概述,并举例阐述多模态的研究方法及在语言研究中的应用,为语言研究和语言教学工作提供借鉴. 胡阿旭 陈贵萍 于洪志关键词:语言研究 基于CRF的维吾尔文命名实体识别研究 2012年 在国内外机器翻译、信息检索等领域中英文及中文的命名实体研究技术基本成熟,但是维吾尔文命名实体识别还处于初步阶段,本文中笔者通过条件随机场模型(Conditional Random Fields,CRF)研究维吾尔文命名实体中的维吾尔族人名、新疆地名、及新疆组织机构名,以此实验来验证这三类实体的识别正确率。 努尔比亚·吐拉甫 于洪志 李亚超关键词:维吾尔文 蒙古族大学生汉语不同文本阅读眼动研究 被引量:5 2012年 文章以10名蒙古族大学生为被试,采用眼动仪记录阅读10类不同汉语文体的9项眼动数据,得出蒙古族大学在汉语阅读时,眼动各参数和文体的熟悉度及所处的历史时期有着密切的联系,文体所处的年代越早,熟悉度越低,阅读难度越大.总体上阅读成绩要低于汉族学生. 陈贵萍 胡阿旭 于洪志关键词:蒙古族大学生 汉语文本 不同文体 眼动研究 CRF与规则相结合的藏文人名识别方法 被引量:1 2016年 文章就藏文人名本身的特性分析了人名识别的难点,提出了CRF与规则相结合的藏文人名识别方法.该方法首先以CRF作为机器学习模型,充分利用藏文人名的各类特征,然后针对人名不能全面召回的问题,利用规则方法进行后处理,最终建立了一种优势互补的识别模型.实验结果表明,该文提出的方法具有较好的性能,F-值可达91.55. 加羊吉 李亚超 于洪志关键词:CRF模型 广灵方言单字调实验研究 被引量:2 2017年 文章运用语音实验的方法对广灵方言的声调进行研究,并对其基频进行归一化处理,分析该方言声调的类型及分化情况,讨论其基频变化和音域范围,最后得出广灵方言中共有四个声调,分别是阴平(52)、阳平(41)、上声(44)、去声(413),其中阴平和阳平有合并的趋势.本文的主要目的是对广灵方言声调的实际情况进行客观描写,为今后深入研究广灵方言提供一定的参考. 王红洁 李永宏关键词:声调 语音实验 藏语音素音位系统的功能负担计算 2010年 文章通过引入传统语言学中"音位功能负担"的研究思路,以藏语的音素音位系统为研究对象,对拉萨话和夏河话的元音、辅音及声调的音位功能负担进行了量化研究,结果表明夏河话和拉萨话元音的音位功能负担差别不大,拉萨话辅音和声调音位功能负担的总和与夏河话辅音非常接近。夏河话复辅音中前置复音和部分辅音韵尾的脱落所造成的信息量的损失转移到声调上去,从而为历史语言中关于方言分化和声调产生理论提供了参考基础。 杨阳蕊 周一心 于洪志关键词:音位 区别性特征 藏语 信息熵 基于ERP 实验的两类汉语单字词类歧义研究 歧义现象是包括汉语在内的许多语言中客观存在的 一种重要的复杂语言现象。本文采用ERP技术,基于ERP数据 及溯源定位相结合的研究方法,以两类最常用的汉语单字的 词类歧义作为研究对象(1.名/动类兼词,简称N/V; 2.形...关键词:汉语 ERP 文献传递 网络资源链接 PowerLab生物信号处理系统在音语生理研究中的应用 被引量:2 2010年 随着科学技术的进步和先进仪器的出现,生理语音学研究正在向采用高精端设备,进行多模态研究的方向发展。本文通过PowerLab硬软件的介绍,主要从肌电采集器、呼吸带和脑电帽三个方面,重点阐述了每项设备的工作原理、提取的参数和在言语生理研究中的应用。PowerLab生物信号处理系统在语音生理研究中有着广阔的应用前景。 孙婷 李永宏 于洪志关键词:肌电 脑电 生理语音学 基于改进卡方统计量的藏文文本表示方法 被引量:4 2014年 藏文文本表示是将非结构化的藏文文本转换为计算机能够处理的数据形式,是藏文文本分类、文本聚类等领域特征抽取的前提。传统的藏文文本表示方法较少考虑特征项之间的关联度,容易造成语义损失。为此,结合向量空间模型,提出一种新的藏文文本表示方法。提取文本中词频统计TF-IDF值较高的部分词项作为对比词项,对藏文文本进行断句处理,以每个句子作为一个语境主题,利用卡方统计量计算文本中词项与对比词项的关联程度。实验结果表明,与传统的向量空间模型相比,该方法能更准确地表示藏文文本。 徐涛 于洪志 加羊吉关键词:藏文信息处理 文本表示 向量空间模型 基于EPG信号的蒙古语复辅音的发音特征研究 被引量:1 2011年 在动态腭位研究方法的基础上,对蒙古语中以双唇音、舌尖音、舌面音为前置辅音的复辅音舌腭接触面积和舌位特征进行了探究,得出以下结论:①蒙古语复辅音中拥有共同持阻段的接触面积会相对大于没有共同的持阻段的接触面积.②前置音为舌尖音时在齿龈区舌腭接触越靠前其AC值将较大.③后置辅音为擦音或塞擦音的复辅音,在形成擦段时需舌体的抬起,因而PC和VC值为最高. 金雅声 格根塔娜 胡阿旭关键词:蒙古语 复辅音 发音特征 EPG