周喜
- 作品数:114 被引量:186H指数:8
- 供职机构:中国科学院新疆理化技术研究所更多>>
- 发文基金:中国科学院西部之光基金中国科学院西部行动计划项目新疆维吾尔自治区重点实验室开放课题基金更多>>
- 相关领域:自动化与计算机技术文化科学电子电信自然科学总论更多>>
- 基于词缀的维吾尔谚语识别关键技术研究
- 2018年
- 在自然语言理解、机器翻译、舆情分析等自然语言处理领域中,维吾尔谚语识别是整个文本实体识别的重要组成部分。为满足维吾尔谚语信息化的需求,本文构建了比较完善的维吾尔谚语语料库。同时,从传统语言学角度对维吾尔谚语的语法、语义结构进行分析,构建了一个由维吾尔谚语功能语类(词缀)组成的、专属维吾尔谚语规则的知识库,并将此知识库与自然语言处理技术相结合,实现一个既能够从文本中识别出维吾尔谚语,又能提供维汉互译等功能的信息软件系统。该系统也为开展计算机理解与处理维吾尔文字奠定了一个崭新的基础。
- 穆妮热.穆合塔尔李晓杨雅婷杨雅婷周喜
- 关键词:维吾尔谚语
- 基于多语种信息技术的汉语学习辅助系统被引量:4
- 2011年
- 介绍新疆地区汉语学习的现状和开发面向新疆地区的计算机辅助汉语学习系统的必要性。提出需要解决的问题和目标,描述发音评测、动态翻译等多语种关键技术的实现原理和步骤。应用关键技术实现多语言版本的汉语学习辅助系统,可以有效地辅助汉语学习,但尚需进一步完善。该系统有利于新疆地区的双语教学和普通话普及,具有一定的推广意义。
- 彭祥伟李鹏李鹏王磊
- 关键词:计算机辅助语言学习汉语学习动态翻译
- 基于汉语关键词的维吾尔语关键词生成方法、装置、电子设备及存储介质
- 本发明公开了一种基于汉语关键词的维吾尔语关键词生成方法、装置、电子设备及存储介质,涉及信息处理领域,尤其涉及文本过滤、内容监管领域。具体实现方案为:利用汉维双语将汉语关键词翻译为维吾尔语关键词;对获得的维吾尔语关键词进行...
- 杨雅婷艾孜麦提·艾尼瓦尔董瑞马博王磊周喜
- 文献传递
- 面向维吾尔文不平衡数据分类的特征选择方法被引量:3
- 2013年
- 为解决维吾尔文文本分类中不平衡数据集问题,提出了一种改进的卡方特征选择方法。结合维吾尔文的语言特性对文本进行预处理,降低特征空间维度;运用卡方和逆文档频数相结合的方法进行特征选择,进一步降低特征空间维数;使用朴素贝叶斯分类器进行分类。在维吾尔文不平衡语料库上进行的实验表明,提出的特征选择方法在不平衡数据集中要优于卡方和信息增益特征选择方法。
- 董瑞周喜
- 关键词:不平衡数据文本分类维吾尔文信息增益
- 基于重建误差的任务型对话未知意图检测
- 2023年
- 现有未知意图检测模型通常将语句映射到向量空间,并使用局部异常因子算法定义密度较小的特征点为未知意图,但经交叉熵损失训练的已知意图特征簇更加狭长,簇内的整体间距、密度和分散情况不均匀,进而增加了检测难度。针对上述问题,提出一种基于自动编码器重建误差的未知意图检测模型。在训练阶段,使用融入标签知识的联合损失函数训练已知意图分类器,使已知意图特征类间距离大且类内距离小,并利用这些特征训练一个仅能获取已知意图信息的自动编码器。在测试阶段,利用自动编码器将重建误差较大的样本视为未知意图,其余样本视为已知意图正常分类。在SNIPS数据集上的实验结果表明,在已知意图占比为25%、50%、75%时,该模型的Macro F1得分相比于表现最优的增强语义的高斯混合损失基线模型分别提升了16.93%、1.14%和2.37%,能够检测到更多的未知意图样本,同时在类别分布极不平衡的ATIS数据集上也有较好的性能表现。
- 毕然王轶周喜
- 关键词:意图识别损失函数
- 面向资源缺乏语言的实体链接系统
- 本发明涉及一种面向资源缺乏语言的实体链接系统,该系统采用基于规则和统计相结合的方法,对维吾尔语词汇进行词干切分和词性标注;根据实体指称项的上下文,对实体指称项进行扩充,通过机器翻译的双语对齐技术,实现汉语和维吾尔语词汇的...
- 蒋同海李晓马博王磊周喜赵凡杨雅婷
- 文献传递
- 一种基于混合隶属度随机块模型的蛋白质相互作用预测方法和系统
- 本发明公开了一种基于混合隶属度随机块模型的蛋白质相互作用预测方法和系统,该系统由数据处理模块、复合物隶属度计算模块和结果生成模块组成,基于随机块的蛋白质相互作用预测方法,从数据库中获取蛋白质相互作用数据,对获得的数据进行...
- 胡伦王小娟周喜蒋同海苏小芮
- 文献传递
- 改进的关联分类算法在信息化评估中的应用
- 2011年
- 在信息化评估过程中,传统关联分类算法无法优先发现短规则,且分类精度对规则次序的依赖较强。为此,提出基于子集支持度和多规则分类的关联分类算法,将训练集按待分类属性归类,利用子集支持度挖掘关联规则,通过计算类平均支持度对测试集进行分类。实验结果表明,该算法发现规则的能力和分类精度均优于传统方法。
- 马博杨雅婷周喜胡斌华
- 关键词:数据挖掘信息化
- 一种属性图聚类方法及系统
- 本发明提供了一种属性图聚类方法及系统,所述方法包括:将属性图输入训练好的属性图聚类模型,输出隶属度矩阵,将属性图中的每个节点划分到其隶属度最大的簇中;所述属性图聚类模型为图卷积神经网络模型;所述属性图聚类模型的训练过程为...
- 胡伦杨月赵博伟周喜马玉鹏
- 基于国产Linux系统跨平台的综合资源应用开发关键技术与应用研究
- 刘稚李晓蒋同海梁剑周喜胡彬华王磊丁景全庆军毕祥玉李桃陈俊红周宇杨晴雯王丽王晓博杜欢
- “基于国产Linux系统的综合资源应用系统关键技术与应用研究”。主要针对政府综合资源信息服务领域,研究整合现有政府信息资源以及政务业务的具体模式、安全策略、远程维护的关键技术和整体解决方案,同时研究开发跨平台的信息整合与...
- 关键词:
- 关键词:LINUX跨平台