胡慧君 作品数:47 被引量:138 H指数:6 供职机构: 武汉科技大学计算机科学与技术学院 更多>> 发文基金: 国家社会科学基金 湖北省教育厅人文社会科学研究项目 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 文化科学 轻工技术与工程 经济管理 更多>>
《编译原理》中的离散数学基础理论还原研究 2013年 从离散数学角度出发考察《编译原理》课程内容,致力于还原《编译原理》课程内容中的离散数学基础理论。涉及到的《编译原理》课程内容包括形式语言、有穷自动机、语法分析、形式化以及语言运算等,还原的离散数学基础包括等价、演绎与归纳、图论以及代数系统。针对计算机相关专业大学生,通过《编译原理》课程内容中离散数学基础理论的还原,培养离散数学意识,提高离散数学修养,加强学习《编译原理》和《离散数学》课程的兴趣。 胡慧君 刘茂福关键词:离散数学 等价原理 形式语言 有穷自动机 代数系统 基于逆类别注意力机制的电商文本分类 2021年 电商数据所属类别对于分析电商数据有重要意义,基于人力的分类无法适应如今海量的电商数据,基于传统算法模型的分类难以提取有价值的人工特征.本文采用BiLSTM模型并且引入注意力机制,将其应用于电商数据分类中.该模型包括Embedding层、BiLSTM层、注意力机制层和输出层.Embedding层加载Word2Vec开源工具训练得到的词向量,BiLSTM层捕捉每个词语的上下文信息,注意力机制层为每个词语分配权重,合成新的样本特征.实验表明,基于逆类别率的注意力机制在电商数据的分类准确率达到91.93%,与不加注意力机制的BiLSTM模型和其他引入的注意力机制相比,均有不同程度的提高.此模型电商数据分类中有良好的效果,为注意力机制的引入提供了新的思考方向. 王维 胡慧君 刘茂福关键词:文本分类 面向包装印刷业的设计与生产智能辅助系统 胡威 柯鹏 李文翔 胡慧君 陈黎 徐新 刘茂福 郭宏 梁平 赵婉青 黎文飞 胡雷 鲁俊良 田佳 中国包装印刷业面临迫切的产业升级需要,产品设计生产的效率和质量是竞争力的重要核心。现有生产流程设计、打样和生产环节对人工依赖性强,导致设计与生产周期长、效率低、成本高,无法满足发展要求。该项目对包装印刷设计生产流程进行分...关键词: 基于依存句法的可解释图像描述生成 2023年 已有图像描述生成模型虽可以检测与表示图像目标实体及其视觉关系,但没有从文本句法关系角度关注模型的可解释性.因而,提出基于依存句法三元组的可解释图像描述生成模型(interpretable image caption generation based on dependency syntax triplets modeling,IDSTM),以多任务学习的方式生成依存句法三元组序列和图像描述.IDSTM模型首先通过依存句法编码器从输入图像获得潜在的依存句法特征,并与依存句法三元组及文本词嵌入向量合并输入单层长短期记忆网络(long short-term memory,LSTM),生成依存句法三元组序列作为先验知识;接着,将依存句法特征输入到图像描述编码器中,提取视觉实体词特征;最后,采用硬限制和软限制2种机制,将依存句法和关系特征融合到双层LSTM,从而生成图像描述.通过依存句法三元组序列生成任务,IDSTM在未显著降低生成的图像描述精确度的前提下,提高了其可解释性.还提出了评测依存句法三元组序列生成质量的评价指标B1-DS(BLEU-1-DS),B4-DS(BLEU-4-DS),M-DS(METEOR-DS),并在MSCOCO数据集上的实验验证了IDSTM的有效性和可解释性. 刘茂福 毕健旗 周冰颖 胡慧君关键词:可解释性 多任务学习 基于权值模型的灰度图像二值化算法定量评估方法 本发明涉及一种基于权值模型的灰度图像二值化算法定量评估方法。其技术方案为:先对灰度图像A使用n(n为7~20的自然数)种灰度图像二值化算法进行二值化处理,再对生成的二值图像集进行处理,得到灰度图像A的前景点权值矩阵和背景... 胡慧君 刘亚 刘茂福文献传递 中文文本中实体数值型关系无监督抽取方法 被引量:6 2016年 中文实体间的数值型关系抽取有着广泛的应用前景,目前常用的实体关系抽取一般采用有监督抽取方法,且多用于短文本和简单句,并不适合处理海量复杂句.针对来自于网络的大量复杂文本,本文提出了一种中文实体数值型关系的无监督抽取方法.在中文分词、词性标注等自然语言处理结果的基础上,首先经过句式分析并采用选择树算法构建候选集,接着利用Jaro-Winkler距离进行候选集筛选,最后抽取得到数值型三元组关系.本文在钢铁、船舶、房地产3个行业的数据上进行了实验,结果表明,该方法抽取中文实体数值型关系是有效的. 吴胜 刘茂福 胡慧君 张志清 顾进广关键词:实体关系抽取 信息抽取 一种面向情感数据标注的交叉验证方法、设备和存储介质 本发明提供了一种面向情感数据标注的交叉验证方法、设备和存储介质,方法包括,获得初始数据,将同一份初始数据复制生成多份相同数据,并对数据进行切分,将切分后的数据分发给标注员进行标注,将标注好的数据收集后重新进行整合,获得多... 胡慧君 丁子毅 刘茂福 高峰基于联合神经网络模型的中文医疗实体分类与关系抽取 被引量:15 2019年 近年来,医疗健康领域的实体分类与关系抽取引起了广泛关注。以往工作大多采用流水线模型,此类模型容易忽略任务间联系并造成错误传播,而联合学习则能够很好地避免这2个问题。为此,把卷积神经网络与支持向量机、条件随机场相结合,构建了联合神经网络模型。在此模型基础上,以参数共享的方式,分别通过任务联合、模型联合以及特征联合对实体分类与关系抽取2个任务进行联合学习,在药品说明书语料库中取得了非常不错的效果,实体分类和关系抽取的 F 值分别达到了98.0%和98.3%。实验表明,联合神经网络模型对于实体分类和关系抽取是非常有效的。 张玉坤 刘茂福 胡慧君关键词:关系抽取 COVID-19物资知识图谱的构建 被引量:13 2020年 新型冠状病毒肺炎(corona virus disease 2019,COVID-19)由于其高传染性和长潜伏期受到世界各地的广泛关注。为了更好地服务医疗问答系统等相关领域,本文结合自顶向下与自底向上两种方式半自动化构建了COVID-19物资知识图谱。首先,根据实际需求讨论确定了物资的主体结构,主要包括医用防护装备、医用防护设施、日常防护用品、医用诊疗设备以及治疗用药五大类,然后通过政府公文、医学网站、百科类网站以及各大电商网站等权威数据细分知识图谱本体层,并添加物资实体,同时,为了使世界各地的研究者们能方便地使用COVID-19物资知识图谱,所有中文都通过机器翻译成了英文并由人工校验。为了保证数据的可靠性,将通过随机采样对知识图谱进行人工审查,准确率为98.73%。最后,通过WebVOWL对COVID-19物资图谱进行可视化展示,并根据前沿科技应用介绍本知识图谱的优秀应用场景。 向军毅 胡慧君 刘宇 刘宇 唐东昕 刘茂福关键词:知识图谱 医用物资 基于问题分解的多跳机器阅读理解模型 被引量:1 2022年 多跳机器阅读理解是自然语言处理领域最困难的任务之一,需要在多个段落之间进行推理。多跳机器阅读理解任务中的复杂问题一般由多个简单问题融合而成,可以通过分解复杂问题使模型更好地理解问题。因此,针对复杂多跳问题,提出了一种基于问题分解的多跳阅读理解模型。该模型首先将多跳问题分解为多个单跳问题,然后利用单跳阅读理解模型对其进行求解。将问题分解视作一个阅读理解任务:多跳问题是问题分解的上下文,而包含问题答案的证据段落则是问题。阅读理解任务捕捉了多跳问题和证据段落之间的交互语义信息,可以指导多跳问题中单跳问题的抽取。所提模型的BLEU值和Rouge-L值分别为71.48%和79.29%。实验结果表明,该模型对多跳机器阅读理解是有效的。 周展朝 刘茂福 胡慧君