顾彦慧
- 作品数:40 被引量:96H指数:5
- 供职机构:南京师范大学更多>>
- 发文基金:国家自然科学基金江苏省高校自然科学研究项目国家社会科学基金更多>>
- 相关领域:自动化与计算机技术文化科学理学更多>>
- 一种融合了浮游藻类色素蛋白光谱与图像的水质分析方法
- 本发明公开了一种融合了浮游藻类色素蛋白光谱与图像的水质分析方法,包括如下组成部分:(1)光谱分析仪器模块:包括光谱仪、分光计,用于测量浮游藻类色素蛋白的光谱特征;(2)数据处理单元模块;(3)色素蛋白数据库模块:色素蛋白...
- 彭宁康姚佳怡时子延顾彦慧
- 一种高并发实时多属性聚合地图集群服务系统
- 本发明公开了一种高并发实时多属性聚合地图集群服务系统,包括用户前端服务模块、基于Hadoop的聚合地图集群服务模块、地理元数据服务模块、系统开发运维模块和代码版本库模块,所述用户前端服务模块由第一方客户端、直接服务接入模...
- 顾彦慧龙毅顾敏卢新宇曲维光周俊生陈燚陈伍香
- 基于特征融合的汉语被动句自动识别研究
- 2024年
- 汉语中的被动句根据有无被动标记词可分为有标记被动句和无标记被动句。由于其形态构成复杂多样,给自然语言理解带来很大困难,因此实现汉语被动句的自动识别对自然语言处理下游任务具有重要意义。该文构建了一个被动句语料库,提出了一个融合词性和动词论元框架信息的PC-BERT-CNN模型,对汉语被动句进行自动识别。实验结果表明,该文提出的模型能够准确地识别汉语被动句,其中有标记被动句识别F1值达到98.77%,无标记被动句识别F1值达到96.72%。
- 胡康曲维光曲维光魏庭新李斌李斌
- 关键词:汉语被动句自动识别语料库
- 基于神经网络的片段级中文命名实体识别被引量:20
- 2018年
- 命名实体识别是自然语言处理的一个重要基础任务。传统基于统计学习模型的命名实体识别方法严重依赖特征工程,特征设计需要大量人工参与和专家知识,而且已有的方法通常大多将中文命名实体识别任务看作一个字符序列标注问题,需要依赖局部字符标记区分实体边界。为了减弱系统对人工特征设计的依赖,避免字符序列化标注方法的不足,该文对基于神经网络的片段级中文命名实体识别方法进行探索研究。通过采用深度学习片段神经网络结构,实现特征的自动学习,并通过获取片段信息对片段整体分配标记,同时完成实体边界识别和分类。基于神经网络的片段级中文命名实体识别方法在MSRA数据集上对人名、地名和机构名识别的总体F1值达到了90.44%。
- 王蕾谢云周俊生顾彦慧曲维光
- 关键词:神经网络
- 面向中文AMR标注体系的兼语语料库构建及兼语结构识别被引量:1
- 2021年
- 兼语结构是汉语中常见的一种动词结构,由述宾短语与主谓短语共享兼语,结构复杂,给句法分析造成困难,因此兼语识别工作对于语义解析及下游任务都具有重要意义。但现存兼语语料库较少,面向中文抽象语义表示(AMR)标注体系的兼语语料库构建仍处于空白阶段。针对这一现状,该文总结出一套兼语语料库标注规范,构建了包含4760个兼语句的面向中文AMR标注体系的兼语语料库。基于构建的语料库,采用LA-BiLSTM-CRF模型识别兼语结构,达到了86.06%的F1,并分析了识别结果,提出了改进方向。
- 侯文惠曲维光魏庭新魏庭新李斌顾彦慧
- 关键词:兼语结构
- 基于转发图的微博事件主题摘要方法被引量:2
- 2014年
- 自动摘要是自然语言处理中研究文本主题提取的重要课题.传统的摘要研究侧重于新闻、Web网页和博客等长文本的主题提取.本文关注以微博为代表的短文本的主题摘要,提出基于图结构的微博主题区域划分方法,并采用LDA方法提取微博热点事件的主题信息.最后,通过可视化方式展现主题内容在微博转发中的变化.
- 赵斌吉根林曲维光顾彦慧
- 关键词:可视化
- 基于运动目标语义增强的多模态中学实验步骤检测方法及系统
- 本发明公开了一种基于运动目标语义增强的多模态中学实验步骤检测方法及系统,首先对视频帧预处理,通过帧差分获取运动区域,利用目标检测技术获取运动目标并使用BERT模型提取语义时序特征,再在编码器中对视频特征进行时序依赖建模获...
- 陈燚袁浩淼邢武略周俊生顾彦慧
- 基于神经网络的复句判定及其关系识别研究被引量:1
- 2021年
- 复句是自然语言的基本单位之一,复句的判定及其语义关系的识别,对于句法解析、篇章理解等都有着非常重要的作用。基于神经网络模型识别自然语料中的复句,判断其复句关系,构造复句判定和复句关系识别联合模型,以最大程度地减少误差传递。在复句判定任务中通过Bi-LSTM获得上下文语义信息,采用注意力机制捕获句内跨距离搭配信息,利用CNN捕获句子局部信息。在复句关系识别任务中,使用Bert增强句子的语义表示,运用Tree-LSTM对句法结构和成分标记进行建模。在CAMR中文语料上的实验结果表明,基于注意力机制的复句判定模型F1值达到91.7%,基于Tree-LSTM的复句关系识别模型F1值达到69.15%。在联合模型中,2项任务的F1值分别达到92.15%和66.25%,说明联合学习能够使不同任务获得更多特征,从而提高模型性能。
- 贾旭楠魏庭新曲维光曲维光顾彦慧
- 关键词:神经网络语义建模
- 基于神经网络的连动句识别被引量:1
- 2022年
- 连动句是具备连动结构的句子,是汉语中一种特殊的句法结构,在现代汉语中十分常见且使用频繁。连动句语法结构和语义关系都很复杂,在识别中存在许多问题,对此该文针对连动句的识别问题进行了研究,提出了一种基于神经网络的连动句识别方法。该方法分两步:第一步,运用简单的规则对语料进行预处理;第二步,利用文本分类的思想,使用BERT编码,利用多层CNN与BiLSTM模型联合提取特征进行分类,进而完成连动句识别任务。在人工标注的语料上进行实验,实验结果达到92.71%的准确率,F_(1)值为87.41%。
- 孙超曲维光曲维光顾彦慧魏庭新顾彦慧
- 关键词:连动句文本分类神经网络
- 基于Alpha-Beta剪枝与大语言模型加速催化材料筛选的方法
- 本发明提出了一种基于Alpha‑Beta剪枝与大语言模型(LLM)的催化剂快速筛选方法。这一系统旨在通过先进的LLM技术,在催化剂材料空间增强科学推理加速筛选。方法主要由以下模块组成:催化材料快速筛选模块,大语言模型催化...
- 卢新宇顾彦慧彭宁康李猛