李爱萍
- 作品数:32 被引量:176H指数:7
- 供职机构:太原理工大学更多>>
- 发文基金:山西省自然科学基金国家重点实验室开放基金武汉大学软件工程国家重点实验室开放课题基金更多>>
- 相关领域:自动化与计算机技术电子电信文化科学轻工技术与工程更多>>
- 实体词语义信息对中文实体关系抽取的作用研究被引量:7
- 2017年
- 为了探索从外部词典提取的实体词语义信息在中文实体关系抽取上的作用,提出了知网语义树和《同义词词林》编码树两种新特征,并连同已有的最短路径依存树、知网第一基本义原、《同义词词林》编码、实体大类和实体小类特征一起探究了其对抽取性能的影响。实验数据表明,作为单一特征时,提出的两种新特征性能虽然不如实体大类和实体小类特征,但是比最短路径依存树、知网第一基本义原、《同义词词林》编码好;作为组合特征时,最短路径依存树和两种新特征的组合特征取得了最好的性能。由此可以得出结论,从非语料中获取的最短路径依存树、知网语义树和《同义词词林》编码树特征可以代替从语料中获取的实体大类和实体小类特征,可以用于下一步开放域的关系抽取。
- 段利国徐庆李爱萍崔敏君
- 关键词:知网树核函数关系抽取
- 查询交互响应时间预测模型的采样优化被引量:5
- 2015年
- 在数据库系统和云计算环境中运行并行负载是一种常态,这些系统需要满足其服务等级协议(Service Level Agreements,SLA).响应时间是系统调度负载并满足SLAs的最重要的指标,准确预测数据库系统并行负载(查询)的响应时间必须要考虑并行执行的查询之间的相互影响—查询交互.目前基于查询交互的查询响应时间预测方法主要以实验驱动的方法建模,需要大量的实验采样.由于数据量的爆发式增长导致负载运行时间不断增长,进行一次完整的建模所需的开销非常大.合理减少建模所需采样数目,可以有效降低建模所需成本和提高建模效率.本文基于查询交互的BAL(Buffer Access Latency)模型提出一种采样策略[1],在不运行样本的情况下,使用已有的测量结果预测样本运行的响应时间,并依据预测对全样本空间聚类,然后根据聚类结果进行采样.实验表明,此方法相比常用的拉丁超立方抽样方法减少33%样本数目,并且保持了模型的预测精度.
- 张锦文牛保宁李爱萍
- 基于句子情感加权算法的篇章情感分析被引量:11
- 2015年
- 针对篇章级的文本情感倾向性分析准确率不高的问题,提出一种新的基于句子加权算法的篇章级文本情感倾向性分析方法.该方法将文本细化为句子的集合,在充分分析汉语中各种句子的句式结构特点的基础上,对复杂句采用新的情感判断规则判别情感,对简单句采用朴素贝叶斯算法判别情感,依据新提出的句子情感值的计算规则为每个句子赋予情感权值,最后依据此次研究提出的句子情感权值合成算法计算得出篇章级文本的情感倾向性.在实验中,使用本文所提出的方法对篇章级文本进行情感分析获得了较好的准确率、召回率和F值.实验证明,基于句子加权算法的情感分析方法要比传统的文本分类方法效率更高.
- 李爱萍邸鹏段利国
- 关键词:复杂句简单句
- 基于实体词语义相似度的中文实体关系抽取被引量:4
- 2015年
- 为了探索语义相似度在中文实体关系抽取上的作用,提出由实体词在《同义词词林》中的5层编码构建成的《同义词词林》编码树和由关系实例中的实体词,各个类别中所有实体词计算相似度后求得的平均值构建成的实体词语义相似度树2种新特征,并连同已有的《同义词词林》编码、实体类型信息共4种特征探究其对抽取性能的影响。单一特征的试验中,实体类型特征效果最好,F值达到了小类84.9、大类83.2;组合特征的试验中,实体类型和《同义词词林》编码树的组合特征效果最好,大类小类的F值都比实体类型特征提高了2.5,3种组合特征性能不升反降。试验结果表明《同义词词林》编码树是对实体类型的有效补充,但过多的特征会造成信息冗余,使抽取性能下降。
- 徐庆段利国李爱萍阴桂梅
- 关键词:中文实体关系抽取语义相似度树核函数语法树
- 基于可视化测试软件平台GTEST的ATLAS翻译器的研究与实现
- ATLAS是一种广泛应用于军事装备和航空电子领域的测试语言规范,目前国内尚没有完全自主知识产权的ATLAS编译器类的软件产品。ATLAS编译器构造的工作量非常大,是构造常规的高级编程语言编译器工作量的数倍。本文着力研究从...
- 李爱萍
- 关键词:高级编程语言自动测试系统词法分析语义翻译
- 文献传递
- 智能家居平台构件适应与协同模型及形式化分析
- 智能家居平台的构件适应与协同问题是平台研发和运行过程中需要解决的关键问题.由于缺少形式化的理论研究,目前对该过程及结果正确性的验证方法尚属空白.本文提出一种基于构件适应与协同的智能家居平台逻辑模型,对平台及各构件进行形式...
- 马俊伟李爱萍段利国
- 关键词:形式化描述
- 文献传递
- 融合多种神经网络与多特征的答案排序方法
- 2021年
- 针对答案排序问题,提出并构建融合多种神经网络与多特征的答案排序模型。将问题和候选答案的词向量送入使用Leaky Relu激活函数的卷积神经网络进行学习,得到的学习结果与词汇特征、主题特征等相互拼接,输入到双向门控循环单元,其输出结果经由多层感知器进行处理后,通过softmax分类器得出最终答案排序的结果。实验结果表明,该模型在WikiQACorpus数据集上取得了较好实验结果,准确率略高于已有基线模型,达到74.43%。
- 王龙段利国李爱萍
- 关键词:卷积神经网络
- 基于UML的自动测试系统建模方法研究被引量:7
- 2006年
- 为提供自动测试系统的领域知识,在对自动测试系统的特性进行研究的基础上,将UML引入自动测试系统的建模过程中,利用UML的扩展机制为自动测试系统的框架开发提供该领域的知识。通过为一个自动测试系统开发平台不同于常规软件产品部分的建模实例,给出了自动测试系统的特定领域知识的表达方式。
- 李爱萍王家礼段利国
- 关键词:自动测试系统领域知识
- 基于小波聚类的数据集简化算法研究被引量:4
- 2006年
- 大数据集没有非常有效的简化方法。提出一种基于小波聚类的数据预处理的算法DPWaveCluster,该算法包括量化特征空间、小波变换、聚类、形成查找表、映射数据点到聚类,以及按要求在聚类标识周围选取适当数据点形成简化数据集等操作步骤。利用小波变换的多分辨分析特性获得无监督聚类来帮助简化数据集。通过synthetic_dat和topo标准数据集的仿真实验表明,该算法实现简化大数据集高效而适用。
- 段利国李爱萍曹啸
- 关键词:数据集小波变换聚类
- 基于复杂句式短文本情感分类研究被引量:2
- 2018年
- 目前,网络文本中主观内容的情感倾向性识别成为文本信息处理的研究热点。针对汉语中复杂句式的结构特点以及对多种复杂句式的有效分析,基于word2vec进行情感词典的扩建,将扩充后的情感词典、关联词表、否定词表进行特征提取,得到有效的特征词序列,构建新的复杂句式模型并结合SVM进行训练和预测,完成复杂句式情感分类。实验结果表明,提出的复杂句式情感分类模型在处理精度方面比传统的句子级情感分类方法有了明显的提高,获得良好的情感分析效果。
- 李毅捷段利国李爱萍
- 关键词:文本信息处理情感分析SVM