张华 作品数:6 被引量:8 H指数:3 供职机构: 浙江工商大学计算机与信息工程学院 更多>> 发文基金: 国家自然科学基金 浙江省自然科学基金 天津市自然科学基金 更多>> 相关领域: 理学 自动化与计算机技术 一般工业技术 更多>>
一种基于主题过滤和语义匹配的服务发现方法 被引量:3 2022年 在互联网现有的大量可用的服务中,如何高效的为特定的业务目标匹配合适的服务是目前研究的一大难题。针对这一问题,提出一种基于主题过滤和语义匹配的可用于海量服务发现的方法。首先,使用Word2Vec对主题描述文本和业务目标描述文本进行相似度比较,获取业务目标主题。其次,使用TextRank对服务描述文本提取服务关键句,通过提取到的业务目标主题对服务关键句进行过滤,缩小比较范围。再次,对相应的业务目标与服务描述文本进行词向量提取,使用带注意力机制BiLSTM模型计算两者相似度并返回与业务目标描述文本最相似的前N个服务列表给业务开发人员进行选择,并对从Programmable Web上爬取的数据进行标注,以此建立实验所需的业务目标-服务句子数据集,评估本文方法的有效性。最后,与TextCNN等模型进行对比,结果表明:本文方法的MAP比不带注意力机制的BiLSTM模型、TextCNN模型、Word2VecSD模型分别提高了1.41百分点、4.61百分点和4.95百分点,并且在今后的工作中有进一步改进的潜力。 周澳回 翁知远 周思源 黄乔 汪烨 张华关键词:循环神经网络 自然语言处理 用SVM和FFT对膜蛋白功能分类 2009年 膜蛋白在细胞生命活动中扮演着重要的角色。目前,有很多方法用来预测和分类膜转运蛋白。然而,预测膜蛋白功能的工作并不多。为了解决这个问题,基于蛋白质序列信息结合快速傅里叶变换利用支持向量机的方法预测来自TCDB数据库中的channels/pores,electrochemical potential-driven transporters和primary active transporters三类膜转运蛋白共1817条蛋白质的功能。模型使用20种氨基酸的分布,残基的疏水性、平均极性和溶剂化自由能为原始的特征数据,利用快速傅里叶变换将其转化为频域上的信息作为机器学习的特征输入。通过五倍交叉检验预测准确率达到了72.1%,而先前的文献报道的准确率为68.1%。论文的研究证明该方法可以有效地对channels/pores,electrochemical potential-driven transporters和primary active transporters三种不同功能的膜转运蛋白进行功能分类。 高建召 王奎 胡刚 张华关键词:支持向量机 快速傅里叶变换 疏水性 基于情景特征的前馈动态集成分类器 2013年 集成分类器已被广泛应用于数据流分类模型以此削弱概念漂移的影响。通常当基分类器的分类准确率低于特定的阈值时,集成分类器开始学习代替分类准确率低的分类器,以此来克服概念漂移的影响。但仅当基分类器的错误率低于阈值时才开始学习会使集成分类器对当前概念的判断产生一定滞后性,所以本文在集成分类器的基础上,融入了情景特征的分析,采用信息增益的方法提取情景特征,通过动态设置情景特征的阈值来提前预测概念漂移的发生。当情景特征的变化超出情景阈值时,立即通知集成分类器重新学习产生新的基分类器,而不是等到基分类器的准确率低于集成分类器的阈值时才开始学习,这样便使集成分类器具有了一定的前馈性。通过对特定数据的实验分析,证明了本文提出的OCEC(Origin Characteristics Ensemble Classifier)模型降低了挖掘概念漂移数据流时的集成泛化误差,提高了检测概念漂移的有效性。 琚春华 邹江波 魏建良 张华关键词:数据流 概念漂移 前馈 统计深度的几何推广 2010年 改进统计深度的定义,并将点的深度概念推广到直线与平面的深度,由此得到深度计算的基本定理和深度的一系列性质.最后讨论应用展望. 张华 胡刚 沈世镒氨基酸在蛋白质空间结构中的深度倾向性因子 被引量:4 2007年 用统计和几何方法给出了氨基酸在蛋白质空间结构中的深度计算,并利用PDB数据库得到了不同氨基酸在蛋白质中的深度倾向性因子,并得到了这些倾向性因子与氨基酸的物理、化学综合特性的相关性质. 沈世镒 胡刚 张华蛋白质空间形态特征分析与计算方法 被引量:3 2006年 本文的主要目的是把空间多面体、超图与深度这三个概念综合起来,作为描述与分析空间质点系形态的基本工具。在此基础上,我们针对蛋白质空间形态中的二种重要特征: “空洞”与“口袋”,用小球滚动法给出它们的计算方法。 沈世镒 胡刚 张华关键词:超图