黄岚 作品数:14 被引量:16 H指数:2 供职机构: 长江大学 更多>> 相关领域: 自动化与计算机技术 文化科学 经济管理 更多>>
基于深度学习的有监督实体关系抽取方法对比研究 2021年 系统揭示深度学习主流模型的原理,并探究其在有监督实体关系抽取任务中的效果差异。对目前的主流技术范式、关键技术、研究进展和存在的问题进行了分析总结,然后以有监督的实体关系抽取任务为基础,对比研究了几种典型的深度学习模型和预训练语言模型,对其有效性进行了实验分析。不同模型关系抽取准确率在关系种类上的分布也有较大差异,BERT模型在标准数据集上取得的F1值高于基于CNN和基于PCNN的模型,同时具备更好的鲁棒性。BERT模型的整体性能优于其他两种模型,能适用于更普遍的情况。 王鼎乾 胡卓涵 黄政龙 梁倩倩 黄岚关键词:自然语言处理 关系抽取 神经网络 基于SolrCloud的分布式分面信息检索系统设计与实现 2017年 针对大数据时代海量信息给信息索引和检索带来的挑战,笔者以企业级开源全文检索服务器Solr的分布式模式SolrCloud为基础,设计并实现了一个分布式分面信息检索原型系统。以新浪微博数据为例,通过单机与集群对比实验对该系统分布式索引和检索的性能进行了评估,实验结果显示该系统能够快速有效检索微博信息。 黄岚 周娟关键词:SOLR 一种信用卡欺诈检测方法 本发明公开了一种信用卡欺诈检测方法,包括以下步骤:S1:获取训练数据集;S2:将S1获取的训练数据集进行数据探索性分析,得到数据集中各个特征的重要性和功能性,以及各个特征与其他特征之间的联系;S3:对S2处理后的特征进行... 江琼琴 宋文广 赵俊峰 陈汉林 郭国民 刘小灵 苏宏发 杨瑾 赵莉 崔艳荣 张健 余谦 雷鸣 黄岚 钟宝荣文献传递 基于关键人物的分布式视频检索系统设计与实现 2017年 针对基于关键人物的视频检索问题,以Hadoop分布式计算平台为支撑,设计并实现了一个可处理大量视频数据的分布式视频检索原型系统。分析了系统的三大关键问题:基于人脸检测的视频帧提取、基于人脸匹配的视频帧筛选和基于PCA的相关视频检索。以2014年大数据竞赛提供的TED演讲视频基准数据集为例,对系统实现效果和检索性能进行了评测。 黄岚 周娟关键词:视频检索 分布式计算 HADOOP平台 一种自动无损提取大豆植株表型的方法 本发明公开了一种自动无损提取大豆植株表型的方法,包括:获取大豆植株图像,将大豆植株图像输入至预先训练的YOLOv5s‑S神经网络模型中识别豆荚区域和茎区域,获得豆荚和茎秆的坐标信息,并根据豆荚的坐标信息获取豆荚个数,采用... 黄岚 邱丽娟 王俊 周婉 陈伊洁 詹炜 李伟豪 张聪 熊亚俊CpG岛识别算法综述 2018年 DNA甲基化是一种常见的表观遗传过程,普遍存在于动植物等各种真核生物中,具有调控基因表达等功能,并影响遗传物质的稳定性。非甲基化的CpG双核苷酸在基因组中一般呈现局部聚集模式,被称为CpG岛(CpGIsland,简称CGI)。CGI的非正常甲基化常与癌症、生长异常等现象关联。因此,准确识别CGI并预测其甲基化状态具有重要意义。综述了目前主流的CGI计算识别方法,分析其优缺点,并讨论了CGI识别算法研究的未来方向。 李梦琪 黄岚 翟光超 翟文豪 吴环关键词:生物信息 表观遗传 数据挖掘课程实践教学资源库建设 被引量:13 2014年 针对面向本科开设数据挖掘课程过程中存在的教学难度大、学习兴趣不易维持、灌输式教学形式效果差等问题,提出如何通过建设开放数据挖掘实践教学资源库提升教学效果,激发学生的学习兴趣,扶持创新动机,促进教学团队建设,助力学科发展;分析建设实践教学资源库的必要性、主要建设内容和建设方法。 黄岚关键词:数据挖掘 教学探索 实践教学 教学资源 词语搭配抽取系统的对比研究 2016年 词语搭配抽取系统是自动抽取搭配的有效工具,对自然语言处理和语言学习具有重要作用。从语料库来源、抽取方法和抽取结果三方面对常用的搭配抽取系统作比较分析,以便找到一种适合于特定情况的系统。 薛晶 杜友福 黄岚关键词:抽取方法 语料库 一种基于维基百科的中文词语相关度学习算法 2016年 词语相关程度计算是语义计算的基础。维基百科是目前最大、更新最快的在线开放式百科全书,涵盖概念广,概念解释详细,蕴含了大量概念间关联关系,为语义计算提供了丰富的背景知识。然而,中文维基百科中存在严重的数据稀疏问题,降低了中文词语相关度计算方法的有效性。针对这一问题,该文利用机器学习技术,提出一种新的基于多种维基资源的词语相关度学习算法。在三个标准数据集上的实验结果验证了新算法的有效性,在已知最好结果的基础上提升了20%—40%。 黄岚 杜友福关键词:维基百科 中文信息处理 链接结构 融合预训练的港口吞吐量LSTM预测模型 2023年 港口吞吐量时序变化数据量较小且变化快,传统长短时记忆(long short term memory,LSTM)神经网络在此类数据上易出现过拟合,导致模型预测性能不佳。针对此问题,提出融合预训练与LSTM时序模型,通过预训练捕获任务领域的全局信息,再用LSTM模型精确描述各个港口的吞吐量变化规律,以提升模型对全部港口吞吐量预测的准确性。以天津港等15个中大型港口过去21年的月吞吐量为实验数据,以BP(back propagation)、自回归积分滑动平均模型(autoregressive integrated moving average model,ARIMA)、传统LSTM等预测模型和目前流行的图神经网络(graph nerual network,GNN)-LSTM模型为比较基准进行仿真实验。结果表明:所提出的融合预训练的LSTM模型能有效解决LSTM神经网络的过拟合问题,整体预测准确率高于所有基准模型。与传统LSTM模型相比,基于预训练的LSTM的MAE指标平均降低45.2%,最多降低80.0%。 张聪 许浩然 詹炜 黄岚关键词:港口吞吐量