公共文化服务平台

黄永: 作品数：17 被引量：141H指数：8; 供职机构：武汉大学更多>>; 发文基金：国家自然科学基金教育部人文社会科学重点研究基地度重大研究项目国家科技支撑计划更多>>; 相关领域：文化科学自动化与计算机技术环境科学与工程更多>>

合作作者

学术文本的结构功能识别--在关键词自动抽取中的应用被引量：32: 2017年; 当前的关键词自动提取研究大多基于候选词的词频、文档频率等统计信息,往往忽略了侯选词所在的学术文本的内在结构,导致关键词提取的效果不佳。本文将学术文本看作是5个结构功能域的集合,提出了融合学术文本结构功能特征的多特征组合提取方法,并利用学术文本的章节标题对其结构功能进行识别,然后通过SVM二分类和LambdaMART学习排序算法分别在计算机语言学领域的文献集上进行了实现。实验结果表明,本文提出的组合特征方法相比基准特征在关键词提取的效果上取得了较大的提升,尤其在分类实验中准确率的相对提升上达到10.75%,证明了学术文本结构功能特征在关键词自动提取上的重要性。; 方龙李信黄永陆伟; 关键词：关键词提取支持向量机

我国图书情报领域近十年科研论文研究方法的演化分析——以《情报学报》和《中国图书馆学报》为例被引量：11: 2017年; 本文通过对图书情报领域的科研论文进行内容分析,从科研论文研究方法的角度揭示图书情报学科的发展情况。在通过参考已有的科研论文研究方法分类体系的基础上,分析近十年科研论文中的研究方法得出了图书情报领域科研论文研究方法的分类体系。为揭示该学科科研论文中研究方法的演化规律,笔者对近十年发表在《情报学报》和《中国图书馆学报》两本权威期刊上共2556篇论文的研究方法进行分类标注并进行演化分析。结果表明:(1)图书情报学科的研究方法越来越重视定量的研究方法;(2)《情报学报》的研究方法从一开始的以定性研究为主逐渐发展为以数据为驱动的定量研究为主定性研究为辅;(3)《中国图书馆学报》的研究方法主要以定性研究为主,近年来定量研究占比有所增长,但是仍然以定性研究为主。; 赵忠伟黄永程齐凯陈海华; 关键词：图书情报学研究方法科研论文

学术文献引文上下文自动识别研究被引量：19: 2016年; [目的 /意义]引文内容分析能够帮助揭示文献引用关系的深层语义内涵,而引文上下文识别作为引文内容分析的基础显得尤为重要。[方法 /过程]梳理已有引文上下文研究的现状,总结当前引文上下文识别的不足,在此基础上归纳引文上下文识别的5类特征,并采用文本分类和序列标注两种方法开展引文上下文自动识别实验。[结果 /结论]实验结果表明,本文提出的特征能够很好地提升引文上下文识别效果,且基于文本分类的SVM分类效果要优于基于序列标注的CRF。; 雷声伟陈海华黄永陆伟; 关键词：支持向量机条件随机场

基于最大熵模型的学术缩写自动识别被引量：1: 2015年; 为实现海量英文学术文本中缩写词及对应缩写定义的识别,本文提出了一种自动缩写识别算法MELearn-AI。该算法在人工标注数据集的基础上,从序列标注的角度,通过最大熵模型实现了计算机领域英文学术文本中的自动缩写识别。MELearn-AI在本文构建的评测数据集"Paren-sen"上得到了95.8%的查准率和86.3%的查全率,相对于其他两组对照实验的效果有较为明显的提升。本文提出的自动缩写识别方法能够在计算机领域的学术文本上取得令人满意的效果,有助于更好地理解并利用该领域术语。; 张秋子陆伟程齐凯黄永; 关键词：信息抽取

学术文本的结构功能识别——功能框架及基于章节标题的识别被引量：49: 2014年; 当前学术文本挖掘研究大多数是采用基于词汇、窗口、全文的方法，往往忽略了学术文本的内在结构，导致了很多歧义性问题。本文针对当前研究不足，提出一种研究性论文的结构功能框架，对学术文本的章节功能和逻辑结构进行了定义。在此基础上本文从三个不同层次（基于章节标题、基于章节内容和标题、基于段落）论述了结构功能的自动分类问题，并从第一个层次（基于章节标题）采用词表与序列标注相结合的方法进行了结构功能的自动分类实验，取得了令人满意的效果。; 陆伟黄永程齐凯; 关键词：文本挖掘

学术文本的结构功能识别——基于段落的识别被引量：35: 2016年; 学术文本的结构功能识别是学术文本章节层次的文本分类问题,其本质就是识别章节的结构功能。本文将基于段落的学术文本结构功能识别分为两个子问题:段落位置识别及基于段落投票的章节结构功能识别。在自动构建的大规模数据集上的实验结果表明,虽然基于段落的结构功能识别效果不如基于章节整体内容的识别,但仍然取得了不错的效果。本文结合实验结果着重分析了影响基于段落的识别效果的两个重要因素:段落长度及章节中段落数量,并在最后对学术文本结构功能识别的三个层次做了总结,指出了拟进一步探讨的问题和方向。; 黄永陆伟程齐凯桂思思; 关键词：文本分类文本挖掘

基于引文上下文的学术文本自动摘要技术研究被引量：4: 2016年; 学术文本自动摘要是指对于给定学术文献,自动地抽取其核心内容,以提高用户撰写和阅读文献的效率。目前基于文本词频对句子重要性排序的自动摘要技术,无法从语义层面揭示学术文本的核心内容。本文在已有研究的基础上,引入引文上下文内容特征,并通过构建支持向量回归模型,综合考虑自动摘要系统中的各个特征对句子权重的影响,重新对句子重要性进行排序。基于WE-ROUGE的评测表明,相比于传统基于词频统计和图模型的方法,本文提出的算法能够有效提升自动摘要的准确度。; 陈海华黄永张炯陆伟; 关键词：支持向量回归

学术文本词汇功能识别--在关键词自动抽取中的应用被引量：8: 2021年; 传统的关键词自动抽取常以候选词的出现频次、位置等非语义信息构建特征,并未考虑关键词在学术文献中承担的特定语义角色,即词汇功能。通过对现有数据统计,本文发现作者标注关键词中约有67.99%是研究问题或研究方法词。因此,本文将关键词的词汇功能分为三类:“研究问题”“研究方法”和“其他”,在传统的词频特征以及位置特征基础上,融合词汇功能特征,使用计算机领域的学术文献基于分类和排序两种思想进行关键词抽取实验。实验结果表明,融合词汇功能后,关键词抽取效果得到明显提升。相较于基准实验,二分类模型的准确率Acc和F值分别相对提升24.63%和25.19%,达到了0.840和0.666;排序模型的MAP、NDCG@5和P@5分别相对提升168.32%、189.50%和148.30%,提升至0.813、0.828和0.447,证明了学术文献词汇功能特征在关键词自动抽取中具有重要作用。; 姜艺黄永夏义堃李鹏程李鹏程; 关键词：关键词抽取支持向量机

学术文本的结构功能识别——在学术搜索中的应用被引量：13: 2016年; 在学术大数据环境下,学术文本挖掘研究向细粒度和语义化方向发展。学术文本的结构功能是对学术文本正文的结构及章节功能的概括。为探讨结构功能在学术搜索中的作用,本文将学术文本看作是个结构功能域的集合,使用域加权语言模型对学术文本结构功能进行加权,并以一般语言模型为基准,在INEX04数据上进行了文档级检索实验。实验结果表明本文所提出的模型取得了较大的提升,尤其在P@5上的相对提升达到13.93%。根据模型中各个结构功能域的权重参数分析可以得知,引言功能作用最大,相关研究、方法的作用次之,实验及结论的作用最小。本文的实验也证明了学术文本的结构功能在学术搜索中的应用价值。; 黄永陆伟程齐凯桂思思; 关键词：学术搜索语言模型

纯粹引文网络仿真研究: 引用是科学计量学最重要的工具之一，其相关指标已经广泛的应用于学者、机构、期刊的评价中。关于引用行为、引用影响因素的研究更是科学计量学的研究热点。现有研究在相关性分析的基础上向因果分析逐渐转变。在这种趋势之下，更多的学者将...; 黄永; 关键词：因果关系仿真技术

黄永

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户反馈

黄永

合作作者

文献类型

领域

主题

机构

作者

传媒

年份

用户登录

用户反馈