李信
- 作品数:39 被引量:325H指数:11
- 供职机构:华中科技大学同济医学院医药卫生管理学院更多>>
- 发文基金:国家自然科学基金国家社会科学基金中国博士后科学基金更多>>
- 相关领域:文化科学医药卫生自动化与计算机技术语言文字更多>>
- 我国数字图书馆研究的历史起源和演化研究--基于RootCite和CSSCI的实证方法被引量:1
- 2022年
- [目的/意义]探究我国数字图书馆研究的历史起源和演化情况,推进国内数字图书馆研究的进一步建设与发展。[方法/过程]利用自主开发的RootCite工具和中文社会科学索引CSSCI数据库进行参考文献出版年图谱分析,识别对我国数字图书馆研究的起源和演化起到重要作用的中外文献、杰出学者和出版物,并与国外数字图书馆研究的相应情况进行比较。[结果/结论]RootCite结果显示:1900-2020年间,有27篇经典文献对我国数字图书馆研究的起源和演化起到了重要作用,包括8篇外文文献和19篇中文文献。其次,从我国数字图书馆研究社区中识别得到的27篇经典文献,与国际数字图书馆研究社区中识别的经典文献存在较大的差异,尤其在学科领域形成之后。最后,本研究证明了基于RootCite和CSSCI的实证方法用于识别我国社会科学领域研究的历史根源和演化进展的可行性。
- 李信黄佳妮唐旭丽
- 关键词:数字图书馆CSSCI历史根源
- 作者关键词生存分析——以国内图情领域为例被引量:8
- 2020年
- 作者关键词作为论文的重要组成部分,能够反映论文的主要内容,已被广泛应用于学科以及主题演化研究中。本研究引进Kaplan-Meier曲线,将其应用于作者关键词生存分析,揭示作者关键词的生存状况,有利于学科以及主题的演化研究。首先,采集国内CSSCI数据库1998-2018年持续收录的13本图情领域期刊发表的所有论文;其次,采用Kaplan-Meier曲线对图情领域的作者关键词生存分析进行刻画;最后,利用Log Rank检验以及Breslow检验分别对情报学与图书馆学的关键词生存曲线差异以及权威期刊与核心期刊的关键词生存曲线差异进行显著性检验。研究结果表明,图情领域的作者关键词生存曲线第1年先快速下降,之后呈现缓慢下降的趋势,关键词平均生存时间为2.245年;情报学学科的关键词平均生存时间比图书馆学的长,且在0.001水平下具有显著性差异;此外,权威期刊的关键词平均生存时间比核心期刊的长,且在0.001水平下具有显著性差异。本研究将Kaplan-Meier曲线应用于作者关键词的生存分析,揭示了国内图情领域的作者关键词生存状况,对基于关键词的主题和学科演化分析具有一定的借鉴意义。
- 刘智锋李信
- 关键词:图书情报
- 全文本文献计量分析学术沙龙综述被引量:16
- 2018年
- 以"科学计量与科技评价的理论、方法与应用"为主题的"2018科学计量与科技评价天府论坛"于2018年9月19—21日在成都顺利召开,"全文本文献计量分析"沙龙作为此次论坛的一项重要学术活动,为与会学者们提供了一个开放探讨的平台。本文通过对沙龙嘉宾的发言和讨论内容进行梳理与总结,将沙龙的主要内容归纳为引用位置与引用程度分析、引用行为与引用动机分析、引用情感分析与论文评价、全文本知识单元与实体抽取、数据开放、数据标注与评测、新兴研究话题发现与预测等六个主题,以期揭示全文本文献计量分析的研究现状和发展趋势。
- 王佳敏李信李信
- 关键词:文献计量分析
- 领域无关学术文献词汇功能标准化数据集构建及分析被引量:9
- 2019年
- 【目的/意义】构建一个较大规模的学术文献词汇功能标准化数据集,并对其进行描述分析,以期为学术检索、文献推荐和科学计量等应用研究提供更加科学合理的数据支撑。【方法/过程】在学术文本词汇功能框架的基础上,针对"研究问题"和"研究方法"这两种领域无关词汇功能,生成学术文献词汇功能自动标引规则模板,开发相应的词汇功能标注平台,对88865篇计算机领域文献进行自动标引,并对得到的数据集进行整体分析、热点和趋势分析以及研究方法特点分析。【结果/结论】得到一个包含23221个不重复研究问题的Topic数据集、18427个不重复研究方法的Method数据集和30145个"问题-方法"对的Topic-Method数据集;人工检验准确率高于95%。此外,文章还创新性地提出了研究方法的"功能特点",并进行了相关实践。
- 程齐凯李信陆伟
- 关键词:学术文献
- 学术文本可读性和复杂度评价研究被引量:5
- 2018年
- 本文以计算机和图书情报学科的学术文本作为研究对象,综合SMOG、FKG、ARI、FOG 4种可读性评价公式和句法复杂度分析工具L2SCA,从学科、学术文本结构位置和不同影响因子期刊等方面出发,对学术文本的可读性和复杂度进行比较分析。研究结果表明,不同学科学术文本之间的可读性差异不明显,而学术文本正文部分的可读性都显著低于摘要部分;此外,在复杂度方面,正文在大多数指标上均比摘要的复杂度高。
- 陈练文李信赵超烨
- 基于文献计量的语言政策与规划学科溯源与热点研究被引量:5
- 2021年
- 本文运用参考文献出版年图谱这种新兴的文献计量方法,探究语言政策与规划学科领域的历史参考文献,发现对该学科的起源和演化起到重要影响的文献主要来源于语言学与社会学领域,其中习得规划和本体规范方面最为重要。同时,参考文献出版年图谱也揭示了从学科诞生到现在,语言政策与规划领域的研究热点和研究趋势的变化:早期研究关注本体规划、地位规划,以自上而下的政府行为为主;20世纪90年代以来的研究理论性加强,更注重多层面互动,研究趋向于多元化、微观化和复杂化。
- 陈练文李信
- 关键词:语言政策语言规划
- 传统文献计量与科学评价的一个补充视角:全时间域的RPYS被引量:11
- 2017年
- 本文对传统文献计量和科学评价存在的问题进行了分析,假设全时间域的RPYS分析可能成为传统文献计量和科学评价的一个补充视角。为了验证该假设,笔者在前期RPYS研究的基础上,将其分析时间延展至一个学科或领域的全时间域,然后以情感分析领域为例,进行实验设计,识别该领域的重要文献及其学者、期刊分布,并分析该领域的研究起源、研究演化和研究热点。RPYS结果显示,1905—2010期间有17篇文献对于情感分析的起源、发展和演化起到了积极的推动作用;同时,由于RPYS是基于参考文献视角的分析方法,因此在对情感分析的研究热点和研究趋势的发现上存在一定的局限性。最后,文章将RPYS得到的结果与传统文献计量视角得到的前17篇高被引论文进行比较分析发现,在传统的文献计量方法为主的情况下,加入RPYS作为补充视角,可能得到更加全面、准确和客观的结果。
- 李信李倩
- 关键词:情感分析
- 基于词汇功能识别的科研文献分析系统设计与实现被引量:11
- 2017年
- [目的 /意义]从学术文本词汇功能的角度出发,考虑科研文献中词汇的语义功能,设计和实现一个基于词汇功能识别的科研文献分析系统,在一定程度上弥补现有科研文献分析系统的不足之处。[方法 /过程]首先阐述学术文本词汇功能的定义及其识别研究的现状进展;在此基础上,对系统思路、功能模块进行设计;最后,选取1994-2013年CNKI中计算机领域的文献作为数据来源,实现一个基于词汇功能识别的科研文献分析系统CS-LAS。[结果 /结论]CS-LAS可以满足科研工作者更为细粒度的信息需求,对于传统学术数据库的检索结果有一定的优化,同时实现对某一学科的研究热点和研究趋势的合理把握和可视化呈现。
- 李信程齐凯刘兴帮
- 关键词:计算机领域
- 学术文本的结构功能识别--在关键词自动抽取中的应用被引量:32
- 2017年
- 当前的关键词自动提取研究大多基于候选词的词频、文档频率等统计信息,往往忽略了侯选词所在的学术文本的内在结构,导致关键词提取的效果不佳。本文将学术文本看作是5个结构功能域的集合,提出了融合学术文本结构功能特征的多特征组合提取方法,并利用学术文本的章节标题对其结构功能进行识别,然后通过SVM二分类和LambdaMART学习排序算法分别在计算机语言学领域的文献集上进行了实现。实验结果表明,本文提出的组合特征方法相比基准特征在关键词提取的效果上取得了较大的提升,尤其在分类实验中准确率的相对提升上达到10.75%,证明了学术文本结构功能特征在关键词自动提取上的重要性。
- 方龙李信黄永陆伟
- 关键词:关键词提取支持向量机
- 基于参考文献出版年图谱的知识管理演化研究被引量:5
- 2018年
- 探索一个学科或领域的演化进程,科学、准确的揭示其发展规律,对于其建设发展和之后的学术研究具有重要意义。文章引入一种新兴的科学计量方法——参考文献出版年图谱,进行知识管理领域的演化研究,并从多个角度与传统的学科演化研究方法进行比较分析。结果表明,参考文献出版年图谱能够较好地识别特定领域的重要文献、作者和期刊等,揭示了知识管理领域的发展脉络,证明了参考文献出版年图谱用于学科演化分析的可行性。
- 杨冬敏李信
- 关键词:知识管理