宋培彦
- 作品数:37 被引量:119H指数:7
- 供职机构:中国科学技术信息研究所更多>>
- 发文基金:国家社会科学基金国家科技支撑计划中国科学技术信息研究所预研基金项目更多>>
- 相关领域:文化科学自动化与计算机技术语言文字医药卫生更多>>
- 句间回指模糊的多层次消解模型
- 2010年
- 句间回指消解是当前中文信息处理的一个重要研究课题,直接从语义和语用入手,以法律文本为语料来源,对句间回指进行形式化描述和消解,服务于计算机句群自动理解。概念基元是"显微镜",看清指代语与先行语的微观语义联系;句类是"放大镜",将指代语和先行语纳入57组基本句类中进行关联;语境单元则是"望远镜",为指代语和先行语提供宏观的语境知识。语料考察结果表明,这一多层次的消解模型对实现句间回指消解是有效的。
- 宋培彦刘宁静
- 关键词:自然语言理解
- 同义词抽取结果的噪音清洗方法研究
- 2015年
- 【目的】同义词抽取结果中的噪音会严重影响结果的可应用性,需要预先进行清洗。【方法】提出一种基于同义关系网络的噪音清洗方法,将同义词抽取结果转化为无向结构的同义关系网络,在该网络中自动识别出同义词抽取结果中部分噪音,并结合语义的分布相似性对方法进行改进,以提高噪音的识别比例。【结果】通过在工程技术领域随机选取的术语上进行实验,表明该方法可以过滤同义词抽取结果中32.6%–73.0%的噪音。【局限】只能清除部分噪音,还需要改进方法以提高噪音识别的准确性。【结论】通过构建同义关系网络能够清洗同义词抽取结果中的噪音,该问题值得进一步深入研究。
- 刘伟王星宋培彦
- 关键词:同义词信息抽取
- 语义网环境下叙词表构建方法研究被引量:5
- 2018年
- 【目的/意义】通过研究语义网环境下叙词表的构建方式,促进叙词表的共建和共享。【方法/过程】叙词表是进行知识组织的有效工具。从知识工程的角度,对语义网环境下叙词表的基本特征和构建方式进行分析,研究叙词表构建的技术模型与演进路径,为叙词表的编制、使用和维护提供新的思路和视角。进而,结合知识的多维度描述方法,对语义网环境下叙词表构建的有效性进行实证研究和展望。【结果/结论】《汉语主题词表》研究和实践表明,语义网环境下叙词表的共建共享在机制和技术上是可行的。
- 宋培彦陈白雪王星
- 关键词:叙词表知识组织知识表示语义网
- 一种基于C#正则表达式的汉语文本信息检索方法被引量:1
- 2009年
- C#中的正则表达式可以按照用户指定的模式从非结构化文本中提取信息,简单易用,功能强大。简要介绍C#正则表达式主要的语法格式和功能,结合汉语文本检索的实例,演示其使用方法。上机实验结果表明,C#正则表达式在处理汉语文本时的准确率和效率都是较高的,F值为95.53%。
- 宋培彦张冬梅
- 关键词:正则表达式信息检索中文信息处理
- 肿瘤领域专家学术影响力评价方法及其实证研究被引量:2
- 2018年
- 为了对专家学术影响力进行评价、支撑专家推荐等应用,引入了基于NIF指数的专家学术影响力评价算法,设计了计算模型和流程;通过对专家产出文献数据进行标准化处理,形成可量化、易更新、精度相对较高的领域专家学术影响力评价方法,以"肿瘤"领域为例,从论文被引用次数、论文数量、参考文献数量、单篇最高被引频次4个角度开展实证研究,在灵敏度、区分度和适用性都有较大提高,有助于提高专家评价和推荐效果。
- 宋培彦程志强
- 关键词:专家库
- 一种基于知识组织语义关系的科技专家信息聚合方法
- 本发明公开了一种基于知识组织语义关系的科技专家信息聚合方法,涉及信息科学与知识工程技术领域。该方法,通过将专家信息与知识组织工具进行语义化关联,在知识组织工具的语义关系框架下,实现了专家信息的语义聚合、自动发现和动态更新...
- 宋培彦梁冰赵志远
- 文献传递
- 基于语义网络的中文词汇链构造方法被引量:6
- 2011年
- 词汇链是文本中一系列词汇关联而成的语义链,构造词汇链有助于提高文本的连贯性,把握文本主题。借鉴概念层次网络(HNC)理论对词汇语义进行形式化描述的原理,研究基于语义网络节点遍历计算的词汇链构造方法。首先对汉语文本进行分词处理,从知识库中获得词语的HNC符号,然后对语义符号进行解析,获得词语的语义关联性并构造词汇链;最后,对词汇链进行优选处理,设定阈值获得优选词汇链。实验结果表明,该方法构造的词汇链可接受度较高,对主题标引、自动文摘、文本分类等有重要价值。
- 宋培彦杨代庆
- 关键词:词汇链语义计算概念层次网络主题标引
- 网络百科知识组织方法研究被引量:11
- 2012年
- 文章对百度百科、互动百科和维基中文百科的知识分类和主题组织方法进行对比分析,研究网络环境下知识组织的特征,提出了基于"分类-主题-用户标签"多级映射的结构化概念空间模型,为网络百科知识组织提供参考依据。
- 宋培彦路青赵星
- 关键词:知识组织叙词表在线词典网络百科映射
- 术语知识库的构建与服务研究被引量:6
- 2014年
- 术语知识库是开展知识服务的基础资源。基于知识组织理论设计统一的知识描述框架,对术语知识表示进行细粒度的刻画,构建专业术语知识库资源,进而探讨网络环境下开展术语服务的基本方式,设计了术语服务实验系统,初步证实了术语知识库的应用前景。
- 宋培彦王星李俊莉
- 关键词:知识库知识组织
- 汉语主题词表研究热点与发展路径研究被引量:1
- 2016年
- 利用文献计量方法对近30年来汉语主题词表研究论文进行统计,揭示汉语主题词表研究的总体面貌。利用关键词共现分析和社会网络分析方法,对研究主题、作者合著关系进行可视化展示,并对网络环境下新型汉语主题词表的发展思路提出了建议和对策。
- 宋培彦刘伟
- 关键词:汉语主题词表知识组织可视化共现