薛鹏军
- 作品数:5 被引量:76H指数:4
- 供职机构:南京农业大学信息科学技术学院信息管理系更多>>
- 发文基金:国家社会科学基金更多>>
- 相关领域:文化科学自动化与计算机技术更多>>
- 基于知识库的网页自动标引和自动分类系统的设计被引量:45
- 2004年
- 针对中文网页文本信息特征,提出了信息标引和组织方案,并构建了一个基于知识库的网页自动标引和自动分类系统。中文网页的自动标引和自动分类思想主要基于知识库进行。知识库实际上是一个基于《中图法》的专家知识系统,包括了中图法库、汉表库、分类号主题词对应库、同义词库、关键词库等若干数据库。在确定网页基本信息标引源的基础上,中文网页主题标引运用了基于词频的统计加权法;通过与分类号一主题词对应库主题词串的词面相似度计算,进一步完成中文网页的分类标引。最后还讨论了新词识别等技术问题。
- 侯汉清薛鹏军
- 关键词:知识库自动标引自动分类系统概念语义网络
- 基于知识库的中文网络检索工具——经济信息智能搜索引擎研究
- 该论文试衅从计算机技术和图书情报学理论与实践手段出发,应用文献信息自动标引和组织技术于网页的加工处理过程上.在分析了中外搜索引擎的现状与不足,搜索引擎分类主题一体化进展以及网页主要特征的基础上,该文提出了针对中文网页特征...
- 薛鹏军
- 关键词:智能搜索引擎经济信息网络检索知识库自动标引
- 文献传递
- 网页自动标引方案的优选及标引性能的测评被引量:10
- 2002年
- 本文介绍了三种网页自动标引方案 ,通过对“中国经济网”上 5 0页网页的手工标引、自动标引结果比较 ,从而优选出一种方案 ,即对网页全文不同部位加权 ,采用词频加权统计法。最后对该方案自动主题标引和分类标引分别从人机相符率方面进行测评。
- 仲云云侯汉清薛鹏军
- 关键词:网页自动标引主题标引分类标引网络信息资源
- 中文信息自动分类用知识库的设计与构建
- 2003年
- 在计算机智能处理技术远未成熟的情况下,基于概念语义网络的自动分类采用知识库技术,仍将是一种实用的选择。本项研究根据分类语言、主题语言、自然语言三者兼容互换的原理,以众多标引员的主题标引和分类标引的经验,即文献数据库实体中大量存在的文献分类号和主题词双重标引数据为基础,建立一个以《中图法》为基础的分类知识库——分类法与主题词表对照数据库。论文对构建分类知识库的思路、步骤及主要技术,包括关联度测度方案、标引词模式匹配、新词增补等进行了讨论。
- 侯汉清薛鹏军
- 关键词:知识库构建分类主题一体化《中国图书馆分类法》《中国分类主题词表》
- 中文信息自动分类用知识库的设计与构建被引量:25
- 2003年
- 在计算机智能处理技术远未成熟的情况下,基于概念语义网络的自动分类采用知识库技术,仍将是一种实用的选择.本项研究根据分类语言、主题语言、自然语言三者兼容互换的原理,以众多标引员的主题标引和分类标引的经验,即文献数据库实体中大量存在的文献分类号和主题词双重标引数据为基础,建立一个以<中图法>为基础的的分类知识库--分类法与主题词表对照数据库.论文对构建分类知识库的思路、步骤及主要技术,包括关联度测度方案、标引词模式匹配、新词增补等进行了讨论.
- 侯汉清薛鹏军
- 关键词:中文信息知识库主题词表主题标引文献数据库