国家自然科学基金(60173017)
- 作品数:7 被引量:454H指数:4
- 相关作者:史忠植任力安何清张宁贾自艳更多>>
- 相关机构:中国科学院中国科学技术大学人民大会堂更多>>
- 发文基金:国家自然科学基金北京市自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 基于概念空间的文本检索系统被引量:40
- 2002年
- 当前信息检索存在着信息过载和词汇不匹配的问题。文章提出了一种新的检索方式缓解这两个问题。这种检索方法在文本聚类的基础上,基于概念空间并与传统的关键词检索相结合能够帮助用户快速、准确地定位所需要查找的信息。文章将对这种检索方式进行介绍,并且着重介绍利用共现分析以及Hopfield网络生成概念空间。
- 郑毅吴斌史忠植
- 关键词:文本分析HOPFIELD网络INTERNET
- 一种新的海量数据分类方法被引量:14
- 2002年
- 使用支持向量机对非线性可分数据进行分类的基本思想是将样本集映射到一个高维线性空间使其线性可分。文章则基于Jordan曲线定理,提出了一种通用的基于分类超曲面的分类法,它是通过直接构造分类超曲面,根据样本点关于分类曲面的围绕数的奇偶性进行分类的一种新分类判断算法,不需作升维变换,不需要考虑使用何种核函数,而直接地解决非线性分类问题。对数据分类应用的结果说明:基于分类超曲面的分类法可以有效地解决非线性数据的分类问题,并能够提高分类效率和准确度。
- 任力安何清史忠植
- 关键词:支持向量机人工智能
- 基于C/S体系结构的报到表决管理信息系统被引量:1
- 2005年
- 以C/S体系结构为基础,设计并实现了电子报到表决管理信息系统。对其中包括门口报到子系统、电子表决子系统、会务管理子系统、视频显示子系统等各子系统的功能进行分析,提出各功能模块的设计方案。实践证明该电子报到表决管理信息系统运行安全可靠。
- 王华伟史忠植胡宏
- 关键词:MISC/S模式表决系统
- 一种基于向量空间模型的多层次文本分类方法被引量:144
- 2002年
- 本文研究和改进了经典的向量空间模型 (VSM )的词语权重计算方法 ,并在此基础上提出了一种基于向量空间模型的多层次文本分类方法。也就是把各类按照一定的层次关系组织成树状结构 ,并将一个类中的所有训练文档合并为一个类文档 ,在提取各类模型时只在同层同一结点下的类文档之间进行比较 ;而对文档进行自动分类时 ,首先从根结点开始找到对应的大类 ,然后递归往下直到找到对应的叶子子类。实验和实际系统表明 。
- 刘少辉董明楷张海俊李蓉史忠植
- 关键词:向量空间模型信息增益特征提取词语权重文档分类
- 数据仓库中ETL技术的研究被引量:255
- 2002年
- 作为数据仓库的关键部件,支持数据抽取、清洗、转换和装载的工具集对任何数据仓库工程都是一个必不可少的成功因素。该文简单介绍了ETL技术,包括ETL的相关概念、ETL在数据仓库中的功能和重要地位以及现有的研究成果,然后重点介绍了ETL的具体设计和实现方法。
- 张宁贾自艳史忠植
- 关键词:数据仓库ETL数据抽取数据清洗数据装载
- 1比特加法记忆独立二输入逻辑概率模型分析
- 2005年
- 在已有的带记忆密码逻辑的研究结果的基础上,给出了1比特加法记忆独立二输入逻辑概率模型,证明了其输出序列是独立均匀同分布的二元随机变量序列;得到了其输出序列单点提供的关于输入的信息量之和等于输出序列提供的关于输入的信息量。
- 刘恒范修斌吕述望孙鹏
- 关键词:信息熵
- 分类超曲面方法在海量数据分类中的应用被引量:1
- 2002年
- 1引言
人的智慧中一个很重要的方面是从实例学习的能力,通过对已知事实的分析总结出规律,预测不能直接观测的事实.在人们对机器智能的研究中,用机器(计算机)来模拟这种学习能力,这就是我们所说的基于数据的机器学习问题,它是现代智能技术中的重要方面,其研究从观测数据(样本)出发寻找规律,利用这些规律对未来数据或无法观测的数据进行预测(分类).
- 任力安何清史忠植
- 关键词:学习算法拓扑学