郑毅
- 作品数:6 被引量:189H指数:4
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家自然科学基金北京市自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于概念空间的文本检索系统被引量:40
- 2002年
- 当前信息检索存在着信息过载和词汇不匹配的问题。文章提出了一种新的检索方式缓解这两个问题。这种检索方法在文本聚类的基础上,基于概念空间并与传统的关键词检索相结合能够帮助用户快速、准确地定位所需要查找的信息。文章将对这种检索方式进行介绍,并且着重介绍利用共现分析以及Hopfield网络生成概念空间。
- 郑毅吴斌史忠植
- 关键词:文本分析HOPFIELD网络INTERNET
- 面向CIMS的数据仓库及数据挖掘研究
- 张建史忠植田启家胡宏王军李云峰张颖刘继敏叶施仁宫秀军李晓黎吴斌何清刘少辉武成岗李辉郑毅朱光涛傅伟鹏
- 提出一种新型的学习模型:该模型由观察学习和内省学习构成。提出一种基于偏置变换的决策树学习算法BSDT。提出了基于摄动的模糊聚类方法:简称FCMBP模糊聚类。提出概念层次的提升及下沉方法。提出了关联属性度量的概念;提出了必...
- 关键词:
- 关键词:数据仓库数据挖掘
- 文本挖掘及其在文本检索中的应用
- 该文进行了以下方面的研究:作为整个文本检索系统的基础,该文首先讨论了为文本检索系统建立索引.该文讨论了在关系数据库下倒排索引的建立、编码、存储、获取以及并行化等问题.分类是有效组织网上信息的一个有效的途径.该文在向量空间...
- 郑毅
- 关键词:文本检索数据挖掘文本分类
- 文献传递
- 基于概念空间的文本语义索引被引量:12
- 2002年
- 1 引言据统计,在现今的联机存储信息中,80%以上的信息以文本的形式存在.信息的多元化、复杂化,致使信息的自动索引成为急需解决的问题.本文研究的内容是建立一个基于概念空间的文本语义索引.
- 李源郑毅何清史忠植
- 关键词:HOPFIELD神经网络搜索引擎INTERNET信息检索
- 一种基于群体智能的客户行为分析算法被引量:69
- 2003年
- 提出了一种基于群体智能的客户行为分析算法 .首先将客户的消费模式作为平面上的一个点随机分布于平面区域内 ;然后依据基于群体智能的聚类方法 ,选用由小到大的群体相似系数进行聚类分析 ;最后 ,在平面区域内采用递归算法收集聚类结果 ,获得不同消费特征的客户群体 .文中还提出了算法的并行策略 ,提高了算法对大数据量的适应性 .该文以电信移动客户话费数据作为实验数据 ,并将算法结果与其它经典聚类算法的结果进行比较分析 .分析结果表明 :这种基于群体智能的客户行为分析算法能够满足客户聚类和分类的要求 ,特别是在大客户分析及一对一营销中特别客户的分析方面该算法有直观。
- 吴斌郑毅傅伟鹏史忠植
- 关键词:群体智能数据挖掘神经网络人工智能
- 一种基于群体智能的Web文档聚类算法被引量:78
- 2002年
- 将群体智能聚类模型运用于文档聚类 ,提出了一种基于群体智能的 Web文档聚类算法 .首先运用向量空间模型表示 Web文档信息 ,采用常规方法如消除无用词和特征词条约简法则得到文本特征集 ,然后将文档向量随机分布到一个平面上 ,运用基于群体智能的聚类方法进行文档聚类 ,最后从平面上采用递归算法收集聚类结果 .为了改善算法的实用性 ,将原算法与 k均值算法相结合提出一种混合聚类算法 .通过实验比较 ,结果表明基于群体智能的 Web文档聚类算法具有较好的聚类特性 ,它能将与一个主题相关的 Web文档较完全而准确地聚成一类 .
- 吴斌傅伟鹏郑毅刘少辉史忠植
- 关键词:群体智能WEB文档聚类算法自组织聚类互联网信息检索