徐新华
- 作品数:4 被引量:24H指数:3
- 供职机构:北京科技大学管庄校区更多>>
- 发文基金:国家自然科学基金国家科技成果重点推广计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 增量聚类综述及增量DBSCAN聚类算法研究被引量:12
- 2006年
- 本文首先介绍了增量聚类算法的分类以及研究现状,提出了增量聚类算法等价性概念;然后介绍了增量DBSCAN聚类算法;最后针对用于批量更新的增量DBSCAN聚类算法,提出了本文的改进方法。其中,用插入更新数据集生成的子模式调整原聚类模式的方法,还可有效地应用于分布式聚类。
- 徐新华谢永红
- 关键词:聚类增量聚类
- 分布式综合知识发现系统结构研究被引量:2
- 2007年
- 利用多Agent技术,采用多层次结构,建立基于内在机理研究基础上的分布式综合知识发现系统(DKD(D&K))总体结构模型。该模型设计了基于双库协同机制的分布式KDD的知识发现线路,使得分布式数据的预处理、挖掘算法及挖掘结果的评价和导航等研究贯穿于一体,形成了一个完整的系统。该模型不仅较好的继承原综合知识发现系统KD(D&K)的主要特征,而且紧密结合了分布式数据库已经成熟的技术方法,并且与现在国际上比较典型的分布式知识发现系统比较有一定的优越性。
- 谢永红徐新华杨炳儒
- 关键词:知识发现分布式数据挖掘分布式数据库知识库
- 一个通用型知识发现系统的设计与实现被引量:5
- 2007年
- 在介绍内在机理研究的理论研究及模型成果的基础上,建立一个通用型知识发现系统的主要设计思想和方法。软件运用了主题管理、语言场理论、基于双库协同机制的关联规则挖掘算法、知识的综合评价等思想方法,对基于各类关系型数据库的知识发现系统的实现进行了尝试,并对未来的工作做出了展望。
- 谢永红刘勇徐新华
- 关键词:知识发现系统关联规则知识库
- 智能专题化信息搜集Crawler被引量:5
- 2006年
- 介绍了基于Web内容和结构挖掘的专题化智能Web爬行Crawler系统,并重点介绍其中CA(C&S)算法,该算法充分利用神经网络可以方便地模拟网络的拓扑结构和并行计算的特点,采用加强学习判断网页与主题的相关度,在进行相关度计算时,不考虑网页的全部内容,而通过提取网页的HTML描述中的重要标记,对Web网页进行内容和结构分析,从而判断爬行到的网页与主题的相关性,以提高信息搜集的效率和精确性。
- 钱榕徐新华郑莹杨炳儒
- 关键词:WEB挖掘神经网络