宋泽锋 作品数:15 被引量:74 H指数:4 供职机构: 北京科技大学 更多>> 发文基金: 国家自然科学基金 教育部科学技术研究重点项目 国家科技成果重点推广计划 更多>> 相关领域: 自动化与计算机技术 电子电信 理学 更多>>
序列模式挖掘综述 被引量:27 2008年 综述了序列模式挖掘的研究状况。首先介绍了序列模式挖掘背景与相关概念;其次总结了序列模式挖掘的一般方法,介绍并分析了最具代表性的序列模式挖掘算法;最后展望序列模式挖掘的研究方向。便于研究者对已有算法进行改进,提出具有更好性能的新的序列模式挖掘算法。 陈卓 杨炳儒 宋威 宋泽锋关键词:数据挖掘 周期模式 增量式挖掘 宽度优先的频繁子图高效挖掘新算法 被引量:1 2008年 频繁子图已成为数据挖掘领域研究的热点之一。在经典的Apriori算法的基础上,提出了一种图挖掘的新算法Apriori-Graph。首先给出了一种新的、用于计算图的邻接矩阵规范编码的结点排序策略,大大降低了求图规范编码的复杂度,并可加速子图规范编码序列匹配的速度。其次,对候选子图的生成进行了规范。最后,针对频繁性检验这一瓶颈过程,给出了若干性质,从而较大地降低了候选子图频繁性判断的代价。实验结果表明,Apriori-Graph算法具有较高的挖掘效率。 王映龙 杨炳儒 宋威 宋泽锋关键词:数据挖掘 频繁子图 邻接矩阵 APRIORI算法 一种基于遗传算法的关联规则挖掘算法 2005年 基于对数据挖掘,特别是关联规则挖掘的研究,本文提出了基于遗传算法的关联规则挖掘方法,根据关联规则挖掘的特点,提出了对遗传算法中数据的编码模块的改进方案,特别是通过对早熟问题的分析,将改进的自适应Pc,Pm算法应用到遗传算法中来,从而提高了算法的效率。最后给出了完整的基于遗传算法的关联规则挖掘算法。 宋泽锋 周万珍 刘涛 李侠关键词:关联规则挖掘算法 遗传算法 数据挖掘 自适应 PC 基于高性能特征选择函数的Web文档聚类算法 被引量:2 2009年 目前常用向量空间模型VSM(vector space model)表示文档,造成的高维问题制约了其实际应用的效果。采用了一种高性能特征选择函数,在构建VSM时选取对区分类别贡献较大的特征词,因此有效地降低了特征空间的纬度,大大提高了系统的效率,改善了聚类的效果。通过真实数据集上的实验,证明其性能优于传统方法。 杨炳儒 邵阔义 宋泽锋 张克君关键词:文档聚类 WEB挖掘 降维 免疫进化机制及其在时序模式挖掘中的应用研究 2008年 针对目前动态数据挖掘中存在的问题,提出基于数据增量的动态挖掘进程概念;在动态挖掘进程和生物免疫进化过程的相似性基础上,提出了知识发现中的免疫进化机制的基本内涵;给出了基于免疫进化机制的时序模式挖掘算法及其实验分析,以验证理论的正确性和有效性。 杨炳儒 秦奕青 宋泽锋关键词:动态数据挖掘 免疫算法 围绕知识发现当今国际进展中两大核心问题的创新技术及其应用推广 杨炳儒 宋威 侯伟 张帆 宋泽锋 一、项目简介本技术发明项目是人工智能与计算机科学技术等多学科交叉领域前沿重大问题的研究。在几乎没有任何先导工作可借鉴的情况下,历经15年另辟新研究方向,形成了集技术方法发明、软件载体发明与应用创新为一体,综合性很强的技术...关键词:关键词:软件系统 基于危险理论的人工免疫系统模型及其算法研究 宋泽锋关键词:人工免疫 知识发现 文本挖掘 基于图的多关系数据挖掘理论研究与方法 被引量:1 2008年 在过去的几年.结构化数据挖掘的需求日渐兴起,图是计算机学科和离散数学中最好的结构数据研究之一,基于图的数据挖掘已越来越广泛。本文介绍了基于图的数据挖掘的理论基础及其研究方法。 王映龙 宋泽锋 陈卓关键词:结构化数据 数据挖掘 非结构化信息抽取关键技术研究探讨 被引量:15 2009年 以基于内在认知机理的知识发现理论为指导,针对汉语命名实体识别的难点,充分考虑专家知识在命名实体识别中的作用;根据不同的实体类型,采用灵活变化的统计与规则相结合的方式;采用各种技术来研究信息抽取的任务,如:机器学习技术、篇章分析与理解技术、句法分析技术、图算法与图挖掘技术、词计算技术、快速全文检索技术等;该文探讨的是不仅要从文本中获取简单子句中的关系,还要获得跨句子、段落中的实体关系。 周法国 王映龙 杨炳儒 宋泽锋关键词:信息抽取 命名实体识别 共指消解 基于非结构化数据挖掘结构模型的Web文本聚类算法 被引量:7 2008年 在非结构化数据挖掘结构模型——发现特征子空间模型(DFSSM)——的运行机制下,提出了一种新的Web文本聚类算法——基于DFSSM的Web文本聚类(WTCDFSSM)算法.该算法具有自稳定性,无须外界给出评价函数;能够识别概念空间中最有意义的特征,抗噪声能力强.结合现代远程教育网应用背景实现了WTCDFSSM聚类算法.结果表明:该算法可以对各类远程教育站点上收集的文本资料信息自动进行聚类挖掘;采用网格结构模型,帮助人们进行文本信息导航;从海量文本信息源中快速有效地获取重要的知识. 胡健 杨炳儒 宋泽锋 钱榕关键词:WEB文本挖掘 文本聚类