您的位置: 专家智库 > >

于满泉

作品数:16 被引量:335H指数:7
供职机构:中国科学院计算技术研究所更多>>
发文基金:国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 7篇期刊文章
  • 7篇会议论文
  • 1篇学位论文
  • 1篇专利

领域

  • 15篇自动化与计算...

主题

  • 5篇网页
  • 4篇信息处理
  • 4篇WEB挖掘
  • 3篇信息过滤
  • 3篇视觉特征
  • 3篇系统聚类
  • 3篇向量
  • 3篇向量空间
  • 3篇向量空间模型
  • 3篇HTML标记
  • 2篇单链
  • 2篇信息采集
  • 2篇信息检索
  • 2篇引擎
  • 2篇邮件
  • 2篇邮件过滤
  • 2篇预处理
  • 2篇数据预处理
  • 2篇网页分块
  • 2篇文本分类

机构

  • 16篇中国科学院
  • 4篇中国科学院研...

作者

  • 16篇于满泉
  • 8篇许洪波
  • 6篇王斌
  • 4篇骆卫华
  • 4篇程学旗
  • 3篇余智华
  • 3篇潘文锋
  • 2篇谭松波
  • 2篇李盛韬
  • 2篇白硕
  • 1篇王映
  • 1篇白硕
  • 1篇周立德
  • 1篇郭岩
  • 1篇吴丽辉
  • 1篇赵章界
  • 1篇王斌
  • 1篇孟庆发
  • 1篇陈铁睿
  • 1篇吕铁强

传媒

  • 2篇计算机应用
  • 2篇第一届全国信...
  • 2篇NCIRCS...
  • 1篇计算机研究与...
  • 1篇计算机工程
  • 1篇微电子学与计...
  • 1篇中文信息学报
  • 1篇计算机科学
  • 1篇全国第八届计...
  • 1篇全国第八届计...

年份

  • 3篇2006
  • 7篇2005
  • 5篇2004
  • 1篇2003
16 条 记 录,以下是 1-10
排序方式:
基于分块的网页信息解析器的研究与设计被引量:79
2005年
详细介绍了网页信息解析的基本技术手段,在综合权衡优缺点的基础上,提出了针对新 闻网站复杂结构页面较为有效的分块算法,并结合实际的项目需求,设计实现了网页信息解析器 TVPS,实验结果表明,该解析器具有良好的性能,满足实际的需求。
于满泉陈铁睿许洪波
关键词:WEB挖掘HTML标记视觉特征网页分块
面向人物追踪的知识挖掘研究
近年来,关于文本信息处理的诸如检索、分类、聚类、抽取等技术有了很大的发展,目前的研究偏重于综合利用各种手段来更好地满足新的应用场景,一系列国际评测也推动了各项技术的发展。尽管在移动通信领域,跟踪人物行踪的技术已相对成熟;...
于满泉
关键词:知识挖掘信息处理
文献传递
Winnow算法在垃圾邮件过滤中的应用
本文从文本分类与信息过滤角度研究垃圾邮件过滤问题,介绍Winnow算法在垃圾邮件过滤中的应用,在PU1邮件语料和Ling-Spam语料上实验Winnow算法的性能,得到了较好的效果.实验表明,这种错误驱动的在线学习方法在...
潘文锋王斌于满泉谭松波
关键词:垃圾邮件过滤文本分类信息过滤
文献传递
基于网页分块的个性化信息采集的研究与设计被引量:16
2005年
个性化Web信息采集是信息检索领域内一个将采集技术与过滤方法结合的新兴方向,也是信息处理技术中的一个研究热点。文章分析了个性化Web信息采集的基本问题,提出了难点以及相关的解决方案,并在此基础上设计了基于网页分块的个性化Web信息采集系统。
吕铁强于满泉孟庆发周立德
关键词:信息采集信息检索信息处理个性化
基于内容的个性化信息过滤系统的研究与设计被引量:18
2005年
以典型的向量空间模型为例,剖析了个性化信息服务中内容过滤面临的主要问题及基本对策,并结合用户的实际需求,设计实现了“天罗”个性化信息过滤系统,实验结果表明,系统达到了很高的准确率、召回率和处理速度。
于满泉许洪波赵章界余智华
关键词:个性化信息过滤向量空间模型关键词匹配
基于多策略优化的分治多层聚类算法的话题发现研究被引量:50
2006年
话题发现与跟踪是一项评测驱动的研究,旨在依据事件对语言文本信息流进行组织利用。自1996年提出以来,该研究得到了越来越广泛的关注。本文在研究已有成熟算法的基础上,提出了基于分治多层聚类的话题发现算法,其核心思想是把全部数据分割成具有一定相关性的分组,对各个分组分别进行聚类,得到各个分组内部的话题(微类),然后对所有的微类再进行聚类,得到最终的话题,在聚类的过程中采用多种策略进行优化,以保证聚类的效果。基于该算法的系统在TDT4中文语料上进行了测试,结果表明该算法属于目前结果最好的算法之一。
骆卫华于满泉许洪波王斌程学旗
关键词:计算机应用中文信息处理系统聚类
主题Web信息采集的研究与设计
主题Web信息采集是信息检索领域内一个将采集技术与过滤方法结合的新兴方向,也是信息处理技术中的一个研究热点。本文分析了主题Web信息采集的基本问题,提出了难点以及相关的解决方案,并在此基础上设计了“天达”主题Web信息采...
李盛韬吴丽辉于满泉潘文锋余智华王斌程学旗
关键词:信息采集信息检索信息处理主题
文献传递
基于多策略优化的分治多层聚类算法的话题发现研究
话题发现与跟踪是一项评测驱动的研究,旨在依据事件对语言文本信息流进行组织利用。自1996年提出以来。该研究得到了越来越广泛的关注。本文在研究已有成熟算法的基础上,针对其不足,提出了基于分治多层聚类的话题发现算法。基于该算...
骆卫华于满泉许洪波王斌程学旗
关键词:系统聚类向量空间模型
文献传递
网页内部结构挖掘技术研究
随着信息服务向深入化、专业化方向发展,网页内部蕴含的结构信息体现出越来越重要的价值.本文根据页面内部蕴涵的潜在知识,深入剖析了网页内部结构挖掘可利用的技术手段,并综合分析了它们的优缺点;同时,针对复杂的页面结构,提出了较...
于满泉谭松波许洪波
关键词:WEB挖掘视觉特征HTML标记网页结构
文献传递
Web使用信息挖掘综述被引量:72
2005年
Web使用信息挖掘可以帮助我们更好地理解Web和Web用户访问模式,这对于开发Web的最大经济潜力是非常关键的。一般来说,Web使用信息挖掘包含三个阶段:数据预处理,模式发现和模式分析。文章以这三个阶段为框架,分别介绍了数据预处理的技术与困难,Web使用信息挖掘中常用的方法和算法,以及主要应用。
郭岩白硕于满泉
关键词:数据挖掘WEB挖掘WEB用户访问模式数据预处理
共2页<12>
聚类工具0