您的位置: 专家智库 > >

马亮

作品数:14 被引量:309H指数:8
供职机构:清华大学软件学院更多>>
发文基金:国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 9篇期刊文章
  • 5篇会议论文

领域

  • 12篇自动化与计算...
  • 2篇文化科学

主题

  • 5篇信息处理
  • 5篇中文
  • 5篇中文信息
  • 5篇中文信息处理
  • 4篇信息检索
  • 4篇计算机
  • 4篇计算机应用
  • 3篇信息抽取
  • 3篇抽取
  • 2篇兴趣点检测
  • 2篇智能WEB
  • 2篇时空信息
  • 2篇自适
  • 2篇自适应
  • 2篇网页
  • 2篇工作流
  • 1篇信息过滤
  • 1篇引擎
  • 1篇特征串
  • 1篇去重

机构

  • 14篇清华大学

作者

  • 14篇马亮
  • 11篇陈群秀
  • 4篇吴平博
  • 3篇顾明
  • 2篇谭伟
  • 1篇王华
  • 1篇孙学刚
  • 1篇蔡莲红
  • 1篇顾玉春

传媒

  • 5篇中文信息学报
  • 2篇全国第八届计...
  • 2篇全国第八届计...
  • 1篇计算机研究与...
  • 1篇计算机工程
  • 1篇计算机应用研...
  • 1篇小型微型计算...

年份

  • 3篇2006
  • 6篇2005
  • 4篇2003
  • 1篇2002
14 条 记 录,以下是 1-10
排序方式:
基于时空分析的线索性事件的抽取与集成系统研究
信息抽取技术能够提供高质量的检索服务.本文面向网络新闻事件,对人们感兴趣的事件关键信息进行了抽取和集成.系统中采用了如下的方法、策略:(1)利用句型模板构造抽取规则,然后直接从经过时间短语和空间短语识别和规范化处理的文本...
吴平博陈群秀马亮
关键词:信息抽取
文献传递网络资源链接
一种自适应的网页分类策略
网络信息资源的快速膨胀,使得传统的人工分类检索的方法力不从心,而信息的实时性和动态性又使得静态的分类方法显得不适应。本文提出了一种能够自动适应网络信息更迭特点,主动发掘新信息类型的自适应分类策略。该策略通过改进的Rocc...
孙学刚陈群秀马亮
关键词:自适应分类
基于ABC法的工作流仿真模型的设计与实现被引量:5
2006年
仿真是工作流技术的重要组成部分之一,其目的是检查过程模型中可能存在的错误,优化过程模型。该文对以活动网络图为基础建立的工作流模型,提出了一种基于ABC法的工作流仿真模型的设计与实现。
顾玉春马亮顾明
关键词:ABC法仿真模型网络图
基于时空分析的线索性事件的抽取与集成系统研究被引量:32
2006年
信息抽取技术能够提供高质量的检索服务。本文面向网络新闻事件,对人们感兴趣的事件关键信息进行了抽取和集成。系统中采用了如下的方法、策略:(1)利用句型模板构造抽取规则,然后直接从经过时间短语和空间短语识别和规范化处理的文本中抽取事件信息,从而跳过了深层句法分析,降低了实现系统的难度;(2)利用事件的规范化的时空信息关联不同文档中的同一事件,进行事件合并;(3)文档发生事件转移时对文档进行事件切分,从而解决了文档内不同事件信息的归并问题。初步实验结果表明:本文采用的方法和策略是有效的。
吴平博陈群秀马亮
关键词:计算机应用中文信息处理信息抽取时空信息
智能Web信息检索相关研究
本文介绍了近期在Web信息检索领域所进行的研究工作.首先,在自适应文本信息过滤研究中,采用了基于多次反馈的增量学习机制来构造过滤模型,并在模型自适应学习过程中引入特征衰减等调节因素.相应的试验系统在相关的国际比赛中取得了...
马亮陈群秀谭伟
关键词:信息检索兴趣点检测
文献传递
智能Web中文主题信息收集系统IRobot的设计被引量:15
2002年
本文介绍了智能Web中文主题信息收集系统IRobot的设计思想和方法。针对Web主题信息收集所具有的许多新特性,系统采用了对待收集URL进行相关度预测为主,对已收集页面进行相关度评价结合的收集机制。尤其在URL的相关度预测中,深入考虑了Web主题信息结构和组织特性的多种因素,综合提高了系统的性能。相比已有的研究,系统的精度和收集效率更高,且更为稳定,并能够自动获得主题领域内重要资源的列表。
马亮陈群秀王俊徐国伟
关键词:IROBOT信息检索相关度评价中文信息处理系统设计
线程池技术研究与应用被引量:68
2005年
线程池技术为线程创建、销毁的开销问题和系统资源不足的问题提供了很好的解决方案,在服务器软件中得到了广泛的应用。将线程池技术应用于工作流引擎后,系统的响应速度和整体性能得到了很大的提高。
王华马亮顾明
关键词:线程池服务器工作流引擎
一种改进的自适应文本信息过滤模型被引量:30
2005年
自适应信息过滤技术能够帮助用户从Web等信息海洋中获得感兴趣的内容或过滤无关垃圾信息.针对现有自适应过滤系统的不足,提出了一种改进的自适应文本信息过滤模型.模型中提供了两种相关性检索机制,在此基础上改进了反馈算法,并采用了增量训练的思想,对过滤中的自适应学习机制也提出了新的算法.基于本模型的系统在相关领域的国际评测中取得良好成绩.试验数据说明各项改进是有效的,新模型具有更高的性能.
马亮陈群秀蔡莲红
关键词:信息检索WEB自适应信息过滤LANGUAGEMODEL
基于时空分析的线索性事件的抽取与集成系统研究
信息抽取技术能够提供高质量的检索服务。本文面向网络新闻事件,对人们感兴趣的事件关键信息进行了抽取和集成。系统中采用了如下的方法、策略:(1)利用句型模板构造抽取规则,然后直接从经过时间短语和空间短语识别和规范化处理的文本...
吴平博陈群秀马亮
关键词:信息抽取时空信息
文献传递
基于特征串的大规模中文网页快速去重算法研究被引量:56
2003年
网页检索结果中 ,用户经常会得到内容相同的冗余页面 ,其中大量是由于网站之间的转载造成。它们不但浪费了存储资源 ,并给用户的检索带来诸多不便。本文依据冗余网页的特点引入模糊匹配的思想 ,利用网页文本的内容、结构信息 ,提出了基于特征串的中文网页的快速去重算法 ,同时对算法进行了优化处理。实验结果表明该算法是有效的 ,大规模开放测试的重复网页召回率达 97 3% ,去重正确率达 99 5 %。
吴平博陈群秀马亮
关键词:计算机应用中文信息处理特征串去重算法
共2页<12>
聚类工具0