刘斌
- 作品数:2 被引量:111H指数:2
- 供职机构:中国科学院计算技术研究所更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种新的基于统计的自动文本分类方法被引量:84
- 2002年
- 自动文本分类就是在给定的分类体系下 ,让计算机根据文本的内容确定与它相关联的类别。为了提高分类性能 ,本文提出了中文文本多层次特征提取方法和基于核的距离加权KNN算法。多层次特征提取方法在汉字、常用词表和专业词表三个层次上提取文档的统计特征 ,能够更好地反映文档的统计分布。基于核的距离加权KNN算法解决了样本的多峰分布、边界重叠问题和分类器的精确分类决策问题。实际应用中 ,互联网和文本库提供了大量经过粗分类的训练文本 ,但普遍存在样本质量较差的问题 ,本文通过样本重要性分析技术解决此问题。实验系统证明了新方法的有效性。
- 刘斌黄铁军程军高文
- 关键词:自动文本分类汉字识别
- 基于CORBA的分布式Agent通信构架被引量:27
- 2001年
- 随着 Internet的不断发展 ,传统的搜索引擎在信息获取上显露出明显的不足 .Agent技术的出现使得个性化的主动信息服务成为可能 ,但是单个 Agent的能力有限 ,因此需要在 Agent之间进行通信与交流 ,实现社会过滤以提高信息服务的质量 .为了解决 Agent的运行平台和底层通信机制的异构性问题 ,提出了基于公用对象请求代理体系结构CORBA的分布式 Agent通信构架—CADA.Agent获取用户的信息需求并用 KQML 进行描述 ,它通过通信器与其他Agent进行信息交流 .通信器对接收到的服务请求进行过滤 ,将其转发到能够提供该服务的 Agent,最后把处理结果返回给客户端 .CADA屏蔽了运行平台和底层通信机制 ,能够有效地解决分布式 Agent的通信问题 .
- 刘斌王兰邵王浩军
- 关键词:CORBA人工智能INTERNET