王大为
- 作品数:4 被引量:10H指数:2
- 供职机构:中国科学院合肥智能机械研究所更多>>
- 发文基金:国家科技支撑计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术农业科学更多>>
- 基于最大熵方法汉语基本短语分析被引量:3
- 2008年
- 提出了一个汉语基本短语分析模型,将汉语短语的边界划分和短语标识分开,假定这两个过程相互独立,采用最大熵方法分别建立模型解决。最大熵模型的关键是如何选取有效的特征,文中给出了两个步骤相关的特征空间以及特征选择过程和算法。实验表明,模型的短语定界精确率达到95.27%,标注精确率达到96.2%。
- 朱冲王大为张向利
- 关键词:最大熵原理
- 基于用户兴趣的搜索结果动态聚类算法被引量:2
- 2008年
- 目前搜索引擎返回的结果往往比较多,而且各类文档混合在一起,没有针对性,使用者仍然需要花费大量时间来寻找自己感兴趣的文档。提出了一种对搜索结果动态聚类算法,利用用户的兴趣特点,从搜索结果的文档中抽取摘要,利用这种摘要随着用户的浏览进程进行动态聚类,将这些文档聚成不同类别。用户只需要找出自己感兴趣类别,便可以得到足够多感兴趣的文档。实验证明,这种方法是有效的,并具有抗噪声等良好性能。
- 李营王儒敬王大为魏保子
- 关键词:搜索引擎文本聚类
- 基于时空快照数据库的时间序列预测被引量:4
- 2008年
- 时空数据库是在空间数据库的基础上引入了时间维,时空数据模型和时空变化分析是GIS领域当前研究热点之一。提出一种在时空快照数据中预测时间序列发展和关联规则发现的方法。首先采用基态修正模型表达时空数据,从中提取出时空快照序列,将时空快照序列聚类为几个簇,再在簇内挖掘关联规则。将该方法应用于实验数据,结果证明这种方法能够有效地从时空快照数据中发现时空序列的发展趋势。
- 王大为王儒敬李营魏保子
- 关键词:时空数据时间序列关联规则
- 基于浅层语义的农业FAQ检索系统被引量:1
- 2009年
- 本文提出了一种基于浅层语义的FAQ检索模型。该模型以自然语言为接口,利用"知网"和农业本体,首先从用户输入中抽取农业领域概念词,然后根据这些概念词从系统数据库中检索出一个候选QA对的小集合,通过计算输入问句与候选QA对的语义相似度,选择一些与输入问句接近的问题,以及对应的答案返给用户。
- 柴秀荣王大为
- 关键词:本体