罗海飞
- 作品数:4 被引量:41H指数:2
- 供职机构:上海交通大学电子信息与电气工程学院软件学院更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于贝叶斯的文本分类方法被引量:18
- 2006年
- 文本分类中的两个关键问题,算法和特征提取。贝叶斯算法是最有效的文本分类算法之一,但是属性间强独立性的假设在现实中并不成立,借鉴概率论中的多项式模型提出了一种改进型的贝叶斯方法;传统的特征抽取方法有词频法、互信息法、CHI统计、信息增益法等,然而上述方法对于词条的权重未作考虑,引进了权重的表征方式,给出了改进方法。由实验证明了通过以上方面的改进,文本分类的正确率得到了提高。
- 罗海飞吴刚杨金生
- 关键词:文本分类特征抽取贝叶斯多项式
- 基于Corpus库的词语相似度计算方法被引量:23
- 2006年
- 构建了一个语义关联库,称为Corpus库,该库使用词语空间和关系空间结构化地存储了词语和其上下文之间的统计信息,并通过阅读大量的预料数据来训练其相关数据。详细介绍了Corpus库的训练方法,并对训练过程中出现的大量关系提出了裁剪方案。在此基础上,通过构建词语的上下文关系向量提出了一种词语相似度算法。实验证明这是一种有效的对词语相似度进行计算的方法。
- 章志凌虞立群陈奕秋罗海飞邵晓敏
- 关键词:CORPUS词语相似度信息检索
- 基于改进Corpus库的词语相似度计算方法
- 的相似度度量方法广泛的应用在智能信息检索等领域,本文通过构建存储词语共现信息的Corpus实现了一种度量词语相似度的方法.同时,为了控制词语关系的空间,给出了相应的关系空间裁剪方法.实验证明这是一种有效的在有限空间中对词...
- 章志凌虞立群罗海飞邵晓敏
- 关键词:CORPUS词语相似度信息检索
- 嵌入式数据库技术及其在智能电视节目选择系统中的实现
- 随着智能信息家电对数据管理要求的不断提高,嵌入式数据库技术显得日益重要。本文在分析和研究通用嵌入式数据库的基础上,设计实现了一个更为精简、高效并适合于资源有限的嵌入式设备应用的数据库sjtuedb,并给出了较为详细的设计...
- 邵晓敏罗海飞章志凌
- 关键词:嵌入式数据库
- 文献传递