南通大学自然科学基金(08Z030)
- 作品数:3 被引量:3H指数:1
- 相关作者:樊康新邱建林顾卫江更多>>
- 相关机构:南通大学更多>>
- 发文基金:南通大学自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于多种特征选择的NB组合文本分类器设计被引量:1
- 2009年
- 针对朴素贝叶斯(NB)分类器在分类过程中存在诸如分类模型对样本具有敏感性、分类精度难以提高等缺陷,提出一种基于多种特征选择方法的NB组合文本分类器方法。依据Boosting分类算法,采用多种不同的特征选择方法建立文本的特征词集,训练NB分类器作为Boosting迭代过程的基分类器,通过对基分类器的加权投票生成最终的NB组合文本分类器。实验结果表明,该组合分类器较单NB文本分类器具有更好的分类性能。
- 樊康新
- 关键词:朴素贝叶斯BOOSTING算法
- 基于TREC目标优化的过滤阈值调整算法
- 2009年
- 检出阈值的优化调整是自适应信息过滤的重点和难点之一。分析现有的阈值调整方法中普遍存在的问题,以TREC效用指标为目标函数,对阈值调整方法中的极大似然估计法和局部优化法进行比较分析,提出基于TREC目标优化的全局极大似然估计法与局部效用指标优化相结合的自适应过滤阈值调整算法。实验结果表明该方法能有效地提高信息过滤系统的性能。
- 樊康新
- 关键词:自适应信息过滤阈值调整
- 基于VSM的自适应信息过滤系统的研究与设计被引量:2
- 2009年
- 为了从网络动态信息流中获得感兴趣的内容或过滤掉无关的垃圾信息,设计了一个基于向量空间模型的自适应信息过滤系统;描述了该系统的结构和工作流程;对该系统实现的关键技术,包括文本表示、用户模板与过滤阈值初始化、特征项选取、自适应过滤算法、模板更新和阈值调整等进行了深入的分析和研究。
- 樊康新邱建林顾卫江
- 关键词:信息过滤自适应特征提取用户模板