国家242信息安全计划(2005C36)
- 作品数:2 被引量:52H指数:2
- 相关作者:王斌王思力张华平李洋方滨兴更多>>
- 相关机构:中国科学院更多>>
- 发文基金:国家242信息安全计划国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 双数组Trie树算法优化及其应用研究被引量:38
- 2006年
- 本文对双数组Trie树(Doub le-Array Trie)算法提出了一种优化策略,即在采用Trie树构造数组的过程中,优先处理分支结点数更多的结点。这种优化策略可以在保证该算法数据查找效率不变的同时,进一步减少数据稀疏,提高空间利用率。我们基于该优化算法实现了一个词典管理程序,并与利用其他索引机制的词典进行了实验对比。实验结果表明,利用优化的双数组Trie树算法的词典不仅在查询速度上优于用其他索引机制的词典,而且存储数据的空间占用也比较小。
- 王思力张华平王斌
- 关键词:计算机应用中文信息处理TRIE树词典分词
- 基于用户反馈的反垃圾邮件技术被引量:14
- 2007年
- 在分析传统垃圾邮件过滤技术的基础上,提出了一种基于用户反馈的反垃圾邮件技术。该技术通过引入用户反馈机制,使用改进的朴素贝叶斯方法,构建面向特定用户的过滤器,从而进行垃圾邮件过滤。邮件语料库实验和原型系统的测试证明,该方法能够有效地降低误报率,提高反垃圾邮件系统的可用性,具有较好的实用效果。
- 李洋方滨兴王申
- 关键词:垃圾邮件过滤朴素贝叶斯方法用户反馈