安徽省自然科学基金(2004kj011)
- 作品数:4 被引量:68H指数:3
- 相关作者:赵鹏蔡庆生耿焕同王清毅于琨更多>>
- 相关机构:中国科学技术大学安徽大学更多>>
- 发文基金:安徽省自然科学基金国家自然科学基金安徽省高等学校优秀青年人才基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种用于文章推荐系统中的用户模型表示方法被引量:6
- 2007年
- 分析了现有文章推荐系统中基于关键词向量的用户模型表示方法存在的不足,提出了基于聚类兴趣点的用户模型表示方法。该方法可通过文章聚类形成兴趣点。由于传统的基于划分的聚类算法存在的不足,提出了基于复杂网络特征的文章聚类算法。实验结果表明该用户模型的表示方法较好地反映了用户多方面的兴趣,提高了文章推荐系统的性能。
- 赵鹏蔡庆生王清毅
- 关键词:聚类复杂网络推荐系统用户模型
- 一种基于语义和统计特征的中文文本特征表示方法被引量:10
- 2007年
- 基于关键词集的中文文本特征表示方法难以准确表示文本语义信息,从而导致聚类质量较差.为了解决这个问题,本文将本体论和词共现模型的思想引入到中文文本的特征表示中,并在此基础上提出了一种基于语义和统计特征的中文文本特征表示方法.本方法在统计特征的基础上加入了基于知网和特征项共现的语义特征,实验结果表明该方法更加准确地表示了中文文本的语义信息,使得中文文本自动聚类的质量提高了近18%.
- 赵鹏耿焕同蔡庆生
- 关键词:向量空间模型知网词共现
- 一种基于复杂网络特征的中文文档关键词抽取算法被引量:50
- 2007年
- 关键词抽取是自然语言理解领域中的重要技术之一.本文研究汉语语言所组成的自然语言网络中的复杂网络特性,并根据语言网络中的"小世界"特性和近两年复杂网络研究中部分新的理论成果,提出基于复杂网络特征的中文文档关键词抽取算法.该算法根据文档语言网络中单词结点的复杂网络特征值进行关键词抽取.实验结果表明,本文算法抽取关键词所获得的平均准确率要高于 TFIDF 关键词抽取算法所获得的平均准确率.
- 赵鹏蔡庆生王清毅耿焕同
- 关键词:复杂网络语言网络关键词抽取
- 基于商空间模型的CBR系统被引量:2
- 2006年
- 传统的CBR系统采用平面结构,系统在运行过程中不断学习,范例库将变得越来越大,当范例数超过某一预设的上界时,就会出现“沼泽问题”。为了解决这个问题,该文提出了基于商空间模型的CBR系统,采用分层递阶的立体结构,在运行阶段将惰性学习算法与积极学习算法相结合。实验表明利用本方法构造的CBR系统实现E-mail分类预测时,系统的性能和有效性都得到了很大的提高。
- 赵鹏蔡庆生耿焕同于琨
- 关键词:商空间理论信息粒度分层递阶结构