杜晓娟
- 作品数:2 被引量:23H指数:2
- 供职机构:内蒙古工业大学信息工程学院更多>>
- 发文基金:内蒙古自治区自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 云计算环境下混合协同过滤优化技术研究被引量:5
- 2018年
- 针对冷启动问题,通过K-means聚类与改进的遗传算法相结合的混合算法实现协同过滤算法中聚类模型的构建,自适应地获取聚类算法中的K值及初始聚类中心集,由新用户或新项目自身属性信息计算熵值,来对其进行归类及近邻搜索,最终实现新用户和新项目的最优推荐。针对扩展性问题,利用基于云计算平台MapReduce分布式框架,完成相关算法的并行化计算。在UCI数据集上验证了用户或项目聚类模型构建的有效性,在Movie Lens数据集上,分别进行单机环境和Hadoop平台上的实验,验证了改进算法的有效性及推荐质量。
- 田保军杜晓娟杨浒昀苏依拉
- 关键词:协同过滤聚类算法遗传算法HADOOP
- Hadoop下基于聚类协同过滤推荐算法优化的研究被引量:18
- 2016年
- 作为重要的个性化推荐算法之一,协同过滤推荐算法有其独特的优势,但同时存在数据稀疏性、冷启动和扩展性问题。针对数据稀疏性问题,对项目相似度进行改进,利用基于项目的协同过滤对原始评分矩阵进行填充,以此降低数据稀疏性对推荐质量的影响。针对冷启动问题,采用基于用户和项目属性分别进行聚类的方法,通过聚类模型建立新用户和新项目与现有用户和现有项目之间的联系,根据对现有用户和现有项目的推荐预测新用户和新项目的推荐。针对扩展性问题,利用云平台Hadoop的MapReduce框架完成相关算法的并行化,以此解决传统协同过滤推荐算法面临的严重扩展性问题。实验表明,改进后的算法较好地解决了以上问题。
- 田保军胡培培杜晓娟苏依拉
- 关键词:协同过滤数据稀疏性扩展性聚类HADOOP