您的位置: 专家智库 > 资助详情>福建省教育厅科技项目(JA12335)

福建省教育厅科技项目(JA12335)

作品数:1 被引量:7H指数:1
相关作者:郭文龙更多>>
相关机构:福建江夏学院更多>>
发文基金:福建省教育厅科技项目更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 1篇中文期刊文章

领域

  • 1篇自动化与计算...

主题

  • 1篇相似重复记录
  • 1篇MPN

机构

  • 1篇福建江夏学院

作者

  • 1篇郭文龙

传媒

  • 1篇计算机应用与...

年份

  • 1篇2014
1 条 记 录,以下是 1-1
排序方式:
一种改进的相似重复记录检测算法被引量:7
2014年
数据仓库中相似重复记录的清洗对于提高数据质量有着重要意义,传统的判重算法有SNM算法、MPN算法及KNN算法等。针对MPN算法判重精度和时间效率不高等缺陷,提出一种改进的MPN算法。根据记录属性的重要性分别设定属性权值,将属性切分为原子,进一步计算原子的权值,通过判定属性相似度进而判定记录相似度,提高查准率和查全率。采用均分大数据集为若干数据子集,并行采用MPN算法进行判重,提高判重时间效率。理论和实验分析表明该方法提高了相似重复记录检测的准确率和时间效率。
郭文龙
共1页<1>
聚类工具0