安徽省高校省级自然科学研究项目(KJ2010A003)
- 作品数:3 被引量:36H指数:2
- 相关作者:王平水王建东余永红柏文阳更多>>
- 相关机构:安徽财经大学南京航空航天大学南京大学更多>>
- 发文基金:安徽省高校省级自然科学研究项目国家自然科学基金安徽省自然科学基金更多>>
- 相关领域:自动化与计算机技术自然科学总论更多>>
- 基于聚类的匿名化隐私保护技术研究被引量:2
- 2010年
- 目前多数匿名化隐私保护技术由于其严重依赖于预先定义的泛化层或属性域上的全序关系,导致匿名结果产生很高的信息损失,数据的可用性降低。通过定义距离和代价度量函数,提出基于聚类算法构造l-多样性匿名隐私保护模型。实验结果表明,该方法可减少信息损失,提高发布数据的可用性。
- 王平水
- 关键词:数据发布隐私保护K-匿名聚类
- 基于特征项权重自动分解的文本聚类被引量:5
- 2011年
- 提出一种自动文本聚类方法,应用遗传算法进行全局和快速的文本特征项选择以实现降维处理,引入概率匿名思想,根据文本中不同特征项权重的组合,基于动态规划设计一个优化的多项式时间聚类算法,将文本集划分成适当个数的分区,并对每个分区进行聚类,从而形成初始聚类,采用相同方法对所有初始聚类进行再聚类,形成最终的文本聚类。实验结果表明,该方法既能实现文本特征项的有效选择,又能较好地改善文本聚类效果和性能。
- 余永红柏文阳
- 关键词:文本聚类遗传算法
- 匿名化隐私保护技术研究综述被引量:30
- 2011年
- 随着互联网技术的迅猛发展,隐私保护已成为个人或机构关心的基本问题,各种数据挖掘工具的出现使得隐私泄露问题日益突出.通常移除标识符的方式发布数据是无法阻止隐私泄露的,攻击者仍然可以通过链接操作以很高的概率来获取用户的隐私数据.匿名化是目前数据发布环境下实现隐私保护的主要技术之一.论文简要介绍了匿名化技术的相关概念和基本原理,主要从匿名化原则、匿名化方法和匿名化度量等方面对匿名化技术研究现状进行了深入分析和总结,最后指出匿名化技术的研究难点以及未来的研究方向.
- 王平水王建东
- 关键词:数据发布隐私保护标识符K-匿名