张健沛
- 作品数:162 被引量:815H指数:14
- 供职机构:哈尔滨工程大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金黑龙江省自然科学基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术文化科学电子电信交通运输工程更多>>
- 多遍扫描KeyGraph执行模型被引量:3
- 2009年
- 机会发现是近年人工智能和决策领域提出的一个新的研究课题。通过研究机会发现的关键算法KeyGraph,提出一种新型的多遍扫描执行模型,并提出利用矩阵分解实现KeyGraph的具体计算,对KeyGraph的计算方法进行改进。有效地提高了算法的执行效率,减少了计算数据量,并降低了时间空间复杂度。
- 孙晓华孙晓华徐悦竹张健沛
- 关键词:人工智能
- 一种基于多支持向量机分类器的并行学习算法
- 2006年
- 为了在并行计算系统中应用支持向量机,提出一种基于多支持向量机分类器的并行学习算法.分析了w-model算法的不足,并在训练过程中采用循环式反馈更新各支持向量机分类器以避免样本的分布状态对各分类器性能的影响,提高各分类器的训练精度.学习过程以平均分类精度为阈值,对部分分类器重新训练,实现对多分类器学习系统性能的全局优化.在UCI标准测试数据集上进行的实验结果表明,循环式反馈能有效地平衡多分类器学习性能相差过大的问题,算法较w-model具有更高的训练效率和分类效率.
- 杨静张健沛李忠伟
- 关键词:支持向量机多分类器
- 基于时间密度的数据流匿名方法被引量:2
- 2014年
- 针对数据流中的匿名问题,提出一种基于时间密度的数据流匿名算法,考虑数据流的强时态性,提出时间权重和时间密度概念,当已发布簇的个数达到上限时,删除时间密度最小的簇,以此来保证已发布簇的可重用性。此外,为了保持较高的执行效率,算法对数据采用单遍扫描,以实现数据流的高效匿名。在真实数据集上的实验结果表明,提出的方法能保持较高的效率和较好的数据效用。
- 谢静张健沛杨静张冰
- 关键词:隐私保护数据流匿名
- 基于标准偏移量的学生成绩K-means聚类分析算法研究被引量:6
- 2015年
- 针对利用距离差聚类分析算法分析学生学科成绩不够准确的问题,提出了利用标准差计算标准偏移量构建目标函数的K-means聚类分析算法,给出了初始聚类中心选取办法和算法的描述及处理流程;实验结果分析可得,利用标准偏移量构建的学生成绩K-means聚类分析算法,符合对学生成绩按学科类别聚类分析的特性要求;该算法能够较好的实现学科成绩高度关联属性的聚类分析结果。
- 孙菲张健沛董野任福栋于涛郭春平
- 关键词:标准差
- 基于拓扑势的网络社区结点重要度排序算法被引量:20
- 2012年
- 针对经典网络社区划分方法存在的划分结果难以理解的问题,基于源自物理学中核子场的拓扑势理论,提出针对具有聚类效应的社会网络和复杂网络的社区结点重要度排序算法.在算法中,首先利用NSP方法(network soft partitionbased on topological potential)依据结点在社区中所起的作用将其分为内部结点和边界结点,其次分别对内部结点和边界结点的重要性进行量化并排序,最后将2个排序结果进行拼接以构成最终的排序结果.实验表明,文中算法不但可以解决前述问题,而且具有和快速排序算法同样的时间复杂度.
- 张健沛李泓波杨静白劲波张乐君
- 关键词:复杂网络社会网络
- 一种基于话题影响力的微博话题溯源方法被引量:3
- 2015年
- 针对微博网络容易放大个人观点、导致不良信息扩散传播和影响社会稳定的问题,提出一种基于话题影响力的微博话题溯源方法.该方法针对以往影响力计算方法仅关注单条微博信息或单个用户的不足,分析了用户行为与话题热度变化的相关性,将微博内容和意见领袖的影响力相结合计算话题的影响力强度,根据话题在传播过程中的影响力变化趋势逆向递推,在搜索出的相似话题集合中层层回溯寻找话题源头集合.最后对新浪微博网络数据集进行实验,并以查全率与查准率为评估标准,结果表明,该方法能够追溯出微博话题的源头集合.
- 杨静董圆张健沛
- 关键词:在线社会网络意见领袖
- 基于投影区域密度划分的k匿名算法被引量:1
- 2015年
- 在数据发布的隐私保护中,现有的算法在划分临时匿名组时,没有考虑临时匿名组中相邻数据点的距离,在划分过程中极易产生许多不必要的信息损失,从而影响发布匿名数据集的可用性。针对以上问题,提出矩形投影区域,投影区域密度和划分表征系数等概念,旨在通过提高记录点的投影区域密度来合理地划分临时匿名组,使划分后的匿名组产生的信息损失尽量小;并提出基于投影区域密度划分的k匿名算法,通过优化取整划分函数和属性维选择策略,在保证匿名组数量不减少的同时,减少划分过程中不必要的信息损失,进一步提高发布数据集的可用性。通过理论分析和实验验证了算法的合理性和有效性。
- 王超杨静张健沛吕刚
- 关键词:隐私保护
- 基于滑动窗口的敏感关联规则隐藏被引量:1
- 2013年
- 提出了一种新的基于数据流的关联规则隐藏算法HSRDS,采用一种变化的频繁模式树(TFP-Tree)作为原始数据与清洗后数据的过渡结构,并结合滑动窗口技术,快速实现最新数据的敏感规则隐藏。同时在进行敏感关联规则隐藏的过程中,提出了两个阈值σ和δ,使得保证敏感规则成功隐藏的同时,也能最小化隐藏规则所产生的负面效应。
- 张君维杨静张健沛张乐君
- 关键词:计算机应用数据挖掘
- 基于熵分类的个性化隐私匿名方法被引量:3
- 2013年
- 针对传统(α,k)-匿名模型不能满足敏感属性值之间不同隐私保护程度个性化需求的问题,引入敏感属性值个性隐私敏感因子和个性隐私保护需求度的概念,进而形式化地定义了个性化(α,k)-匿名模型;同时,还提出了一种基于熵分类的个性化隐私匿名方法来实现个性化(α,k)-匿名模型。实验表明:该方法不仅能获得与现有(α,k)-匿名算法近似的信息损失度和时间代价,同时也满足了个性化服务的需求,获得更合理的隐私保护。
- 王波杨静张健沛
- 关键词:计算机应用隐私保护个性化
- Parzen窗核密度估计的大规模数据模式分类隐私保护方法被引量:1
- 2014年
- 针对大规模数据集上的模式分类任务,提出基于Parzen窗核密度估计的模式分类隐私保护算法。利用Parzen窗算法对原始大规模训练集服从的概率密度进行估计,根据估计的概率密度函数构造la个替换训练样本,其中l为原始样本的数目,a通过10折交叉验证方式确定。最后发布替换训练样本进行模式分类,以实现原始数据上的隐私保护。在Adult数据集上的仿真实验充分验证了算法的有效性。
- 原永滨杨静张健沛于旭
- 关键词:PARZEN窗核密度估计数据发布隐私保护