赵兴旺
- 作品数:29 被引量:156H指数:5
- 供职机构:山西大学计算机与信息技术学院更多>>
- 发文基金:国家自然科学基金山西省自然科学基金山西省科技基础条件平台建设计划项目更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 一种基于全局和局部信息增强的图对比学习引文网络节点分类方法及系统
- 本发明提供一种基于全局和局部信息增强的图对比学习引文网络节点分类方法及系统。本发明的技术方案是:采用两个不同的数据增强策略生成增强视图,首先,基于扩散矩阵和特征相似矩阵得到权重矩阵,进行拓扑和特征增强得到第一个增强视图;...
- 梁吉业高佳佳李志强赵兴旺
- 基于二部图表示的属性网络社区发现算法被引量:1
- 2023年
- 属性网络社区发现是网络数据分析中的一项重要研究内容。为了提高社区发现的准确性,现有算法大多通过融合拓扑信息和属性信息对属性网络进行低维表示,然后基于低维特征进行社区发现。然而,这类算法通常基于深度模型进行表示学习,缺乏一定的可解释性。因此,文中提出了一种基于二部图表示的属性网络社区发现算法,以提高社区发现结果的准确性和可解释性。首先,分别基于属性网络的拓扑信息和属性信息计算网络中各个节点作为代表点的概率,通过两类信息融合选出一定比例的节点作为代表点;其次,基于拓扑结构和节点属性计算各个节点到代表点的距离,构建二部图;最后,基于二部图利用谱聚类算法进行社区发现,得到最终结果。在人造属性网络和真实属性网络上与已有的属性网络社区发现算法进行实验比较分析。实验结果表明,所提算法在标准化互信息、调整兰德指数等评价指标上均优于已有算法。
- 赵兴旺薛晋芳
- 关键词:二部图
- 一种基于先验信息的混合数据聚类个数确定算法被引量:3
- 2016年
- 聚类个数的确定是聚类分析中一个富有挑战性的难题。现有的聚类个数确定方法主要采用随机选取初始聚类中心的策略,导致聚类过程中迭代次数的稳定性不强。基于此,在利用含有类标签的先验信息优化初始类中心的基础上,提出了一种基于先验信息的混合数据聚类个数确定算法。实验证明,该算法是有效的。
- 庞天杰赵兴旺
- 关键词:聚类分析聚类个数混合数据先验信息
- 基于多阶近邻融合的不完整多视图聚类算法被引量:4
- 2022年
- 在实际应用中,聚类多视图数据是一项重要的数据挖掘任务.样本缺失所导致的多视图不完整给聚类任务带来了巨大的挑战.大部分已有的不完整多视图聚类方法主要基于浅层图结构信息,易受到噪声及缺失数据的影响,且难以准确刻画并兼容所有视图的潜在结构,从而降低了聚类性能.为此,提出了一种更为鲁棒和灵活的基于多阶近邻扩散融合的不完整多视图聚类算法.该算法在利用多阶相似性学习不完整视图潜在结构的基础上,通过跨视图交叉扩散的方式,将不同阶的深层结构信息进行非线性融合,以此挖掘视图间更全面的结构信息,从而降低了缺失样本所导致的视图结构不确定性.进一步证明了所提算法的收敛性.实验结果表明,相比已有方法,所提出的算法在处理不完整多视图聚类问题上是更加有效的.
- 刘晓琳白亮赵兴旺赵兴旺
- 关键词:结构信息
- 基于自注意力融合的不完整多视图聚类算法
- 2024年
- 基于不完整数据的多视图聚类任务已经成为无监督学习领域的研究热点之一。然而大多数基于“浅层”模型的多视图聚类算法通常在面对大规模高维数据时难以提取和刻画视图内的潜在特征结构;同时,堆叠或求平均的多视图信息融合方式忽视了视图之间的差异性,没有充分考虑各视图对构建公共一致表示的不同贡献。针对以上问题,提出一种基于自注意力融合的不完整多视图聚类算法(IMVCSAF)。首先,基于深度自编码器提取各视图的潜在特征,并采用对比学习的方式最大化各视图间的一致性信息;其次,采用自注意力机制对各视图的潜在表示进行重新编码和融合,并全面考虑和挖掘不同视图之间的内在因果性和特征互补性;再次,基于公共一致表示对缺失实例样本的潜在表示进行预测和恢复,从而完整地实现多视图聚类的过程。在Scene-15、LandUse-21、Caltech101-20和NoisyMNIST数据集上的实验结果表明,IMVCSAF在满足收敛性要求的前提下得到的准确率均高于其他对比算法,而在50%缺失率的Noisy-MNIST数据集上,IMVCSAF的准确率比次优的COMPLETER(inCOMPlete muLti-view clustEring via conTrastivE pRediction)算法提高了6.58个百分点。
- 李顺勇李师毅胥瑞赵兴旺
- 关键词:互信息
- 符号数据最佳聚类个数的确定方法
- 2009年
- 在聚类分析中,如何选择恰当的聚类个数是一个非常复杂而又必须面对的问题。尽管针对数值型数据聚类个数的选择算法已经进行了广泛地研究,但如何确定符号型数据的聚类个数仍然是一个富有挑战性的问题。结合划分和层次聚类的思想,提出一种符号数据聚类个数的确定算法。在UC I数据集上的实验结果表明该方法是有效的。
- 赵兴旺梁吉业曹付元
- 关键词:聚类个数划分聚类层次聚类
- 一种基于同配性的重叠蛋白质复合体检测算法
- 2019年
- 蛋白质复合体在生物过程中具有重要的作用,从蛋白质互作用网络中进行蛋白质复合体检测是后基因时代的一项具有挑战性的任务。种子扩展方法是一种从蛋白质互作用网络中进行重叠蛋白质复合体检测的有效技术。然而,现有方法面临两方面的问题:1)在选择种子结点时通常仅仅考虑了网络中结点的直接邻居之间的连接紧密度,难以充分体现结点在局部邻域子图内的重要性;2)在簇的扩展过程中假设候选结点之间是相互独立的,忽略了候选结点的添加顺序可能对聚类结果带来的影响。为了解决以上问题,文中基于生物网络同配性提出了一种重叠蛋白质复合体检测算法。该算法利用结点的二阶邻域信息来度量结点的重要性,进而选择种子结点,在簇扩展过程中利用同配性实现多个候选结点的批量添加。为了对重叠聚类结果进行评价,提出了一种重叠复合体评价指标F-overlap。与其他复合体检测算法在蛋白质互作用数据集上的对比实验结果表明,所提算法能够有效地进行重叠蛋白质复合体检测。
- 王杰梁吉业赵兴旺郑文萍
- 一种基于社区专家信息的协同过滤推荐算法被引量:28
- 2018年
- 协同过滤推荐算法由于不受特定领域知识限制、简单易实现等优点,得到了广泛的应用.但是,在实际应用中,该类算法往往面临着数据稀疏性、可扩展性、冷启动等问题.为了解决其中的用户冷启动问题,将用户社交信息和评分信息进行融合,提出了一种基于社区专家信息的协同过滤推荐算法.首先,依据用户的社交关系将用户划分为不同的社区;其次,根据一定的准则确定各个社区的专家,并利用社交信息和评分信息对专家评分进行填充进而缓解稀疏性;最后,对冷启动用户根据其所属社区的专家信息进行预测评分.在数据集FilmTrust和Epinions上与已有协同过滤推荐算法进行了比较分析.实验结果表明,提出的算法可以有效缓解协同过滤推荐算法中的用户冷启动问题,并在平均绝对误差和均方根误差2个评价指标上优于已有算法.
- 张凯涵梁吉业赵兴旺王智强
- 关键词:推荐系统协同过滤冷启动
- 一种手机点名签到系统
- 一种点名签到系统,包括一部主手机,多部副手机,所述的手机是智能手机,所述的主手机内安装有点名系统模块以及一份实施项目时间表,和一份或多份参加项目人员情况及考勤表;所述的副手机中装有点名客户端模块及参加项目时间表一份;本发...
- 陈红星赵兴旺
- 基于2阶段集成的多层网络社区发现算法
- 2023年
- 社区发现旨在挖掘复杂网络蕴含的社区结构,是复杂网络分析的重要任务之一.然而,现有的社区发现方法大多针对单层网络数据,对现实世界中广泛存在的多层网络数据的研究较少.针对多层网络的社区发现问题,提出了一个基于2阶段集成的社区发现算法,以提高社区发现结果的准确性和可解释性.首先,在各层分别得到基社区划分;其次以各层社区划分结构信息为主并结合其他各层网络得到的基社区划分中最优的社区划分信息进行局部集成;再次,基于信息熵对各层局部社区划分中各个社区的稳定性进行度量,并通过其他层社区划分结果来对各个局部社区划分的准确性进行评价;最后,基于各个社区以及社区划分的重要性进行全局加权集成得到最终的社区划分结果.在人造多层网络和真实多层网络数据上与已有的多层网络社区发现算法进行了比较分析.实验结果表明,提出的算法在多层模块度、标准化互信息等评价指标上优于已有算法.
- 赵兴旺张珧溥梁吉业
- 关键词:多层网络模块度