倪颖杰 作品数:16 被引量:11 H指数:1 供职机构: 江南计算技术研究所 更多>> 发文基金: 国家自然科学基金 国家科技重大专项 国家高技术研究发展计划 更多>> 相关领域: 自动化与计算机技术 更多>>
基于高性能数据挖掘的网络海量信息处理平台 被引量:9 2009年 互联网的迅猛发展对网络信息处理提出了新的挑战,而这些都迫切需要高性能计算技术的支持。为了提高网络海量信息智能并行处理能力,促进网络信息存储与管理、信息融合、数据挖掘、智能处理和信息利用等发展,本文提出了基于高性能数据挖掘的网络海量信息处理平台,重点分析了网络海量信息处理平台实现的关键技术,并对平台的网络热点分析应用的实现进行了介绍。 倪颖杰 王律科 张军关键词:网络信息处理 并行数据挖掘 分布式并行数据库 RDS 融合知识迁移学习的微博社团检测模型构建 2018年 传统社团检测算法大多基于网络拓扑结构,没有充分利用网络节点的标签等信息,所以无法合理地解释得到的社团结构。微博、Facebook、Twitter等社交媒体网络增长迅速,用户标签通常不完整,应用传统机器学习模型补全标签通常需要大量训练样本,这种模式需要人工标注训练数据,时间周期长、泛化能力差。将迁移学习理论应用到这类任务中,可以避免人工标注损耗、缩短训练时间,所以针对新浪微博数据特点,提出一种融合知识迁移学习的微博社团结构检测模型(community structure inference model with knowledge transfer learning,KTL-CSIM)。社团结构检测模型基于度数相关的随机块模型,建立基于拓扑结构与节点信息的似然概率模型。文本向量化模型基于知识迁移模型将源领域知识迁移到目标领域微博数据上,得到目标领域文本向量。这种方法不需要人工标注数据,有效减少了模型训练时间,提高了泛化能力。 刘宇廷 倪颖杰关键词:社交网络 基于网络拓扑与节点元数据的社团检测算法 被引量:1 2018年 传统社团检测算法利用网络拓扑挖掘社团结构,忽略了真实复杂网络中节点自身属性等信息在社团归属方面的重要作用。为此,提出基于网络拓扑与节点元数据的复杂网络社团检测算法。将高维的节点元数据建模为混合高斯模型,结合随机块模型建立似然概率模型,通过求解模型最优解得到网络的最优划分结果。在基准网络与Facebook网络上的实验结果表明,该算法不仅能准确挖掘网络中的社团结构,而且可结合真实社团情况给出合理解释。 刘宇廷 毕海滨 郭强 倪颖杰关键词:复杂网络 高斯混合模型 一种数据存储方法和装置 本发明公开了一种数据存储方法和装置,该方法获取待分析数据集,确定该数据集中的各个子数据集的数据类别;并查询预置的数据类别与数据分类规则的对应关系,确定子数据集的数据分类规则,按照子数据集的数据分类规则,将该子数据集划分为... 倪颖杰 姚建华 李祖华 张军 朱开颜 刘桂英 马飞 李弢文献传递 基于InfiniBand网络存储的集群数据库应用研究 本文介绍了IB 网络存储及IB iSER 协议,实现了基于IB 网络储存 (IB-SAN)的集群数据库,并对系统的实际应用性能进行了实验与分析。结果表 明:使用IB-SAN 搭建集群数据库是完全可行的,整体性能比使用传统... 马飞 倪颖杰 陈忠平关键词:INFINIBAND 一种数据存储方法和装置 本申请公开了一种数据存储方法和装置,该方法获取待分析数据集,确定该数据集中的各个子数据集的数据类别;并查询预置的数据类别与数据分类规则的对应关系,确定子数据集的数据分类规则,按照子数据集的数据分类规则,将该子数据集划分为... 倪颖杰 姚建华 李祖华 张军 朱开颜 刘桂英 马飞 李弢文献传递 一种数据库优化方法及装置 本发明实施例公开了一种数据库优化方法及装置,用于根据获取的实时业务负载数据,动态调整服务队列中的服务数据库结点,实现数据库业务性能的优化,提高数据库优化效率。本发明实施例方法包括:定期获取分布式数据库结点的实时业务负载信... 倪颖杰 张军 李祖华 朱开颜 刘桂英 马飞 李弢文献传递 基于高性能数据挖掘的网络海量信息处理平台 互联网的迅猛发展对网络信息处理提出了新的挑战,而这些都迫切需要高性能计算技术的支持。为了提高网络海量信息智能并行处理能力,促进网络信息存储与管理、信息融合、数据挖掘、智能处理和信息利用等发展,本文提出了基于高性能数据挖掘... 倪颖杰 王律科 张军关键词:数据挖掘 网络信息 海量数据 管理平台 并行处理能力 文献传递 邻居粒子对搜索、分子动力学计算方法及众核处理系统 本发明提供一种邻居粒子对搜索方法,适用于配置成执行分子动力学计算的众核处理系统;该方法包括:分别以各粒子作为主粒子来建立各粒子的邻居粒子对;其中,对于各主粒子,均在其所处计算区域内的其余粒子中确定该主粒子的邻粒子;从而在... 张军 刘桂英 倪颖杰 李祖华 马飞 李弢文献传递 一种数据库优化方法及装置 本发明实施例公开了一种数据库优化方法及装置,用于根据获取的实时业务负载数据,动态调整服务队列中的服务数据库结点,实现数据库业务性能的优化,提高数据库优化效率。本发明实施例方法包括:定期获取分布式数据库结点的实时业务负载信... 倪颖杰 张军 李祖华 朱开颜 刘桂英 马飞 李弢文献传递