孙广中 作品数:90 被引量:330 H指数:9 供职机构: 中国科学技术大学 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 中央高校基本科研业务费专项资金 更多>> 相关领域: 自动化与计算机技术 文化科学 交通运输工程 理学 更多>>
基于龙芯2号国产万亿次高性能计算机KD-50-I 陈国良 张俊霞 安学军 张焕杰 吴冬冬 李会民 高翔 孙广中 李春生 顾乃杰 杨寿保 郑启龙 安虹 吴俊敏 蒋承东 杨晓奇 申凯 李晖 李凯 吴超 方维 邹丰富 隋秀峰 该项目采用64位龙芯2F CPU,加上1G内存、I/0控制部件和千兆以太网接口等,构成一无盘工作模块(处理单元)。并采用高密度组装技术,在1U标准机箱内部署12个这样的处理单元,构成一个计算节点。这些处理单元之间通过千兆...关键词:关键词:高性能计算机 龙芯2号 千兆以太网 基于网格和最近邻居的聚类算法 被引量:1 2008年 针对目前已有的聚类算法不能很好地处理包含不同密度的簇数据,或者不能很好地区分相邻的密度相差不大的簇的问题,提出1种新的基于严格最近邻居和共享最近邻居的聚类算法.通过构造共享严格最近邻图,使样本点在密度一致的区域保持连接,而在密度不同的相邻区域断开连接,并尽可能去除噪声点和孤立点.该算法可以处理包含有不同密度的簇数据,而且在处理高维数据时具有较低的时间复杂度.实验结果证明,该算法能有效找出不同大小、形状和密度的聚类. 陈义如 孙广中 许胤龙关键词:聚类算法 相似度 网格 最近邻居 多核平台上Top-k查询的性能优化 被引量:2 2012年 随着Web搜索引擎等实际应用的发展,Top-k查询的实时性能日益受人关注.为了提升Top-k查询在高性能计算机上的实时性能,本文针对领域中具有代表性的No Radom Access(NRA)程序进行性能分析,根据多核处理器的结构特点,采用分层的优化方法对NRA程序进行并行优化.通过使用数据结构调整,任务调度等方法优化,优化后程序在实验数据集上获得了59%的串行性能提升,并具有接近线性的加速比. 吴超 孙广中 陈国良关键词:TOP-K查询 多核处理器 大数据时代中的去匿名化技术及应用 被引量:13 2013年 首先通过案例说明隐私保护的重要性,然后介绍隐私保护中常用的匿名化方法,并针对评分推荐系统、社交网络和博客分别介绍有效的去匿名化方法。表明在大数据时代下虽然数据的公开有利于学术研究,但是也需要加强考虑隐私保护的问题。 孙广中 魏燊 谢幸关键词:大数据 隐私保护 分层并行计算模型 被引量:12 2008年 传统单一的并行计算模型变得越来越复杂,对并行计算各阶段针对性不强、指导能力差的特点,为此提出了对并行计算模型分层研究的思想,依此把并行计算模型分为并行算法设计模型、并行程序设计模型、并行程序执行模型三个层次,分别给出了各个模型的特点及研究内容.理论分析结果表明,通过分层,每个阶段的模型分工明确,目标单一,指导性强. 陈国良 苗乾坤 孙广中 徐云 郑启龙关键词:并行程序设计模型 基于历史运行数据预测并行程序运行时间的方法 本发明公开了一种基于历史运行数据预测并行程序运行时间的方法,针对小规模历史运行数据预测大规模运行时间的问题,建立了使用随机森林和多任务套索回归的两层模型,随机森林可以拟合复杂的模型,而使用多任务套索回归,将相关性强的任务... 孙广中 周文举 孙经纬MapReduce模型的调度及容错机制研究 MapReduce是一种并行编程模型,可以用来处理和生成大量数据集。它的调度以及容错机制是模型的重要一部分。通过对MapReduce模型的执行过程进行分析,提取得到其上面的调度以及容错模型。并将P2P模型中常用的调度思想... 孙广中 肖锋 熊曦关键词:MAPREDUCE 调度 容错 文献传递 基于行为模式的学生异常学习表现预测方法 本发明公开了一种基于行为模式的学生异常学习表现预测方法,包括:基于原始的校园记录获取行为序列,并构建隐马尔可夫模型;从隐马尔可夫模型中提取行为统计特征及行为关联特征;基于提取的行为统计特征及行为关联特征,应用正则化的多任... 孙广中 张茜文献传递 并行程序运行时参数优化方法 本发明公开了一种并行程序运行时参数优化方法,包括:利用一次一因子实验方法进行预备实验,获得程序性能受单个参数变化的影响,从而筛选出对程序性能影响超出预定目标的参数及其参数值;利用均匀实验方法,从预备实验筛选出的参数中粗筛... 孙广中 史腾飞 周英华文献传递