国家教育部博士点基金(20113108120022)
- 作品数:8 被引量:82H指数:3
- 相关作者:谢江张武张惠然戴东波夏上云更多>>
- 相关机构:上海大学上海电机学院更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金上海市教育委员会重点学科基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 用于生物分子网络比对的自适应匈牙利贪心混合算法的并行化被引量:2
- 2013年
- 生物分子网络比对是生物信息学中一个重要领域,是研究生物现象和生命机理的有效手段,而自适应匈牙利贪心混合算法(AHGA)是其中一个有效的生物分子网络比对算法。但是生物分子网络数据的规模都比较大,而且由于其拥有生物背景,生物分子网络数据具有一些特殊性。为了能够在可以接受的时间范围内获得大规模生物分子网络的比对结果,使用MPI和统一计算架构(CUDA)对自适应混合算法进行了并行化,在比对中充分考虑生物分子网络的生物学意义,对两种方式进行了对比分析,以寻找更合适生物分子网络的比对方法。
- 马进谢江戴东波谭军张武
- 关键词:自适应混合算法并行化
- 基于consR的并行图匹配方法
- 2015年
- 随着社交网络、生物网络规模的迅速扩大,能够快速、高效地实现对这些网络的匹配、查询等工作已经成为许多应用领域的迫切需求。给定两个网络图,图匹配的过程即为对图G1中的每个节点在图G2中找到唯一一个相对应的最为相似的节点,使得给定的两个图的匹配边的数量最多。文中基于大图匹配方法 consR,进行了两方面的优化:当图的节点数目较少时,优化了图G1、G2的相似性矩阵计算策略,从而使得图匹配的计算更加快捷;当图的节点数目较大时,针对匹配过程中最为耗时的步骤进行并行优化处理。实验结果表明,在与consR方法计算出的匹配结果保持一致的情况下,一定程度上缩短了图匹配计算时间。
- 田豪爽戴东波张惠然谢江
- 关键词:图匹配并行化
- CPSE-Bio:基于云计算的生物问题求解环境被引量:2
- 2013年
- 生物信息学是结合计算机技术解决生物问题,利用计算机能力加速生物研究的交叉性学科.问题求解环境(problem solving environment,PSE)是一类面向科学问题求解的计算平台,研究人员通过使用PSE可以高效地参与和开展科学研究.由于生物数据规模通常很大,而这些数据随着生物技术的发展仍在不断地增加,因此,传统的单机单系统PSE已无法满足生物计算需求.介绍上海大学计算机工程与科学学院高性能计算研究所生物信息学研究团队将云计算技术与PSE相结合,实现基于云环境的问题求解环境CPSE-Bio,并对其中2个代表性模块,即PPI(protein-protein interaction)多数据库网络查询(multi-database retrieval technology,MDRT)模块和蛋白质挖掘(protein mining,PM)模块,进行性能分析和比较.
- 谢江王旻超易荣贵夏上云张武
- 关键词:生物信息学问题求解环境云计算
- 云存储中一种基于布局的虚拟磁盘节能调度方法被引量:10
- 2012年
- 在云存储中,如何有效地调度用户请求到目标磁盘以实现绿色节能存储是一个热点问题.鉴于云存储对节能调度算法提出的新要求,如请求响应时间敏感与对动态优化的限制等,本文提出了一种基于布局的虚拟磁盘节能调度方法.该方法将磁盘阵列动态划分为工作区与就绪区,以工作区为主向用户分发资源,并以未连接虚拟机的虚拟磁盘为单位,根据实时负载情况对虚拟磁盘布局进行动态优化.实验结果表明,这种方法不仅能够降低磁盘阵列的能耗,而且能够有效地缓解响应时间延长的问题,还能够使虚拟磁盘布局达到更高的负载均衡水平.
- 李建敦彭俊杰张武
- 关键词:云计算虚拟磁盘节能调度负载均衡
- 基于KVM虚拟化技术的Hadoop架构被引量:2
- 2013年
- 本文提出并实现了一种Hadoop与虚拟化技术相结合的模型.该模型将多核计算机虚拟成多节点集群,最大限度地利用计算资源.在实验测试的基础上,通过分析任务在Hadoop环境中的并行机制,弄清计算任务在节点中与核中的分配方式,以达到提高并行效率、降低硬件开销的目的,最后通过对典型应用问题进行计算,从而对本文所提出模型的正确性和有效性进行了验证.
- 夏上云王旻超张惠然戴东波谢江李青张武
- 关键词:大规模数据HADOOP虚拟化并行计算
- 基于云计算平台的医疗健康监视系统被引量:4
- 2013年
- 在医学领域,通常认为多数突发性疾病导致死亡的原因是由于延误了时间而没有给予病人及时的帮助.因此,如何为病人提供快速而有效的治疗一直是医学领域的一个重要研究方向.介绍构建的基于云计算平台,能够准确及时获取心脏病人相关信息(如生理情况、历史病历、地理位置等)的健康监控系统.基于该系统,医生能够及时为病人提供可靠的医疗建议与救助,并与病人家属及时沟通.
- 张惠然戴佳筑李芝龙沈小龙
- 关键词:云计算卫星定位
- 大规模带状线性方程组混合编程并行求解
- 分布式共享存储集群系统已经成为高性能计算机的发展趋势,这种系统在每个节点内是共享内存的,而节点间则是分布式存储。为了充分利用这种多级体系结构,文中针对计算流体力学中的大规模带状线性方程组进行求解,建立了MPI/OpenM...
- 徐磊郑汉垣刘智翔封卫兵张武
- 关键词:混合编程模型MPIOPENMP
- 文献传递
- 基于消息传递接口的大规模生物网络比对并行化算法
- 2014年
- 为有效降低生物网络比对算法的时间复杂度,提出一种基于可扩展的蛋白质相互作用网络比对(SPINAL)算法的消息传递接口(MPI)并行化实现方法。该方法将MPI并行化思想运用在SPINAL算法中,在多核环境中采用并行排序代替算法原本的排序方式,并结合负载均衡策略合理分配任务。实验结果表明,与未使用并行排序以及负载均衡策略相比,该方法在处理大规模生物网络比对时能有效地缩短计算时间,提高运算效率,对于不同组比对数据都有较为稳定的优化保障,具有良好的可扩展性。
- 束俊辉张武薛倩斐谢江
- 关键词:消息传递接口
- 基于Python的新浪微博数据爬虫被引量:62
- 2014年
- 目前很多的社交网络研究都是采用国外的平台数据,而国内的新浪微博没有很好的接口方便研究人员采集数据进行分析。为了快速地获取到微博中的数据,开发了一款支持并行的微博数据抓取工具。该工具可以实时抓取微博中指定用户的粉丝信息、微博正文等内容;该工具利用关键字匹配技术,匹配符合规定条件的微博,并抓取相关内容;该工具支持并行抓取,可以同时抓取多个用户的信息。最后将串行微博爬虫工具和其并行版本进行对比,并使用该工具对部分微博数据作了一个关于流感问题的分析。实验结果显示:并行爬虫拥有较好的加速比,可以快速地获取数据,并且这些数据具有实时性和准确性。
- 周中华张惠然谢江
- 关键词:爬虫PYTHON大数据