林帅
- 作品数:2 被引量:7H指数:1
- 供职机构:西安电子科技大学计算机学院更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于MapReduce的模体发现问题算法研究
- 模体发现问题是生物信息学中的核心问题之一,它对于研究基因表达的调控机制有着极为重要的生物学意义。植入/(l, d/)模体发现问题是其中一种非常重要的模型,但这一问题是NP难解的,要解决该问题往往要涉及巨大的计算量,因此,...
- 林帅
- 关键词:并行计算MAPREDUCEHADOOP
- 文献传递
- 基于MapReduce的模体发现算法被引量:7
- 2012年
- 模体发现对于基因发现和理解基因调控关系有着重要的意义,它是生物信息学中最具挑战性的问题之一。提出了针对PMSP算法的3种数据划分方法,并在此基础上提出了基于MapReduce的模体发现算法(PMSPMR)。针对不同难度的问题,在Hadoop集群上的实验结果表明,PMSPMR算法具有良好的可扩展性。特别地,对于难度较大的模体发现问题实例,PMSPMR算法的加速比接近于Hadoop集群中节点的数目。此外,对于真实数据的实验,PMSPMR算法能够识别出真核细胞和酿酒酵母中已知的转录调控模体,表明了算法的有效性。
- 霍红卫林帅于强张懿璞
- 关键词:数据划分可扩展性