黑龙江省自然科学基金(ZJG0705)
- 作品数:4 被引量:34H指数:3
- 相关作者:郭茂祖刘扬邹权王峻李建伏更多>>
- 相关机构:哈尔滨工业大学东北农业大学更多>>
- 发文基金:黑龙江省杰出青年科学基金国家自然科学基金黑龙江省自然科学基金更多>>
- 相关领域:自动化与计算机技术生物学更多>>
- 质心法:受类别驱动的RNA二级结构预测方法被引量:3
- 2009年
- RNA二级结构预测问题是计算分子生物学中的一个重要问题.目前的RNA二级结构预测模型和算法都是把待测结构RNA的一级序列作为输入,仅根据输入的序列预测其二级结构.这样做丢失了待测RNA的类别信息,进而无法利用同类别RNA二级结构的保守性.在实际的生物学研究中,对于关心二级结构的RNA,其类别往往是已知的.本文提出一种新的RNA二级结构预测思路:结合类别信息、根据已知的近似形状细化RNA的二级结构.这种方法尤其适用于长度较短、保守性好的非编码RNA.该方法的一个关键问题是如何将一个序列按照近似的形状进行折叠.为此本文首次提出了茎区的"质心"和"质心距"的概念,并且给出了一个结合了Hopfield网络和类别信息的RNA二级结构预测算法.实验表明本文提出的方法在所测试ncRNA分子上效果好于目前的方法.
- 邹权郭茂祖刘扬
- 关键词:RNA二级结构生物信息
- 生物信息学中的学习问题被引量:2
- 2009年
- 生物信息学是结合了信息科学和生命科学的一门交叉学科,兴起于人类基因组计划.随着人类基因组计划的完成与深入,生物信息的研究工作由原来的计算生物学时代进入后基因组时代,后基因组时代中一个最重要的分支就是系统生物学.本文从信息科学的视角出发,详细论述了机器学习方法在计算生物学和系统生物学中的若干应用.
- 郭茂祖邹权李文滨韩英鹏
- 关键词:生物信息学计算生物学系统生物学
- 一种基于Quartet Puzzling和邻接法的进化树构建算法被引量:3
- 2008年
- 最大似然法是目前较准确的一种进化树构建方法,但是其时间复杂度非常高.在实际应用中,用分治策略实现最大似然法的Quartet Puzzling(QP)得到了人们的关注.它首先估计Quartet拓扑结构集合Q,然后利用重组技术将Q中的信息合并到一起构成一个包含所有序列的进化树.研究表明,QP的准确性不像人们所期望的那样高.如何快速有效地将Q所包含的信息融合在一起仍然是QP所面临的一个问题.为了提高QP,结合邻接法提出一种新的进化树构建方法QPNJ.理论上,QPNJ与QP具有相同的时间复杂度.通过模拟实验将QPNJ与QP以及目前流行的进化树构建方法进行了比较.结果表明,QPNJ比QP和邻接法更准确,并且其性能不依赖于模型树的结构,从而证明了QPNJ的有效性.
- 李建伏郭茂祖刘扬
- 关键词:进化树最大似然法分治算法QUARTET
- 类别不平衡的分类方法及在生物信息学中的应用被引量:27
- 2010年
- 提出一种处理正反例不平衡的分类方法,以解决生物信息学中的snoRNA识别、microRNA前体判别、SNP位点的真伪识别等问题.利用集成学习的思想,将反例集均匀分割并依次与正例集组合,得到一组类别平衡的训练集.然后对每个训练集采用不同原理的分类器进行训练,最后投票表决待测样本.为了避免弱分类器影响投票效果,结合AdaBoost思想,将每个分类器训练中产生的错误样本加入到下2个分类器的训练集中,既避免了AdaBoost的反复训练,又有效地利用投票机制遏制了弱分类器的影响.5组UCI测试数据和3组生物信息学实验证明了它在处理类别不平衡分类问题时的优越性.
- 邹权郭茂祖刘扬王峻
- 关键词:生物信息学