国家重点基础研究发展计划(2011CB910200) 作品数:10 被引量:6 H指数:1 相关作者: 郑浩然 马浩 陈孝旭 李明达 李贵生 更多>> 相关机构: 中国科学技术大学 更多>> 发文基金: 国家重点基础研究发展计划 安徽省自然科学基金 更多>> 相关领域: 医药卫生 生物学 更多>>
融合基因表达数据的组织间代谢差异研究 2015年 目的不同组织细胞代谢系统中包含的代谢反应是全基因组尺度代谢网络中所有代谢反应的子集。对不同组织细胞代谢系统差异的研究,可以帮助理解不同组织的代谢特异性。方法基于已有的全基因组尺度代谢网络,融合两种组织细胞基因表达的变化信息,提出一种基于约束建模的方法,以预测多细胞生物不同组织细胞之间的代谢系统差异。根据"不同条件下基因表达量的变化信息,为预测相关反应在代谢流量上变化提供了‘线索’"这一假设,本方法试图最大化拟合在表达层面和代谢层面上显著性变化的一致性,并进一步确定出代谢活性必定为上调或下调的反应集合,从而对生物体的不同组织细胞之间代谢系统差异有一个定性的描述。结果融合了肝脏组织和心脏组织的基因表达数据进行实验,将代谢差异研究方法与之前的研究方法比较,发现该方法能更加有效检测肝脏和心脏组织间的代谢差异。结论为进一步研究多细胞生物和高等生物的不同组织细胞之间的代谢系统差异提供了一种有效的方法。 马浩 郑浩然 陈孝旭关键词:差异基因表达 一致性 基于基因芯片数据的代谢网络重构及其应用 被引量:1 2013年 目的基因组尺度的代谢网络重构提供了一种从系统层面深入观察生物体的方法,由此重构得到的网络是个体的"全基因组网络"。鉴于这种网络不能反映出不同环境条件下细胞内的动态变化过程,本文给出一种从基因芯片数据出发对生物体的实时"工作网络"进行重构的方法。方法通过对基因芯片数据使用dChip软件计算探针的P-A call后可得到基因的表达谱,然后在所整合的多源数据库的辅助下经由"基因表达谱→酶→反应→代谢网络"的过程进行"工作网络"的自动化重构。结果对来源于14种组织的182个干细胞样本进行工作网络重构的结果表明,所有干细胞之间具有较高的相似性,但不同组织来源的干细胞之间仍存在一定差异性。结论以基因芯片数据为数据源的代谢网络重构方法可有效用于生物体的"工作网络"重构。 卫超 郑浩然关键词:微阵列数据 基因芯片 干细胞 SACNet:一种癌症网络合成与分析系统 2018年 目的针对目前癌症的疾病网络构造的片面性和不精确性,提出一个基于集成多种数据源的癌症网络构造分析辅助工具系统。方法基于KEGG数据库的癌症生物通路和DisGeNET数据库的基因疾病关系等数据源,利用生物通路差异分析方法结合癌症基因表达数据获取差异通路集合,集成网络可视化工具生成癌症网络,结合网络聚类分析方法给出聚类分析结果,并对聚类分析结果进行基因功能聚类,分析癌症聚类子网络在癌症中的生物学功能。结果该工具系统生成的癌症网络以及聚类得到的网络分析结果能较准确反映出癌症和致病基因之间的联系。结论该系统界面友好,人机交互性好,可以有效辅助科研人员工作,对探寻癌症内部致病机制具有价值和意义。 刘续伟 郑浩然关键词:聚类分析 网络可视化 融合基因表达差异的生物代谢变化预测 2017年 目的当前存在许多基于约束的优化建模方法利用全基因组的代谢网络来预测生物代谢流量分布,而几乎所有的这些建模方法都需要代谢物的摄取和分泌速率以及生物先验知识的信息,比如假设生物量或者ATP产量最大。但是由于多细胞生物代谢物的摄取和分泌速率的测量很困难,并且多细胞高等生物的不同组织通常有不同的代谢目标,所以很难确定一个合理的代谢目标来建模研究高等生物的代谢。本文利用基因表达的差异信息和代谢网络,能够预测单细胞或多细胞生物代谢流量的变化,不需要生物的先验知识和代谢物分泌或摄取速率的信息。方法模型假设在两点状态下,如果编码酶的基因表达量存在显著变化,则酶催化的反应的代谢流量也应该存在显著变化。利用微阵列基因组学数据和生物全基因组的代谢网络,通过使生物代谢流量的变化与基因表达的变化尽可能一致来建立优化模型,预测生物显著差异的代谢流量分布。结果模型利用在有氧恒化器中以不同稀释速率生长的大肠杆菌的基因表达数据,预测的代谢流量与实验中实际测量的代谢流量一致。结论本文提出的基于约束的建模方法可以简单准确地定性预测低等生物的代谢流量变化,为研究高等生物的代谢变化提供了有效途径。 胡聪聪 郑浩然 马浩关键词:代谢网络 差异基因表达 多细胞生物 一种基于仿真的预测癌细胞致死基因的方法 被引量:1 2017年 目的癌细胞致死基因的研究是治疗癌症的重要尝试,其发现依赖于生物学上的基因敲除实验。鉴于此类实验的高代价、长周期等不足,本文给出一种基于计算机仿真的预测癌细胞致死基因的方法,旨在运用计算机仿真技术预测对癌细胞研究有价值的信息,为基因敲除的生物实验提供线索,帮助降低实验成本。方法计算机仿真实验基于人类全基因组代谢网络,融合癌细胞的基因表达数据,用一种基于约束建模的方法,以预测癌细胞代谢网络中有活性的反应,并将这些反应命名为"core reactions",将"core reactions"作为输入,重构出一致的癌症工作网络。在该网络上,使用基于约束的流量平衡基因敲除算法,获取使得工作网络biomass产量为0的基因,即致死基因。结果以肾透明细胞癌为例,根据上述算法,计算结果给出了肾透明细胞癌潜在的7个致死基因。结论本文给出一种高通量数据结合代谢网络,构造癌症特异网络,并通过计算机仿真基因敲除以获取癌细胞致死基因的方法。此方法通用、高效,有助于更好地开展生物学实验。 许扬 郑浩然关键词:基因敲除 致死基因 肾透明细胞癌 一种面向组学数据的中级融合分类方法 被引量:3 2016年 目的对组学数据进行深入分析有助于推动医疗诊断等方面的研究。利用单一种类组学数据的分析方法无法解决某些复杂生物医学问题。为利用多种组学信息以解决复杂的生物医疗问题,本文提出一种中级融合分类方法。方法引入偏最小二乘法(partial least squares,PLS)分别对各种组学数据进行降维,然后利用支持向量机(support vector machine,SVM)对融合后的数据进行分类。结果"非小细胞肺癌与肾癌"和"结肠直肠癌与结肠直肠腺瘤"这两个组学数据集被用于测试本文方法的有效性。在这两个癌症组学数据集上的应用,体现出该方法不但能有效降低高维组学数据的维数,而且具有较高的分类准确率(接受者操作特征曲线下的面积达0.95以上)。结论本文提出的中级融合方法能够利用多种组学数据对癌症样本进行分类,可有效提高疾病诊断的准确率。 李明达 郑浩然关键词:降维 偏最小二乘法 支持向量机 一种面向芯片合成技术的寡核苷酸设计方法 2015年 目的研发适用于芯片合成技术的寡核苷酸设计方法。方法面对芯片合成技术的需求,提出新方法,对需要处理的核苷酸序列,通过交叉匹配及酶切位点消除算法对序列中的交叉匹配片段及酶切位点进行密码子替换,尽可能减少交叉匹配及酶切位点序列的出现,对处理后的序列采用近似Tm值优化方法进行切割。结果比对相同序列在该方法和Tmprime两种方法中的结果,从寡核苷酸长度、Tm值范围、错配片段数等因素进行比较,验证了新方法在处理交叉匹配上有很好的效果。结论该方法符合适用于芯片合成技术的寡核苷酸设计的需求,大大减少了交叉匹配及酶切位点的出现情况,为芯片合成技术的寡核苷酸设计提供了一种有效方法。 吴世军 郑浩然关键词:酶切位点 微生物代谢网络模块性与鲁棒性分析 被引量:1 2013年 目的模块性和鲁棒性是微生物代谢网络的2个重要性质,但对于模块性和网络的结点度分布间的关系、网络鲁棒性和物种环境间的关系等问题仍不清楚。方法基于KEGG的代谢数据库,构建了已有全基因组序列的1015种微生物代谢网络,利用现有方法计算了代谢网络的模块性和鲁棒性,分析了网络模块性和结点度分布、鲁棒性和物种环境间的关系。结果微生物代谢网络的模块度显著高于度序列相同的模拟随机网络,而其紧密度低于这些随机网络。生活环境变化性大的物种的环境鲁棒性也较高,环境鲁棒性好的物种在自身环境下的网络鲁棒性相对较差。结论代谢网络的高模块性不能完全由度序列分布情况来解释,物种代谢网络的鲁棒性和其生活环境密切相关。 李贵生 郑浩然关键词:代谢网络 模块度 鲁棒性 微生物 融合基因芯片数据上下文特定网络的重构 2014年 目的在特定类型细胞或特定环境条件下,已有的全基因组代谢网络中的部分反应并不参与到实际的代谢过程中。为反映特定条件下生物体代谢系统的工作状态,本文提出一种重构上下文特定网络的新方法,用来构建特定条件下的代谢网络。方法首先根据基因芯片数据中蕴含的PA Calls信息,由基因-酶-反应之间的调控关系,计算出在表达层面上为"Absent"状态的反应集合。然后使用一个混合整数规划模型,从全基因代谢网络中删除表达为"Absent"状态的反应及其关联反应,在满足计量平衡等约束条件下,寻找与表达层面吻合最优的网络,即为特定条件下的上下文特定网络。结果重构了肝脏和心脏两种组织的上下文特定网络。实验结果表明,两种组织的上下文特定网络存在很大差异性,尤其在某些具有组织特异性的代谢功能上,如胆汁酸合成等。结论融合基因芯片数据信息的上下文特定网络重构方法,能够有效构建反映特定条件下生物体代谢系统状态的上下文特定网络。 陈孝旭 郑浩然关键词:基因芯片 代谢系统 组织特异性 基于代谢网络拓扑结构的基元模块发现方法 2014年 目的为提取出物种代谢网络具有的基本结构模块即基元模块,提出一种基于拓扑结构的发现代谢网络基元模块方法。方法首先利用网络模块化方法将不同物种的代谢网络划分为模块集合,然后通过合并相似的模块以及分解较大的代表模块等操作,最终获得基元模块集合。同时,利用超几何假设检验的方法以确定模块所具有的代谢功能,并在此基础上验证发现基元模块方法的合理性。结果对KEGG数据库中的1452个物种代谢网络经上述方法处理后,最终得到11446个基元模块,并且这些基元模块能够很好地表示代谢网络。结论提出了一种基于代谢网络拓扑结构的发现基元模块的方法,该方法能够有效提取出组成物种代谢网络的基元模块。 操勇 郑浩然关键词:代谢网络 拓扑