江苏省高校自然科学研究项目(10KJA330034)
- 作品数:6 被引量:18H指数:2
- 相关作者:陈峰赵杨易洪刚沃红梅朱晶晶更多>>
- 相关机构:南京医科大学昆山市卫生监督所南通大学更多>>
- 发文基金:江苏省高校自然科学研究项目国家自然科学基金江苏高校优势学科建设工程项目更多>>
- 相关领域:医药卫生更多>>
- 基于基因水平主成分logistic回归模型在全基因组关联研究中的应用被引量:2
- 2012年
- 探讨基于基因水平的主成分logistic回归模型分析方法及其在全基因组关联研究中的应用。以全基因组关联研究基因型模拟数据为例,介绍基于主成分的logistic回归模型在基因水平检测遗传变异与复杂性疾病之间关联的分析策略。模拟结果表明致病位点所在基因假设检验的P值在所有基因检验结果中为最小。研究结果提示在全基因组关联研究中,采用基于基因水平的主成分logistic回归模型一方面能够降低检验的自由度,另一方面能够处理单核苷酸多态性之间相关性问题,在检测致病基因与疾病关联时具有一定的效能。
- 易洪刚沃红梅赵杨张汝阳柏建岭魏永越陈峰
- 关键词:主成分分析LOGISTIC回归模型全基因组关联研究
- 结肠直肠癌全基因组关联的研究进展被引量:4
- 2013年
- 结肠直肠癌(CRC)在全球的发病率和死亡率呈上升趋势。2000年CRC新增病例94.5万,2008年达到120万,平均年增加3.37%;2000年死亡病例数为49.2万,2008年达到60.9万,年均增加2.97%。2008年全球范围内CRC列男性常见肿瘤第三位,而在女性中居第二位。同时我国CRC发病率也呈快速上升趋势。2000年CRC在我国恶性肿瘤发病率中居第五位,于2007年上升至第三位。
- 吴叶娇易洪刚
- 关键词:结肠直肠癌全基因组关联研究
- 高维生物学数据两阶段组合降维策略研究被引量:2
- 2012年
- 目的探讨高维生物学数据的多阶段组合降维策略。方法以微阵列数据的判别分析为例,采用实际数据和模拟数据相结合的方法,提出"初步选维→进一步降维"的两阶段组合降维策略,并与后续的"判别→验证"相结合,形成了"选维→降维→判别→验证"的判别分析思路。以后续判别分析的预测效果、预测结果的稳定性与敏感性等为指标,对2种单一降维(PCA,PLS)方法和4种组合降维方法(PCA+SIR、PCA+SAVE、PLS+SIR和PLS+SAVE)进行了考察。结果从判别模型的预测效果、预测结果的稳定性及敏感性来看,PLS优于PCA,PLS+SIR/SAVE的组合降维效果更佳。结论用t计分法选维,以"PLS+SIR/SAVE"法进行降维的两阶段组合降维策略,对于微阵列数据判别分析,是实用的、可行的。
- 荀鹏程钱国华赵杨于浩陈峰
- 关键词:偏最小二乘微阵列数据
- 高维肺癌病例-对照研究资料的随机森林降维分析被引量:7
- 2012年
- 目的探讨随机森林算法在肺癌高维病例-对照资料分析中的应用效果。方法选取500例医院来源肺癌患者作为病例组,以517名社区来源对照人群作为对照组,每名研究对象均常规采集静脉抗凝血5ml,位点基因型通过GoldenGate定制芯片平台分型,经筛选获得399个SNP位点,先利用随机森林算法进行降维,再用传统的logistic回归对降维后的变量进行分析,并采用受试者工作特征曲线(ROC)曲线下面积(AUC)分析多个SNP位点与肺癌的遗传易感性。结果经随机森林算法筛得50个平均重要性得分最高且错误率最低的变量,其中环境变量(吸烟、年龄分组、性别)的重要性得分均位于前20,分别为4.05、3.12、1.16;在调整3个环境变量后,经阳性结果错误率(FDR)法进干亍多重性校正,结果仍有统计学意义的SNP位点有6个(FDR—P〈0.05),而如果直接采用传统logistic回归分析,则无法发现有统计学意义的SNP位点。对于2个ROC曲线(分别为只包含环境变量模型ROC曲线、包含环境变量和SNP位点模型的ROC曲线)AUC(分别为0.6491±0.0172、0.6811±0.0166)的似然比检验结果表明,6个SNP位点与肺癌的关联性有统计学意义(χ^2=43.82,P=3.6×10^-11)。结论利用随机森林算法先剔除高维数据的噪声位点,再利用logistic回归分析,可提高检验效能,优于直接利用logistic回归分析。
- 朱晶晶赵杨陆凤胡志斌陈峰
- 关键词:肺肿瘤人工智能
- 对卫生统计学发展有重要影响的学会——记中国卫生信息学会(原中国卫生统计学会)被引量:1
- 2013年
- 中国卫生统计学会成立于1984年,1994年底成为国家级学术团体,2004年更名为中国卫生信息学会。学会通过举办学术会议、专题讨论会,编辑出版《中国卫生统计》杂志等促进卫生统计学术交流与合作;通过开展继续教育和培训提高卫生统计工作者的业务水平。本文以学会各个发展时期的主要事件和学术活动为主线,简述学会发展历程。
- 沃红梅陆守曾易洪刚陈峰
- 关键词:卫生统计
- 全基因组关联研究中的二阶段病例对照设计被引量:2
- 2010年
- 全基因组关联研究(GWAS)已成为寻找疾病致病基因的重要手段,但是研究费用昂贵,大部分研究者选择了资源利用率更高的二阶段设计.为系统阐述二阶段病例对照设计的研究设计和统计分析方法,论文作者结合实例分析介绍了其设计的基本原理,在GWAS中的实施步骤、统计分析策略以及应用特点和现状.
- 马昭君易洪刚赵杨陈峰
- 关键词:全基因组关联研究病例对照