曹红艳
- 作品数:26 被引量:113H指数:7
- 供职机构:山西医科大学公共卫生学院更多>>
- 发文基金:国家自然科学基金山西省自然科学基金山西省科技攻关计划项目更多>>
- 相关领域:医药卫生理学文化科学生物学更多>>
- 基于多组学数据的透明细胞肾细胞癌预后分子分型研究被引量:2
- 2022年
- 目的探讨关联-信号-注释增强的相似网络融合(association-signal-annotation boosted similarity network fusion,ab-SNF)方法在透明细胞肾细胞癌(clear cell renal cell carcinoma,ccRCC)多组学数据整合分子分型中的应用,识别ccRCC不良预后患者,研究不同分型患者的潜在致病基因、通路活性及相关免疫浸润细胞。方法从癌症基因组图谱(the cancer genome atlas,TCGA)数据库中下载ccRCC的miRNA、mRNA表达数据及DNA甲基化数据。利用ab-SNF对ccRCC患者多组学数据进行整合分型;采用Cox回归分析模型研究不同分型患者的预后风险;针对不同分型,筛选差异表达mRNA(DEmRNAs)、miRNA(DEmiRNAs)及差异甲基化基因(differentially methylated genes,DMGs),并对重合基因进行相关分析与基因本体(gene ontology,GO)富集分析;最后对不同分型患者进行免疫细胞浸润和通路活性分析。结果ab-SNF将ccRCC患者分为低危组和高危组,其中高危组患者的死亡风险是低危组的1.903倍;筛选出5218个DEmRNAs,107个DEmiRNAs及2625个DMGs。其中,20个差异表达基因受到DEmiRNA调控,567个基因差异表达的同时伴有异常甲基化;588个重合基因富集于有统计学意义的10个GO生物项。此外,筛选出有统计学意义的6种免疫浸润细胞和9条通路。结论ab-SNF能够有效地识别ccRCC亚型,筛选出的ccRCC潜在致病基因、重要通路及相关免疫浸润细胞,可为ccRCC靶向治疗提供新的参考。
- 魏亿芳李灵梅李治房瑞玲曹红艳曹红艳
- 关键词:分子亚型
- 重复测量计数资料的随机效应ZIP模型被引量:1
- 2009年
- 目的探索重复测量0过多计数资料的统计模型。方法将重复测量中的个体当作随机效应引进ZIP模型,建立随机效应ZIP模型。结果模拟研究和实例分析表明,由于随机效应ZIP模型既考虑了个体不同测量值的相关性,又考虑了0过多的问题,结果优于随机效应Poisson回归和固定效应ZIP模型。结论在重复测量计数资料0过多时,宜采用随机效应ZIP模型。
- 曾平曹红艳刘桂芬
- 关键词:计数资料心律不齐
- 潜在类别分析在出生缺陷高危人群识别中的应用被引量:11
- 2016年
- 目的 应用潜在类别分析(latent class analysis,LCA)对具有不同出生缺陷相关因素分布特征的人群进行分类,识别出出生缺陷高危人群,为采取有重点、有针对性的干预措施提供依据。方法 选取近亲结婚、亲属缺陷儿、自然流产史、既往缺陷儿、孕期发热、孕期感冒、居住地存在污染源、孕期用药、育龄9个出生缺陷相关因素作为显变量,进行潜在类别分析,识别出潜在类别,进而对人群进行分类。结果 当潜在类别数目为4时模型拟合最佳,依据各因素在4个潜在类别中的条件概率的分布特征,将类别1~类别4分别命名为:一般人群组、家族缺陷史组、孕期感冒发热组、单纯用药组。对个体进行聚类后,4类人群的出生缺陷率比较,χ~2值为3099.254,P〈0.001。不同潜在类别人群缺陷率有差别。家族缺陷史组(73.7%),感冒发热组(3.8%),单纯用药组(2.5%),一般人群组(1.0%)缺陷率依次降低,其中家族缺陷史组缺陷率最高,提示家族缺陷史组人群为出生缺陷高危人群,应该有重点有针对地进行干预。结论 潜在类别分析可以应用于出生缺陷高危人群识别中。依据各因素在潜在类别中的条件概率的分布特征进行人群的分型,通过比较不同类别人群的缺陷率的差异,识别出生缺陷高危人群,揭示出生缺陷预防的重点人群和内容,为制定出生缺陷预防措施提供依据。
- 李金刘小琴曹红艳张岩波
- 基于生存结局加权多组学数据整合的胶质瘤分子分型
- 2024年
- 目的探讨将生存结局加权的多组学数据整合方法survClust应用于胶质瘤(glioma)数据,以识别具有显著分子异质性和预后差异的胶质瘤分子分型。方法采用survClust方法对中国胶质瘤基因数据库(Chinese glioma genome atlas,CGGA)的胶质瘤多组学数据进行结局加权整合分型,并拟合Cox比例风险模型评估不同分型患者预后。对不同分型间的差异表达基因(DEmiRNAs,DEmRNAs,DMGs)进行筛选,对DEmiRNAs靶基因、DEmRNAs、DMGs的重合基因进行GO功能注释;最后对不同分型患者进行免疫浸润分析。结果survClust将胶质瘤患者分为高危组和低危组,高危组患者的死亡风险是低危组的2.931倍。不同分型差异基因的分布存在差异,共筛选出194个DEmiRNAs,3396个DEmRNAs,1230个DMGs。将189个重合基因进行GO功能注释,得到52条差异具有统计学意义的GO生物项。此外,不同分型在B淋巴细胞、CD4+T细胞、CD8+T细胞、中性粒细胞、巨噬细胞和髓样树突状细胞的免疫浸润水平存在统计学差异。结论结局加权整合算法survClust能够有效识别兼具分子异质性和显著预后差异的胶质瘤亚型,同时基于分型结果筛选出的潜在生物标志物将为胶质瘤的个性化治疗提供科学理论依据。
- 贾聪聪杜港赵鑫师国京房瑞玲李治张岩波曹红艳
- 关键词:分子亚型胶质瘤
- 潜在特质模型在疾病易感性评价中的应用被引量:1
- 2017年
- 目的介绍潜在特质模型的原理、方法和技术,探讨潜在特质模型在疾病易感性评价中的应用。方法以出生缺陷数据为实例,采用R 2.5.1软件的Ltm包例证潜在特质模型的构建和分析原理。结果通过对出生缺陷数据进行潜在特质模型拟合,潜在特质得分能够很好地预测评估其发病危险。结论潜在特质模型用于疾病患病风险评价有很好的效果。
- 刘娜石志红曹红艳郭兴萍张岩波
- 卫生统计学贯通式教学方法的应用被引量:4
- 2017年
- 卫生统计学是开展生物医学实验、临床试验、流行病学调查和卫生管理医学研究的重要方法支撑。如何针对不同的资料类型,灵活地采用适宜的统计分析方法,挖掘出有意义的影响因素尤为重要。在卫生统计学习过程中,医学生普遍反映统计方法种类繁多,
- 曹红艳罗艳虹张岩波
- 关键词:卫生统计学教学方法流行病学调查
- 先天性心脏病与孕妇患病史的Poisson回归模型分析被引量:2
- 2015年
- 目的:探讨孕妇既往病史和孕期患病及用药对先天性心脏病发病的影响,为制定有效干预措施提供依据。方法:选取山西省6个县(市)2006-2008年所有出生儿母亲或一级亲属,存活婴儿36 716名为研究对象。问卷调查,采用多因素Poisson回归模型分析母亲既往病史、孕期患病及用药情况对先天性心脏病的影响。结果:Poisson回归分析表明,母亲患心脏病(OR=8.587,90%CI:1.749-42.165)、感冒或发热(OR=2.599,90%CI:1.548-4.363)、先兆流产(OR=6.242,90%CI:2.618-14.881)、生殖系统感染(OR=4.245,90%CI:1.728-10.425)及服用抗生素(OR=2.943,90%CI:1.248-6.940)增加子代先天性心脏病的发病风险。结论:先天性心脏病的发病与母亲既往病史和孕期所患疾病及用药有关,应重视孕期疾病的防治,谨慎用药,预防先天性心脏病的发生。
- 罗艳虹郭兴萍宋春英李红霞张雪娟曹红艳武姣张岩波
- 关键词:先天性心脏病孕期用药POISSON回归
- 基于健康行为过程取向的大学生体育锻炼行为比较被引量:4
- 2017年
- 目的比较不同类型高校大学生体育锻炼行为,为促进大学生体育锻炼行为改善提供参考。方法采用随机整群抽样的方法,抽取山西省理工类、医科类、综合类及财经类4所高校的873名大学生进行体育锻炼情况的问卷调查。结果不同体育锻炼阶段的人数分布整体呈倒U型,意向阶段(32.8%)和准备阶段(23.5%)的人数最多,意向前阶段(21.0%)和维持阶段(7.9%)的人数最少。4类高校大学生体育锻炼态度总量表及行为认知、情感体验、行为控制感3个维度上的得分差异均有统计学意义(F值分别为5.49,8.31,6.78,5.75,P值均<0.01),且财经类高校大学生体育锻炼态度最差。4类高校大学生体育锻炼变化程序除互助联系外,总得分及各维度得分差异均具有统计学意义(P值均<0.01),且财经类高校大学生的体育锻炼行为最差。结论在实施行为干预时,结合健康行为过程取向理论可有效改变大学生体育锻炼行为,但须考虑性别、专业等影响因素。
- 刘咏菊郑晓赵慧宁苏纯惠胡伟红曹红艳张持晨
- 关键词:健康教育身体锻炼
- 某体育院校体育类大学生健康素养状况及影响因素分析被引量:14
- 2017年
- 目的了解体育类大学生健康素养状况及影响因素,为体育专业大学生开展健康教育提供参考依据。方法 2015年10—12月采用两阶段单纯随机抽样的方法,抽取北京体育大学457名在校本科生,采用问卷调查法调查体育类大学生健康素养水平。结果体育类大学生健康素养水平为16.19%,基本知识和理念具备率为36.76%、健康生活方式与行为具备率为11.82%、基本技能素养具备率为16.85%。不同性别、年级、生源地的体育类大学生健康素养差异有统计学意义(P<0.05)。多因素Logistic回归分析结果显示,年级(OR=3.108,95%CI:1.757~5.497)、生源地(OR=2.200,95%CI:1.228~3.939)及是否参加过健康教育活动(OR=2.398,95%CI:1.373~4.189)是体育类大学生健康素养的影响因素。结论体育类大学生健康素养水平低于全国同等学历人群水平,健康生活方式与行为养成率、基本技能持有率均较低,应采取措施,提高健康素养水平。
- 李瑜曹晓娜曹红艳黄亚茹刘清华
- 关键词:体育类大学生影响因素
- 基于高斯混合模型双向聚类重采样和随机森林构建DLBCL早期复发预测模型
- 2025年
- 目的应用一种可以同时解决少数类和多数类类间和类内不平衡问题的类别不平衡处理方法,并将其与随机森林(random forest,RF)分类器结合实现对弥漫大B细胞淋巴瘤(diffuse large B-cell lymphoma,DLBCL)患者早期复发的预测,为DLBLC患者的治疗提供参考。方法首先使用一种基于高斯混合模型双向聚类重采样的类别不平衡处理方法(Gaussian mixture model,GMM-GMM)处理数据,并与随机过采样(random over sampling,ROS)、合成少数类过采样技术(synthetic minority over-sampling technique,SMOTE)、Borderline-1 SMOTE、Borderline-2 SMOTE、GMM上采样、GMM下采样、SMOTE+RUS、SMOTE+GMM和GMM+RUS进行比较,然后以RF作为分类器验证10种类别不平衡方法的性能,之后为验证RF的性能,在处理后的数据集上使用logistic回归和决策树(decision tree,DT)作为对照,最后从区分度和校准度两方面对模型进行评价。结果在本文所有模型中,采用GMM-GMM的RF模型取得了相对最优的分类性能(accuracy=0.79,AUC=0.87,sensitivity=0.71,specificity=0.87,G-means=0.79,MSE=0.21)。结论GMM-GMM优于其他传统的重采样方法,结合RF用于DLBCL患者早期复发的预测取得了相对较好的分类结果,可以很好地实现对DLBCL患者早期复发的预测。
- 王俊霞张岩波余红梅余红梅周洁曹红艳张高源周洁王雪嫚郭玉娇赵志强罗艳虹
- 关键词:复发预测