您的位置: 专家智库 > >

文雯

作品数:6 被引量:33H指数:4
供职机构:重庆医科大学公共卫生与管理学院卫生统计与信息管理教研室更多>>
发文基金:国家自然科学基金更多>>
相关领域:医药卫生理学更多>>

文献类型

  • 5篇中文期刊文章

领域

  • 5篇医药卫生
  • 1篇理学

主题

  • 1篇地理信息
  • 1篇地理信息系统
  • 1篇调查数据
  • 1篇信息系统
  • 1篇行为者
  • 1篇性行为
  • 1篇影响因素
  • 1篇朴素贝叶斯
  • 1篇朴素贝叶斯分...
  • 1篇朴素贝叶斯分...
  • 1篇微阵列
  • 1篇微阵列数据
  • 1篇先验
  • 1篇先验信息
  • 1篇列数
  • 1篇男男性行为
  • 1篇男男性行为者
  • 1篇结构方程模型
  • 1篇结构数据
  • 1篇克里金

机构

  • 5篇重庆医科大学

作者

  • 5篇文雯
  • 5篇彭斌
  • 4篇陈江鹏
  • 4篇胡珊
  • 2篇唐小静
  • 1篇王宏
  • 1篇曾庆

传媒

  • 4篇中国卫生统计
  • 1篇上海交通大学...

年份

  • 5篇2015
6 条 记 录,以下是 1-5
排序方式:
基于最大相关最小冗余朴素贝叶斯分类器的应用被引量:1
2015年
目的将基于最大相关最小冗余(maximum relevance minimum redundancy,MRMR)的朴素贝叶斯分类器(naive bayesian classifier,NBC)应用于基因表达数据并与经典NBC、随机森林(random forests,RF)进行比较。方法采用Matlab与R软件编程,应用结肠癌与肺癌基因表达数据集,分别采用上述三种方法进行比较研究,使用10-折交叉验证方法估计经典NBC与RF的分类准确率。结果应用MRMR-NBC分析结肠癌基因表达数据集显示,采用信息熵(mutual information quotient,M IQ)法,当特征m=11时分类准确率达93.55%;而采用信息差(mutual information difference,M ID)法时,当m=15时分类准确率达到95.16%。应用MRMR-NBC分析肺癌基因表达数据集显示,采用MIQ法,当m=14时分类准确率最高达98.63%,而采用MID法时当m=12时分类准确率达到97.26%。而采用经典NBC分析结肠癌与肺癌基因表达数据时,分类准确率分别为66.67%、80.00%;RF在分析结肠癌与肺癌基因表达数据时,分类准确率分别为81.89%、77.62%。结论 M RM R-NBC能在仅有极少属性参与分类时,得到较高的分类准确率,优于经典NBC与RF。
陈江鹏彭斌文雯曾庆唐小静胡珊文小焱阙萍
关键词:朴素贝叶斯分类器
贝叶斯层次模型在嵌套结构调查数据中的应用研究被引量:7
2015年
目的针对分层抽样流行病调查数据的结构特点,构建两种基于分层嵌套思想的贝叶斯层次模型,并探讨其优缺点。方法以贝叶斯层次模型为基础,利用嵌套结构中的层级关系构建模型,其中,模型一以嵌套层效应分解为特点构建,模型二以嵌套层效应逐级传递为特点构建。以重庆市出生缺陷调查数据为例,采用Open BUGS软件进行模型拟合及分析。结果以偏差信息准则(deviance information criterion,DIC)作为拟合优度评价,模型一和模型二的DIC值分别为101.8和101.6,大致相等;敏感性分析显示,在总体率的超参数μ设置不同先验信息下,模型一和模型二对总效应估计的变异性分别为(用标准差度量,10-4):后验均数1.191和27.546;后验中位数1.038和7.617,模型一的变异性比模型二小。结论模型一和模型二均可用于嵌套结构的调查数据建模分析及预测,拟合效果相当;但模型一比模型二受先验信息影响小,稳健性更好,更适合先验信息欠缺时的数据分析。
文雯文小焱胡珊彭斌
关键词:分层抽样
基于地理信息系统的全国1996—2012年出生缺陷空间分析被引量:13
2015年
目的探讨全国出生缺陷发病的空间分布特征,为出生缺陷的有效防控提供科学依据。方法建立全国1996—2012年出生缺陷发病数据库,利用普通克里金插值,生成全国出生缺陷发病水平图,对发病率进行空间自相关分析、趋势面分析和空间回归分析。结果全局自相关显示:全国出生缺陷1996—2004年(I=0.226,P=0.000 6)和2005—2012年(I=0.283,P=0.000 03)呈现空间聚集性;局部自相关指出了出生缺陷发病的"正热点"区域分别为广东、广西和福建,"负热点"区域分别为黑龙江、吉林和辽宁;趋势面分析显示:出生缺陷发病由西向东先增高再降低,由北向南逐渐增加;空间回归分析显示:发病率随着纬度的递增而降低。结论全国出生缺陷发病具有明显的地域分布规律,应针对不同区域制定相应的预防控制措施。
文小焱彭斌胡珊文雯陈江鹏阙萍
关键词:地理信息系统克里金
应用结构方程模型分析男男性行为者生存质量影响因素的研究被引量:4
2015年
目的调查男男性行为者(men who have sex with men,MSM)生存质量现状,并探讨MSM生存质量的影响因素。方法在重庆市通过滚雪球方式招募532名MSM,使用世界卫生组织生存质量测定量表简表(WHOQOL-BREF)、社会支持评定量表(SSRS)对其进行问卷调查,采用结构方程模型分析其生存质量的影响因素。结果调查的532名MSM生存质量总分为13.11±2.17。通过结构方程模型发现MSM生存质量影响因素包括社会支持、健康行为、社会地位、经济状况四个因素,其中社会支持对生存质量的标准化总效应达0.55。结构方程模型拟合结果:χ2/v=1.651,RMSEA=0.052,CFI=0.959,NFI=0.933,IFI=0.960,GFI=0.958,AGFI=0.939。结论模型拟合结果良好,社会支持、社会地位、健康行为、经济状况均影响MSM的生存质量。
陈江鹏文雯彭斌王宏
微阵列数据中的先验信息对基于LASSO变量选择方法影响的模拟研究被引量:2
2015年
目的探讨微阵列数据中的先验信息对基于LASSO变量选择方法的影响。方法设置真实模型后,逐步融合先验信息,采用R、MATLAB软件编程,模拟比较先验信息对LASSO,group LASSO(简称为g LASSO)中的non-overlap group LASSO(简称为nog LASSO)和overlap group LASSO(简称为og LASSO)变量选择的影响。结果经典的LASSO、og LASSO变量选择方法在处理模拟微阵列数据时具有较好的预测精度(AUCLASSO=0.8915≈AUCog LASSO=0.8923>AUCnog LASSO=0.8396,MSEnog LASSO=0.1358>MSEog LASSO=0.0975≈MSELASSO=0.0928),LASSO可解释性最强(平均入选模型基因数分别为21.52、111.95、101.01)。nog LASSO在处理基因通路信息时,当[X295]被错分至第19个通路后,尽管未改变其效应值,但入选模型次数大为减少,预测精度下降较为明显,而og LASSO表现更稳健。结论融合微阵列数据中的先验信息并未提高基于LASSO变量选择方法的预测性能及效率,经典的LASSO变量选择方法仍为处理微阵列数据的有效方法。
陈江鹏彭斌文雯唐小静文小焱胡珊
共1页<1>
聚类工具0