刘妍岩 作品数:19 被引量:20 H指数:2 供职机构: 武汉大学数学与统计学院 更多>> 发文基金: 国家自然科学基金 中央高校基本科研业务费专项资金 湖北省自然科学基金 更多>> 相关领域: 理学 生物学 农业科学 社会学 更多>>
关于不连续密度函数的NN-估计 刘妍岩关键词:密度函数 随机分形的若干研究 博士论文的主要内容由以下四个部分组成:1.随机自相似集正则性的研究;该博士论文的第1章证明了随机自相似集具有强正则性,特别这一结果包含了Falconer的结果.2.随机Moran集Hausdorff维数的研究;3.具有混... 刘妍岩关键词:维数 量纲 基于DNA微阵列数据分析的分级Bayes模型 2009年 如何分离出少量区别不同组织类型的特异性基因是DNA微阵列数据分析中的主要问题,特别是构建恰当的统计模型来刻画这些不同组织类型的DNA表达形式尤为重要.为此,基于基因DNA微阵列数据的特点,我们假定对数变换后的微阵列数据服从混合正态分布.我们采用分级Bayesian先验刻画不同基因的相关性,利用分级Bayesian方法构建模型,给出了刻画不同组织基因表达的差异的一个标准,用MCMC迭代计算该标准.模拟计算表明我们的模型具有较好的识别能力. 刘妍岩 杨丹关键词:BAYES推断 DNA 基因表达 微阵列 基于正态混合模型的贝叶斯分类方法及其应用 被引量:4 2020年 本文主要研究正态混合模型的贝叶斯分类方法.贝叶斯分类以后验概率最大为准则,后验概率需要估计相关的条件分布.对于连续型数据的分类,其数据由多个类别混合而成,仅用单一分布难以描述,此时混合模型是一个较好的选择,并且可由EM算法获得.模拟实验表明,基于正态混合模型的贝叶斯分类方法是可行有效的.对于特征较多的分类,不同特征对分类的影响不同,本文对每个特征应用基于正态混合模型的贝叶斯分类方法构建基本分类器,然后结合集成学习,用AdaBoost算法赋予每个分类器权重,再线性组合它们得到最终分类器.通过UCI数据库中实际的Wine Data Set验证表明,本文分类方法与集成学习的结合可以得到高准确率和稳定的分类. 张婧 袁敏 刘妍岩关键词:贝叶斯分类 EM算法 ADABOOST算法 NQD样本最近邻密度估计的相合性 被引量:7 2006年 随机变量X1,…,Xn称为是两两NQD的,若对于任意Xi,Xj(i≠j,i,j=1,2,…,n)都有:P(Xi 刘妍岩 张艳丽关键词:最近邻密度估计 相合性 基因调控网络的边预测 被引量:2 2015年 为构建基因调控网络,提出了一个基于基因表达水平和网络反传递的算法.该算法用网络反传递思想来分析由传统相关性计算方法产生的间接效果,并考虑了调控网络的稀疏性,在模型算法中加入了控制网络稀疏性的l_1范数惩罚项.在大肠杆菌实验数据上测试该算法,这种方法提高了相关性分析对调控网络中边的预测能力,皮尔逊相关系数提高了6.42%,斯皮尔曼相关系数提高了5.92%,互信息提高了9.35%.总的来说,这个模型为修饰大量系统的相关性数据提供一种新思路,可以应用到网络边的预测和推断生物网络的控制动力学中. 黎妍 张晓飞 易鸣 刘妍岩关键词:基因调控网络 斯皮尔曼等级相关系数 考虑基因与基因间的交互作用的基因组选择方法研究 被引量:1 2019年 综合考虑主基因效应以及基因间的交互效应对植物选育种的作用是基因组选择研究关注的热点问题之一.目前已有的研究大多忽略了基因的交互效应,这主要是由于考虑交互效应会大大增加备选基因的数目,从而导致已有的统计建模方法不稳定.本文将基因效应与基因间的交互效应同时引入模型,提出三步模型构建方法以达到简化计算和提高模型预测精度的目标.第一步,不考虑具体模型,通过距离相关筛除方法删掉与响应变量显著无关的基因;第二步,在剩下的基因中,利用贝叶斯方法筛选可能的基因;第三步,基于选出的基因,同时考虑单基因效应和交互效应,利用惩罚方法选择模型并估计参数.通过模拟计算说明我们提出的方法与已有的一步模型选择方法相比具有计算简单、稳健、运行时间少并且预测精度高等优点.最后,将本文的方法应用于油菜花数据,实证分析表明,我们提出的方法显著地提高花期性状的预测精度. 刘妍岩 王蕊 赵燕 邹君关键词:交互效应 贝叶斯方法 ψ-混合相依变量线性形式的强稳定性(英文) 被引量:2 2011年 线性形式的强稳定性在科学技术上存在着广泛应用. 本文讨论了ψ-混合随机变量列线性形式的强稳定性.通过对ψ-混合随机变量列运用截尾术, 借助于ψ-混合随机变量的性质以及Borel-Cantelli引理, 得到了ψ-混合随机变量线性形式具有强稳定性的充分条件. 同时也给出了一些其它形式的结果. 杨延召 刘妍岩关键词:强稳定性 Ψ-混合 遗传参数的极大似然估计 2009年 将Luo和Woolliams模型中的混合正态分布推广到混合对数正态分布,先用矩量法得到各参数的估计值,再将此估计值作为EM(Expectation Maximization)算法迭代的初值进行迭代,将矩量估计和极大似然估计结合起来,提高了EM算法的收敛速度并使修改后的模型更符合生物学事实. 张晴霞 刘妍岩关键词:极大似然估计 数量性状基因位点 标记基因 多元失效时间数据的一般边际半参数危险率模型研究 2014年 在生物医学研究中,多元失效时间数据非常常见.该文提出用一般边际半参数危险率回归模型来分析多元失效时间数据.此模型包括了三种常用边际模型:边际比例风险模型、边际加速失效时间模型和边际加速危险模型作为子模型.对于模型中的回归系数,可以通过估计方程的方法来估计它,同时也给出了基准累积危险率函数的估计.得到的估计可以证明是相合的和渐近正态的. 杨青龙 郭丽莎 刘妍岩关键词:渐近正态