曹永秀
- 作品数:8 被引量:9H指数:2
- 供职机构:中南财经政法大学统计与数学学院更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金湖北省自然科学基金更多>>
- 相关领域:理学电子电信更多>>
- 基于广义SELO惩罚的高维变量选择(英文)被引量:1
- 2018年
- 本文考虑高维线性模型中的变量选择和参数估计.提出了一种广义的SELO方法求解惩罚最小二乘问题.一种坐标下降算法结合调节参数的一种连续化策略和高维BIC被用来计算相应的GSELO-PLS估计.模拟研究和实际数据分析显示了提出方法的良好表现.
- 石跃勇曹永秀余吉昌焦雨领
- Cox比例风险模型中基于SELO惩罚函数的变量选择方法被引量:2
- 2018年
- 在生物医学研究中,研究个体的失效时间往往存在删失,Cox比例风险模型是经常被用来处理此类删失数据的模型.对于带有删失的高维数据,如何从众多协变量中挑选出少数的致病因素是研究者的兴趣所在.本文针对高维删失数据利用SELO惩罚函数考虑了基于Cox比例风险模型框架下的变量选择及参数估计问题.在允许协变量维数发散的条件下,本文给出SELO惩罚估计量的相合性以及oracle性质.计算方面若采用传统方法计算惩罚估计解,当协变量维数较高时计算Hesse阵的逆矩阵需要花费大量的时间,且SELO惩罚函数在原点的不光滑性也给计算SELO惩罚估计带来很大难度.为此,本文利用光滑化技术对SELO惩罚函数进行近似,并利用DFP公式去代替Hesse阵的逆矩阵,进而提出了MSQN算法.模拟计算的结果表明,SELO惩罚方法比已有常用的惩罚方法表现更好,而且本文提出的新算法与常用的坐标下降算法相比表现更优.在真实数据部分,本文还分析了乳腺癌数据,并利用留一交叉验证法来评估预测的好坏.
- 曹永秀焦雨领石跃勇刘妍岩
- 加速失效时间模型下关于广义病例队列抽样功效计算的一个注记(英文)
- 2018年
- 本文在加速失效时间模型下研究了广义病例队列抽样的功效计算问题.利用光滑加权Gehan估计方程方法估计了未知回归参数,研究了固定预算下广义病例队列抽样的功效计算.模拟研究和实际数据分析评估了提出方法在有限样本下的表现.
- 石跃勇曹永秀焦雨领余吉昌
- 基于病例队列设计的平均处理效应的估计
- 2022年
- 病例队列设计因为具有成本效益而被广泛应用于流行病学和生物医学的研究中.对于病例队列设计,现有的统计方法主要集中在如何得到回归参数的相合及有效的估计上,然而很少有工作估计非随机化处理的因果效应.本文基于病例队列设计数据提出了一种有效的估计平均处理效应的方法,建立了所提估计量的相合性和渐近正态性,并通过仿真研究考察了其在有限样本下的表现.最后,我们将所提方法应用于真实数据的分析中.
- 曹永秀余吉昌
- 发散维数SICA惩罚Cox回归模型的一种修正BIC调节参数选择器(英文)被引量:4
- 2017年
- 本文研究了发散维数SICA惩罚Cox回归模型的调节参数选择问题,提出了一种修正的BIC调节参数选择器.在一定的正则条件下,证明了方法的模型选择相合性.数值结果表明提出的方法表现要优于GCV准则.
- 石跃勇焦雨领严良曹永秀
- 关键词:COX模型
- 基于病例队列数据的比例风险模型的诊断被引量:2
- 2020年
- 病例队列设计是一种在生存分析中广泛应用的可以降低成本又能提高效率的抽样方法.对于病例队列数据,已经有很多统计方法基于比例风险模型来估计协变量对生存时间的影响.然而,很少有工作基于病例队列数据来检验模型的假设是否成立.在这篇文章中,我们基于渐近的零均的值随机过程提出了一类检验统计量,这类检验统计量可以基于病例队列数据来检验比例风险模型的假设是否成立.我们通过重抽样的方法来逼近上述检验统计量的渐近分布,通过数值模拟来研究所提方法在有限样本下的表现,最后将所提出的方法应用于一个国家肾母细胞瘤研究的真实数据集上.
- 余吉昌曹永秀
- Morgenstern族次序统计量的协变量的分布被引量:1
- 2012年
- 本文研究了Morgenstern族次序统计量的协变量的分布及其在筛选测验中的应用.利用排序集抽样的方法,获得了分组测验情形下每组协变量的极值的分布.最后,将上述结果应用至总体为Gumbel二维指数分布和二维均匀分布的情形,给出了不同的样本量下选择问题的筛选效率.
- 郭丽莎金凌辉曹永秀
- 关键词:协变量极值二维均匀分布
- ?~0正则化下衰减信号稀疏恢复的PDASC算法
- 2019年
- 稀疏恢复的主要任务之一是发展和分析在计算上易于处理的算法以得到欠定线性系统的稀疏解.焦雨领等(2015)提出了一种PDASC算法求解i^0正则化最小二乘问题,并在一定的RIP条件下分析了 PDASC的误差估计,进而建立了有限步全局收敛性.对一类具有强衰减特性的信号,本文将RIP常数条件减弱到与稀疏度T无关.此外,数据驱动的选择准则被提出用来选择适合的正则参数.数值实验验证了 PDASC算法和数据驱动参数选择准则的效率和精度.
- 张虎曹永秀焦雨领石跃勇
- 关键词:连续化