孙玲莉
- 作品数:4 被引量:12H指数:3
- 供职机构:天津财经大学中国经济统计研究中心更多>>
- 发文基金:国家自然科学基金国家社会科学基金全国统计科学研究计划重点项目更多>>
- 相关领域:经济管理理学自动化与计算机技术金属学及工艺更多>>
- 基于少数类过采样的倾向得分匹配插补法被引量:4
- 2021年
- 无回答在大数据应用中频繁发生。通常,实际数据的无回答率较低,在这样的情况下,采用倾向得分模型对无回答单元与回答单元进行匹配,易导致倾向得分匹配插补法的插补效果显著下降。为此,将合成少数类过采样算法的思想融入到倾向得分匹配插补法中,提出基于少数类过采样的倾向得分匹配插补法。利用统计模拟与实证研究,在不同无回答率、插补重数和误差分布情形下,演示新插补法的统计性质和应用效果。统计模拟显示,新插补法具有明显高于倾向得分匹配插补法的精度,统计性质受无回答率、插补重数和误差分布的影响小。实证结果显示,新插补法在实际数据中具有较好的应用性。基于少数类过采样的倾向得分匹配插补法提供了处理无回答问题的新思路,并具有较好的扩展性。
- 杨贵军杨贵军孙玲莉
- 基于EMB多重插补法的线性模型系数估计量的模拟研究被引量:7
- 2016年
- 基于EMB多重插补法的线性模型系数估计量,分析其统计性质,并与PMM多重插补法以及DA插补法进行比较。模拟结果显示,随着无回答率增加,系数估计量的偏差绝对值、均方误差呈递增趋势,估计方差的递增趋势相对更显著。在完全随机无回答机制或随机无回答机制下,建议插补重数为15。在依赖被解释变量的非随机无回答机制下,建议插补重数可适当增大。在依赖其他变量的非随机无回答机制下,估计量的均方误差和估计方差的差异大,使用EMB多重插补法要谨慎。
- 杨贵军孙玲莉孟杰
- 基于EMB多重插补法的线性模型系数估计量的模拟研究
- 本文模拟研究基于EMB 多重插补法的线性模型系数估计量,分析其统计性质,并与PMM 多重插补法以及DA 插补法进行比较。模拟结果显示,随着无回答率增加,系数估计量的偏差绝对值、均方误差呈递增趋势,估计方差的递增趋势相对更...
- 杨贵军孙玲莉孟杰
- 响应倾向得分匹配插补法被引量:4
- 2018年
- 倾向得分匹配插补法是处理无回答的常用方法,该方法对无回答与回答的样本量差异较为敏感。提出响应倾向得分匹配插补法,建立回答单元响应变量观测值秩变换的响应倾向得分模型,匹配无回答单元和回答单元的响应倾向得分,选择响应倾向得分相近的回答单元作为无回答单元的插补值。模拟研究表明,响应倾向得分匹配插补法的插补效果优于原倾向得分匹配插补法、最近邻插补法和回归插补法。在完全随机无回答机制和随机无回答机制下,随着插补重数增加,采用响应倾向得分匹配插补法的回归系数估计量的偏差绝对值和均方误差呈递增趋势。在实际应用中,插补重数选择不宜过高,建议插补重数为5。针对Sparrows数据集的分析结果显示,采用响应倾向得分匹配插补法处理无回答,能够较好估计回归模型系数。响应倾向得分匹配插补法有效改进原倾向得分匹配插补法,提高了统计分析结果的可靠性。
- 杨贵军孙玲莉李璐