SPSS缺失值处理:最大期望和多重插补

数据缺失绝对是统计分析中最为常见的问题之一,最常见的做法莫过于直接把数据导入软件进行分析,可是大多数统计模型会直接忽略有缺失值的记录,相当于在分析前先行对缺失值进行列表删除。当缺失值比较多的时候,这种做法会丢失大量的信息,如果缺失是非完全随机的,还有可能带来错误的结论。

数据缺失机制:完全随机缺失(Missing Completely At Random,MCAR)、随机缺失(Missing At Random,MAR)、非随机缺失(Missing At Non-Random,MANR)。MCAR是指数据的缺失是完全随机的,和变量自身或者其他变量的取值无关,实际中极为少见。MAR是指缺失值的丢失与本变量无关,而与数据集中其他(部分)变量有关。MANR是指数据的缺失不仅与其他变量的取值有关,也和自身取值有关。缺失值的处理方法:(1)删除;(2)单独成组分析;(3)填充

缺失值填充的方法有很多,简单如直接用均值、众数进行填充,稍微复杂一些的如回归填充、最大期望(Expectation-Maximization,EM)、多重插补(Multiple Imputation,MI)等。

最大期望

多重插补

原创文章(本站视频密码:66668888),作者:xujunzju,如若转载,请注明出处:https://zyicu.cn/?p=11921

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
xujunzju的头像xujunzju管理者
上一篇 2022年4月8日 21:13
下一篇 2022年4月20日 22:36

相关推荐

发表回复

登录后才能评论
联系我们
邮箱:
xujunzju@gmail.com
公众号:
xujunzju6174
捐赠本站
捐赠本站
分享本页
返回顶部