
Cox回归的应用前提
比例风险假设(PH假设):各协变量的风险比例不随时间变化,如果违反比例风险假设,可能需要使用时依协变量或分段Cox模型等修正方法
无信息删失:删失的发生与事件发生无关
无时间依赖性协变量:协变量的效应在整个研究期间恒定
关键步骤与实现
1. 数据准备
- 变量类型:需包含时间变量(如生存时间)、状态变量(如是否发生事件)和协变量(如年龄、性别)。分类变量需转换为因子(如 as.factor())。
- 缺失值处理:通常采用逐案删除法(listwise deletion)。
2. 单因素Cox回归
library(survival)
res.cox <- coxph(Surv(time, status) ~ sex, data = lung)
summary(res.cox)
结果解读:coef:回归系数,正值表示风险增加(如性别为男性时HR=0.588,风险降低)。z值:Wald统计量(coef/se(coef)),用于检验系数显著性(p<0.05为显著)。HR(exp(coef)):风险比,HR>1表示风险升高。
3. 多因素Cox回归
res.cox <- coxph(Surv(time, status) ~ age + sex + ph.ecog, data = lung)
summary(res.cox)
模型评估:似然比检验、Wald检验、得分检验:三者p值均显著表明模型整体有效。Concordance:值越接近1,模型预测能力越强。
4. 逐步回归与变量筛选
前向选择:从空模型开始,逐步添加显著变量。后向消除:从全模型开始,逐步剔除不显著变量。逐步选择:结合前两者,每次添加变量后检查已有变量的显著性。
multiCox <- step(coxph(Surv(time, status) ~ ., data = df), direction = "both")[[14]]
5. 比例风险假设检验
使用cox.zph()
函数验证风险比例假设:
test.ph <- cox.zph(res.cox)
print(test.ph) # p>0.05表示假设成立[[4, 13]]
原创文章(本站视频密码:66668888),作者:xujunzju,如若转载,请注明出处:https://zyicu.cn/?p=20135