Я новичок в R, пытаясь построить модель логистической регрессии для построения набора данных. Предполагается, что модель предсказывает событие первичного исхода, используя переменные rand_arm, пол и SES.
model2 <- glm(prim_outcome ~ rand_arm + sex + SES, data = building,
family = 'binomial')
glm(formula = prim_outcome ~ rand_arm + sex + SES, family = "binomial",
data = building)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.8209 -1.2511 0.7194 0.9069 1.3302
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.6760 0.2781 2.431 0.0151 *
rand_armtype B 0.5437 0.2487 2.187 0.0288 *
sexmale -0.5045 0.2520 -2.002 0.0453 *
SESlow -0.5238 0.2955 -1.773 0.0763 .
SESmedium 0.2267 0.3126 0.725 0.4685
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 392.05 on 299 degrees of freedom
Residual deviance: 374.88 on 295 degrees of freedom
AIC: 384.88
Number of Fisher Scoring iterations: 4
Затем я должен предсказать вероятность результата для пациента, который имеет пол = женский, rand_arm = тип b и SES = средний. Вот моя попытка:
preddata <- data.frame(rand_arm = "type B", sex="female", SES = "medium")
predict(model2, newdata = preddata, type = 'response')
Который дает:
1
0.8094473
Затем я должен изобразить эту вероятность как функцию возраста пациента и добавить к графику доверительные интервалы 95%, и я не знаю, как действовать дальше. Я не уверен, как получить предсказанные вероятности и ввести их в график. Любая помощь в том, как это сделать, будет оценена по достоинству, поскольку я просматривал различные форумы/похожие вопросы, но все еще борюсь. Спасибо.