宝塔服务器面板,一键全能部署及管理,送你10850元礼包,点我领取

参考链接:https://jingyan.baidu.com/article/597a064395087c312b524313.html

在回归分析模型 Y=β0+β1X+ε(一元线性回归模型)中,Y是被解释变量,就称为因变量。X是解释变量,称为自变量
。表示为:因变量Y随自变量X的变化而变化。协变量是指那些人为很难控制的变量,通常在回归分析中要排除这些因素对结果的影响。

“选择变量”即是条件变量,并且有个条件定义按钮(rule),通过这个按钮可以给定一个条件,只有变量值满足这个条件的样本数据才参与回归分析。

logistic回归方法的选择:输入、向前、向后与条件、LR、Wald

http://www.datasoldier.net/archives/2023

当自变量较少,且研究者希望考察所有自变量与因变量间关系时,可考虑使用Enter法,强迫所有自变量参与建模,而不考虑是否有显著影响。

当自变量较多,研究者希望软件帮助筛选对因变量有显著影响的自变量参与建模,此时,新手用户可选择【向前:LR】或【向前:条件】方式进行logistic逐步回归建模。

模型摘要:一般用-2对数似然 体现模型的拟合度,一般这个-2对数似然越小说明模型拟合度越好

Hosmer and Lemeshow Test这是一个方程拟合度检验,做的是虚无假设,假设拟合无偏差,查看sig值,如果是>0.05,说明应该接受结果,即认同拟合方程与真实的方程基本没有偏差。

也就是说这个sig值越大越好。

 方程式中的变量显著性<0.05,说明这个变量进入模型是有意义的。

如何判断Logistic回归中哪个自变量更重要?

转载自:http://www.datasoldier.net/archives/tag/logistic%e5%9b%9e%e5%bd%92

在线性回归中,SPSS软件直接给出了各自变量的回归系数以及对应的标准化回归系数,可根据后者比较各自变量对因变量的重要性,十分方便。

但是我们发现在logistic回归中,SPSS软件只给出了回归系数而没有提供标准化后的回归系数,那么此时应该如何判断自变量的重要性呢?

二元逻辑回归-风君雪科技博客

logistic回归中有一个非常重要的概念,叫做OR,通俗理解为解释变量的危险程度。我在比较各自变量(解释变量)重要性时,首选使用OR值的大小对自变量进行排序,

OR值越大说明对应的自变量越是重要。

比如上面的例子。Exp(B)即OR值,用Exp(B)对3个自变量进行排序,很显然它们对目标变量的影响重要性依次为“动物脂肪摄入”> “高血脂史” > “A型性格” 。

这个办法简单有效,我认为最好是加个前提,logistic回归模型对数据变异的拟合足够优秀,模型能通过统计检验,样本量的数量足够多能支持这个结论的稳定性

此外,也可以考虑使用自变量wald检验(瓦尔德)的显著性p值来对自变量重要性进行排序,经验上它的结果和OR排序是一致的。

如何计算logistic 回归的标准化回归系数?

二元逻辑回归-风君雪科技博客

 二元逻辑回归-风君雪科技博客

 先用SPSS–分析–描述性统计—描述  得到各变量的标准(偏)差,然后用EXCEL计算,得到各变量的标准化回归系数

二元逻辑回归-风君雪科技博客