Logistic回归多分类无序Logis

时间:2022-6-15 11:32:00 来源:肝增生性结节

京东运营求职招聘微信群 http://liangssw.com/bozhu/12746.html
点击上方“医学统计分析学习笔记”,快速订阅。

本文字〡15图〡预计阅读15分钟

在前面学习了二项Logistic回归、多分类有序Logistic回归,对应的因变量类型分别为二分类、多分类有序资料,而日常研究中我们经常会遇到因变量为无序多分类资料,比如下面4个研究:

研究不同肥胖测量指标与老年高血压亚型患病间的关系,根据SBP及DBP水平可将高血压分为3类亚型:单纯收缩期高血压(ISH)、单纯舒张期高血压(IDH)和收缩期舒张期高血压(SDH);

评估肝活检与B超在脂肪肝诊断中的意义,B超可见肝脏改变分为4类:肝脏弥漫性损伤、肝实质回声稍细密增强、肝实质回声稍增粗欠均、肝实质回声未见异;

探讨不同分子亚型乳腺癌患病的影响因素,IHC法检测乳腺肿瘤组织ER/PR/HER2/Ki-67水平,将病例分为3个分子型:Luminal型、HER2过表达型、Triple-negative型;

分析年龄>55岁社区人群非酒精性脂肪性肝病(NAFLD)合并代谢综合征(MS)的危险因素,将所有研究对象分为4组,即单纯NAFLD组、单纯MS组、NAFLD合并MS组及正常对照组;

上述研究的因变量类型均为多分类无序资料,此时应采用多分类无序Logistic回归模型分析。此外,有序多分类Logistic回归模型在调整连接函数后仍不满足平行线假设,可考虑采用多分类无序Logistic回归模型。多分类无序Logistic回归模型,以某一水为参照水平(SPSS默认以取值最大水平作为参照),与其他水平相比建立(水平数-1)个广义Logistic模型,例如:4水平的因变量,以水平4为参照,分别建立3个p个自变量对应的Logistic模型,如下所示:01数据

研究不同高血压亚型患病影响因素,根据SBP及DBP水平将研究对象分为正常组、单纯收缩期高血压组、单纯舒张期高血压组、收缩期舒张期高血压组,收集了3个自变量,分别为年龄、是否饮酒、是否吸烟,数据集如下所示:

?高血压数据集

02SPSS实践

??,如下所示:

?选入高血压类型,注意设置参照类型,SPSS默认以赋值最大对应的水平为参照,这里选择,以正常组为参照。?选入分类变量,?选入连续型变量。如下所示:

?多分类无序logistic回归对话框

模型选项,默认为主效应,主效应分析因子变量、协变量的主效应,不分析交互项效应;全因子分析所有主效应及因子变量的交互效应,不分析协变量交互效应;可通过定制/步进设置自变量交互项,如下图所示:

?多分类无序logistic模型选项框

统计选项,总体模型的统计,见下图:

伪R方,输出Cox-Snell、Nagelkerke以及McFadden的R方;

步骤摘要,汇总了步进法中每一步中进入或移除效应的汇总表,仅在逐步模型中有效;

模型拟合度信息,将拟合模型与仅有截距、空模型进行比较;

信息准则,输出Akaike的信息标准(AIC)和Schwarz的Bayesian信息标准(BIC);

单元格概率,按协变量模式和响应类别显示观察、期望频率(带残差)分布表和比例表;

分类表,输出观察响应和预测响应表;

拟合度卡方统计,输出Pearson和似然比卡方统计;

单调性测量,输出包含有关协调对、非协调对和相等对的信息的表。

?多分类无序logistic统计选项框

参数选项,与模型参数相关的统计:

估计,计算模型参数估计值及指定置信水平参数估计的CI;

似然比检验,输出模型偏效应的似然比检验;

渐近相关,输出参数估计相关性的矩阵;

渐近协方差,输出参数估计协方差的矩阵;

定义子群体,允许选择因子和协变量的子集,以便定义单元格概率和拟合度检验所用的协变量模式。

条件选项,见下图,迭代,允许指定希望算法循环的最大次数、最大步骤二分次数。

对数似然估计收敛性性,如果对数似然函数中的绝对变更小于指定值,则假定收敛性。如果值为0,则不使用此准则,指定一个非负值;

参数收敛,如果参数估计值中的绝对变更小于此值,则假定收敛性。如果值为0,则不使用该标准。

Delta允指定一个小于1的非负值。此值将按协变量模式添加到响应类别交叉制表的每个空单元格中,有助于稳定算法和避免估计值偏差。奇异性容差,允许指定检查奇异性时所用的容差。

?多分类无序logistic条件选项

条件选项,见下图,在使用步进法建立模型时,可提供对统计标准的控制,除非模型对话框中指定了步进模型,否则将忽略这些选项。

离散度量,允许指定用于修正参数协方差矩阵的估计离散度量值。偏差使用偏差函数(似然比卡方)统计估计刻度,可以指定刻度值,但必须是正数值。

?多分类无序logistic选项选项

保存选项,可保存以下内容:

估计响应概率,这些概率是将因子/协变量模式分类为响应类别的估计概率,估计概率的数目与响应变量的类别数目相当,最多保存25个概率;

预测类别,该类别是因子/协变量模式的具有最大期望概率的响应类别;

预测类别概率,该概率是估计响应概率中的最大概率;

实际类别概率,该概率是将因子/协变量模式分类为观察类别的估计概率。

?多分类无序logistic保存选项

将模型信息输出到XML文件,将参数估计值及其(可选)协方差导出到指定的XML(PMML)格式的文件。03结果解读

个案处理摘要输出了因变量、自变量为分类变量的频数分布表,如下所示:

?个案摘要

模型拟合信息对模型中所有自变量的偏回归系数是否全部为0进行似然比检验,不引入自变量时-2ln(L)为.93,最终模型为.77,减少了66.16,自由度为9,P<0.,表明至少有一个自变量的偏回归系数不为0。伪R方表为三种伪决定系数,均比较小,如下所示:

?模型拟合信息及伪R方

似然比检验,自由度均为3,年龄为连续型自变量,自由度等于拟合的方程个数,是否饮酒、吸烟的自由度等于取值水平-1*拟合的方程个数。由于因变量分了四类,是否饮酒、吸烟均为二分类资料,因此三个自变量的自由度均为3。似然比检验结果表明,是否饮酒、吸烟均具有统计学意义(P<0.)。如下图所示:

?模型似然比检验

以正常组为参照,单纯收缩期高压组的年龄无统计学意义(P=0.),饮酒、吸烟者单纯高血压患病分别是非饮酒、非吸烟者的1.56倍(P<0.)、1.29倍(P=0.),如下图所示:

?模型参数估计

另外,对于多分类有序Logistic回归模型,如果平线性假设检验(P<0.05),先调整连接函数,如果调整后仍然不满足平行性假设,考虑采用多分类无序Logistic回归模型。

中国卫生统计,(4):-.

参考文献

[1]

转载请注明:http://www.lonmm.com/hbys/12889.html
热点排行
肝增生结节应注意什么

近年来,父亲的肝增生性结节越来越严重了,应酬多起来了,大鱼大肉吃的夜多了……【查看详情】

精彩推荐
肝增生结节的基本常识

肝增生性结节这种疾病也是一种常见的疾病,但是了解的却极少,就……【查看详情】

相关导读
肝增生结节应注意什么

近年来,父亲的肝增生性结节越来越严重了,应酬多起来了,大鱼大……【查看详情】

网站首页 | 网站地图 | 合作伙伴 | 广告合作 | 服务条款 | 发布优势 | 隐私保护 | 版权申明 | 返回顶部