科研Labs二分类 Logistic 回归

二分类 Logistic 回归

分析多个因素对二分类结局(如发生/未发生、有效/无效)的影响。用最大似然法(IRLS)拟合, 输出各因素的 OR(比值比)及 95%CI、显著性与模型拟合指标。临床预测、影响因素分析的核心方法。

① 粘贴数据(含表头)

第一行为列名,之后每行一个病例。结局变量须为 0/1(0=未发生,1=发生)。可从 Excel 整块复制粘贴。

使用说明与方法学

Logistic 回归用来做什么?

用于分析一个或多个因素(自变量)对二分类结局(如患病/未患病、有效/无效、复发/未复发)的影响,是临床影响因素分析和预测模型构建最常用的方法。结果以 OR(比值比)表达每个因素的作用方向和强度。

OR(比值比)怎么解读?

OR>1 表示该因素是危险因素(增加结局发生的可能),OR<1 表示保护因素(降低可能),OR=1 表示无关联。连续变量的 OR 指每增加 1 个单位时结局发生比值的变化。判断是否显著要看 95%CI 是否包含 1——不包含 1 才有统计学意义。

数据怎么准备?

整理成表格:第一行为列名,每行一个病例。结局变量必须编码为 0(未发生)和 1(发生)。自变量可以是连续值(如年龄、检验指标)或已编码的分类值。从 Excel 选中整块区域复制后直接粘贴即可。

什么是「完全分离」警告?

当某个自变量几乎完美地区分了结局(例如所有阳性病例的指标都高于所有阴性病例),最大似然估计会发散、OR 变得极大且不可靠。这在小样本或变量过强时常见,并非工具出错。应对方法是增大样本量、合并类别或减少自变量。