倾向性评分匹配 (Propensity Score Matching, PSM)
背景
研究类型:①实验性研究;②观察性研究
实验性研究中随机对照实验(RCT)最常用,并且因为能够平衡组间所有混杂因素,使得两组唯一区别就是干预因素,所以被称为临床研究“金标准”(在样本量足够大的情况下,只要是纯随机,组间混杂因素大概率是平衡的)
但是临床研究无法做到纯随机分组,eg:
在该项研究 当中,选择手术治疗或 SBRT 已经是既定的事实,而不是将病人随机分为两组后一组使用手术治疗,另一组使用 SBRT 疗法。(假设年轻人更倾向于 SBRT,而老年人更侵向于手术治疗。而我们已知年龄也是影响疗效的一项因素,这样结果大概率是 SBRT 的疗效优于手术治疗,这样的实验结果就存在偏倚。我们就需要用 PSM 平衡掉年龄「混杂因素」的影响)
原理
通过统计学方法,把所有的混杂因素通过打分并计算总分的方式,给出每一个受试对象的混杂总分,这个混杂总分就是倾向性评分(Propensity Score,PS)
PS 评分差距在 0.02 分(也可以适当放宽到 0.03 分)的两个受试对象可以配成一对,从而实现组间混杂因素的平衡(这两个受试对象必须来自不同组,一个来自试验组,一个来自对照组)。PS 评分差距,也叫做匹配容差(Match Tolerance),还可以称为卡钳值,一般为 0.02 或 0.03,卡钳值越大,能匹配上的个体就越多,但是组间混杂因素的平衡性就会变差。
在 A/B 组当中分别找一个元素进行配对,相当于找对象,A1 与 B3 门当户对
不足之处
样本丢失!因为有些样本无法找到合适的对象(无法找到另外一组中和自己 PS 评分差异在 0.02 分以内的样本),需要舍弃。
这就意味着,只有大样本的观察性研究才适合进行 PSM。
实际操作
因为 PSM 的配对方法可以分为 1:1 和 1:N ,所以操作方法也可以分为两类。1:1 配对通常使用 SPSS 就可完成,而 1:N 配对则主要依赖 R 语言和 Python 完成。
SPSS
1. 以“分组”为因变量,混杂因素为自变量,建立二元 Logistic 回归模型
2. 根据回归运算结果计算出每一个受试对象的倾向性评分(PS)
3. 根据 PS 匹配两组间的受试对象,实现混杂因素的组间平衡