[诠释经典]医学预测模型前沿圣经-Clinical Prediction Models (绪论) 原创总结
建模课题的框架不掌握能行吗
当然不能行。
先上我们的课题框架 + 七步法建模:
图释:构建临床预测模型的重点规则步骤。内容是基于 Steyerberg 教授的《临床预测模型》一书的绪论章节
建模的第一步,也是最重要的一步是明确:为什么要进行预测?有足够的必要性吗?
如果打算在临床工作中使用,我们还应该考虑模型所在的临床决策节点,以及涉及哪些学科。然后,我们对所选的结果和预测因子有可靠的测量方法吗?注意,这里的结果和预测因子是在临床应用层面上的而不是研究论文中的结果(Results)和变量(Variables)。
比如,对于预测开颅术后感染,一定是希望预测节点在出现脑脊液检测阳性之前,因为该检测虽然为金标准,但是敏感度低,尤其在感染早期。预测的目的也很重要。由于预测是要指导抗生素用药,是否能在套餐医嘱范围内提前停药,那么晚于术后48小时预测也就没有意义(因为已经停药了)。但是,由于预测节点早,能够获取的临床信息也会更有限,比如大多数样本不会有脑脊液检查,所以脑脊液检查即便纳入,在数据集中也属于数据缺失较多的变量。另外,由于是回顾性研究,数据来源是电子病历,所以各项检验检查数据是优势,但病史相关信息是弱项。尤其是脑脊液漏,很少会被记录。
当全面思考过以上研究问题、预期应用场景、结果和预测因子之后,应该要提出一个研究假设(hypothesis)。然后选择一种研究类型来验证假设。比如,是仅仅探索关联性?还是找更为严格的因果关系?随后,需要选择一个适合这个研究问题的统计模型。还需要预先计算样本量(非常重要),进一步明确研究是否可行。如果以上所有内容都经过严格讨论并在各学科层面达成一致,就可以制定完整的研究方案了。
关于建模的具体操作处理,Steyerberg 教授提出了以下需要遵循的七个步骤:
第一,数据检视。包括处理缺失值和数据清理。
第二,需要考虑如何对连续和分类变量进行编码(变成计算机懂的“语言”)。如何选择变量以确保模型实际使用时的可行性和效果。这里没有一成不变的规则,要具体场景具体分析。
第三,如何在计算中有效且真实体现我们想要验证的关联性?比如,如果你选择了一种机器学习的方法(而不是传统统计学),那么模型将更多地由“数据驱动(data-driven)”,意味着它会“自动学习”数据内在规律,而传统的统计分析会预先使用临床专业知识(theory-based)作为假设提前定好模型的逻辑。
第四,一旦有了模型,我们就要估算其参数,来衡量参数意义。这时的参数衡量是统计学角度,如 p 值。目前提倡 p 值仅做参考,不作为主要筛选依据。
第五,自然是评估模型质量。也就是说,模型是否确实在场景中有用。这时会有一系列衡量模型表现的指标供我们选择。关于评估模型质量,建议阅读 Steyerberg 教授的文献 。
第六,考虑模型在样本之外其他对象身上的有效性(泛化),当然,能够泛化这本就是建立模型的初衷。此外,还有一些统计学方法来进行内部验证和外部验证,并减少过拟合。
第七,也是最后一步,往往很容易被忽略,那就是如何呈现模型。合理的呈现方式应该考虑应用者的需求。比如有时候模型会化为一个量表,共便捷的临床使用。
以上这些步骤我们都将在今后课程详细讨论。
参考文献:Steyerberg, E.W.; Vickers, A.J.; Cook, N.R.; Gerds, T.; Gonen, M.; Obuchowski, N.; Pencina, M.J.; Kattan, M.W. Assessing the performance of prediction models: A framework for some traditional and novel measures. Epidemiology 2010, 21, 128.