[随笔]科研玄学知多少?
你的科研五行缺一个套路
今天要讲一个大部分人都不知道的科研套路。说它是套路,因为如果你能遵循了,那你的科研成果是非常可控的,没有多少玄学。
......套路就是这个 Research Pyramid,科研金字塔:
图释:哲学讲究这么一个顺序:认知论 epistemology,范式 paradigm,方法论 methodology,方法 method,我在最后加了个工具technique。可以理解为它是用来得出事物真相的一个公式。科研的顺序是从塔尖到塔底,而且如果从底部去掉一层,两层,依然还是金字塔,研究还是合理进行的,然而去掉塔尖或者中间部分,那就不成塔,你的研究就要看运气了。
这里要用 JAMA 的一篇文章来讲述,让你服气 😁 题目为用于急诊儿科预测持续性脑震荡症候群风险的评分系统:
图释:这是原文标题和摘要,不用细看,下面我来分解。
“importance”:认知
图释:高达1/3的此类患者得不到一个清晰的预判来监测持续性脑震荡症候群 PPCS,目前也不存在验证过的、实用的预测工具
认知决定了你能够看到什么重要 什么不重要 — 也就是在探讨重要性。这里 JAMA 直接把摘要写作里的第一条,从传统的background 变成了 importance, 说明它是要作者认真讲明白,抓住重点。有些学者写文章的时候就一两句,说,这个别人没做过,我们做了,这就是它的重要性 —— 这是错的。别人恰恰可能是因为它不重要。重要性和创新性可以替换使用,所谓的缺乏创新性本质也是认知还不够。听上去好像在贬低,大家都是硕士博士起步,怎么会认知不够呢?实际上一般是因为文献查的不够多,思考得不到位,立意不够充分。
而且创新性并不是要搞个大新闻,两分的文章也是有创新性的。大家如果把自己的学术研究当成一个完整拼图里的一块,其实是全世界的学者一起来完成一幅主题。重要性大小就好像你这一块的大小,但是如果没有重要性或创新性,那么好比你这一块和别人重复了,或者你的内容不符合这张画。
“objective”:学科范式
图释:学科涉及临床儿科,急诊科学,脑科学,统计学建模
学科范式 paradigm,就是要明白你的研究问题是属于哪个学科范畴。因为它决定了你要用怎样的理论和解题思路,以及你要不要寻求其他某些专业的人合作。我们每个人都在各自学科里继承着前辈们的课题,很少需要认真思考学科范式的问题。但是当大数据和人工智能与各学科融合发展,做这些学科交叉的课题要求我们花点时间严谨地界定范式,也就是要有解题思路的理论依据。
“design”:方法论
图释:方法论就是“design”,通常作为方法部分的第一句,本研究点明了是前瞻性、队列研究
methodology 这个词是方法论,翻译成我们领域的词汇就是研究类型。在显摆方法论的时候是有一些注意点的,我发现有些作者会把自己的 method 说成 methodology,确实更有逼格,但是用得不对。methodology 可以理解为就是study design,其实一两句话就能说完了,如果需要说得更细,那你八成是在说methods,甚至更下面一层的工具,technique。study design 主要就是讲一讲前瞻还是回顾的(prospective or retrospective),观察的还是干预的(observational or interventional),一两句话让审稿人觉得你的设计总体上没毛病。
“exposure, main outcome and measurement”:方法
图释:这里讲了人群样本,主要结果和衡量指标,可以说是“方法三件套”
从方法 methods 开始,才是你的“办案”细节。注意,这些方法一定是符合你的方法论的。而且到了这一步,你能得到什么样的结果已经“冥冥之中”有了定数,自此的具体步骤只是一个揭示的过程而非一个创造的过程。 换句话说,如果前面的过程有问题,这时已经无力回天,除非从塔尖重来。比如选择了什么样的人群,样本量有多大,就决定了你的主要结果和次要结果能是什么,以及结论的区间可能会在哪。这里也要告诉读者,你要衡量哪些结果来回答前面提出的研究问题。
"result":工具
图释:工具是直接计算结果的,是要在前面的学科范式、方法论框架里的,不是凭空选择的
最后的工具 technique 直接用来得到结果。前面说了要衡量哪些结果,到这里就是告诉读者你将用什么工具来衡量。比如p值和置信区间,都属于工具。现在 p 值已经遭到越来越多的质疑甚至反对,所以在呈现结果的时候往往需要多个角度,比如同时给出置信区间。
用什么样的工具就好像选取什么样的相机设备去给事实真相拍照。 假设你得到了一个比较大的 p 值,也就是一张比较糊的照片,那你并不能说这个物体本身就是这么糊,而是目前的手段工具只能做到这个程度,这时候你需要清晰说明这张照片是用了什么设备,什么参数下拍的,确保公开透明,让其他学者至少能够得到更多有用信息,这也是审稿人非常赞赏的行为,因为这样一来阴性结果也可以是有价值的。
这时候,只要前面走的过程是对的,那就应该接受这个“不好的” p 值。但是往往这时候时间金钱都已经投入了很多,有人开始对这张糊的照片进行ps,或者对这个物体进行一些修饰,这叫学术造假,有人不想造假,但却任意调整“拍照”距离和角度,直到“照片“满意。这看似没有造假,但也是错误的,因为此时的拍照距离和角度,它的范围是前面的学科范式与方法论已经给框好的,新的拍照距离和角度其实是你自己的主观臆断和遐想,而不是靠严谨的科学步骤一步步走出来的。甚至有人根据这张拍的照片,修改一开始陈述的“主要结果”和“次要结果”,这就更离谱了,而可怕的是,这在科研写作中完全可以被掩盖掉,审稿人要非常仔细才能看出蛛丝马迹,甚至不可能看得出来。这也就是为什么会鼓励在进行研究之前先发布 Protocol(研究计划)。
这时候你可能还是想问,如果上述步骤全都按部就班认真走过来,最后结果还是阴性,文章还是悲剧怎么办?首先我要告诉你,放心,这不太可能,这才真的是发生了玄学。这时就看看,是不是杂志找错了?或者写作太差?总之,你的学术研究本身如果能把上述步骤按顺序做好,一定一定会有值得被看到的东西。
医学 - 统计 - R 语言三位一体
欢迎小伙伴一起讨论学习!
微信:Positivism_y
QQ 群:760447631
邮箱:hellomedstat@gmail.com