1f914

ChatGPT4o来了?CO-STAR又是什么?你是吃瓜还是焦虑?你会不会让大语言模型帮你写论文?以不变应万变的底层逻辑就是拿来主义!

2024/06/06 发布 2024/07/07

什么叫大语言模型的提示词,它为什么是新时代必备技能

如果你只是用英语作为其他专业的辅助工具,比如你像我一样是学医的,就没有必要在语言上和自己过不去,今天我只想教给大家如何绕过痛点,无痛写作。

我们只要小学生的英语水平,加上所需要的学科专业词汇,就可以得到符合学术发表水准的英语表达。这就必然要用到大语言模型,最著名的就是ChatGPT了。往后最重要的外语不一定是英语 最重要的话不一定是“我爱你”,而是掌握ChatGPT喜欢的语言和话。换句话说,咱们都要学会如何向ChatGPT问问题。

所以我们不妨拿大语言模型领域内最厉害最前沿的工具帮自己更快地达到目的,这就是我们要用的工具(其实是两个,今天只讲左边的):

image.png

这两个工具英文里他们叫Prompt Framework。 Prompt 就是指令提示,也就是我们对 ChatGPT “说的话”。Framework 就是一个结构,它帮助我们把我们要说的内容结构化,不同的目的适合不同的结构,从而提高提问效率。左边这个蓝色的叫做Costar Framework,C-O-S-T-A-R 每一个字母对应一个成分,它的发明者获得了新加坡Prompt大赛的冠军(光是一个如何提问都能用来举办比赛......)

结合了一些调查和我们的使用体会,先帮大家上结论: Costar 更适合产出 Introduction(论文的“介绍”部分),因为它喜欢基于一些限定的背景知识,但是又有一些创造力,而且可以精准地确定题材和风格的内容。而这个橙色的部分,更适合产出一些一板一眼的内容,会很忠实于你的指令。而且你如果提供模板,它会照着模板来写,很少有多余的发挥,所以非常适合我们写 Methods 和 Results 这一部分。这期我们只讲左边的,即怎么用 Costar 写 Introduction。(右边的框架以后也会讲)

科研举例说明

比如我们要写一篇系统评价 来评估现有的开颅手术术后感染高危因素的所有 meta 分析的证据质量。如果我们不用 Costar,而是用普通的提问方式(插一句,因为我需要 GPT 返回给我的内容是英文,而且 GPT 更加擅长英文,所以我就编辑好英文的内容去问他。但是大家完全不用担心英文不够好,再差也只要足够把意思表达准确就可以了)
image.png
GPT给我的回答是:

image.png

我有三点不满意:一是红框部分,只在讲预防术后感染的重要性。而我想要描述的不光是术后感染重要性,而是随之而来的感染风险因素的不清晰和证据不足、众说纷纭,而增加了控制术后感染的难度。所以“预防术后感染重要性”只要作为一句话的背景就够了。第二不满意的是蓝框部分,指出的当前研究存在的问题并不是我想要表达的,可以说是跑题了。我相信大家和 chat GPT对话 也时常遇到这种情况。但是蓝框框里的最后一句话是我可以采纳的,所以我可以摘下来,以备后面使用。最后一段黄色框框就是隔靴搔痒的一些话,即便我的英文水平做不到我行我上,也不影响我认为它不够好。

这么说,前面的 costar 是不是比普通提问法更好呢? costar 就是六个单词的首字母组成的(大家不用在意这个代码框,用其他文本编辑都可以):

# Context #

# Objective #

# Style #

# Tone #

# Audience #

# Response #

第一个context 是我要向大家重点介绍的,也是大语言模型背后的算法逻辑。它是指你要给大语言模型提供语境、背景上下文。对于我们想当然的内容,甚至是常识,如果我们不说,机器也并不能知道,就不能自动的定位到相关领域。或者说你给它增加了很多难度。这一步其实是在吸引 Chat GPT 的“attention”(注意力)来“定位”到你需要的知识领域。可见context 是我们要着重写好的地方。因为相比之下,剩下的内容就太简单了:objective 目的,就是要Chat GPT做什么事情,咱们就让 ta 帮我们写一个 introduction。接下来的“style”更简单:academic research 或者 medical academic research,表示我们要学术研究的风格。“tone”口吻,当然是professional tone,专业的口吻。audience 是指写给谁看,我们可以指定相关的临床工作者啊,医学科研人员啊等等。response是指返回的格式,对于我们不是 data science 领域的人,这一条很单纯。一般都是“text”也就是文本就够了。高级一点的可以写 markdown 格式等等。

image.png

现在只有上下文context还没有直接填好,因为有一个独特写法,我们已经帮大家试过,总结成了套路:
image.png

第一,某件事的某方面重要:一定要具体到某方面。因为其实你的文章只能解决一个小问题,我们不要在大背景上说太多。对于GDP来说,他不需要你做很多铺垫,精准的一两句话就可以让他准确定位领域。第二,你要说这方面没有被研究明白。这时候很多人就觉得可以了,实际上你更应该说由于没有研究明白,而导致了什么具体问题,才会让他产出的内容更具有逻辑,且言之有物。第三,我的研究为什么、凭什么能解决这个问题。这里同样要提到最具体的层面,一定不要笼统。

这些误区,你踩中了吗

再次以我们前面说的开颅手术的例子来说,我们时常容易犯以下的错误:
image.png

对于第一点,千万不要絮絮叨叨的从大背景说起,像是和一个外行人说话一样。GPT 不需要你从做科普开始,直接讲细分领域足以正确的让他定位。如果确实需要从更大的背景铺垫开始,那么一定要减少着墨,否则很容易导致回答失焦,讲半天也讲不到重点。我们可以讲述开颅手术术后感染的预防很重要,但是一带而过即可,更要讲的是,厘清循证医学证据很重要。对于第二部分内容,我们要说的足够具体,但也只要直接精确的描述问题。一两个简单句描述关键点就够了,ChatGPT 会照顾到点与点之间的连贯性。第三点上,同样不要说正确的废话,而是要直击痛点。最后就是,我们一定要用自己最舒服的语言完成这一步,无论是中文英文还是摩斯密码。因为在使用最舒服的语言时,你才能在内容上有最好的表现,写论文是确保传达内容,而不是英语写作比赛。

接着我们把这些关键点连成一段看一看,没什么逻辑问题就 ok,再翻译成英文。如果自己不想翻译,我非常推荐使用 DeepL,网页免费版就够用了:
image.png

为什么还是建议用英文作为最终输入呢?再啰嗦一下,一是我们本来就希望他输出英文,毕竟是SCI。二,是 ta 需要去搜索的原始文件也是英文,省得来回翻译导致错误。第三是Chatgpt 对于中文,尤其是学术领域的中文,表现还是差很多的。

提示词框架使用效果

终于我们完成了自己的内容输出,这时候不用关心没有引用文献出处,因为我们只要把它交给 Costar 和 Chatgpt 了:
image.png

这就是我粘贴给Costar的内容 然后我又把这个内容粘贴给了 Chatgpt。这里我用了代码框,你也可以不用,只要在 Costar 每个关键词的两边加上“#”就可以。再给大家一个比较关键的提醒:在objective这一步,我们需要再加一句: cover the above context with coherence. coherence 表示连贯性,这样再次确保它连成篇之后行文逻辑流畅。

现在我们看一下返回的结果,并且将它和我们第一次没有使用 Costar 的结果做对比。

说实话我对这个结果比之前满意多了。首先它在第一段压缩了对预防感染重要性的描述,增加了对目前学术研究意志性的描述。从第二段开始也更加具体针对开颅手术,而不是外科领域放之四海皆准的废话。美中不足的是在“however”之后,内容有一些冗长。我可以根据自己的需要来删减。最后一段,它增加了针对本研究的内容,而非一些套话。增强了现有问题与本研究的相关性。当然我们也可以根据给出的回答,做针对性的进一步提问。

所以强烈推荐大家使用框架来和大语言模型对话。用了框架之后,我们做出修改,只要做一些很小的改动,并且可以有的放矢。

提醒:大家对于 GPT 提供的参考文献 最好去看一看是不是确有其事,不要做虚假引用。
再次预告:关于写作我们还将教大家用本文另一个 Prompt Framework 指令框架无痛地写 Methods 和 Results,并且和我们团队里美国的临床研究教授撰写的版本做对比。请持续关注哦,也欢迎留言探讨!

还没有评论,赶紧评论下,抢个沙发?