Prompt工程
Prompt工程
学习Open AI官方API进行提示工程的最佳实践,掌握核心原则,提高与AI的沟通质量和效率。
使用最新的模型

比如在2022年11月前open AI还没有推出擅长聊天的gpt3.5,turbo gpt 4等模型。只有做文本补全的text-davinci, text-curie,text-babbage等等,通常来说,开头的字母越靠后,或者是版本数字越大,说明模型越新。
把指令放在提示的开头,并且用###或”””来分割指令和上下文

要总结的文本用三个引号进行包围,这样能让模型更清楚的区分指令和上下文。
尽可能对上下文和输出的长度,格式,风格等给出具体描述性详细的要求

比如跟模型说,写一首关于open AI的诗,这个要求就很不详细,更好的提示是像左边这样详细要求了,生成内容的长度,题材,风格,主题。以及针对主题的进一步解释,这样模型的回应才更有可能达成你想要的效果。
通过一些例子来阐明想要的输出格式

比如说跟模型说,写一首关于open AI的诗,这个要求就很不详细,更好的提示是像左边这样详细要求了,生成内容的长度,题材,风格,主题。以及针对主题的进一步解释,这样模型的回应才更有可能达成你想要的效果。
先从零样本提示开始,效果不好,则用小样本提示

先从零样本提示开始,如果效果不好,则用小样本提示零样本的意思是不给AI任何回应示范。我们大部分时候都是直接丢问题或指令给AI,但如果效果不是太好,回应和我们期望不符的话,可以考虑给AI几个回答作为参考的例子。
减少空洞和不严谨的描述

比如给这个产品的描述应该要很短,就是呢,只有几句话,不要太多了,这个描述就很啰嗦,也没有说到具体的点儿上。但如果说用三到五句话组成的一个段落来描述此产品,这个提示就比较言简意骇,而且要求清晰。
与其告知不应该做什么,不如告知应该做什么

思维链与分步骤思考

比如AI非常不擅长做数学相关问题,即使我们用样本示范一些正确的结果,到他做时也依然掉链子。比如这个例子里,所有奇数相加后的结果是41,不是53,但问题在于AI生成每个token所用的时长是差不多的。不会因为某个词需要涉及更多的思考而花费更多时间生成那个token,所以计算答案被他乱哈拉过去了,前面有正确的示范答案,也没有什么帮助。
这种时候可以借助思维链,思维链最早是谷歌在2022年一篇论文里提出的。作者发现,思维链可以显著提升大语言模型进行复杂推理的能力。特别是在算术常识和符号推理等任务上。运用思维链的方法是我们给AI的小样本提示里,不仅包含正确的结果,也展示中间的推理步骤。那AI在生成回答时。也会模仿着去生成一些中间步骤,把过程进行分解。就像被老师点名回答问题时,站起来瞬间给出正确答案的难度系数很高,但如果说多说些废话,把思考步骤也讲出来,一方面可以拖时间,有更多思考机会。另一方面,也有助于我们分步骤下,更有机会得到正确答案。

思维链也可以用在数学计算之外的很多方面。借助思维链AI,可以在每一步里把注意力集中在当前思考步骤上。减少上下文的过多干扰,因此针对复杂的任务有更大概率得到准确的结果。在思维链的相关论文里,作者还提到,即使我们不用小样本提示,只是在问题后面加一句let’s think step by step,让我们来分步骤思考。也能提升AI得到正确答案的概率。这是一种成本非常低的方法,用思维链还需要我们想样本示范,而这种方法只需要加上简单的一句话AI,就会自行生成中间步骤进行推理。