跳到主要内容

intro

Chain-of-Thought 相关技术

CoT 相关技术我相信大家都早已听说过,本质上还是让模型多思考一点,经过缜密的思考之后得到的答案也会更加准确,这个与上面介绍的System2原理类似,也是借鉴人类的思考方式。

人类其实是大模型的训练数据

大模型从人类的文字中学习,此时也潜在的学习了人类的思考方式,是不是有点后背发凉

好了,不闲聊了,开始正式介绍 CoT 的相关技术吧。

首先就是来介绍一下原始的论文,作者仅仅在Prompt 当中添加了“let's think step by step”就可以提升在不同任务上的效果,可以看出让模型多思考一会儿(让子弹飞一会儿)是非常有效的trick,而后续无数的研究者都证实了此方法有效。