大家好,我是 Jambo。我们已经学习了如何使用 LangChain 的一些基本功能,解下我们就应该要结合这些功能来做一些复杂的东西了。但在这之前,为了让同学们更好的理解 LangChain 在这其中做了什么,我想先介绍一下关于 GPT 使用方面的一些知识。
在 ChatGPT 开放之初,除了各大公司在 AI 算法方面竞争,还有许多人在研究如何仅通过修改 prompt 就能让 GPT-3 做出更好的回答,这种方法被称为“提示工程(Prompt Engineering)”。如果把 LLM 比喻成一个拥有一般常识的大脑,那么提示工程就是在教它如何思考,从而更有效的结合知识得出答案。像 AutoGPT 就是这样,他通过精心设计的 prompt,就能让 GPT-4 自行完成各种任务。为了让同学们了解这其中的思想,我们先从“思维链”开始介绍。
思维链(Chain of Thought)
思维链(Chain of Thought)在 ChatGPT 推出后不久就被提出,具体来说就是通过手动编写示例的方式让 GPT-3 将问题的思考过程也生成出来,通过这种方式 GPT-3 回答的效果会有大幅提升。就像我们在写比较复杂的计算题,将过程一步一步写出来的正确率会比直接写出答案要高。

后来有人发现,只需要加上 “Let’s think step by step.” 这一魔法提示,就能达到一样的效果,还不需要写示例。并且他还在这基础上,额外让 GPT 根据它前面附带思考过程的回答,再总结出一个更简洁的答案,相当于把思考过程隐藏起来。

我这里想强调的是,我们用 LLM 构建应用时,完全可以在输出最终答案前多

本文介绍了ReAct方法在构建基于LLM的问答机器人中的应用,通过思考、行动和观察的循环,提升GPT等模型的回答质量。ReAct允许LLM决定何时及如何使用外部工具,解决仅依赖prompt的局限性,与人类思考过程相似。LangChain则简化了这一流程,通过代理封装复杂步骤。
:ReAct&spm=1001.2101.3001.5002&articleId=131885624&d=1&t=3&u=8f40469840fb4db583f6db946872ffbb)
1万+

被折叠的 条评论
为什么被折叠?



