提升 LLM 推理能力:CoT, ReAct, ToT
| 特性 | |||
|---|---|---|---|
| 中文名称 | 思维链 | 推理与行动 | 思维树 |
| 核心思想 | 引导模型生成中间推理步骤,模仿人类逐步思考。 | 结合内部推理与外部工具交互,获取并利用额外信息。 | 允许模型同时探索多个不同的推理路径,形成树状结构,并进行评估和选择。 |
| 工作方式 | 在提示中展示逐步推理的示例,引导模型按步骤思考并输出过程。 | 模型交替进行: 1. 思考 (Thought): 分析情况,规划行动。 2. 行动 (Action): 调用外部工具(如搜索)。 3. 观察 (Observation): 获取行动结果。 |
1. 生成多个想法: 每一步产生多个可能的思路。 2. 评估想法: 对各思路进行可行性 / 潜力评估。 3. 搜索策略: 使用如 BFS(广度优先搜索) 或 DFS(深度优先搜索) 探索思路树,可回溯。 |
| 主要优点 | - 提高复杂推理能力 - 增强可解释性,理解模型思路 |
- 处理知识密集型任务(获取外部知识) - 减少信息幻觉 - 动态适应环境反馈 |
- 解决更复杂、探索性强的问题 - 提高规划和决策能力 - 支持回溯,增强鲁棒性 |
| 简单比喻 | 让模型“多想几步”,把思考过程写出来。 | 让模型边“想”边“做”(例如上网查资料)。 | 让模型同时“想”多种可能性,像走迷宫一样尝试不同路径,并选择最优的。 |