1 篇文章带有标签 “思维树”

提升 LLM 推理能力:CoT, ReAct, ToT

特性 CoT (Chain-of-Thought) ReAct (Reasoning and Acting) ToT (Tree-of-Thoughts)
中文名称 思维链 推理与行动 思维树
核心思想 引导模型生成中间推理步骤,模仿人类逐步思考。 结合内部推理与外部工具交互,获取并利用额外信息。 允许模型同时探索多个不同的推理路径,形成树状结构,并进行评估和选择。
工作方式 在提示中展示逐步推理的示例,引导模型按步骤思考并输出过程。 模型交替进行:
1. 思考 (Thought): 分析情况,规划行动。
2. 行动 (Action): 调用外部工具(如搜索)。
3. 观察 (Observation): 获取行动结果。
1. 生成多个想法: 每一步产生多个可能的思路。
2. 评估想法: 对各思路进行可行性 / 潜力评估。
3. 搜索策略: 使用如 BFS(广度优先搜索) 或 DFS(深度优先搜索) 探索思路树,可回溯。
主要优点 - 提高复杂推理能力
- 增强可解释性,理解模型思路
- 处理知识密集型任务(获取外部知识)
- 减少信息幻觉
- 动态适应环境反馈
- 解决更复杂、探索性强的问题
- 提高规划和决策能力
- 支持回溯,增强鲁棒性
简单比喻 让模型“多想几步”,把思考过程写出来。 让模型边“想”边“做”(例如上网查资料)。 让模型同时“想”多种可能性,像走迷宫一样尝试不同路径,并选择最优的。