DeepSeek-R1 - 标签 - 军舰的日志

2025年4月5日星期六

DeepSeek-V3 & DeepSeek-R1

## 构建AI代理：5个常见障碍及解决方案

构建AI代理的新手指南，帮助您克服挑战。

**AI代理**正变得越来越复杂，**能够自动化工作流程、做出决策并与外部工具集成**。然而，在现实世界中部署AI代理面临着很多挑战，这些挑战会影响其可靠性、性能和准确性。现在优先建立AI代理设计的强大基础，将为未来可靠、安全的自主系统奠定基础。

**👉 本指南探讨了开发人员在创建AI代理时面临的五个最常见障碍，以及克服这些障碍的实用解决方案。** 无论您是刚刚入门的新手还是正在改进方法的资深开发人员，这些最佳实践都将帮助您设计出在复杂环境中更可靠、更具扩展性和更有效的AI代理。

让我们开始构建代理式AI吧！

## 1. 管理工具集成

随着AI代理变得越来越复杂，**管理它们对各种工具的访问和使用变得越来越具有挑战性**。**每增加一个工具**都会**引入**新的`潜在故障点`、`安全考虑因素`和`性能影响`。确保代理适当地使用工具并优雅地处理工具故障对于可靠运行至关重要。

要`解决这一挑战`，**请为代理工具箱中的每个工具创建精确的定义**。包括何时使用该工具的`明确示例`、`有效参数范围`和`预期输出`。**构建能够强制执行这些规范的验证逻辑**，并`从一小组定义明确的工具开始`，而不是许多定义松散的工具。**定期监控**将帮助您`识别哪些工具最有效`，以及`哪些定义需要完善`。
// ...

2025年4月5日 1 分钟 50 字

2025年3月8日星期六

推理 LLM 技术内幕 - DeepSeek-R1/o1

2025年3月8日 1 分钟 7 字

DeepSeek-R1 OpenAI-o1 推理模型 LLM

2025年2月14日星期五

部署 DeepSeek-R1 蒸馏模型

T4 GPU 服务器，4卡16G。

conda create -n deepseek-r1 python=3.12 -y
conda activate deepseek-r1

pip install vllm

Installation GPU

2025年2月14日 1 分钟 225 字

DeepSeek-R1 vLLM Qwen Jan LLM

2025年1月21日星期二

DeepSeek R1: 通过强化学习激励 LLM 的推理能力

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

We introduce our first-generation reasoning models, DeepSeek-R1-Zero and DeepSeek-R1. DeepSeek-R1-Zero, a model trained via large-scale reinforcement learning (RL) without super- vised fine-tuning (SFT) as a preliminary step, demonstrates remarkable reasoning capabilities. Through RL, DeepSeek-R1-Zero naturally emerges with numerous powerful and intriguing reasoning behaviors. However, it encounters challenges such as poor readability, and language mixing.

2025年1月21日 62 分钟 15,274 字

DeepSeek-R1 LLM 强化学习 DeepSeek-R1 arXiv

4 篇文章带有标签 “DeepSeek-R1”

2025年4月5日 星期六