3 篇文章带有标签 “llm-agent”

LLM 智能体的外化:记忆、技能、协议与 Harness Engineering 统一综述

论文基础信息

核心观点

可靠的智能体能力不只是来自更强的模型本身,而是来自将认知负担系统性地转移到外部组件:

  • 记忆外化:解决跨会话状态延续问题
  • 技能外化:复用成熟的流程经验,避免每次都重新推理
  • 协议外化:标准化交互规则,让工具调用、多智能体协作更稳定
  • Harness(智能体引擎/管控框架) 是协调以上所有组件的统一运行层,是智能体系统的"认知环境"

什么是Harness?

Harness不是普通的工具链或者SDK,而是模型运行的完整认知环境

  • 模型本身只有通用推理能力,Harness决定了它能访问什么数据、能执行什么操作、怎么受到约束、怎么从错误中学习
  • 智能体的能力不是模型单独具备的,而是模型和Harness环境耦合之后共同产生的
  • Harness的核心作用是把零散的外部组件(内存、技能、协议)组合成连贯的智能行为,把无边界的推理任务转化为结构化的可控执行流程

Andrej Karpathy:Claws 将成为 AI 技术栈中的新层级

周末买了一台新的 Mac mini,打算正儿八经地捣鼓一下 Claws。Apple Store 的店员告诉我这东西现在卖得像热交换一样火爆,而且每个人(买它时)都是一脸懵逼的样子 :)

说实话,运行 OpenClaw 让我有点心里发虚——要把我的私人数据和密钥交给一个由 400k 行代码组成、靠“氛围感编程”(vibe coded) 堆出来的巨型怪物,而且这个怪物目前正面临大规模的活跃攻击,这真的一点吸引力都没有。我已经看到有报告称出现了实例暴露、RCE(远程代码执行)漏洞、供应链污染,以及插件库里被恶意篡改的技能。这感觉完全就是一片混乱的“西部荒野”,简直是安全噩梦。但我确实非常喜欢这个概念。我认为,就像 LLM Agent(智能体)是 LLM 之上的新层级一样,Claws 现在是 LLM Agent 之上的又一新层级,它将编排、调度、上下文管理、工具调用以及某种持久性提升到了一个新的高度。

环顾四周,既然核心思路已经明确,现在已经冒出了很多轻量级的 Claws。例如,粗略扫一眼,NanoClaw 看起来就非常有意思:它的核心引擎只有大约 4000 行代码(这个体量既能装进我的脑子,也能装进 AI Agent 的脑子,所以感觉是可控、可审计且灵活的),而且默认在容器中运行所有内容。我也很喜欢他们的配置方案——不是通过配置文件,而是通过“技能”来实现!

Letta (fka MemGPT) 是用于创建有状态 LLM 服务的框架

Docker 部署

克隆代码

git clone https://github.com/cpacker/MemGPT

设置环境变量,编辑配置文件 .env

  • Ollama
LETTA_LLM_ENDPOINT=http://host.docker.internal:11434
LETTA_LLM_ENDPOINT_TYPE=ollama
LETTA_LLM_MODEL=qwen2.5:7b-q6_K
LETTA_LLM_CONTEXT_WINDOW=32000
LETTA_EMBEDDING_ENDPOINT=http://host.docker.internal:11434
LETTA_EMBEDDING_ENDPOINT_TYPE=ollama
LETTA_EMBEDDING_MODEL=bge-m3
LETTA_EMBEDDING_DIM=1024

在下载 Ollama 模型时,请确保使用标签!

不要执行 ollama pull dolphin2.2-mistral,而是执行 ollama pull dolphin2.2-mistral:7b-q6_K。

如果您没有指定标签,Ollama 可能会默认使用高度压缩的模型变体(例如 Q4)。