4 篇文章带有标签 “skills”

Hermes 智能体全面研究报告与 OpenClaw 对比分析

1. Hermes 智能体基础认知与发展概况

1.1 技术定义与核心特征

Hermes Agent 是由 Nous Research 开发的开源自主 AI 智能体,于 2026 年 2 月正式发布,其核心定位为 "与你共同成长的智能体"(The agent that grows with you)(1)。与传统的 AI 聊天机器人或 IDE 绑定的代码补全工具不同,Hermes Agent 是一个运行在用户服务器上的自主智能体,具有持久记忆和自我改进能力,能够在运行过程中不断学习和进化。

Hermes Agent 的技术架构采用模块化单代理持久循环设计,核心是 run_agent.py 中的 AIAgent 类(约 9200 行代码),负责同步编排整个生命周期:输入→推理→工具执行→内存更新→输出。该系统支持 Linux、macOS 和 WSL2 平台,用户可以通过一条 curl 命令完成安装,无需任何前置依赖,体现了其设计的简洁性和易用性。

在技术栈方面,Hermes Agent 基于 Python 3.11 + 开发,使用 uv (Astral) 管理,主要依赖包括 openai SDK 进行 LLM 通信、rich 和 prompt_toolkit 构建终端 UI、SQLite FTS5 实现会话持久化(97)。

LLM 智能体的外化:记忆、技能、协议与 Harness Engineering 统一综述

论文基础信息

核心观点

可靠的智能体能力不只是来自更强的模型本身,而是来自将认知负担系统性地转移到外部组件:

  • 记忆外化:解决跨会话状态延续问题
  • 技能外化:复用成熟的流程经验,避免每次都重新推理
  • 协议外化:标准化交互规则,让工具调用、多智能体协作更稳定
  • Harness(智能体引擎/管控框架) 是协调以上所有组件的统一运行层,是智能体系统的"认知环境"

什么是Harness?

Harness不是普通的工具链或者SDK,而是模型运行的完整认知环境

  • 模型本身只有通用推理能力,Harness决定了它能访问什么数据、能执行什么操作、怎么受到约束、怎么从错误中学习
  • 智能体的能力不是模型单独具备的,而是模型和Harness环境耦合之后共同产生的
  • Harness的核心作用是把零散的外部组件(内存、技能、协议)组合成连贯的智能行为,把无边界的推理任务转化为结构化的可控执行流程

Claude Cowork 知识工作插件(Knowledge Work Plugins)

知识工作插件(Knowledge Work Plugins)能将 Claude 打造为适配你岗位、团队与公司的专业助手。专为 Claude Cowork 打造,同时兼容 Claude Code

为何使用插件

Cowork 让你设定目标,Claude 即可输出完整、专业的成果。而插件能进一步赋能:你可以告诉 Claude 你的工作偏好、需要调用的工具与数据、关键工作流的处理方式,以及开放哪些斜杠命令——让团队获得更优质、更统一的结果。

每个插件都为特定职能打包了专业能力、工具连接器、斜杠命令和子智能体。开箱即用,就能让 Claude 快速上手协助对应岗位人员。真正的强大之处在于为你的公司定制化——适配你的工具、术语与流程,让 Claude 仿佛为你的团队量身定制。

插件市场

我们开源了 11 个基于实际工作打造与启发的插件:

直接和它对话——智能体工程的实用指南

Peter Steinberger (OpenClaw 的创造者) 分享了核心主张 “拒绝套路,直接对话”。他认为当前的 AI 智能体(尤其是 GPT-5-Codex)已足够强大,无需过度依赖 RAG、复杂的子智能体或繁琐的规格文档等“炒作”手段。

最近我在这里变得安静了许多,因为我正埋头于最新的项目。Agent 智能体工程(Agentic engineering)已经变得如此强大,以至于现在它几乎包揽了我 100% 的代码编写。然而,我看到仍有许多人在解决问题时,还在搞那些华而不实的复杂套路,而不是专注于把活干完(Getting sh*t done)。

这篇文章的灵感部分来自昨晚在伦敦参加的 Claude Code Anonymous 交流会,部分原因是从我上次更新工作流以来已经过了“AI 领域的一年”(实际才几个月,但变化巨大)。是时候同步一下进度了。

所有的基本理念仍然适用,所以我不会再提上下文管理等简单的事情。你可以阅读我的 《AI 开发最佳工作流》 作为入门。

背景与技术栈

我独立工作,当前项目是一个约 30 万行代码(LOC)的 TypeScript React 应用,包含 Chrome 扩展、CLI、基于 Tauri 的客户端以及基于 Expo 的移动端。我使用 Vercel 托管,一个 PR(拉取请求)大约在 2 分钟内就能交付新版本网页进行测试。