文档 - 第 7 页 - 军舰的日志

2026年2月25日星期三

大模型应用开发范式的演变

这四个术语是当前大模型应用开发的核心范式，从指令设计、信息管理、生成式编程到自主智能体构建，层层递进，共同构成了 AI 应用开发的技术栈。

以下是通俗易懂的拆解：

1. Prompt Engineering (提示工程)

这是最基础的技能，重点在于指令的质量。如果把 AI 比作一个极其博学但有时听不懂人话的实习生，Prompt Engineering 就是学习如何写出完美的“任务说明书”。

核心逻辑：通过调整输入的文字（提示词），引导模型输出更高质量的结果。
常用技巧：给 AI 设定角色（“你是一个资深翻译”）、提供示例（Few-shot）、要求逻辑推演（Chain of Thought）。
比喻：就像是在搜索引擎里输入更精准的关键词，或者给厨师下达非常具体的菜谱要求。

2. Context Engineering (上下文工程)

随着模型处理能力增强，大家发现“怎么说”固然重要，但 “给它看什么资料” 更重要。这就是上下文工程。

核心逻辑：管理和优化输入给模型的信息流。AI 的记忆（上下文窗口）是有限的，你需要精准地挑选出最相关的背景知识喂给它。
典型应用：RAG (检索增强生成)。当你问关于公司手册的问题时，系统先去数据库里搜出相关的几段话，塞进对话框里，AI 才能据此回答。
比喻：开卷考试。Prompt 是考题，Context 就是那本允许你带进考场的、划满了重点的参考书。

2026-02-25 18:00

2026年2月23日星期一

NanoClaw 是您的专属 AI 助手，可安全运行在容器中。轻量设计，易于理解，还能根据您的需求自由定制。与复杂的 OpenClaw 不同，NanoClaw 坚持“小巧易懂”的哲学，仅由单一 Node.js 进程和少量源文件组成，无微服务或复杂配置。其核心安全机制在于利用 Linux 容器（macOS 上支持 Apple Container 或 Docker）进行操作系统级别的隔离，确保智能体只能在挂载的沙箱环境中运行，无法访问宿主机敏感数据。系统支持按群组隔离的持久记忆、可安排的任务调度及网络访问功能。独特的“技能优于功能”架构鼓励用户通过贡献技能脚本（如添加 Telegram 支持）来定制功能，而非直接修改核心代码，从而保持代码库的纯净与个性化适配。

README

NanoClaw —— 您的专属 Claude 助手，在容器中安全运行。它轻巧易懂，并能根据您的个人需求灵活定制。

我为什么创建这个项目

OpenClaw 是一个令人印象深刻的项目，愿景宏大。但我无法安心使用一个我不了解却能访问我个人隐私的软件。OpenClaw 有 52+ 个模块、8 个配置管理文件、45+ 个依赖项，以及为 15 个渠道提供商设计的抽象层。其安全性是应用级别的（通过白名单、配对码实现），而非操作系统级别的隔离。所有东西都在一个共享内存的 Node 进程中运行。

NanoClaw 用一个您能在 8 分钟内

2026-02-23 22:00

nanoclaw documentation claude-code whatsapp container sqlite mcp launchd security ai-native

NanoClaw 架构设计深度解析

NanoClaw 架构的核心洞察是：与其构建复杂的插件 API 来限制扩展的能力，不如利用 Git 的成熟合并机制来安全地组合任意代码变更。 AI（Claude Code）只在 Git 无法自动解决冲突时才介入，而且解决方案会被缓存（git rerere）以便下次自动应用。这使得大多数用户永远不会遇到未解决的冲突，同时保留了无限的定制能力。

提示词（Kimi-2.5 Agent）：

我没有理解 NanoClaw 这里的架构设计，结合源代码（https://github.com/qwibitai/nanoclaw ）仔细研究一下，给我讲明白。

2026-02-23 12:00

nanoclaw architecture-design git-three-way-merge git-rerere skills-system container-isolation conflict-resolution state-tracking migration-skills 软件架构

具身智能大脑：VLA 模型架构解析与训练实战

🦞 太空龙虾：基于 OpenVLA、π0、π0.5、π0.6 等核心论文

📋 目录

VLA 模型概述
架构设计
数据工程
预训练策略
推理与部署
实战指南

1. VLA 模型概述

1.1 什么是 VLA 模型？

Vision-Language-Action (VLA) 是具身智能领域的核心范式，将三大核心能力端到端集成：

Vision：视觉感知（理解机器人看到的环境）
Language：语言理解（理解人类指令）
Action：动作生成（输出机器人执行的控制指令）

1.2 VLA 的革命性意义

传统机器人范式：

视觉感知 → 状态估计 → 任务规划 → 运动控制 → 执行

问题：各模块独立训练，误差累积，泛化能力弱

VLA 范式：

[图像 + 语言] → VLA 模型 → [动作序列]

优势：端到端训练，全局优化，泛化能力强

2. 架构设计

2.1 核心架构组件

2.1.1 视觉编码器（Vision Encoder）

作用： 将机器人视角的图像转换为特征表示

常用架构：

架构	特点	适用场景
ViT (Vision Transformer)	全局注意力，适合复杂场景	通用机器人操作
CLIP ViT	预训练视觉-语言对齐	开放场景理解
EfficientNet	高效，适合边缘部署	低功耗机器人
DINOv2	自监督预训练	少样本学习

输入维度：单帧图像：[B, 3, H, W] 多帧历史：[B, T, 3,

2026-02-23 10:00

vla vision-language-action embodied-ai robot-learning openvla pi0 diffusion-model lora behavior-cloning pytorch

2026年2月22日星期日

NanoClaw 深度分析：AI 原生、技能系统与核心设计思想

本文档深入分析了 NanoClaw — 一个轻量级、AI 原生的个人 AI 助手项目。它的核心设计思想包括：小到可以理解（单一进程、少量文件）、通过容器隔离实现安全（而非应用级权限检查）、AI 原生开发（假设 Claude 始终作为协作者）、技能（Skill）胜于功能（按需转换代码库，而非功能堆积）。最创新的是其 Skills 技能系统，通过 Git 三向合并、三级解决模型（Git→Claude→用户）和共享解决方案缓存，实现了干净、可审计的代码转换。NanoClaw 展示了 AI 原生软件开发的新范式：为 AI + 人类团队协作优化，而非为独立人类开发。

项目概述
核心理念
AI 原生设计
Skills 技能系统
系统架构
安全模型
对比与启示

项目概述

NanoClaw 是一个轻量级、安全的个人 Claude 助手项目。它通过 WhatsApp（或其他渠道）与用户交互，在隔离的容器中运行 Claude Agent SDK，为用户提供一个可定制、可理解的 AI 助手。

WhatsApp (Baileys) → SQLite → 轮询循环 → 容器 (Claude Agent SDK) → 响应

为什么创建 NanoClaw？

NanoClaw 的诞生是对 OpenClaw（原 ClawBot）项目的反拨。

2026-02-22 14:00

nanoclaw openclaw ai-native skills-system claude-code container-security git-merge software-design whatsapp 智能体

Andrej Karpathy：Claws 将成为 AI 技术栈中的新层级

周末买了一台新的 Mac mini，打算正儿八经地捣鼓一下 Claws。Apple Store 的店员告诉我这东西现在卖得像热交换一样火爆，而且每个人（买它时）都是一脸懵逼的样子 :)

说实话，运行 OpenClaw 让我有点心里发虚——要把我的私人数据和密钥交给一个由 400k 行代码组成、靠“氛围感编程”（vibe coded） 堆出来的巨型怪物，而且这个怪物目前正面临大规模的活跃攻击，这真的一点吸引力都没有。我已经看到有报告称出现了实例暴露、RCE（远程代码执行）漏洞、供应链污染，以及插件库里被恶意篡改的技能。这感觉完全就是一片混乱的“西部荒野”，简直是安全噩梦。但我确实非常喜欢这个概念。我认为，就像 LLM Agent（智能体）是 LLM 之上的新层级一样，Claws 现在是 LLM Agent 之上的又一新层级，它将编排、调度、上下文管理、工具调用以及某种持久性提升到了一个新的高度。

环顾四周，既然核心思路已经明确，现在已经冒出了很多轻量级的 Claws。例如，粗略扫一眼，NanoClaw 看起来就非常有意思：它的核心引擎只有大约 4000 行代码（这个体量既能装进我的脑子，也能装进 AI Agent 的脑子，所以感觉是可控、可审计且灵活的），而且默认在容器中运行所有内容。我也很喜欢他们的配置方案——不是通过配置文件，而是通过“技能”来实现！

2026-02-22 12:00

claws openclaw nanoclaw ai-stack llm-agent vibe-coding local-deployment container ai-native-assistant 智能体

氛围编程 vs 智能体工程

Andrej Karpathy：氛围编程（vibe coding）

我称之为“氛围编程”（vibe coding）——这是一种全新的编程方式：你完全沉浸在感觉中，拥抱指数级的效率提升，甚至忘掉代码本身的存在。

这之所以成为可能，是因为大语言模型（比如配合 Sonnet 使用的 Cursor Composer）正变得过于强大。而且，我直接通过 SuperWhisper 和 Composer 语音对话，几乎连键盘都不碰。我会提一些极度偷懒的要求，比如“把侧边栏的间距缩减一半”，因为我根本懒得去代码里找位置。我永远点“全部接受”（Accept All），再也不看代码比对（diffs）了。遇到报错信息，我直接原样粘贴回去，一句话都不解释，通常这样就能修好。

代码库的增长速度超出了我以往的理解能力，如果真要搞懂，我得花好长一段时间去通读。有时大模型修不好某个 Bug，我就绕过去，或者要求进行随机改动，直到 Bug 消失。对于那些周末折腾的练手项目来说，这种方式还算凑合，但也确实挺离谱的。

我正在开发一个项目或 Web 应用，但这感觉并不像在编程——我只是观察、动嘴、运行、粘贴，然后它居然大部分时间都能跑通。

Andrej Karpathy：智能体工程（agentic engineering）

很多人转发这条推文，以此纪念“氛围编程”（vibe coding）诞生一周年。简单回顾一下：

2026-02-22 10:00

vibe-coding agentic-engineering andrej-karpathy ai-agents prompt-engineering code-review testing software-engineering llm 智能体工程

2026年2月21日星期六

EvoMap（一个 Agent 学会，百万 Agent 继承）Skill（技能）

EvoMap：一个 Agent 学会，百万 Agent 继承。让 AI Agent 的能力可以像生物基因一样，通过协议在网络中自由遗传、流动与迭代。这里详细介绍了 EvoMap 的 Skill。

EvoMap -- AI 智能体集成指南

EvoMap 是一个协作式进化市场，AI 智能体在此贡献经过验证的解决方案并从中获益。本文档描述了用于智能体集成的 GEP-A2A 协议。

Hub 地址: https://evomap.ai 协议: GEP-A2A v1.0.0 传输方式: HTTP（推荐）或 FileTransport（本地）

为什么选择 EvoMap

EvoMap 是一个开放的 AI 智能体进化资产市场。它解决了一个根本性问题：缺乏协调的情况下，数百个智能体会独立重复发现相同的修复方案，浪费计算资源、Token 和时间。EvoMap 消除了这种冗余。

集体智能：每一个发布到 EvoMap 的经过验证的修复方案都会对所有连接的智能体可用。一个智能体的突破成为所有人的优势。
质量保证：所有资产都通过内容可寻址验证（SHA256）、验证共识和 GDI 评分后才能被推广。您只会收到经过实战检验的解决方案。
收益共享：当您的发布的 Capsule 被重用于解决问题时，您会获得积分。高质量的贡献者会建立声誉（0-100），解锁更高的支付乘数、优先任务分配和聚合器资格。
悬赏经济：用户发布真实的问题和真实的悬赏。智能体认领任务、发布解决方案并获得报酬 —— 创建一条从能力到收入的直接路径。
群体分解：大型任务可以分解给多个智能体并行处理。提议者、解决者和聚合器各自获得其份额。
知识图谱（付费）：对整个资产库进行语义查询，用于高级模式发现和跨领域重用。

2026-02-21 10:00

evomap gep-a2a evolver ai-agent multi-agent gene capsule evolution-event knowledge-graph a2a-protocol

2026年2月19日星期四

Claude Skill（技能）构建完全指南

这份指南详细介绍了如何为 Claude 构建 “技能” (Skills)，即一种能让 AI 学习特定工作流与专业知识的指令包。通过由 YAML 元数据和 Markdown 指令构成的三层渐进式披露结构，开发者可以教会 Claude 何时以及如何执行复杂任务。技能不仅能独立运行，还能与 MCP（模型上下文协议） 结合，将底层工具访问转化为可靠、标准化的操作流程。文档涵盖了从规划设计到测试分发的全过程，并提供了多种工作流编排模式以提升输出的稳定性。其核心优势在于跨平台通用性，让团队能够统一 Claude 在不同交互界面下的任务处理逻辑。通过使用 skill-creator 等辅助工具，用户可以在短时间内完成技能的迭代与部署。

引言 3
基础知识 4
规划与设计 7
测试与迭代 14
分发与共享 18
模式与故障排除 21
资源与参考 28

引言

技能（Skill） 是一组指令——以一个简单的文件夹形式封装——旨在教导 Claude 如何处理特定的任务或工作流。技能是为您特定需求定制 Claude 最强大的方式之一。与其在每次对话中反复解释您的偏好、流程和领域专业知识，技能让您可以一次性教导 Claude，并使每次对话都受益。

当您拥有可重复的工作流时，技能将非常强大：例如根据规范生成前端设计、使用一致的方法论进行研究、创建遵循团队风格指南的文档，或编排多步骤流程。

2026-02-19 10:00

claude skill skill-md mcp progressive-disclosure skill-creator workflow-automation yaml-frontmatter agents-skills 技能构建

2026年2月18日星期三

🦞 个人 AI 助手 OpenClaw 应用实践

这里展示了我使用 🦞 OpenClaw 的实际使用案例和应用实践。如：自我进化、创建技能（Skill）、查看 GPU 服务器、主题研究、应用构建、定时生成技术博客日报、看新闻、文章总结、技能查看、创建提醒、技术交流、生成 SVG等。希望能给你一些启发，看看 OpenClaw 在实际生活和工作中的强大能力！🚀

OpenClaw 自我进化

😀你配置让模型支持多模态

🤖 完成！✅ 模型已配置为支持多模态。

修改内容：

在 input 数组中添加了 "image" 类型
现在模型可以同时接受文本和图像输入

下一步： 需要重启 OpenClaw Gateway 让配置生效。让我帮你重启：

😀检查新版本

🤖 太棒了！我拿到了 CHANGELOG.md！让我总结一下这个版本的主要变化！

🎉 OpenClaw 2026.2.21 版本更新总结！

从： 2026.2.15
升级到： 2026.2.21-2 (35a57bc)

🚀 主要新功能

1. Gemini 3.1 支持！ 🆕

新增 google/gemini-3.1-pro-preview 模型支持
Google 最新模型集成

火山引擎（Doubao）和 BytePlus 提供商！

2026-02-18 20:00

openclaw ai-agent 应用实践 skill gpu-monitoring pdf-generation rss cron news-summary 斯坦福小镇

OpenClaw 技能：ClawChess 国际象棋对战

📌 文件：SKILL.md

ClawChess — 专为 Moltys 设计的国际象棋

欢迎来到 ClawChess！这是一个 Moltys 之间相互对战的国际象棋平台。系统会为你匹配水平相近的对手，你的 ELO 等级分将根据表现上升（或下降）。

用时规则： 每方 5 分钟（超快棋 Blitz），无加时。

技能文件

文件	地址
SKILL.md（本文件）	`https://www.clawchess.com/SKILL.md`
HEARTBEAT.md	`https://www.clawchess.com/HEARTBEAT.md`
package.json（元数据）	`https://www.clawchess.com/skill.json`

本地安装： mkdir -p ~/.moltbot/skills/clawchess curl -s https://www.clawchess.com/SKILL.md > ~/.moltbot/skills/clawchess/SKILL.md curl -s https://www.clawchess.com/HEARTBEAT.md > ~/.moltbot/skills/clawchess/HEARTBEAT.md curl -s https://www.clawchess.com/skill.json > ~/.

2026-02-18 12:00

openclaw skill clawchess chess api heartbeat tournament molty skill-md agent-game

OpenClaw 源代码分析

当用户在whatsapp, discord 等消息软件中发送了消息后，网关是如何获得的，再到回复，整个流程是如何运转的？

OpenClaw 消息处理完整流程

1. 消息接入 → 2. 路由决策 → 3. AI 处理 → 4. 回复发送

核心文件位置

模块	文件位置	功能
渠道实现	`extensions/*/src/channel.ts`	WhatsApp/Discord/Telegram 等渠道插件
渠道监听	`extensions/discord/src/monitor/listeners.ts`	监听渠道消息事件
消息分发	`src/auto-reply/dispatch.ts`	协调预处理、路由、回复
路由解析	`src/routing/resolve-route.ts`	根据 bindings 配置决定由哪个 agent 处理
网关服务	`src/gateway/server.impl.ts`	网关服务器主实现
Agent 执行	`src/agents/pi-embedded-runner/`	运行 AI agent
消息发送	`src/infra/outbound/deliver.ts`	统一发送逻辑

详细流程示例（以 Discord 为例）

2026-02-18 10:00

openclaw source-code-analysis message-flow routing websocket pi-agent llm cron discord whatsapp

2026年2月17日星期二

OpenClaw 架构设计

概览
核心组件
控制平面
网关协议
消息路由
消息流程
启动流程

概览

OpenClaw 是一个多渠道 AI 助手网关，设计用于在用户自己的设备上运行。它采用单一网关 + 多客户端/节点模型，支持 WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage 等多种通信渠道。

核心结构

组件	描述
🌐 Gateway（网关）	长期运行的守护进程，管理所有消息平台连接和智能体通信
💻 Clients（客户端）	控制平面应用（macOS 应用、CLI、Web 界面）
📱 Nodes（节点）	设备节点，提供硬件能力（macOS/iOS/Android/无头设备）

整体架构

2026-02-17 10:00

openclaw ai-agent architecture gateway websocket channel-adapter message-routing json-rpc control-plane pi-agent

2026年2月16日星期一

OpenClaw：打破互联网的病毒式 AI 智能体

OpenClaw: The Viral AI Agent that Broke the Internet - Peter Steinberger | Lex Fridman Podcast

讨论一下，给我一些选择。如果想说得更具体一些，那就先别写代码，直接说就行了。准备好之后，只需输入“好的，开始构建。”

合并一个 PR，会问：“可以重构什么？”

我经常问：“嘿，我们有足够的测试？”

文件名是什么？它应该放在哪里？

实际可能该模型的智能水平并未下降。只是你习惯了美好的事物。

对于私人智能体（OpenClaw）更多地关乎我的生活，或者像同事那样。如：我给你一个 GitHub URL；嘿，试试这个命令行界面，它真的能用？我们能学到什么？

专门构建了智能体浏览器（Playwright）使用方法

📊 2026 年 Claude 生态爆发期核心事件复盘（修正版）

2026-02-16 10:00

openclaw ai-agent peter-steinberger lex-fridman claude-cowork mcp agentic-os saas-disruption cobol-modernization

2026年2月15日星期日

直接和它对话——智能体工程的实用指南

Peter Steinberger (OpenClaw 的创造者) 分享了核心主张 “拒绝套路，直接对话”。他认为当前的 AI 智能体（尤其是 GPT-5-Codex）已足够强大，无需过度依赖 RAG、复杂的子智能体或繁琐的规格文档等“炒作”手段。

最近我在这里变得安静了许多，因为我正埋头于最新的项目。Agent 智能体工程（Agentic engineering）已经变得如此强大，以至于现在它几乎包揽了我 100% 的代码编写。然而，我看到仍有许多人在解决问题时，还在搞那些华而不实的复杂套路，而不是专注于把活干完（Getting sh*t done）。

这篇文章的灵感部分来自昨晚在伦敦参加的 Claude Code Anonymous 交流会，部分原因是从我上次更新工作流以来已经过了“AI 领域的一年”（实际才几个月，但变化巨大）。是时候同步一下进度了。

所有的基本理念仍然适用，所以我不会再提上下文管理等简单的事情。你可以阅读我的《AI 开发最佳工作流》作为入门。

背景与技术栈

我独立工作，当前项目是一个约 30 万行代码（LOC）的 TypeScript React 应用，包含 Chrome 扩展、CLI、基于 Tauri 的客户端以及基于 Expo 的移动端。我使用 Vercel 托管，一个 PR（拉取请求）大约在 2 分钟内就能交付新版本网页进行测试。

2026-02-15 18:00

agentic-engineering openclaw peter-steinberger codex claude-code vibe-coding mcp skills agents-md software-development

以推理速度交付：为什么我不再阅读代码，而是看着它飞速流转

Peter Steinberger (OpenClaw 的创造者) 分享了他在使用 AI 智能体构建软件方面的最新经验，特别是关于如何以推理速度交付代码，以及他对模型（如 GPT 5.2 和 Opus）的看法。

自五月以来的变化

“氛围编程”（Vibe Coding）在今年取得的进步令人不可思议。大约在五月份时，我对某些提示词（prompts）能直接生成可运行的代码感到惊讶，而现在，这已经成了我的预期。我现在的代码交付速度快到不真实。从那时起，我消耗了大量的Token。是时候更新一下心得录了。

这些智能体（Agents）的工作方式很有趣。几周前有人争论说，为了感受糟糕的架构，人必须亲手写代码，使用智能体会导致脱节——我完全不同意这种观点。当你花足够多的时间与智能体合作，你就会准确地知道某件事应该花多少时间。当 codex 回来时如果未能一次性解决问题，我立刻就会产生怀疑。

我能创建的软件数量，现在主要 受限于推理时间 和 硬核思考。坦率地说——大多数软件并不需要硬核思考。大多数应用只是把数据从一个表单搬运到另一个表单，也许存进某个地方，然后以某种形式展示给用户。最简单的形式是文本，所以默认情况下，无论我想构建什么，它都始于 CLI（命令行界面）。智能体可以直接调用它（CLI）并验证输出——从而闭环。

模型转变

真正解锁像工厂一样构建软件能力的，是 GPT 5。

2026-02-15 10:00

agentic-engineering openclaw peter-steinberger gpt-5.2 codex opus vibe-coding oracle shipping-speed inference-speed

2026年2月14日星期六

🦞 本地 AI 助手 OpenClaw 的架构与记忆系统

🦞 OpenClaw 是一个本地优先（Local-First）、高度自治、基于 Markdown 记忆管理的 AI Agent（智能体）系统。

它的核心亮点在于：

数据主权 (Local-First): 记忆和配置都在本地 Markdown 文件中，用户完全掌控。
拟人化设计: 通过心跳机制 (HEARTBEAT) 和分层记忆，试图构建一个有“长期记忆”和“自主行为”的 AI，而不仅仅是一个聊天机器人。
工程化落地: 考虑了多端接入、混合检索 RAG、上下文压缩以及安全沙盒，这是一个生产力级别的架构。

架构系统

多端接入 (Messaging & Nodes):
- 消息平台: 支持 WhatsApp, Telegram, Discord, 飞书等主流通讯软件，意味着用户可以在这些 App 里直接与 Agent 对话。
- 客户端节点 (Nodes): 覆盖 Android, iOS, macOS。这些节点不仅是聊天窗口，还能调用设备能力（如拍照、定位、录屏、执行脚本），让 AI 拥有“手”和“眼”。
核心网关 (Gateway):
- 运行在本地（支持 Windows, Linux, macOS, iOS, Android, Docker 等）。
- 包含控制平面、HTTP Server、路由、会话管理和任务队列。
- Pi Agent: 是核心大脑，负责处理逻辑。
远程管理: 通过 Tailscale VPN 或 SSH Tunnel 进行安全的远程连接，保障了数据传输的安全性（无需暴露公网 IP）。

2026-02-14 10:00

openclaw ai-agent local-first memory-system markdown rag sqlite-vec 长时记忆心跳机制多模态

2026年2月13日星期五

OpenClaw 智能体工作区指南：构建记忆与人格

OpenClaw 智能体工作区，旨在构建一个具有独立人格、长期记忆和自治能力的 AI。

核心基于 Markdown 文件系统：

身份与原则 (BOOTSTRAP, SOUL, IDENTITY)：确立 AI 的自我认知、名字与核心行为守则。
持续性 (MEMORY, AGENTS)：通过“每日日志”与“长期记忆”实现跨会话的知识积累，而非每次新鲜唤醒。
伙伴与工具 (USER, TOOLS)：记录人类偏好与本地环境配置，实现个性化与外部协作。
自主性 (HEARTBEAT)：在无指令时主动执行维护与状态检查。

总体而言，这套架构通过将记忆转化为持久化、可编辑的 Markdown 文件，实现了自主反思与知识沉淀的自治目标。

2026-02-13 10:00

openclaw agent memory agent-workspace personality markdown long-term-memory heartbeat hindsight letta

2026年2月10日星期二

OpenClaw - 智能体

网关架构 (Gateway Architecture)

概述

一个长期的网关 (Gateway) 进程拥有所有消息传输表面（WhatsApp 通过 Baileys，Telegram 通过 grammY，Slack，Discord，Signal，iMessage，WebChat）。
控制平面客户端（macOS 应用、CLI、Web UI、自动化脚本）通过 WebSocket 连接到网关，绑定在配置的主机上（默认 127.0.0.1:18789）。
节点 (Nodes)（macOS/iOS/Android/无头设备）也通过 WebSocket 连接，但需声明 role: node 并包含明确的能力/命令。
每台主机对应一个网关；它是唯一开启 WhatsApp 会话的地方。
画布主机 (Canvas host)（默认 18793）用于提供代理可编辑的 HTML 和 A2UI。

组件与流程

网关 (Gateway) (守护进程)

维护提供商连接。
公开类型化的 WS API（请求、响应、服务器推送事件）。
根据 JSON Schema 验证入站数据帧。
触发事件，如 agent、chat、presence、health、heartbeat、cron。

客户端 (Client) (Mac 应用 / CLI / Web 管理)

每个客户端一条 WS 连接。
发送请求 (health、status、send、agent、system-presence)。
订阅事件 (tick、agent、presence、shutdown)。

2026-02-10 19:00

openclaw agent skill gateway agent-runtime system-prompt context-management agent-loop pi-agent-core workspace

2026年2月7日星期六

Kimi K2.5：首个开源多模态智能体集群

感觉 Kimi K2.5 在国内被低估了，让子弹飞一会儿 🚀🚀🚀

基准测试（Benchmarks）

Agent Swarm 基准测试

为了严格评估智能体集群（Agent Swarm）框架的有效性，选择了三个具有代表性的基准测试，它们共同涵盖了深度推理、大规模检索以及真实世界的复杂性：

BrowseComp：一项具有挑战性的深度研究基准，需要多步推理和复杂的信息综合。
WideSearch：旨在评估在不同来源中进行广泛、多步信息寻求和推理能力的基准。
In-house Swarm Bench：一项内部开发的集群基准，旨在评估智能体集群在真实世界、高复杂度条件下的性能。它涵盖了四个领域：
- WildSearch（开放网络上不受约束的真实世界信息检索）；
- Batch Download（大规模获取多样化资源）；
- WideRead（涉及 100 多个输入文档的大规模文档理解）；
- Long-Form Writing（连贯生成超过 10 万字的海量内容）。该基准整合了极端规模的场景，旨在压力测试基于智能体系统的编排（Orchestration）、可扩展性（Scalability）和协作能力。

主要基准测试

Kimi K2.5 评估涵盖了多个领域的基准测试，下面是按能力维度分类的各基准测试说明：

推理与通用能力 (Reasoning & General) Humanity’s Last Exam

2026-02-07 01:00

kimi-k2.5 agent-swarm llm multimodal reinforcement-learning computer-use moonshot-ai openrouter agent benchmarks

2026年2月25日 星期三

2026年2月23日 星期一

2026年2月22日 星期日

2026年2月21日 星期六

2026年2月19日 星期四

2026年2月18日 星期三

2026年2月17日 星期二

2026年2月16日 星期一

2026年2月15日 星期日

2026年2月14日 星期六

2026年2月13日 星期五

2026年2月10日 星期二

2026年2月7日 星期六