18 篇文章带有标签 “multi-agent”

代码“图谱化”利器:Understand-Anything

这是一个通过多智能体(multi-agent)流水线将代码库或知识库转化为交互式知识图谱,并提供可视化看板和 AI 问答功能的 Claude Code 插件。

Understand-Anything

Understand Anything 将任意代码库、知识库或文档转化为可探索、可搜索、可对话的交互式知识图谱,支持 Claude Code、Codex、Cursor、Copilot、Gemini CLI 等多平台。

多智能体架构

/understand 命令调用 5 个 agent,/understand-domain 额外增加第 6 个:

Agent 职责
project-scanner 扫描项目文件,检测语言和框架
file-analyzer 提取代码结构(函数、类和导入),生成图节点和边
architecture-analyzer 识别架构层
tour-builder 生成引导式学习路径
graph-reviewer 验证图的完整性和引用完整性
domain-analyzer 提取业务领域、流程和处理步骤(由 /understand-domain 使用)
article-analyzer 从 wiki 文章中提取实体、论断和隐式关系(由 /understand-knowledge 使用)

文件分析器并行运行(最多 3 个并发)。支持增量更新 — 仅重新分析自上次运行以来发生更改的文件。

Claude Managed Agents(托管智能体)开发者参考指南

Claude Managed Agents 概览

这是一个运行在托管基础设施中的预构建、可配置智能体(Agent)框架,最适用于长时间运行的任务和异步工作。

Anthropic 提供了两种使用 Claude 构建应用的方式,分别适用于不同的使用场景:

Messages API Claude Managed Agents
定位 直接的模型提示词访问 运行在托管基础设施中的预构建、可配置智能体框架
最佳用途 自定义智能体循环和精细化控制 长时间运行的任务和异步工作
了解更多 Messages API 文档 Claude Managed Agents 文档

Claude Managed Agents 为将 Claude 作为自主智能体运行提供了框架和基础设施。无需构建自己的智能体循环、工具执行环境和运行时,你即可获得一个全托管的环境,让 Claude 能够安全地读取文件、运行命令、浏览网页并执行代码。该框架支持内置的提示词缓存、压缩以及其他性能优化,以实现高质量、高效的智能体输出。

核心概念

Claude Managed Agents 基于四个核心概念构建:

OpenCode 落地指南:从模型配置到 agency-agents 智能体集成

这是一套通过命令行安装 OpenCode、配置火山方舟等多模型接入,并集成 agency-agents 多智能体体系,最终可在 CLI 或桌面端使用专业化 AI 智能体协作完成各类任务的完整部署与使用流程。

安装 OpenCode

curl -fsSL https://opencode.ai/install | bash
Installing opencode version: 1.3.9
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■ 100%
Successfully added opencode to $PATH in /Users/junjian/.zshrc

                                 ▄
█▀▀█ █▀▀█ █▀▀█ █▀▀▄ █▀▀▀ █▀▀█ █▀▀█ █▀▀█
█░░█ █░░█ █▀▀▀ █░░█ █░░░ █░░█ █░░█ █▀▀▀
▀▀▀▀ █▀▀▀ ▀▀▀▀ ▀  ▀ ▀▀▀▀ ▀▀▀▀ ▀▀▀▀ ▀▀▀▀


OpenCode includes free models, to start:

cd <project>  # Open directory
opencode      # Run command

// ...

桌面应用程序

配置 OpenCode

Anthropic:面向长时间运行应用开发的 Harness 设计

在智能体(Agentic)编程的前沿领域,Harness 设计(测试与运行框架设计)是性能表现的关键。以下是我们如何推动 Claude 在前端设计和长时间运行的自主软件工程中进一步突破的实践。

作者:Prithvi Rajasekaran,Labs 团队成员

发布日期:2026年3月24日

在过去的几个月里,我一直致力于解决两个相互关联的问题:如何让 Claude 产出高质量的前端设计,以及如何让它在无需人工干预的情况下构建完整的应用程序。这项工作源于我们早期在前端设计能力和长时间运行编程智能体 Harness 方面的尝试。当时,我和同事们通过提示词工程(Prompt Engineering)和 Harness 设计,能够将 Claude 的性能提升到远高于基准线的水平——但两者最终都遇到了瓶颈。

为了实现突破,我寻求了一种能够跨越两个完全不同领域的全新 AI 工程方法:一个由主观审美定义,另一个由可验证的正确性和可用性定义。受生成对抗网络(GAN)的启发,我设计了一种包含**生成器(Generator)和评估器(Evaluator)**智能体的多智能体结构。要构建一个能够可靠且具审美感地对输出进行评分的评估器,意味着首先要开发一套标准,将“这个设计好吗?

AI 技术研究及开源项目评估

开源项目

BitNet

BitNet 是微软开源的 1.58-bit 大模型推理框架,通过三值量化将模型压缩 10 倍,大幅降低推理成本。无法在现有昇腾 910B4 服务器上直接部署。因为 BitNet GPU 内核完全依赖 NVIDIA CUDA,与华为 CANN 架构不兼容,目前无任何官方或社区适配版本。

Page Agent

Page Agent 是阿里开源的纯前端 JavaScript GUI Agent 框架,通过一行脚本将 AI Agent 嵌入网页,用自然语言控制页面操作(点击、填表、导航等)。该项目可立即部署,接入研发网的大模型即可使用。

Next AI Drawio

Next AI Drawio 是一款 AI + draw.io 图表生成工具,通过自然语言生成、修改和增强图表(流程图、架构图、云拓扑图等)。该项目可立即部署,接入研发网的大模型即可使用。

agency-agents

agency-agents 是一套 AI Agent 角色提示词库,为 Claude Code、Cursor 等编程助手提供 140 多个专业角色配置(涵盖工程、设计、营销等 12 个领域)。只需要配置到编程助手中即可以使用了。

GitNexus

GitNexus 是一款零服务器的代码智能引擎,支持 Graph RAG 代码探索。

Agent News:首个专为智能体打造的新闻门户,及基于 OpenClaw 的“龙虾团队”自动化运营实践

Agent News

首个专为智能体打造的新闻门户。

GitHub 源代码: https://github.com/wang-junjian/agent-news

技能

ClawHubAgent News 技能

发布技能到 ClawHub

clawhub publish /Users/junjian/.openclaw/workspace/skills/agent-news \
  --slug "agent-news" \
  --name "Agent News - 智能体的新闻门户" \
  --version "1.0.0" \
  --tags "agent, news" \
  --changelog "Initial release: 支持Agent News平台的新闻搜索、发布、编辑、删除等全流程操作。支持部署Agent News的部署和状态查看。"

创建龙虾团队

飞书上创建机器人

打开开发者后台,参考下面的文档分别创建三个机器人:龙虾军舰龙虾编辑龙虾运营

下面是每个龙虾机器人的定位与职责

龙虾军舰

核心定位:团队的枢纽,兼顾协同衔接与流程优化,负责统筹每日工作,确保龙虾编辑、龙虾运营高效联动,避免工作脱节。

elizaOS 多智能体架构设计分析

📋 概述

elizaOS 是一个开源的多智能体 AI 开发框架,用于构建、部署和管理自主 AI 智能体。采用现代化、可扩展的全功能平台设计。

核心特性

  • 🔌 丰富的连接器:内置 Discord、Telegram、Farcaster 等支持
  • 🧠 模型无关:支持 OpenAI、Gemini、Anthropic、Llama、Grok 等主流模型
  • 🖥️ 现代 Web UI:专业仪表板,实时管理智能体、群组和对话
  • 🤖 多智能体架构:从底层设计支持创建和编排专业智能体组
  • 📄 文档摄取:轻松摄取文档,支持 RAG 检索和问答
  • 🛠️ 高度可扩展:强大的插件系统构建自定义功能
  • 📦 开箱即用:无缝的设置和开发体验

🏗️ 系统架构概览

项目结构

Peter Steinberger 开发 OpenClaw 的工作流程及 Agent 编码秘诀分析

通过 2026 年 git 提交历史记录,分析 Peter Steinberger (steipete) 开发 OpenClaw 的工作流程及 Agent 编码秘诀。

关键洞察总结

AI 是放大器,不是替代品

AI 的作用:

  • ✅ 做人类不想做的重复工作(去重、重构)
  • ✅ 快速覆盖大量代码(3天1400次提交)
  • ✅ 标准化和系统化(按模板提交)

人类的作用:

  • ✅ 创造性工作(新功能)
  • ✅ 质量把关(代码审查)
  • ✅ 决策和发布(版本管理)

可借鉴的经验

经验 说明
人机分工 人类做 creative,AI 做 repetitive
明确周期 人类开发期 → AI 重构期 → 人类收尾期
标准化 AI 喜欢模板,建立标准流程
小步快跑 每个阶段有明确目标,快速迭代

一、提交统计概览

总提交数: 8443 次提交在两个月内

峰值日产量:

  • 2026-02-22: 578 次提交
  • 2026-02-15: 478 次提交
  • 2026-02-16: 472 次提交

提交类型分布:

fix:     1557 (26%)
test:     815 (14%)
docs:     857 (14%)
refactor: 308 (5%)
feat:     363 (6%)
chore:    352 (6%)
style:    134 (2%)
build:     21 (0.3%)

二、工作流程核心模式

1️⃣ "Land #PR" 工作流

EvoMap(一个 Agent 学会,百万 Agent 继承)Skill(技能)

EvoMap:一个 Agent 学会,百万 Agent 继承。让 AI Agent 的能力可以像生物基因一样,通过协议在网络中自由遗传、流动与迭代。这里详细介绍了 EvoMap 的 Skill。

EvoMap -- AI 智能体集成指南

EvoMap 是一个协作式进化市场,AI 智能体在此贡献经过验证的解决方案并从中获益。本文档描述了用于智能体集成的 GEP-A2A 协议。

Hub 地址: https://evomap.ai 协议: GEP-A2A v1.0.0 传输方式: HTTP(推荐)或 FileTransport(本地)

为什么选择 EvoMap

EvoMap 是一个开放的 AI 智能体进化资产市场。它解决了一个根本性问题:缺乏协调的情况下,数百个智能体会独立重复发现相同的修复方案,浪费计算资源、Token 和时间。EvoMap 消除了这种冗余。

  • 集体智能:每一个发布到 EvoMap 的经过验证的修复方案都会对所有连接的智能体可用。一个智能体的突破成为所有人的优势。
  • 质量保证:所有资产都通过内容可寻址验证(SHA256)、验证共识和 GDI 评分后才能被推广。您只会收到经过实战检验的解决方案。
  • 收益共享:当您的发布的 Capsule 被重用于解决问题时,您会获得积分。高质量的贡献者会建立声誉(0-100),解锁更高的支付乘数、优先任务分配和聚合器资格。
  • 悬赏经济:用户发布真实的问题和真实的悬赏。智能体认领任务、发布解决方案并获得报酬 —— 创建一条从能力到收入的直接路径。
  • 群体分解:大型任务可以分解给多个智能体并行处理。提议者、解决者和聚合器各自获得其份额。
  • 知识图谱(付费):对整个资产库进行语义查询,用于高级模式发现和跨领域重用。

Cursor 的上下文工程与编程智能体

《Context Engineering & Coding Agents with Cursor》(Cursor 的上下文工程与编程智能体),由 Cursor 团队成员 Lee 和 CEO Michael 主讲。视频深入探讨了软件开发的演变、Cursor 如何利用 AI 提升编程效率,以及未来编程智能体的发展方向。

1. 编程的演变与 Cursor 的核心功能

  • 编程历史回顾:从打孔卡片到图形界面,再到如今的 AI 辅助编程,AI 正在以前所未有的速度推动软件开发的进步。
  • Cursor Tab (代码补全)
  • Cursor 的 Tab 功能深受 GitHub Copilot 启发,但已从简单的“预测下一个词”进化为“预测下一个动作”甚至“预测光标去向”。
  • 强化学习:模型会根据用户的“接受”或“拒绝”操作进行实时在线强化学习(RL),在 30 分钟内即可更新模型行为。
  • 平衡性:Cursor 致力于在建议速度(不打断心流)和建议质量之间找到平衡点。

2. 上下文工程 (Context Engineering)

  • 超越提示词工程:随着模型变强,获取高质量输出的关键不再是“提示词技巧”,而是提供“正确的上下文”。
  • 混合检索策略
  • 字符串匹配:单纯依靠 grep (字符串匹配) 是不够的。
  • 语义搜索:Cursor 通过对代码库建立索引(embeddings),即使文件名不完全匹配(如 header.tsx vs "top navigation"),也能通过语义准确找到相关代码。

OpenAI: 构建智能体的实用指南

什么是智能体?

传统软件帮助用户简化和自动化工作流程,而智能体则能够以高度独立的方式代表用户执行这些工作流程。

智能体是能够独立代表您完成任务的一种系统。

工作流程是指为了实现用户目标而必须执行的一系列步骤,无论是解决客户服务问题、预订餐厅、提交代码变更,还是生成报告。

那些集成了大语言模型(LLM)但并未用其控制工作流程执行的应用程序(例如简单聊天机器人、单轮对话LLM或情感分类器)不属于智能体。

具体来说,智能体具备以下核心特征,使其能够可靠且一致地代表用户行动:

  1. 它利用LLM来管理工作流程的执行并做出决策。它能识别工作流程何时完成,并在需要时主动修正行为。如果执行失败,它可以停止操作并将控制权交还给用户。
  2. 它能够调用多种工具与外部系统交互(既用于获取上下文信息,也用于执行操作),并根据工作流程的当前状态动态选择合适工具,同时始终在明确定义的边界内运行。

何时应该构建智能体?

构建智能体需要重新思考系统如何决策和处理复杂性。与传统自动化不同,智能体特别适合那些传统确定性和基于规则的方法无法胜任的工作流程。

以支付欺诈分析为例:传统的规则引擎像一份检查清单,根据预设条件标记交易;而基于大语言模型的智能体则更像经验丰富的调查员,它能评估上下文、捕捉细微模式,即使没有明确违反规则也能识别可疑行为。

A2A ❤️ MCP

TLDR; Agentic applications need both A2A and MCP. We recommend MCP for tools and A2A for agents.

TLDR; 代理应用程序需要 A2A 和 MCP。我们建议将 MCP 用于工具,将 A2A 用于代理。

Why Protocols?(为什么需要协议?)

Standard protocols are essential for enabling agentic interoperability, particularly in connecting agents to external systems. This is critical in two interconnected areas of innovation: Tools and Agents.

标准协议对于实现代理互操作性至关重要,特别是在将代理连接到外部系统时。这在两个相互关联的创新领域中至关重要:工具和代理。

Tools are primitives with structured inputs and outputs and (typically) well-known behavior.

Agent2Agent 协议 (A2A)

A2A

一个开放协议,旨在实现不透明的智能代理应用程序之间的通信和互操作性。

企业采用人工智能的最大挑战之一是如何让基于不同框架和供应商构建的代理协同工作。这就是我们创建开放的 Agent2Agent (A2A) 协议的原因,这是一种协作方式,旨在帮助不同生态系统中的代理相互通信。Google 正在推动这项行业开放协议倡议,因为我们相信这个协议对于支持多代理通信至关重要,它将为您的代理提供一种通用语言——无论它们构建于哪个框架或供应商之上。借助 A2A,代理可以相互展示它们的功能并协商如何与用户交互(通过文本、表单或双向音频/视频)——所有这些都在安全地协同工作的同时进行。

观看 A2A 的实际应用

观看此演示视频,了解 A2A 如何实现不同代理框架之间的无缝通信。

概念概述

Agent2Agent (A2A) 协议促进了独立 AI 代理之间的通信。以下是核心概念:

  • 代理卡片 (Agent Card): 一个公开的元数据文件(通常位于 /.well-known/agent.json),描述了代理的功能、技能、端点 URL 和身份验证要求。客户端使用它进行发现。
    • A2A 服务器 (A2A Server): 一个公开 HTTP 端点并实现 A2A 协议方法(定义在 json 规范 中)的代理。它接收请求并管理任务执行。
    • A2A 客户端 (A2A Client): 一个消费 A2A 服务的应用程序或另一个代理。它向 A2A 服务器的 URL 发送请求(如 tasks/send)。
    • 任务 (Task): 中心的工作单元。客户端通过发送消息(tasks/sendtasks/sendSubscribe)来启动任务。任务具有唯一的 ID,并经历以下状态:submitted(已提交)、working(工作中)、input-required(需要输入)、completed(已完成)、failed(失败)、canceled(已取消)。
    • 消息 (Message): 表示客户端(role: "user")和代理(role: "agent")之间的通信轮次。消息包含 Parts(部件)。
    • 部件 (Part): MessageArtifact(工件)中的基本内容单元。可以是 TextPart(文本部件)、FilePart(文件部件,包含内联字节或 URI)或 DataPart(数据部件,用于结构化 JSON,例如表单)。
    • 工件 (Artifact): 表示代理在任务期间生成的输出(例如,生成的文件、最终的结构化数据)。工件也包含 Parts(部件)。
    • 流式传输 (Streaming): 对于长时间运行的任务,支持 streaming 功能的服务器可以使用 tasks/sendSubscribe。客户端接收服务器发送事件 (SSE),其中包含 TaskStatusUpdateEvent(任务状态更新事件)或 TaskArtifactUpdateEvent(任务工件更新事件)消息,提供实时的进度。
    • 推送通知 (Push Notifications): 支持 pushNotifications 的服务器可以主动向客户端提供的 webhook URL 发送任务更新,该 URL 通过 tasks/pushNotification/set 配置。

AutoGen

AutoGen

定义 Agent

from autogen import ConversableAgent

llm_config = {"model": "gpt-3.5-turbo"}

agent = ConversableAgent(
    name="chatbot",
    llm_config=llm_config,
    human_input_mode="NEVER",
)

reply = agent.generate_reply(
    messages=[{"content": "给我讲个笑话。", "role": "user"}]
)
print(reply)

// ...
为什么八卦杂志最爱讲床上故事?因为上面都有新闻!哈哈哈~
为什么兔子喜欢吃胡萝卜?因为胡萝卜有好处,营养丰富!

多智能体对话

双人笑话

CrewAI 快速入门

CrewAI

安装

pip install 'crewai[tools]'

CrewAI 使用 Ollama 运行本地 LLM

.env

OPENAI_API_BASE=http://localhost:11434/v1
OPENAI_MODEL_NAME=aya:8b
OPENAI_API_KEY=NULL

agent.py

版本1

每次执行结果都不一样

from dotenv import load_dotenv
load_dotenv()

from crewai import Agent, Task, Crew
from langchain_openai import ChatOpenAI


general_agent = Agent(
    role = "数学教授", 
    goal = """为提问数学问题的学生提供解决方案并给出答案。""", 
    backstory = """您是一位优秀的数学教授,喜欢以每个人都能理解的方式解决数学问题。""", 
    allow_delegation = False,
    verbose = True
)

// ...

版本2

稳定地生成结果

大型语言模型驱动的自主代理

Application scenarios of AI agents(AI代理的应用场景)

AI代理是LLM应用的重要场景,构建代理应用将是2024年的重要技术领域。目前我们主要的智能形式有单AI代理,多AI代理,混合AI代理等三种。

Single AI Agent(单一人工智能代理)

在特定任务场景下完成的工作,比如 GitHub Copilot Chat 下的代理工作区,就是根据用户需求完成特定编程任务的一个例子。基于 LLM 的能力,单个代理可以根据任务执行不同的动作,比如需求分析、项目阅读、代码生成等。它也可以应用于智能家居和自动驾驶。

Multi-AI Agents(多人工智能代理)

这就是AI代理之间相互交互的工作。例如上述Semantic Kernel代理实现就是一个例子。脚本生成的AI代理与执行脚本的AI代理进行交互。多代理应用场景在高度协同的工作中非常有帮助,例如软件行业开发、智能生产、企业管理等。

Hybrid AI Agent(混合人工智能代理)

这就是人机交互,在同一个环境下做决策。比如智慧医疗、智慧城市等专业领域,可以利用混合智能来完成复杂的专业工作。

Intro of AI agent, & AI agent projects s

CodeFuse

CodeFuse 代码领域大模型

CodeFuse 的使命是开发专门设计用于支持整个软件开发生命周期的大型代码语言模型(Code LLMs),涵盖设计、需求、编码、测试、部署、运维等关键阶段。我们致力于打造创新的解决方案,让软件开发者们在研发的过程中如丝般顺滑。