Pi Agent SDK 参考文档

本 SDK 提供对 Pi 智能体能力的程序化访问。可用于将 Pi 嵌入其他应用、构建自定义界面,或集成到自动化工作流中。

典型使用场景:

  • 构建自定义界面(网页、桌面、移动端)
  • 将智能体能力集成到现有应用
  • 用智能体推理创建自动化流程
  • 构建可生成子智能体的自定义工具
  • 以编程方式测试智能体行为

参见 examples/sdk/,获取从极简到全量控制的可运行示例。

SDK 已包含在主包中,无需单独安装。

createAgentSession() 使用 ResourceLoader 提供扩展、技能、提示模板、主题和上下文文件。若未提供,则使用带标准自动发现能力的 DefaultResourceLoader

基于 Pi Agent SDK 适配 OpenAI 兼容接口

通过两种方式,在 TypeScript 中使用 @earendil-works 的 Pi Agent 框架连接本地运行的 Ollama 模型(以 qwen3.5:9b 为例)。

首先,初始化项目并配置为 ES Modules (ESM) 模式,以支持顶层 await 语法。

npm init -y

在生成的 package.json 中,手动添加 "type": "module"

惨痛的教训(The Bitter Lesson)

AI 的未来不在于将人类现有的经验硬塞给机器,而在于设计出能够利用无限算力进行搜索与学习的“元方法”。

回顾70年人工智能研究历程,最深刻的一条教训是:依托算力的通用方法,最终效果远超其他路径,且优势极其显著。究其根本,源于摩尔定律——或者更广义地说,单位计算成本持续呈指数级下降。绝大多数人工智能研究开展时,都默认智能体可使用的算力是恒定的(这种情况下,借助人类知识就成了提升性能为数不多的手段之一)。但只要研究周期稍长于普通科研项目,海量算力必然会成为现实。

研究者为追求短期见效的性能提升,往往试图融入自身对领域的人类认知;但从长远来看,真正起决定性作用的,只有对算力的充分利用。这两条路径本不必相互对立,现实中却常常冲突:投入在一方的时间,就无法用于另一方。研究者会在心理上执着于某一种研究思路;而依赖人类知识的方法,往往会让模型变得复杂,反而难以适配依托算力的通用优化路径。

人工智能研究者们屡屡迟来地领悟到这一惨痛教训,回顾其中几个典型案例,颇具启发意义。

在国际象棋领域,1997年击败世界冠军卡斯帕罗夫的算法,依靠的是大规模深度搜索。彼时,多数国际象棋计算机研究者对此倍感沮丧——他们此前一直钻研的,是融入人类对国际象棋特有棋局结构理解的方法。

Reachy Mini Conversation App

git clone https://github.com/wang-junjian/reachy_mini_conversation_app
cd reachy_mini_conversation_app
uv venv --python 3.12
source .venv/bin/activate
uv sync

⚠️ 注意:要完全复现此仓库 uv.lock 文件中的依赖关系,请运行 uv sync --frozen 命令。这将确保 uv 直接从 lock 文件安装依赖项,而无需重新解析或更新任何版本。

uv sync --extra local_vision         # Local PyTorch/Transformers vision
uv sync --extra yolo_vision          # YOLO face-detection backend for head tracking
uv sync --extra mediapipe_vision     # MediaPipe-based head-tracking
uv sync --extra all_vision           # All vision features

合并额外功能或包含开发依赖项:

uv sync --extra all_vision --group dev

Kilo Code - AI 编码智能体架构设计文档

Kilo Code 是一个功能强大的开源 AI 编码助手,基于 OpenCode 框架开发。项目采用 Monorepo 架构,使用 Turborepo 和 Bun Workspaces 管理多个包。

指标 数值
Monorepo 包数量 23
TypeScript 文件数 5800+
支持的 AI 模型 500+
内置工具数量 50+
UI 组件数(kilo-ui) 65+
国际化语言 19 种
开源协议 MIT
  • 多模型支持:支持 500+ AI 模型,包括 Claude、GPT、Gemini、Grok、Codex、GLM 等
  • 多客户端:CLI、VS Code 扩展、Web UI 和桌面应用,满足不同场景
  • 丰富的工具集:50+ 内置工具,涵盖文件操作、命令执行、代码搜索
  • 插件扩展:支持外部插件和 MCP 服务器,动态加载自定义工具
  • 会话管理:完整的会话系统,支持父子会话、上下文压缩、会话恢复
  • 浏览器自动化:集成 Playwright,AI agent 可操作网页、截图、表单填充

Kilo Code 采用 Turborepo + Bun Workspaces 分层架构,23 个包协同工作。

Pi - AI 编码智能体架构设计文档

Pi 是一个模块化的 AI 编码智能体 Monorepo,使用 TypeScript 构建。它提供统一的 LLM 抽象层、通用的智能体运行时、丰富的终端 UI 框架,以及完全可扩展的编码智能体命令行工具。

Pi(@earendil-works/pi-mono)是由 Mario Zechner 开发的 AI 编码智能体 Monorepo,设计理念是模块化、可扩展、供应商无关。它将多个 LLM 供应商的复杂性抽象为统一 API,提供强大的智能体运行时和工具执行能力,并附带生产就绪的终端 UI。

能力 说明
统一 LLM API 9 种 API 协议和 30+ 供应商品牌的单一接口。只需修改一个字符串即可切换供应商。
智能体运行时 完整的智能体循环,支持并行工具执行、消息注入队列和上下文压缩。
丰富的终端 UI 独立的终端 UI 框架,支持差异化渲染、文本编辑器、图片显示和浮层系统。
扩展系统 80+ 扩展示例、20+ 生命周期钩子。可注册工具、命令、快捷键和供应商。
Web 组件 基于 Lit 的聊天 UI,支持沙箱化 Artifact 渲染(HTML、SVG、PDF、DOCX 等)。
多运行模式 交互式终端、管道友好的打印模式,以及用于 IDE 集成的 JSONL RPC 模式。

Speech To Speech:使用开源模型构建本地语音智能体

VAD

STT

LLM

TTS

从 PyPI 安装默认包:

pip install speech-to-speech

默认安装限定为标准实时语音智能体路径: Parakeet TDT 用于 STT 兼容 OpenAI 的 API 用于语言模型 Qwen3-TTS 用于语音输出 本地音

使用 Claude Code:HTML 超乎寻常的妙用

Thariq: Using Claude Code: The Unreasonable Effectiveness of HTML

Markdown 已成为智能体(agent)与我们沟通时占主导地位的文件格式。它简单、可移植,具备一定的富文本能力,且易于编辑。Claude 甚至已经相当擅长在 Markdown 文件中使用 ASCII 绘制图表。

但随着智能体变得越来越强大,我感到 Markdown 已成为一种受限的格式。我发现自己很难阅读超过一百行的 Markdown 文件。我想要更丰富的可视化效果、色彩和图表,并且希望能轻松分享它们。

我也越来越不亲自编辑这些文件,而是将它们用作规格说明、参考文件、头脑风暴输出等。当我确实需要编辑时,我通常会让 Claude 来编辑,这就削弱了 Markdown 最大的一个优势。

我开始更偏爱 HTML 作为输出格式,而不是 Markdown,并且越来越多地看到 Claude Code 团队中的其他人也在使用它。以下就是原因。

(如果你想先看一些示例,可以在这里看到一大堆:https://thariqs.github.io/html-effectiveness ,不过记得回来看更多关于"为什么"的内容。)

与 Markdown 相比,HTML 能够传达更丰富得多的信息。

Reachy Mini Python SDK 开发实战:从运动控制到视觉音频交互

Notebook 0 — First Connection & Movement

🎯 目标:连接 Reachy Mini 并执行你的第一条运动指令。

Reachy Mini 采用客户端-服务器架构

graph LR
    subgraph Client
        A[Your Python Script]
    end
    
    subgraph Server
        B[Reachy Daemon]
    end
    
    subgraph Reachy Mini
        C[Robot Hardware or Simulation]
    end
    
    A <--> B
    B --> C
  • 守护程序(Daemon):一个后台服务程序,直接控制机器人的电机、传感器、摄像头和音频。
  • Python SDK:你用来发送指令的 reachy_mini 软件包。
  • 多个客户端可以同时连接(如网页应用、脚本、Jupyter Notebook)。
  • 守护程序负责安全地处理底层硬件操作。
  • 你可以通过网络远程控制机器人。例如,在与机器人连接的树莓派(Raspberry Pi)上运行守护程序,同时在性能强大的服务器上运行你的 AI 代码。

在运行代码之前,请先确认机器人已启动并正常运行。

你应该使用 Reachy Mini Control 来检查机器人是否已连接并准备就绪。

LLM Wiki:基于大语言模型的个人知识库构建模式

使用大语言模型(LLM)构建个人知识库的模式。

这是一份概念文件,设计用于复制粘贴到你自己的 LLM 智能体中(例如 OpenAI Codex、Claude Code、OpenCode / Pi 等)。它的目标是传达高层级的理念,而具体细节将由你的智能体与你协作构建。

大多数人与 LLM 和文档打交道的体验看起来像是 RAG:你上传一批文件,LLM 在查询时检索相关片段,然后生成答案。这确实有效,但 LLM 每次都要从零开始重新发现知识,没有任何积累。当你问一个需要综合五份文档的微妙问题时,LLM 必须每次都找到并拼凑相关片段,没有任何东西被沉淀下来。NotebookLM、ChatGPT 文件上传以及大多数 RAG 系统都是这样工作的。

这里的理念不同。与其仅在查询时从原始文档中检索,LLM 增量式地构建并维护一个持久的维基 —— 一个结构化的、相互关联的 Markdown 文件集合,位于你和原始来源之间。当你添加新来源时,LLM 不只是将其索引以备后用。它会阅读来源,提取关键信息,并将其整合到现有维基中 —— 更新实体页面、修订主题摘要、标注新数据与旧主张的矛盾之处、强化或挑战不断演进的综合结论。知识被编译一次,然后保持最新,而不是每次查询都重新推导。

这就是关键区别:维基是一个持久的、复合增长的产物。

给 GitHub Pages 博客加评论:用 Giscus 开启原生的 Discussions 方案

默认情况下,GitHub 仓库没有开启讨论(Discussions)功能。

  • 进入 wang-junjian.github.io 仓库。
  • 点击顶部的 Settings(设置)。
  • General 页面向下滚动,找到 Features 区域。
  • 勾选 Discussions 选项。

为了让 Giscus 有权限向你的仓库写入评论,你需要:

  • 访问 github.com/apps/giscus
  • 点击 Install,并选择将其安装到你的 wang-junjian.github.io 仓库上。

在你的 Discussions 页面中,建议创建一个专门的类别(例如命名为 AnnouncementsComments),并确保该类别的 Discussion format 设置为 Announcement,这样普通用户就不能直接在 GitHub 页面随意发起讨论,只能通过你的博客留言板生成。

访问 giscus.app,在“仓库”栏输入 wang-junjian/wang-junjian.github.io,它会自动检测并生成一段配置代码。

Hermes 与 OpenClaw —— 该选哪个智能体?

Hermes vs. OpenClaw - When to Reach for Which Agent

发布时间:2026-05-07 作者:Brendan O'Leary

上周,有人在 Kilo Discord 里问:"我该从 OpenClaw 切换到 Hermes 吗?" 自 Hermes 今年二月发布以来,这个问题我已经见过不下十几次。问得好 —— 两者都是开源的,都能连接你的聊天应用,都能运行工具、记住上下文。单看功能列表,它们几乎一模一样。

但过去两个月同时运行两者之后,我认为功能清单反而让人分心 —— 真正让它们分道扬镳的是设计哲学。

Hermes 是在一个学习型智能体外包裹了一个网关。

OpenClaw 是在一个消息网关内包裹了一个智能体。

这个区别听起来很抽象,但它对你配置和与每个工具交互的方式有着切实的影响。

Hermes Agent 来自 Nous Research,于 2026 年 2 月发布。截至本文撰写时,GitHub 星标数约为 13.5 万。其 headline 功能是所谓的"学习循环" —— 智能体会基于自身行为创建并进化自己的技能。

根据其功能文档

自我改进的技能:智能体从经验中生成程序性知识。同一类任务跑上一百次,Hermes 真的会越做越好。

KiloClaw 安全白皮书

2026年2月 v1.0;Andrew Storms 独立安全评估

KiloClaw 是一个托管式计算平台,在每个专用虚拟机中运行每个用户的 AI 智能体实例。每位客户都会获得一个隔离的环境,其 AI 智能体可以在其中执行代码、访问文件系统、浏览网页以及连接到聊天频道(如 Telegram、Discord 和 Slack)。

对于代表客户执行任意代码的 AI 智能体托管式计算这类产品,其安全风险本身就很高。租户隔离的失误可能会将一个客户的秘密、对话和已连接账户暴露给另一个客户。机密管理的失误可能会危及客户托付给该平台的 API 密钥。

本白皮书介绍了 KiloClaw 的安全架构、保护客户数据的控制措施,以及 2026 年 2 月进行的独立安全评估的结果。它面向评估 KiloClaw 是否适合其组织的安全团队、合规官和技术决策者。

一项为期10天的独立安全评估通过威胁建模(采用 PASTA 框架,涵盖13项资产中的30个威胁)、代码审查、60多项对抗性测试以及实时基础设施测试,验证了 KiloClaw 的架构。总体结论是:KiloClaw 的安全架构是健全的,并在多个独立层实施了租户隔离。

理解安全模型需要先理解其架构。当客户配置一个 KiloClaw 实例时,该平台会通过多层基础设施创建一个专用的计算环境。

客户的浏览器连接到一个 Cloudflare Worker,该 Worker 通过签

集成个人助手(OpenClaw|Hermes)的方式

聊天软件要集成 OpenClaw,主要有这几类方式(可以组合):

  1. 用 OpenClaw 自带的“Channel 插件”直连(推荐,最省事)
    • Telegram、WhatsApp、Discord、Slack、飞书/Lark、钉钉、Teams、Google Chat、Mattermost、Matrix、IRC、LINE、Signal、iMessage 等。
    • 在 OpenClaw 的初始化或 openclaw channels add 里直接选通道、按向导配置即可。
    • 本质上是:各 IM 的 Bot API / Webhook / Socket Mode / QR 扫码 对接到 OpenClaw 的 Gateway。初始化向导里可以看到支持的通道清单。
  2. 通用 HTTP 接口集成(适合任意聊天平台)
    • OpenClaw 的 Gateway 提供了一个 HTTP 端点 /tools/invoke,可以调用单个工具(例如创建会话、发消息、拉取历史等),支持 Bearer 认证和 OpenAI 兼容的 /v1/* 风格接口。
    • 你的聊天软件后端只要能发 HTTP POST,就可以用这个接口和 OpenClaw 交互。
  3. Gateway WS 协议集成(适合需要实时双向通信的场景)
    • OpenClaw 使用 Gateway WS 协议作为控制面+传输,所有客户端(CLI、Web UI、App 等)都走这个协议。
    • 如果你想自己写一个聊天前端或桥接层,可以直接按 Gateway WS 协议接入。
  4. Webhook 入站集成(事件驱动)
    • OpenClaw 内置 Webhook 能力,可以接收外部系统推送的事件;社区教程也演示了如何通过 Webhook 接收任意第三方系统请求。
    • 很多 IM 本身就支持“收到消息 → 发 Webhook”,你把这些 Webhook 转发给 OpenClaw 即可。
  5. 通过自动化/ iPaaS 平台“曲线集成”(n8n、Zapier、腾讯云/阿里云云函数等)
    • 比如用 n8n:邮件 → HTTP Request 调 OpenClaw API → 飞书通知,已经有人实践过。
    • 适合需要把 IM 和内部系统(工单、CRM、邮件等)串起来的复杂场景。

1. 用 OpenClaw 自带 Channel 插件直连(最常用)

原理:
OpenClaw 是“自托管网关+多通道 Agent 平台”,已经把常见聊天软件的接入做成了内置通道或插件,你只要按向导配置 Bot Token / Webhook / QR 码即可。 典型流程:

  1. 部署并启动 OpenClaw(本地或云主机)。
  2. 在初始化或 openclaw configure / openclaw channels add 里选择要接入的通道,例如:
    • Telegram(Bot API)
    • WhatsApp(QR pairing)
    • Discord(Bot API)
    • Slack(Socket Mode 或 HTTP Events API)
    • Feishu/Lark(飞书)
    • Microsoft Teams(Bot Framework)
    • Mattermost、Matrix、IRC、Google Chat、Signal、iMessage、LINE 等。
  3. 按提示在目标聊天平台创建 Bot、填 Token / Webhook URL / App Token 等参数。
  4. 启动 Gateway(openclaw gateway restart)并验证。 适合:
  • 目标聊天平台在 OpenClaw 支持列表内,且你希望快速把 AI 能力接入现成 IM

2. 通用 HTTP 接口集成(任意聊天软件)

原理:
Gateway 提供了一个始终启用的 HTTP 端点 POST /tools/invoke,用于直接调用单个工具,支持 Gateway 级别的认证与权限控制。 关键信息:

  • 端点:http://<host>:<port>/tools/invoke(与 Gateway WS 共用端口)
  • 认证方式:
    • Bearer Token(gateway.auth.token / OPENCLAW_GATEWAY_TOKEN
    • 或 Password(gateway.auth.password
    • 或无认证(仅建议在私有网络/入口使用)
  • 支持通过 HTTP 头传递上下文,例如:
    • x-openclaw-message-channel: slack / telegram
    • x-openclaw-account-id(多账号时)
  • 请求体示例(列出会话):
    {
      "tool": "sessions_list",
      "action": "json",
      "args": {},
      "sessionKey": "main",
      "dryRun": false
    }
    

集成方式:

  • 在你的聊天软件后端:
    1. 维护 OpenClaw 的地址与 Token;
    2. 收到聊天消息时,调用 /tools/invoke 触发 OpenClaw 的对话/任务工具;
    3. 把返回结果格式化后发回聊天通道。 适合:
  • 想把 自研聊天 App/后台 接到 OpenClaw;
  • 使用 OpenClaw 做统一的 AI 能力网关,前端聊天系统只负责展示和收发消息。

3. Gateway WS 协议集成(前端/实时集成)

原理:
OpenClaw 的所有客户端(CLI、Web UI、桌面/移动端 App)都使用统一的 Gateway WS 协议 作为控制面+传输。
集成方式:

  • 按官方 Gateway 协议规范,实现一个 WebSocket 客户端(JS/Flutter/桌面/Electron 等),连接到 Gateway;
  • 使用协议定义的消息类型进行会话管理、消息收发、工具调用等;
  • 再在你的聊天 UI 里只渲染消息和会话状态。 适合:
  • 自建聊天前端,希望与 OpenClaw 有更细粒度的实时交互(比如实时打字、多轮工具调用状态展示)。

4. Webhook 入站集成(事件驱动)

原理:

  • OpenClaw 内置 Webhook 支持,社区教程也有“day10-webhooks”的实战:通过内置的轻量 HTTP 服务端接收任何第三方系统 Webhook。
  • 官方 Webhooks 插件还提供了带认证的 HTTP 路由,把外部事件绑定到 OpenClaw 的 TaskFlow。 集成方式:
  1. 在聊天平台侧配置:
    • 消息事件 → 发送到你的 Webhook(例如 https://your-domain/webhook)。
  2. 在你的服务端(或 OpenClaw 自带的 Webhook 服务端):
    • 接收 Webhook,格式化成 OpenClaw 需要的事件结构;
    • 转发给 OpenClaw(HTTP 或 WS),触发 Agent 回复/执行任务;
    • 再把结果推回聊天平台(通过平台提供的 Bot API)。 适合:
  • IM 平台只提供“事件 Webhook”而不是 Bot API,或者你希望把多个 IM 统一接到同一个 OpenClaw 实例

5. 通过自动化 / iPaaS 平台集成(n8n/Zapier/云函数等)

原理:

  • OpenClaw 提供了 HTTP API,自动化工具可以直接调用。
  • 腾讯云社区有教程演示:n8n 工作流中用“HTTP Request”节点调用 OpenClaw API,再触发飞书通知等。 集成方式:
  • 在 n8n / Zapier / 腾讯云函数 / 阿里云云函数等:
    • 创建一个“聊天消息触发器”(例如飞书机器人收到消息、Slack Event、微信/企微 Webhook);
    • 用 HTTP Request 节点调用 OpenClaw 的 /tools/invoke 或兼容的 /v1/* 接口;
    • 把返回结果发回 IM 或其他业务系统。 适合:
  • 需要快速串联多个系统(IM + 邮件 + 工单 + 数据库)的场景;
  • 不想写太多后端代码,用低代码平台打通即可。

6. 选型建议(怎么选最适合你的方式)

  • 如果你用的 IM 是:Slack / Telegram / Discord / WhatsApp / 飞书 / Teams / Mattermost / Matrix / IRC / LINE / Google Chat 等
    → 优先用 OpenClaw 自带 Channel 插件,按向导配置即可。
  • 如果你用的是自研聊天 App,或者想统一做多 IM AI 网关
    → 用 Gateway HTTP /tools/invoke + Gateway WS 协议,自己写一层薄后端桥接。
  • 如果你的 IM 只提供 Webhook 事件
    → 用 Webhook 入站 + OpenClaw Webhook 插件,做事件到 Agent 的映射。
  • 如果你需要跨系统自动化(IM+邮件+工单+CRM 等)
    → 用 n8n / iPaaS + OpenClaw HTTP API

研究编码智能体(Kilo Code)开源项目的最佳实践

基于 Kilo Code 的架构特征和当前编码智能体领域的生产实践 ,以下是系统研究此类项目的 方法论框架

研究维度 关键问题 Kilo Code 的启示
Fork 溯源 上游是谁?核心差异点?社区分裂原因? Kilo 从 Roo Code 分叉,差异集中在 Cloud 集成和商业化功能
生态位 是「IDE 插件」「CLI 工具」还是「平台」? Kilo 是「IDE 扩展 + CLI + Cloud」的三位一体
许可策略 是否存在 BSL/SSPL 等限制性条款? MIT 许可证,无商业限制
模型绑定 是否硬编码单一提供商? 模型中立是核心卖点,避免供应商锁定

建议的代码阅读路径(以 Kilo 为例):

  1. 入口层src/extension/activate.ts(VS Code 生命周期)、src/extension/api.ts(IPC 外部 API)
  2. 核心代理循环 — 查找 Cline/Roo/Kilo 主类,理解 Plan → Act → Verify 的循环
  3. 工具调用层McpHub 如何集成外部工具(文件系统、终端、浏览器)
  4. 上下文管理层 — Memory Bank、Context Mentions、自动索引的实现
  5. 模式系统 — Custom Modes 的解析与切换逻辑
  6. 差异标记 — 搜索 // kilocode_change 快速定位增量代码

Reachy Mini 机器人

2025年12月买的 Reachy Mini 机器人,近5个月终于到手了。

Reachy Mini 是由法国机器人公司 Pollen Robotics 开发的一款开源的桌面级人形机器人,旨在为教育、研究和创意项目提供一个灵活且易于使用的平台。Reachy Mini 是 Reachy 机器人的小型版本,具有相似的功能和设计,但体积更小,更适合在桌面环境中使用。

功能特性 Wireless (无线版) Lite (轻量版)
价格 449449 299
电机与机械结构 9 个伺服电机 9 个伺服电机
头部运动 6 自由度 (pitch, roll, yaw, x, y, z) 6 自由度 (pitch, roll, yaw, x, y, z)
身体旋转 ±160° ±160°
天线 2 个动力感应天线 2 个动力感应天线
摄像头 广角摄像头 广角摄像头
麦克风 4 麦克风阵列 4 麦克风阵列
扬声器 5W 扬声器 5W 扬声器
板载算力 树莓派 CM 4 (16GB 存储) -
加速计 内置 IMU -
Wi-Fi 连接 支持 -
独立模式 支持 需通过 USB 连接控制
供电方式 电池供电 + 电源适配器 (7.3V / 5A) 仅限电源适配器 (7.3V / 5A)

  • 网络名称reachy-mini-ap
  • 密码reachy-mini

macOS 图像转为 WebP 格式(Automator)

本工具是一个专为 macOS 设计的自动化脚本,它能帮助您将选择的图片转换为 WebP 格式。

该工具设计为通过 macOS 的“快速操作”或 Automator 工作流程来调用,从而实现便捷的图像转换操作。

  • 作为“快速操作”使用:
    • 设置“快速操作”: 您需要将提供的脚本保存为 Automator 工作流程的“快速操作”。
      • 打开 Automator 应用(在“应用程序” -> “实用工具”中)。
      • 选择 “文件”>“新建”
      • 选择 “快速操作” 并点击“选取”。
      • 在左侧的库中,搜索并拖动 “运行 Shell 脚本” 到右侧的工作流程区域。
      • 在“运行 Shell 脚本”模块中,将“传递输入”设置为 “作为自变量”
      • 将本工具的完整代码粘贴到“运行 Shell 脚本”的文本框中。
      • 选择 “文件”>“存储”,为您的快速操作命名,例如“图像转换为 WebP”。
    • 使用方法:
      • 打开 Finder,导航到您要转换的图片所在的文件夹。
      • 选中您希望转换的所有图片(请确保至少选择一张)。
      • 右键点击选中的图片,或者点击 Finder 窗口顶部的“服务”菜单。
      • 在上下文菜单中,找到并点击您刚才创建的“快速操作”名称,例如 “图像转换为 WebP”
      • 一个对话框会弹出,询问您希望转换为哪种格式。选择您的偏好。
      • 工具将自动处理图片,并将转换后的新图片保存在您选中的图片所在的相同文件夹中。

Kilo Code:基于智能体工程的自动化软件开发平台

# npm
npm install -g @kilocode/cli

# Or run directly with npx
npx @kilocode/cli

基于项目文档和代码结构分析,Kilo是一个开源的AI编码智能体平台,主要用于加速软件开发过程。它是OpenCode项目的fork版本,增强为全面的agentic工程平台。以下是其核心能力的详细分析:

WebP 格式的命令工具

webp 是一个官方工具包,它不是单个软件,而是一整套处理 WebP 格式的命令工具集合。

brew install webp
# 有损(推荐,长截图用)
cwebp -q 80 input.png -o output.webp
# 无损(画质完全不变,体积稍大)
cwebp -lossless input.png -o output.webp
dwebp input.webp -o output.png