1 篇文章带有标签 “agent-harnesses”

协同进化:寻找智能体时代效率与商业的平衡点(罗福莉)

罗福莉 2026年4月6日

两天前,Anthropic 切断了第三方客户端(Harnesses)使用 Claude 订阅的通道——这并不令人意外。三天前,MiMo 推出了其 Token 计划(Token Plan)——这是一个我投入了大量精力去设计的方案,也是我认为在实现合理的算力分配和智能体客户端开发方面一次严肃的尝试。将这两件事结合起来,我有以下几点思考:

  1. Claude Code 的订阅制是一个专为平衡算力分配而设计的精美系统。 我的猜测是——它并不赚钱,甚至可能在亏本,除非他们的 API 利润率高达 10-20 倍,但我对此深表怀疑。虽然我无法严密地计算出第三方客户端接入所带来的损失,但我近距离观察过 OpenClaw 的上下文管理——它真的很糟糕。在单个用户查询中,它会把一轮轮低价值的工具调用作为独立的 API 请求发送出去,每个请求都携带长达 100K 以上 Token 的长上下文窗口——即便有缓存命中,这也是极大的浪费,在极端情况下还会推高其他查询的缓存未命中率。其单次查询的实际请求次数最终比 Claude Code 自身框架高出数倍。折算成 API 定价的话,真实成本恐怕是订阅价格的几十倍。这不仅是一个差距,而是一个巨大的黑洞。
  2. 像 OpenClaw/OpenCode 这样的第三方客户端依然可以通过 API 调用 Claude——它们只是不能再薅订阅制的羊毛了。 短期内,这些智能体用户会感到阵痛,成本极有可能飙升几十倍。但这种压力恰恰会倒逼这些客户端去优化上下文管理、最大化提升提示词缓存(Prompt Cache)的命中率以复用已处理的上下文,并减少无谓的 Token 消耗。痛苦最终会转化为工程上的严谨与克制。
  3. 我强烈呼吁大模型公司不要在搞清楚如何为编程套餐定价且不亏本之前,就盲目地进行价格战、卷到行业底层。 廉价销售 Token 却对第三方客户端敞开大门,看似对用户友好,实则是一个陷阱——正是 Anthropic 刚刚踩进去又退出来的那个陷阱。更深层次的问题在于:如果用户把精力浪费在低质的智能体客户端、极度不稳定且缓慢的推理服务,以及为了削减成本而降级的大模型上,结果却发现依然什么事也做不成——这对于用户体验或留存率来说,绝不是一个健康的循环。
  4. 关于 MiMo Token 计划——它支持第三方客户端,按 Token 配额计费,这与 Claude 最新推出的额外用量包逻辑一致。 因为我们追求的是长期、稳定地交付高质量的模型与服务——而不是吸引你冲动消费后便任由你弃船而去。