Harness Engineering
Harness Engineering 定义
Harness engineering 是一门设计和构建约束、反馈循环和生命周期系统的工程学科,用于让 AI 智能体能够可靠地构建软件。它的核心思想是:不直接让 AI 写代码,而是创建一个环境(harness),让 AI 在这个环境中可靠地构建代码。
三大核心支柱
1. Context Engineering(上下文工程)
- 增强的知识库
- 动态上下文注入(可观测性数据、浏览器导航等)
- 提供 AI 完成任务所需的完整信息
2. Architectural Constraints(架构约束)
- 由 AI 智能体监控
- 自定义 lint 规则
- 结构性测试
- 确保生成的代码符合架构规范
3. Entropy Cleanup(熵清理/垃圾回收)
- 定期运行的智能体来发现不一致和违规
- 对抗系统随时间的退化
- 保持代码库的长期质量
典型架构模式
Anthropic 的三智能体架构:
- Planner(规划智能体):任务分解
- Generator(生成智能体):代码生成
- Evaluator(评估智能体):质量评估(基于 Design quality、Originality、Craft、Functionality 等标准)
关键实践
- 迭代改进:将智能体的困难视为信号,据此添加工具/护栏/文档
- 自我验证循环:build-test-fix 闭环
- 循环检测中间件:防止无限循环
- "推理三明治":计算预算策略
- 状态传递:在智能体之间清晰传递任务状态