Harness 工程:AI 代理可控性架構

智能與秩序 medium 8 篇來源引用
AI編碼代理Harness工程前饋控制反饋控制Claude Code

摘要

Agent = Model + Harness。Harness 是 AI 代理中除模型本身之外的所有組件——讓模型的能力真正可控、可靠、可維護的整體系統。Harness 工程是 1948 年控制論(Sensors + Guides)在 AI 時代的具體實踐,目標是提高首次正確率,並建立自校正閉環。

核心觀點

三層同心圓架構

LangChain 提出的 Agent 定義把 Harness 視覺化為三層同心圓:

  1. 核心層:LLM 模型本身(Claude、GPT 等),這層由模型供應商控制,使用者通常無法修改
  2. 中間層:框架/平台提供者構建,如 Claude Code 的系統提示、檢索工具、編排系統——這是「開箱即用」的 Harness
  3. 外層:使用者為特定業務場景構建的前饋 Guides 與反饋 Sensors——這是差異化價值的來源

外層的 Harness 是每個組織最獨特、最有競爭壁壘的部分。Claude Code 的 CLAUDE.md 就是一個典型的 Guide;CI/CD 中觸發 AI 審查的 webhook 就是一個 Sensor。

Guides vs Sensors:控制論的兩種力量

這組對立來自 1948 年諾伯特・維納的控制論,是所有 Harness 設計的底層邏輯:

維度Guides(前饋控制)Sensors(反饋控制)
時機行動提供方向行動觀察並觸發校正
類比看到食物分泌消化液(預測性調節)體溫過高啟動排汗(偏差修正)
編碼代理例子AGENTS.md 規範、技能文檔提交後 lint、AI 代碼審查
目標提高首次正確率構建自校正閉環

兩者協同,才是完整的 Harness。只有 Guides 沒有 Sensors,就像只告訴員工規則但不給反饋;只有 Sensors 沒有 Guides,就是讓 AI 摸索試誤。

計算型 vs 推理型執行

Harness 的執行類型決定了使用場景與成本結構:

  • 計算型:確定性高、速度快、成本低,如 lint、型別檢查、測試執行——適合提交前的高頻觸發
  • 推理型:語義靈活、成本高、非確定,如 AI 代碼審查、LLM 判斷——適合集成後的低頻深度檢查

時間線部署原則:提交前用快速計算型,集成後用高成本推理型。不能把所有 Sensors 都堆到 CI,也不能讓 AI 審查每一次微小的改動。

三大調節維度

Harness 工程實務上圍繞三個維度展開:

  1. 可維護性(最成熟):程式碼品質、格式規範、文件完整性
  2. 架構適應性(Fitness Functions):系統是否朝預期的架構方向演化
  3. 功能行為(最具挑戰):業務邏輯是否正確——這需要規範文檔和 AI 生成測試,目前仍是最難解的部分

人類開發者的隱性 Harness

值得特別注意的是:資深人類開發者本身就是一個完整的 Harness。

資深程序員瞬間感受到「味道不對」的直覺、對業務場景的深刻理解、對團隊文化的感知——這些無法被編碼成規則的隱性智慧,才是人類最不可替代的 Harness 組件。AI Harness 工程的本質,是把過去只存在於人腦中的這些判斷,盡可能地外化為系統可執行的規則與流程。

來源引用

  • getnote-703240-ai-coding-harness-engineering — 系統闡述 Agent = Model + Harness 框架,三層同心圓架構、Guides vs Sensors、OpenAI 與 Stripe 的實踐案例
  • getnote-880568-cybernetics-homeostasis-tacit-knowledge — 從控制論歷史視角解讀 Harness 工程的思想根源,串連 1948 維納、1968 軟體危機、隱性知識

矛盾與爭議

目前來源觀點一致。最大的開放挑戰是「功能行為 Harness 的可靠性」——如何用可執行的規則捕捉業務邏輯的正確性,目前沒有成熟解法,LLM 判斷的非確定性讓這個維度特別難以系統化。

延伸連結

  • tacit-knowledge 隱性知識是理解 Harness 工程人類側價值的核心——外化隱性知識是 Harness 設計的根本挑戰
  • Human-AI Collaboration Harness 工程是人機協作的基礎設施:不設計 Harness,就是把人機協作留給偶然

來源引用(1 篇)

📁 other(1)

  • 從「空談廉價」到「程式碼廉價」:兩位 AI 大神看到的工作方式巨變
動態牆知識圖譜關於搜尋聯絡我
EN
字級