Ultracode：當 AI 可以帶 coding 團隊，人還剩下什麼？

TL;DR Ultracode 把「深度推理」與「自動團隊編排」綁在同一個開關。它讓 AI 自行評估任務、拆解步驟，甚至複製出數十到數百個分身平行作戰。當機器連「如何分工」都學會，人的價值就被推向更核心的兩件事：這件事值得花算力做嗎？做完的成果，憑什麼算數？

前陣子我打開 Claude Code，在選單最下方看到一個新選項：Ultracode。我順手開啟這個模式，丟進一項繁瑣的程式碼收尾任務，接著什麼也沒做，靜靜盯著螢幕看它怎麼運作。

它不像傳統 AI 一拿到指令就往前衝。它先花時間比對幾條分岔的版本紀錄，確認沒有檔案衝突，才沉穩選了最安全的合併路徑；接著同步鏡像、寫好歷史紀錄，順手補上當天的工作日誌。畫面上反覆跳出「almost done thinking」。整段跑完，讓我在意的不是它做得多漂亮，是它做事的「形狀」變了：它表現得比多數工程師還謹慎。

圖說：我把一段複雜的版本收尾任務交給 Ultracode，全程沒有介入。它自行比對版本、選擇合併邏輯、更新鏡像、補完日誌。

技術表面之下：深度推理與動態分工

先釐清一件事：Ultracode 不是一顆新模型，也不是單純讓 AI「想久一點」。它是 Claude Code 的一種運作模式，2026 年 5 月底隨 Opus 4.8 上線（官方說明在這裡）。開啟開關，系統同時轉動兩道齒輪：

極致推理強度（xhigh）：迫使模型動手改程式碼前，先把所有潛在風險與架構邊界在腦中模擬一遍。
自動動態編排（dynamic workflow）：AI 自己評估任務規模，判斷值不值得拆，再把工作分派出去。

關鍵在第二件事是條件式的。任務夠大、能切開，它才會啟動分身；若任務本質是單線（像我丟給它的版本收尾，一個 rebase 沒辦法切給十個代理同時做），它就老實地一步步寫完。同一個開關，遇到不同問題，會自動長出不同的策略。這是我盯著螢幕時最先讀到的訊號：Ultracode 開著，但它沒有為了用而用。

當任務夠大，AI 自己組一支代理人小隊

一旦任務規模龐大，Ultracode 才展現真正的力道。它會現場寫出一段腳本，在同一個 session 裡拉出數十到數百個「子代理（sub-agent）」，各自啃一塊程式碼。

更精妙的是它的驗證方式：對抗式驗證。一組代理從不同角度進攻問題，另一組專職反駁前面得出的結論，兩派在系統內部來回攻防，直到答案收斂、挑不出漏洞為止。

這不是實驗室裡的理論，而是已經發生過的事。

📊 實戰數據：Bun 的程式語言移植

Bun（知名的 JavaScript 執行環境）作者 Jarred Sumner 分享過一個極端案例：他用這套機制，把 Bun 核心接近百萬行的程式碼，從 Zig 移植到 Rust。

項目	公開數據
工程規模	約 96 萬行原始碼、超過 6,000 個 commit
開發耗時	從動工到合併進主線，不到 10 天
品質驗證	幾百個 AI 代理平行協作、每個檔案配兩位 AI 審查者，最終 99.8% 測試通過

這在過去，是一整支資深工程師團隊耗上數個季度也不一定啃得下的工程量。現在用這套機制，十天內就跑出可合併的結果。（Sumner 也提醒，這比較像一次實驗，未必會取代現有的 Zig 版本。）

我以為的核心競爭力，變成 Claude 的內建功能

看到這個功能，我的心情很複雜，因為這套「多代理協作」我自己才剛辛苦手刻過一套。

過去，其實也不過是兩個月前，為了讓 AI 的不同視窗能用接近團隊協作的方式工作，我把流程拆成幾種明確分工：Chat 負責搜尋與策略判斷，Cowork 負責統整與執行，Code 則負責程式碼與技術檢測。不同環節之間，再透過文件與記憶系統同步狀態，避免資訊斷裂、重複或衝突。

這樣的分工其實是一種 harness engineering：不是只把問題丟給 AI，而是設計一套能約束、引導、分工、交接與驗證 AI 的工作系統。

我曾以為這是我身為獨立工作者的護城河。

Ultracode 把這條護城河直接填平。那些曾經要靠人類嚴密規劃、手動隔離、小心切換視窗才撐得起來的高階協作技巧，現在直接變成軟體底層的一個普通按鈕。這代表一件事：「手動編排 AI」的技術紅利已經歸零。

執行力變免費之後，什麼才是稀缺的？

當工具接管最耗腦力的「分工與編排」，而且成本是開放式的（不設上限，跑到答案穩了才停），人的位置就被往後推了一格。

你不再需要思考「怎麼拆解、怎麼分派」，因為機器做得更快更好。這時真正考驗人的，是兩件無法自動化的事：

算力的判斷：眼前這個問題的徹底程度，值不值得按下開關、放任這群代理耗掉一筆說不準的算力去算到收斂？
成果的品味：當幾百個代理交出一份邏輯嚴密、架構龐大的成品，你憑什麼相信它？又該怎麼界定它的範圍和驗收標準？

驗收的本質就是品味。你得自己先深刻知道什麼叫「好」，才有辦法在機器吐出來的成千上萬行程式碼裡，一眼看出哪裡不對勁、哪些該留、哪些該砍。

我在〈人天已死〉裡談過，AI 壓低執行門檻後，產出由「投入多少時間」轉向「你怎麼定義問題、分配任務、把關品質」，人從作業員移向專案經理。Ultracode 是這條線再往前一步：連「分配任務」這個動作，工具都開始自己做。於是手上剩下的，更純粹是判斷。它沒有讓我少做判斷，是把判斷的位置，從「執行的細節」搬到「該不該動用，以及跑完怎麼信」。這兩個問題沒有自動化幫得上忙，因為它們本質上是價值取捨，不是運算。

結語：真正的護城河

看著 Ultracode 在螢幕上跑完那段收尾，我心裡浮現的不是「人會不會被取代」，而是這樣的問題：當機器開始接手編排、執行、除錯，甚至能直接完成大量程式碼移植時，人該握在手上的能力，到底是什麼？

答案恐怕不是更快的操作，也不是更熟練的執行，因為這些能力正在快速被自動化吸收。今天它能協助處理近百萬行程式碼，明天它能接手的範圍只會更大。那些過去以「執行優勢」為傲的個人與團隊，必須重新理解這個新的現實：純粹執行力的重要性，會被壓縮得越來越小。

但這未必是壞事。它逼我們重新區分：什麼只是忙碌，什麼才是有價值的能力。

我想，最後留下的是判斷力與品味。

判斷力，是知道什麼值得做、什麼不值得做；品味，是知道一件事做到什麼程度，才算真正做好。這兩件事不是工具升級就會自動長出來的，也不是按下一個開關就能立刻取得。它們來自真實的經驗、犯過的錯、看過的壞設計、做過的艱難取捨，以及長時間累積出來的分辨能力。

機器會跑得很快，也可以做得越來越多。但最後，仍然需要人來把關：這件事值得做，而且這樣做是對的。那種能力才是人類的護城河。

項目	費用 (USD)	費用 (TWD)
EN 翻譯	$0.055	$1.78
JA 翻譯	$0.083	$2.70
ZH-CN 翻譯	$0.068	$2.22
封面圖	$0.211	$6.86
合計	$0.417	$13.56

技術表面之下：深度推理與動態分工

當任務夠大，AI 自己組一支代理人小隊

📊 實戰數據：Bun 的程式語言移植

我以為的核心競爭力，變成 Claude 的內建功能

執行力變免費之後，什麼才是稀缺的？

結語：真正的護城河

💬 留言討論

延伸閱讀

Claude Design 更新後，我用一個指令把網站設計系統餵進 AI——難的不是下指令，是看懂它要動哪裡

三個 Claude，一個迴圈：我如何把設計探索接到實作上線

Claude Fable 5：AI 工作系統進入長任務時代