TL;DR Ultracode 把「深度推理」與「自動團隊編排」綁在同一個開關。它讓 AI 自行評估任務、拆解步驟,甚至複製出數十到數百個分身平行作戰。當機器連「如何分工」都學會,人的價值就被推向更核心的兩件事:這件事值得花算力做嗎?做完的成果,憑什麼算數?

前陣子我打開 Claude Code,在選單最下方看到一個新選項:Ultracode。我順手開啟這個模式,丟進一項繁瑣的程式碼收尾任務,接著什麼也沒做,靜靜盯著螢幕看它怎麼運作。

它不像傳統 AI 一拿到指令就往前衝。它先花時間比對幾條分岔的版本紀錄,確認沒有檔案衝突,才沉穩選了最安全的合併路徑;接著同步鏡像、寫好歷史紀錄,順手補上當天的工作日誌。畫面上反覆跳出「almost done thinking」。整段跑完,讓我在意的不是它做得多漂亮,是它做事的「形狀」變了:它表現得比多數工程師還謹慎。

圖說:我把一段複雜的版本收尾任務交給 Ultracode,全程沒有介入。它自行比對版本、選擇合併邏輯、更新鏡像、補完日誌。

技術表面之下:深度推理與動態分工

先釐清一件事:Ultracode 不是一顆新模型,也不是單純讓 AI「想久一點」。它是 Claude Code 的一種運作模式,2026 年 5 月底隨 Opus 4.8 上線(官方說明在這裡)。開啟開關,系統同時轉動兩道齒輪:

  1. 極致推理強度(xhigh):迫使模型動手改程式碼前,先把所有潛在風險與架構邊界在腦中模擬一遍。
  2. 自動動態編排(dynamic workflow):AI 自己評估任務規模,判斷值不值得拆,再把工作分派出去。

關鍵在第二件事是條件式的。任務夠大、能切開,它才會啟動分身;若任務本質是單線(像我丟給它的版本收尾,一個 rebase 沒辦法切給十個代理同時做),它就老實地一步步寫完。同一個開關,遇到不同問題,會自動長出不同的策略。這是我盯著螢幕時最先讀到的訊號:Ultracode 開著,但它沒有為了用而用。

當任務夠大,AI 自己組一支代理人小隊

一旦任務規模龐大,Ultracode 才展現真正的力道。它會現場寫出一段腳本,在同一個 session 裡拉出數十到數百個「子代理(sub-agent)」,各自啃一塊程式碼。

更精妙的是它的驗證方式:對抗式驗證。一組代理從不同角度進攻問題,另一組專職反駁前面得出的結論,兩派在系統內部來回攻防,直到答案收斂、挑不出漏洞為止。

這不是實驗室裡的理論,而是已經發生過的事。

📊 實戰數據:Bun 的程式語言移植

Bun(知名的 JavaScript 執行環境)作者 Jarred Sumner 分享過一個極端案例:他用這套機制,把 Bun 核心接近百萬行的程式碼,從 Zig 移植到 Rust。

項目公開數據
工程規模約 96 萬行原始碼、超過 6,000 個 commit
開發耗時從動工到合併進主線,不到 10 天
品質驗證幾百個 AI 代理平行協作、每個檔案配兩位 AI 審查者,最終 99.8% 測試通過

這在過去,是一整支資深工程師團隊耗上數個季度也不一定啃得下的工程量。現在用這套機制,十天內就跑出可合併的結果。(Sumner 也提醒,這比較像一次實驗,未必會取代現有的 Zig 版本。)

我以為的核心競爭力,變成 Claude 的內建功能

看到這個功能,我的心情很複雜,因為這套「多代理協作」我自己才剛辛苦手刻過一套。

過去,其實也不過是兩個月前,為了讓 AI 的不同視窗能用接近團隊協作的方式工作,我把流程拆成幾種明確分工:Chat 負責搜尋與策略判斷,Cowork 負責統整與執行,Code 則負責程式碼與技術檢測。不同環節之間,再透過文件與記憶系統同步狀態,避免資訊斷裂、重複或衝突。

這樣的分工其實是一種 harness engineering:不是只把問題丟給 AI,而是設計一套能約束、引導、分工、交接與驗證 AI 的工作系統。

我曾以為這是我身為獨立工作者的護城河。

Ultracode 把這條護城河直接填平。那些曾經要靠人類嚴密規劃、手動隔離、小心切換視窗才撐得起來的高階協作技巧,現在直接變成軟體底層的一個普通按鈕。這代表一件事:「手動編排 AI」的技術紅利已經歸零。

執行力變免費之後,什麼才是稀缺的?

當工具接管最耗腦力的「分工與編排」,而且成本是開放式的(不設上限,跑到答案穩了才停),人的位置就被往後推了一格。

你不再需要思考「怎麼拆解、怎麼分派」,因為機器做得更快更好。這時真正考驗人的,是兩件無法自動化的事:

  • 算力的判斷:眼前這個問題的徹底程度,值不值得按下開關、放任這群代理耗掉一筆說不準的算力去算到收斂?
  • 成果的品味:當幾百個代理交出一份邏輯嚴密、架構龐大的成品,你憑什麼相信它?又該怎麼界定它的範圍和驗收標準?

驗收的本質就是品味。你得自己先深刻知道什麼叫「好」,才有辦法在機器吐出來的成千上萬行程式碼裡,一眼看出哪裡不對勁、哪些該留、哪些該砍。

我在〈人天已死〉裡談過,AI 壓低執行門檻後,產出由「投入多少時間」轉向「你怎麼定義問題、分配任務、把關品質」,人從作業員移向專案經理。Ultracode 是這條線再往前一步:連「分配任務」這個動作,工具都開始自己做。於是手上剩下的,更純粹是判斷。它沒有讓我少做判斷,是把判斷的位置,從「執行的細節」搬到「該不該動用,以及跑完怎麼信」。這兩個問題沒有自動化幫得上忙,因為它們本質上是價值取捨,不是運算。

結語:真正的護城河

看著 Ultracode 在螢幕上跑完那段收尾,我心裡浮現的不是「人會不會被取代」,而是這樣的問題:當機器開始接手編排、執行、除錯,甚至能直接完成大量程式碼移植時,人該握在手上的能力,到底是什麼?

答案恐怕不是更快的操作,也不是更熟練的執行,因為這些能力正在快速被自動化吸收。今天它能協助處理近百萬行程式碼,明天它能接手的範圍只會更大。那些過去以「執行優勢」為傲的個人與團隊,必須重新理解這個新的現實:純粹執行力的重要性,會被壓縮得越來越小。

但這未必是壞事。它逼我們重新區分:什麼只是忙碌,什麼才是有價值的能力。

我想,最後留下的是判斷力與品味。

判斷力,是知道什麼值得做、什麼不值得做;品味,是知道一件事做到什麼程度,才算真正做好。這兩件事不是工具升級就會自動長出來的,也不是按下一個開關就能立刻取得。它們來自真實的經驗、犯過的錯、看過的壞設計、做過的艱難取捨,以及長時間累積出來的分辨能力。

機器會跑得很快,也可以做得越來越多。但最後,仍然需要人來把關:這件事值得做,而且這樣做是對的。那種能力才是人類的護城河。