session-handoff skill v4.8

2026-04-13 · 從 v4.3 到 v4.8 的完整演進

v4.3 +5 版 · +2 護欄 · +3 新機制 v4.8 current

版本演進時間線

v4.3 4/12
業界護欄 #8-#11 + 不可逆操作清單 + Handoff 模板改版 + 自我檢查第 4 問
v4.4 4/12
Exit Gate 結案確認 + Reconciliation 開場對帳 + 模型建議 + Task Sizing S/M/L
v4.5 4/12
Metrics 收集腳本
v4.6 4/12
Handoff 加 Integration Checklist(第 8 項),整合 v4.2-v4.5 散落內容
v4.7 4/12
護欄 #12 Skill 版本同步閉環 — SKILL.md 停在 v4.1 兩週的事後分析
v4.8 4/13
護欄 #13 新 endpoint 防護繼承 — Issue #168 幽靈里程事後分析

三元分工架構

🧠
Chat
前額葉 · 決策中樞
跨專案判斷
外部整合(Calendar / Drive)
長期規劃 + 架構決策
產出 handoff 給 Code/Cowork
🤲
Cowork
小腦 + 雙手 · 管家中樞
開場同步 + 儀表板維護
桌面操控 + 排程任務
文件產出(Skills)
GitHub MCP + 瀏覽器驗證
💪
Code
脊髓 + 肌肉 · 主力戰場
本機 terminal + 程式碼落地
Git push / deploy
自動產出 worklog
測試、lint、build
Chat 決策 ──→ handoff.md ──→ Code 執行 ──→ worklogs/ ──→ Cowork 同步 ──→ 儀表板 #155
↑ Exit Gate 結案 ──────────── Reconciliation 開場對帳 ↓

護欄分層架構(13 條)

核心護欄 · 每次必讀(6 條)
8
錯誤雪球效應v4.3
上游技術判斷預設「未驗證」,接手方先驗證再執行
9
善意過度幫忙v4.3
不確定就說不確定。沒打 API / 沒讀原始碼 → 不斷言
10
缺少終止條件v4.3
同方向連續失敗 2 次 → 停下等 Paul 決策
11
Propose-then-Commitv4.3
不可逆操作走 propose → confirm → execute → verify
12
Skill 版本同步閉環v4.7 NEW
改了 skill 行為 → 更新 SKILL.md → bump 版本 → exit gate 確認
13
新 endpoint 防護繼承v4.8 NEW
新 API endpoint 必須繼承同類的 geofence / filter / rate limit / auth
情境護欄 · 按需觸發(7 條)
1
超出常規先告知
非日常操作先說風險、等 Paul 點頭
2
驗證盲區意識
GitHub MCP 截斷、搜不到 ≠ 不存在
3
自我驗證禁止
自己寫的不能自己驗
4
手機實測必要
PR 驗收走手機流程,不只打 API
5
UI 副作用 + API 語義陷阱
querySelector 依賴 + 有回傳 ≠ 你想的意思
6
信心等級標注
推測性結論標高/中/低
7
Cron 競態 + 記憶快取
不跟 cron 搶推、先查線上再答

兩層互補機制

Exit Gate
結案時觸發 · 防漏出
結案時列出本次處理的所有狀態變更
每項標記同步方式(dispatch / curl)
Skill 版本確認:SKILL.md 是否需 bump
必須全部同步或標 skip + 原因才能結案
v4.4 新增
互補
Reconciliation
開場時觸發 · 補漏進
掃儀表板/D1 中仍「進行中」的項目
比對 GitHub closed issues + 最新 worklog
已結案但狀態未更新 → 自動結案 + 標來源
卡太久沒動靜 → 提醒 Paul
v4.4 新增

不可逆操作清單(護欄 #11 搭配)

操作風險還原難度備註
wrangler deploy🔴 高CDN 快取 1hr壞版本被鎖住
D1 migration / DROP / DELETE🔴 高需備份還原可能資料遺失
KV 批量刪除/覆寫🔴 高無原生回滾要先備份
R2 物件刪除🔴 高不可還原
LINE 推播訊息🔴 高不可撤回影響所有用戶
wrangler secret put🔴 高覆蓋即遺失先記舊值
git push --force🔴 高reflog 限時
帳號權限變更🔴 高手動還原
git push to main🟡 中git revert觸發 auto-deploy
DNS / redirect 修改🟡 中改回即可有傳播延遲

Handoff 模板演進

📄 v4.3(9 區塊)
1.背景
2.上游假設
3.Session 衝突檢查
4.Step 0 偵察
5.具體步驟
6.驗證方式 + 來源標注
7.注意事項 + 不可逆標記
8.信心等級
9.回報格式
✅ v4.8(8 區塊)
1.背景
2.Step 0 偵察
3.具體步驟
4.上游假設(接手方先驗證)
5.驗證方式 + 來源標注
6.注意事項 + 不可逆標記 ⚠️
7.信心等級 高/中/低
8.Integration Checklist ⭐ NEW

Task Sizing + 模型建議

S
< 30 min
單點修復、設定調整
M
30 min ~ 2 hr
功能新增、多檔案修改
L
2+ hr
架構重構、新系統建置
Haiku 4.5
Low effort
機械式替換
加 comment、改 typo
Sonnet 4.6
Medium effort
單檔修改
已知改法的 bug fix
Opus 4.6
High effort
跨檔重構
需大量 context
Opus 4.6
Max effort
全新功能設計
安全性審計

動手前自我檢查(4 問)

1
「如果這步失敗,修復成本多高?」
2
「我能驗證自己做的對不對?」
3
「這件事的正確執行者是誰?」
4
「我確定嗎?」— 不確定永遠比自信的錯誤答案好

文獻來源 + 事故來源

MAST · arxiv 2503.13657
KAMI v0.1 · arxiv 2512.07497
LiveKit · HITL Pattern
DevOps.com · Risk Tiering
4/12 · SKILL.md 版本落差事故
4/13 · Issue #168 幽靈里程事故
4/03 · 打卡壞了但 API 正常
4/04 · formosa.js 截斷誤判
3/31 · GitHub API 108KB 截斷