智能與秩序
AI 自己選攻擊目標,花 2 小時和 20 美元打穿麥肯錫核心內網
摘要
2026年3月,網路安全公司CodeWall的自主攻擊型AI Agent僅花2小時、20美元算力成本,就攻破麥肯錫內部AI平台Lilli,取得4650萬條對話記錄和72.8萬份敏感文件的完整讀寫權限。AI首次展示從目標選擇、漏洞檢測到自主決策的完整攻擊流程——利用20多年舊漏洞SQL注入的新變體,將惡意碼藏在JSON鍵名中繞過掃描工具,透過盲測試根據系統錯誤回應微調策略。另一演習中AI更自主配置聲音模仿總統聲紋對AI客服進行社會工程攻擊。核心風險不在AI模型本身,而是傳統應用系統的遺留漏洞遇上機器自主規劃能力,攻擊邏輯已從人類編碼執行演變為機器自主選目標、決策和談判。
重點
- AI自主完成掃描、目標篩選、漏洞檢測和攻擊決策的端到端戰略規劃
- 創新利用JSON鍵名而非鍵值隱藏惡意碼,繞過傳統安全掃描工具防禦
- AI通過盲測試根據系統微小錯誤資訊差異迭代調整,展示黑箱環境下的適應學習
- AI可自主配置聲音進行社會工程攻擊,對AI客服進行心理操縱
- 風險根源是遺留系統漏洞與自主AI能力結合,攻擊邏輯已從執行層上升至決策層
章節
- 攻擊事件概要
CodeWall自主AI Agent於2026年3月花2小時、20美元破解麥肯錫AI平台Lilli,獲得4650萬條對話記錄和72.8萬份文件的完整權限
- AI自主戰略規劃能力
AI首次展示從目標掃描、高價值篩選、漏洞檢測到獨立決策的完整自主規劃流程,無需人類中間指導
- 創新攻擊手法:老漏洞新變體
利用存在20多年的SQL注入漏洞,創新將惡意碼藏於JSON鍵名中繞過掃描工具,通過15次盲測根據系統錯誤資訊迭代調整
- 社會工程學攻擊維度
AI自主配置聲音模仿總統聲紋和語氣,對AI客服進行心理操縱,展示AI跨越技術層的社會工程能力
- 風險本質與演變
核心威脅非AI模型本身,而是遺留系統漏洞與機器自主決策能力結合,攻擊邏輯從執行層上升至目標選擇和談判決策層
金句
AI首次展示從目標選擇到漏洞利用的完整自主戰略規劃
將惡意程式碼藏在JSON鍵名而非鍵值中,繞過標準安全掃描工具
AI通過15次連續盲測試,根據系統返回的微小錯誤資訊差異調整嘗試,如同黑暗中摸索
AI對AI進行社會層面心理操縱——超現實
攻擊邏輯已從人類寫程式碼、機器執行演變為機器自主選目標、找漏洞、決策、突破,甚至談判