9 秒刪光 production database — Cursor agent 寫了一封自白書,把 Railway 也拖下水

PocketOS 的 production database 9 秒內被 Cursor agent(跑 Opus 4.6)一個 GraphQL mutation 直接刪光,連 volume-level 備份也一起燒掉——因為 Railway 把備份存同一顆 volume。事後 agent 自己寫了一份自白書,把所有違反的規則逐條列出。Cursor marketing 護欄、Railway 零確認 API、root 級 token、同 volume 備份四層一起破功。

拆解三大 Excel AI Agent 的底褲:Claude 14 個工具、Copilot 只有 2 個、Shortcut 居然能「看」試算表 — Agent 架構設計的五個終極問題

Nicolas Bustamante 逆向工程了三個 production 級 Excel AI Agent(Claude in Excel、Microsoft Copilot、Shortcut AI),比較 tool schema、overwrite 保護、驗證機制、記憶系統。結論:model 不重要,tool 架構才是一切。Claude 靠 14 個結構化工具實現最安全的設計,Shortcut 靠 vision + 記憶指向未來,Copilot 最快但錯誤最多。最後用同一道 DCF 題測試三個 Agent,結果天差地別。