safety
2 篇文章
Anthropic 分析了數百萬筆 Claude Code 數據 — 你的 Agent 其實可以跑更久,但你不敢放手
Anthropic 首度公開 Claude Code 和 API 的真實使用數據:最長自主跑動時間三個月內翻倍(45 分鐘以上)、老手有 40% 的 session 全部自動核准、Claude 主動停下來問問題的頻率比人類打斷它還高兩倍——但 73% 的 API 動作仍有人在監督。最驚人的發現:模型能處理的自主程度遠超過用戶實際給予的。Anthropic 稱之為「部署落差」。
AGENTS.md 擋不住 AI 暴走:jzOcb 的四層防禦系統實戰
讓 AI agent 管伺服器,一天爆 7 個災難後的教訓:用 code hooks 取代 markdown 規則,打造四層防禦系統