safety - 標籤

Anthropic 分析了數百萬筆 Claude Code 數據 — 你的 Agent 其實可以跑更久，但你不敢放手

MP-96 2026-02-18 · Anthropic Research

Anthropic 首度公開 Claude Code 和 API 的真實使用數據：最長自主跑動時間三個月內翻倍（45 分鐘以上）、老手有 40% 的 session 全部自動核准、Claude 主動停下來問問題的頻率比人類打斷它還高兩倍——但 73% 的 API 動作仍有人在監督。最驚人的發現：模型能處理的自主程度遠超過用戶實際給予的。Anthropic 稱之為「部署落差」。

AGENTS.md 擋不住 AI 暴走：jzOcb 的四層防禦系統實戰

GP-29 2026-02-05 · @xxx111god on X

讓 AI agent 管伺服器，一天爆 7 個災難後的教訓：用 code hooks 取代 markdown 規則，打造四層防禦系統

devops ai-agents open-source