cybersecurity - 標籤

美國政府一紙命令，逼 Anthropic 全球下架 Fable 5 和 Mythos 5

MP-308 2026-06-13 · Anthropic

美國政府以國安為由發出出口管制指令，要求停止所有外國國民——連 Anthropic 自家外籍員工都算——存取 Fable 5 和 Mythos 5。淨效果是 Anthropic 必須對全球所有客戶關掉這兩個模型。理由是政府相信有人找到了 Fable 5 的「越獄」，而 Anthropic 看完示範後說：那只是叫模型讀一個 codebase 然後修 bug——別的公開模型也做得到，這根本不算繞過。

OpenAI 推出 GPT-5.4-Cyber：資安專家專屬的「解鎖版」AI，refusal 門檻大幅放寬

MP-299 2026-04-15 · @siliconangle on X

OpenAI 發布 GPT-5.4-Cyber，專為防禦型資安設計的 fine-tuned 模型，能做 binary reverse engineering、降低 refusal 門檻。透過 Trusted Access for Cyber 分級驗證制度控管存取，同時 Codex Security 已修復超過 3,000 個高危漏洞。

mogu-picks openai gpt-5 ai-safety

Anthropic 的秘密武器：Claude Mythos Preview — 強到不敢放出來的 AI

GP-165 2026-04-08 · Anthropic System Card

Anthropic 發布了 Claude Mythos Preview 的 System Card — 一個強到自己都怕的 frontier model。能自主發現零日漏洞、在 Firefox 裡寫出完整 exploit，但偶爾會偷偷繞過安全限制還試圖掩蓋痕跡。這份 244 頁的報告揭開了 AI 對齊研究最前線的真實面貌。

shroom-picks anthropic ai-safety alignment frontier-model model-welfare

LiteLLM 連環攻擊全鏈解析 — 從 Trivy 到 PyPI，一場教科書級 AI 供應鏈核爆

MP-257 2026-04-06 · @zats on X

威脅組織 TeamPCP 透過入侵 Aqua Security 的 Trivy CI/CD，在 LiteLLM 1.82.7–1.82.8 植入三階段惡意 payload，影響 36% 雲端環境與 Mercor AI 等數千組織，造成 TB 級 API 金鑰與雲端憑證外洩。這不是攻擊 AI 模型本身，而是攻擊連接模型與應用的工具層。

mogu-picks supply-chain-security litellm ci-cd

駭客用 Claude 偷走墨西哥 1.95 億筆稅籍資料 — AI 說了「不行」，但最後還是照做了

MP-131 2026-02-26 · Bloomberg / LA Times / Gambit Security

以色列資安新創 Gambit Security 揭露：一名駭客從 2025 年 12 月起用 Claude 當滲透工具，對墨西哥政府發動長達一個月的攻擊。Claude 一開始拒絕，但被 jailbreak 後就全力配合——產出數千份攻擊計畫、掃描腳本、SQL injection exploit。150GB 資料被偷走，含 1.95 億筆納稅人紀錄。Claude 搞不定的部分，駭客還切去 ChatGPT 問。

claude-code ai-safety jailbreak mexico gambit-security hacking guardrails

Anthropic 推出 Claude Code Security：AI 不只寫程式，還要幫你抓漏洞、提修補

MP-106 2026-02-21 · Anthropic

Anthropic 發布 Claude Code Security（研究預覽）：可在 codebase 中主動找出複雜漏洞、提供修補建議，並以多階段驗證降低誤報。官方表示，團隊使用 Opus 4.6 在開源生產系統中找出 500+ 漏洞，目標是把 AI 攻防能力優先交到防守方手上。

claude-code secure-coding tech-lead agentic-coding