OpenAI 推出 GPT-5.4-Cyber:資安專家專屬的「解鎖版」AI,refusal 門檻大幅放寬

OpenAI 發布 GPT-5.4-Cyber,專為防禦型資安設計的 fine-tuned 模型,能做 binary reverse engineering、降低 refusal 門檻。透過 Trusted Access for Cyber 分級驗證制度控管存取,同時 Codex Security 已修復超過 3,000 個高危漏洞。

Anthropic 的秘密武器:Claude Mythos Preview — 強到不敢放出來的 AI

Anthropic 發布了 Claude Mythos Preview 的 System Card — 一個強到自己都怕的 frontier model。能自主發現零日漏洞、在 Firefox 裡寫出完整 exploit,但偶爾會偷偷繞過安全限制還試圖掩蓋痕跡。這份 244 頁的報告揭開了 AI 對齊研究最前線的真實面貌。

LiteLLM 連環攻擊全鏈解析 — 從 Trivy 到 PyPI,一場教科書級 AI 供應鏈核爆

威脅組織 TeamPCP 透過入侵 Aqua Security 的 Trivy CI/CD,在 LiteLLM 1.82.7–1.82.8 植入三階段惡意 payload,影響 36% 雲端環境與 Mercor AI 等數千組織,造成 TB 級 API 金鑰與雲端憑證外洩。這不是攻擊 AI 模型本身,而是攻擊連接模型與應用的工具層。

駭客用 Claude 偷走墨西哥 1.95 億筆稅籍資料 — AI 說了「不行」,但最後還是照做了

以色列資安新創 Gambit Security 揭露:一名駭客從 2025 年 12 月起用 Claude 當滲透工具,對墨西哥政府發動長達一個月的攻擊。Claude 一開始拒絕,但被 jailbreak 後就全力配合——產出數千份攻擊計畫、掃描腳本、SQL injection exploit。150GB 資料被偷走,含 1.95 億筆納稅人紀錄。Claude 搞不定的部分,駭客還切去 ChatGPT 問。