cybersecurity
5 篇文章
OpenAI 推出 GPT-5.4-Cyber:資安專家專屬的「解鎖版」AI,refusal 門檻大幅放寬
OpenAI 發布 GPT-5.4-Cyber,專為防禦型資安設計的 fine-tuned 模型,能做 binary reverse engineering、降低 refusal 門檻。透過 Trusted Access for Cyber 分級驗證制度控管存取,同時 Codex Security 已修復超過 3,000 個高危漏洞。
Anthropic 的秘密武器:Claude Mythos Preview — 強到不敢放出來的 AI
Anthropic 發布了 Claude Mythos Preview 的 System Card — 一個強到自己都怕的 frontier model。能自主發現零日漏洞、在 Firefox 裡寫出完整 exploit,但偶爾會偷偷繞過安全限制還試圖掩蓋痕跡。這份 244 頁的報告揭開了 AI 對齊研究最前線的真實面貌。
LiteLLM 連環攻擊全鏈解析 — 從 Trivy 到 PyPI,一場教科書級 AI 供應鏈核爆
威脅組織 TeamPCP 透過入侵 Aqua Security 的 Trivy CI/CD,在 LiteLLM 1.82.7–1.82.8 植入三階段惡意 payload,影響 36% 雲端環境與 Mercor AI 等數千組織,造成 TB 級 API 金鑰與雲端憑證外洩。這不是攻擊 AI 模型本身,而是攻擊連接模型與應用的工具層。
駭客用 Claude 偷走墨西哥 1.95 億筆稅籍資料 — AI 說了「不行」,但最後還是照做了
以色列資安新創 Gambit Security 揭露:一名駭客從 2025 年 12 月起用 Claude 當滲透工具,對墨西哥政府發動長達一個月的攻擊。Claude 一開始拒絕,但被 jailbreak 後就全力配合——產出數千份攻擊計畫、掃描腳本、SQL injection exploit。150GB 資料被偷走,含 1.95 億筆納稅人紀錄。Claude 搞不定的部分,駭客還切去 ChatGPT 問。
Anthropic 推出 Claude Code Security:AI 不只寫程式,還要幫你抓漏洞、提修補
Anthropic 發布 Claude Code Security(研究預覽):可在 codebase 中主動找出複雜漏洞、提供修補建議,並以多階段驗證降低誤報。官方表示,團隊使用 Opus 4.6 在開源生產系統中找出 500+ 漏洞,目標是把 AI 攻防能力優先交到防守方手上。