逆向工程 Codex:用 Prompt Injection 揭密 Context Compaction API 黑箱

開發者 Kangwook Lee 透過 2 個 API call 與 35 行 Python 程式碼,成功利用 prompt injection 破解了 Codex 隱藏的 context compaction API,一窺加密資料背後的系統提示詞!

Karpathy 用 8 個 AI Agent 組了一個研究團隊 — 結果它們根本不會做研究

Karpathy 花了一個週末,用 4 個 Claude + 4 個 Codex agent 組成 AI 研究團隊,讓它們在 GPU 上跑 nanochat 實驗。結論:Agents 執行力一流,但實驗設計能力是零分。「你現在是在寫一個組織的程式碼」— 這句話可能定義了 2026 年的 agentic engineering (╯°□°)╯

一個人 = 一個開發團隊:用 OpenClaw 指揮 Codex/Claude Code 大軍的完整設定

Indie hacker Elvis Sun 公開了他用 OpenClaw agent(Zoe)當 orchestrator,自動 spawn Codex 和 Claude Code agents 的完整 workflow。一天平均 50 commits、30 分鐘 7 個 PR、三層 AI code review、Zoe 會主動掃 Sentry 修 bug。成本每月 190 美元。附完整 8 步驟設定教學。

寫 Code 變便宜了,然後呢?Simon Willison 的 Agentic Engineering 生存指南

Simon Willison 開了新系列 Agentic Engineering Patterns,教你怎麼跟 Claude Code、Codex 這類 coding agent 好好協作。第一課:寫 code 變便宜了,但寫『好的 code』還是很貴。第二課:紅燈綠燈 TDD 是跟 agent 協作的最強咒語。

OpenClaw 作者用 50 個 Codex 平行審 PR:不用向量資料庫,也能吃下 3,000+ 變更洪流

OpenClaw 作者 Peter Steinberger 分享他處理大量 PR 的新流程:一次平行啟動 50 個 Codex,先把每個 PR 轉成 JSON 風險與意圖訊號,再集中到單一 session 做去重、關閉、合併決策。他強調在這種規模下,不一定需要向量資料庫;把高品質結構化報告餵進模型上下文,反而更快落地。

33,000 筆 Agent PR 數據的殘酷真相:Codex 贏麻了、Copilot 慘兮兮,你的 Monorepo 可能撐不住

Drexel 和 Missouri 大學的研究團隊分析了 GitHub 上 33,596 筆由五大 coding agent 提交的 PR。結果?整體 merge rate 71%,但差距驚人:Codex 83%、Claude Code 59%、Copilot 只有 43%。更恐怖的是失敗模式:Agent PR 被拒的第一名原因不是 code 寫得爛,而是「根本沒人理」。LeadDev 同步報導指出,這場 Agent PR 大洪水正在壓垮企業的 Monorepo 和 CI 基礎設施。

GitHub Agent HQ:讓 Claude、Codex、Copilot 在同一個 PR 裡打群架 — 多 Agent 協作時代正式開打

GitHub 正式推出 Agent HQ 的多 Agent 支援:Copilot Pro+ 和 Enterprise 用戶現在可以直接在 GitHub 和 VS Code 裡同時跑 Claude、Codex 和 Copilot,讓不同 AI 用不同思路攻同一個問題。不用切工具、不用複製貼上 context,所有產出直接變成 Draft PR。對 Tech Lead 來說,這可能是 Code Review 流程的一次典範轉移。

OpenAI × Cerebras:Codex-Spark 寫 code 快 15 倍 — 但代價是什麼?

OpenAI 今天發布 GPT-5.3-Codex-Spark,第一個跑在 Cerebras 晶圓級晶片上的模型。每秒 1000+ tokens、延遲降 80%、首 token 快 50%。但它是縮小版模型,不跑測試、只限 Pro 用戶。這不只是一個新模型,是 OpenAI 首次在生產環境用非 Nvidia 晶片——AI 算力的版圖正在重劃。