codex
34 篇文章
逆向工程 Codex:用 Prompt Injection 揭密 Context Compaction API 黑箱
開發者 Kangwook Lee 透過 2 個 API call 與 35 行 Python 程式碼,成功利用 prompt injection 破解了 Codex 隱藏的 context compaction API,一窺加密資料背後的系統提示詞!
Agent Harness 工程:OpenAI 如何用 Codex 達成零手寫百萬行程式碼
OpenAI 團隊在五個月內讓 Codex 寫出了百萬行程式碼,人類完全零手寫。這篇文章分享了他們如何透過建構 Agent Harness(鷹架與回饋迴圈),讓軟體工程師的工作從「寫程式」轉變為「設計環境」。
Karpathy 用 8 個 AI Agent 組了一個研究團隊 — 結果它們根本不會做研究
Karpathy 花了一個週末,用 4 個 Claude + 4 個 Codex agent 組成 AI 研究團隊,讓它們在 GPU 上跑 nanochat 實驗。結論:Agents 執行力一流,但實驗設計能力是零分。「你現在是在寫一個組織的程式碼」— 這句話可能定義了 2026 年的 agentic engineering (╯°□°)╯
一個人 = 一個開發團隊:用 OpenClaw 指揮 Codex/Claude Code 大軍的完整設定
Indie hacker Elvis Sun 公開了他用 OpenClaw agent(Zoe)當 orchestrator,自動 spawn Codex 和 Claude Code agents 的完整 workflow。一天平均 50 commits、30 分鐘 7 個 PR、三層 AI code review、Zoe 會主動掃 Sentry 修 bug。成本每月 190 美元。附完整 8 步驟設定教學。
寫 Code 變便宜了,然後呢?Simon Willison 的 Agentic Engineering 生存指南
Simon Willison 開了新系列 Agentic Engineering Patterns,教你怎麼跟 Claude Code、Codex 這類 coding agent 好好協作。第一課:寫 code 變便宜了,但寫『好的 code』還是很貴。第二課:紅燈綠燈 TDD 是跟 agent 協作的最強咒語。
OpenClaw 作者用 50 個 Codex 平行審 PR:不用向量資料庫,也能吃下 3,000+ 變更洪流
OpenClaw 作者 Peter Steinberger 分享他處理大量 PR 的新流程:一次平行啟動 50 個 Codex,先把每個 PR 轉成 JSON 風險與意圖訊號,再集中到單一 session 做去重、關閉、合併決策。他強調在這種規模下,不一定需要向量資料庫;把高品質結構化報告餵進模型上下文,反而更快落地。
33,000 筆 Agent PR 數據的殘酷真相:Codex 贏麻了、Copilot 慘兮兮,你的 Monorepo 可能撐不住
Drexel 和 Missouri 大學的研究團隊分析了 GitHub 上 33,596 筆由五大 coding agent 提交的 PR。結果?整體 merge rate 71%,但差距驚人:Codex 83%、Claude Code 59%、Copilot 只有 43%。更恐怖的是失敗模式:Agent PR 被拒的第一名原因不是 code 寫得爛,而是「根本沒人理」。LeadDev 同步報導指出,這場 Agent PR 大洪水正在壓垮企業的 Monorepo 和 CI 基礎設施。
GitHub Agent HQ:讓 Claude、Codex、Copilot 在同一個 PR 裡打群架 — 多 Agent 協作時代正式開打
GitHub 正式推出 Agent HQ 的多 Agent 支援:Copilot Pro+ 和 Enterprise 用戶現在可以直接在 GitHub 和 VS Code 裡同時跑 Claude、Codex 和 Copilot,讓不同 AI 用不同思路攻同一個問題。不用切工具、不用複製貼上 context,所有產出直接變成 Draft PR。對 Tech Lead 來說,這可能是 Code Review 流程的一次典範轉移。
OpenAI 的 Agent 三劍客:Skills + Shell + Compaction 實戰心法
OpenAI 官方釋出 long-running agent 的三大 primitive:Skills(可重用的 SKILL.md 指令包)、Shell(hosted container 執行環境)、Compaction(自動 context 壓縮)。附 10 條實戰 tips 跟 Glean 的 production 數據。
OpenAI × Cerebras:Codex-Spark 寫 code 快 15 倍 — 但代價是什麼?
OpenAI 今天發布 GPT-5.3-Codex-Spark,第一個跑在 Cerebras 晶圓級晶片上的模型。每秒 1000+ tokens、延遲降 80%、首 token 快 50%。但它是縮小版模型,不跑測試、只限 Pro 用戶。這不只是一個新模型,是 OpenAI 首次在生產環境用非 Nvidia 晶片——AI 算力的版圖正在重劃。
在 Claude Code 裡優雅調用 Codex
把 Codex 當 MCP server 接進 Claude Code,一條命令搞定,體驗直接升級。Codex CLI 的沙箱限制太多?讓 Claude Code 當你的主控台。
OpenAI 研究員每月花 $10,000 用 Codex 自動化研究 — 產生 700+ 假說
Karel(OpenAI 研究員)分享他如何用 Codex 花掉上億 tokens:讓 agent 自己寫筆記、爬 Slack、分析數據、產生 700+ 假說。他現在只跟一個 agent 對話,其他的都是 subagent 在背後跑。
OpenAI 內部大公開:我們如何轉型到 Agent-First 開發(來自共同創辦人的內部備忘錄)
OpenAI 共同創辦人 Greg Brockman 發文公開 OpenAI 內部如何轉型到 agentic software development。3 月底前目標:agent 成為所有技術任務的 first resort。內含六大建議,包含「Say no to slop」的程式碼品質觀點。
Claude Code vs Codex:選對工具再上場
Claude Code 是聖殿騎士,穩扎穩打;Codex 是玻璃大砲法師,輸出爆炸但容易翻車。選好任務,再選角色。