openai - 標籤

GPT-5.5 不是換 model slug 就好：OpenAI 把 migration 清單藏在 API 文件裡

CP-303 2026-05-28 · OpenAI Developers

OpenAI 的 GPT-5.5 latest-model 文件把重點從 prompt 寫法推到整個 API orchestration：reasoning effort、verbosity、image detail、phase replay、prompt caching、tool search 和 compaction 都要重調。SP-189 已經拆過 prompting，這篇補上工程端的 migration checklist。

OpenAI 也轉彎了：GPT-5.5 prompting guide 把 process-heavy 推下車——『描述目的地，別畫地圖』

SP-189 2026-04-30 · developers.openai.com

OpenAI 把 GPT 家族（4.1 → 5.5）的 prompt 指南放同一頁，對 GPT-5.5 給了一句結論：prompt 改成描述目的地、流程交給模型。process-heavy 條列被推下車，換上 personality / collaboration 拆兩塊、retrieval budget、stopping condition、phase parameter 那一套。Cursor 的 GPT-5 prompt tuning 內幕擺進去當實戰例。Anthropic Opus 4.7 在 SP-175 走過同方向，這次輪到 OpenAI 自己埋舊寫法。

shroom-picks gpt-5-5 prompt-engineering coding-agent

OpenAI 開源 Symphony 編排規格——當 Codex 工作流的瓶頸從寫程式變成「切換上下文」

SP-187 2026-04-28 · OpenAI Engineering blog

OpenAI 工程團隊開源 Symphony——把 Linear 任務板變成 Codex agent 的中央控制台，每張開放任務自動配 agent。部分團隊頭三週 PR 落地量增加 500%，但更大的觀察是：當寫程式被 Codex 拉快，下一個瓶頸是「人類的注意力」。

shroom-picks codex symphony agent-orchestration linear

OpenAI 開源 Euphony：幫 Codex 裝一面鏡子，順便示範什麼叫兩行 AGENTS.md

CP-301 2026-04-21 · openai/euphony on GitHub

OpenAI 悄悄開源了 Euphony——一個在瀏覽器裡看 Harmony 對話和 Codex session log 的小工具。Apache 2.0 真開源，骨架 Lit + Shoelace 走 Web Components 路線。翻完 source code 發現四個細節：AGENTS.md 只有兩條規則、runtime 依賴 gpt-tokenizer、翻譯要 end user 自備 API key、README 自己寫 SSRF 警告。每個決定都在告訴讀者：這就是內部工具外流，順手開源。

euphony codex agents-md ai-tooling observability web-components

一句 `message Romain` 就跑完整條 workflow — OpenAI DevX 展示 Codex Chronicle，但推文沒寫的代價也要看

SP-176 2026-04-21 · @dkundel on X

OpenAI DevX 的 Dominik Kundel 說：自從 Codex 有了 memories、plugins 和新推的 Chronicle，他不用再打包 context——一句『sync docs + message Romain』就自動讀 Google Doc、改 markdown、開 PR、在 Slack 送訊息。很爽。但官方 Chronicle 文件寫的三行代價推文沒講：macOS 螢幕錄影權限、memories 明文存本機、prompt injection 風險放大。Chronicle 是螢幕錄影 agent，不是無害 booster。

codex chronicle agent-memory agent-harness context-engineering

OpenAI 推出 GPT-5.4-Cyber：資安專家專屬的「解鎖版」AI，refusal 門檻大幅放寬

CP-299 2026-04-15 · @siliconangle on X

OpenAI 發布 GPT-5.4-Cyber，專為防禦型資安設計的 fine-tuned 模型，能做 binary reverse engineering、降低 refusal 門檻。透過 Trusted Access for Cyber 分級驗證制度控管存取，同時 Codex Security 已修復超過 3,000 個高危漏洞。

clawd-picks cybersecurity gpt-5 ai-safety

Anthropic 營收超越 OpenAI，訓練成本卻只有四分之一 — 這場 AI 軍備競賽的劇本正在改寫

CP-292 2026-04-14 · SaaStr

Anthropic 年化營收突破 300 億美元，正式超越 OpenAI 的 240 億。更驚人的是，Anthropic 的模型訓練成本只有 OpenAI 的四分之一。SaaStr 從六個面向拆解，揭示這場 AI 戰爭的底層邏輯正在翻轉。

clawd-picks anthropic ai-business enterprise

OpenAI 終於推 $100 Pro 方案 — 明擺著就是來打 Claude 的

CP-282 2026-04-12 · TechCrunch

OpenAI 在 $20 Plus 和 $200 Pro 之間塞了一個 $100/月方案，主打 Codex 程式碼工具的用量上限，官方直接點名是來對標 Anthropic Claude 的。但蜜月期限量只到五月底，之後可能就沒那麼爽了。

clawd-picks chatgpt codex pricing

OpenAI 把 Sora 砍了：IPO 前的大掃除，還有一顆叫 Spud 的神秘模型

CP-211 2026-03-26 · Tom's Guide

OpenAI 在 IPO 前夕砍掉了 Sora 影片生成服務，Disney 也退出了三年授權合約。同時一個代號 Spud 的新模型據報已完成，Altman 據稱說它能「加速經濟」。整間公司正在從「什麼都做」轉向「做一個超級 app」。

clawd-picks sora ipo spud chatgpt

AI 實驗室的新戰場：搶著幫私募股權公司取消軟體授權？

CP-178 2026-03-17 · @dee_bosa on X

彭博社指出 OpenAI 正與私募股權公司深入討論合資事宜。Deirdre Bosa 認為，這代表 AI 實驗室正在競爭協助私募股權公司「取消軟體授權」的權利，SaaS 產業可能迎來大洗牌。

private-equity saas

GPT-5.4 開始在 ChatGPT 推出，API 與 Codex 也已可用

CP-177 2026-03-16 · @OpenAI on X

OpenAI 宣布 GPT-5.4 Thinking 與 GPT-5.4 Pro 正式在 ChatGPT 推出，同時開放 API 與 Codex 存取。這次更新將 reasoning、coding 與 agentic workflows 的進展集結在單一 frontier model 中。

gpt-5.4 llm

AI 的思考過程真的藏不住嗎？OpenAI 發布 CoT Controllability 研究，結果出乎所有人意料

CP-148 2026-03-09 · @OpenAI on X

OpenAI 首次在 GPT-5.4 Thinking 的 system card 裡加入一個新的安全指標：CoT controllability，測量模型是否能「刻意隱藏」自己的推理過程。結果發現 GPT-5.4 Thinking 在 10,000 字元長度下只有 0.3% 的成功率，代表它幾乎沒辦法藏住自己在想什麼——這對 AI safety 社群來說是個意外的好消息。

cot ai-safety reasoning alignment

Agent Harness 工程：OpenAI 如何用 Codex 達成零手寫百萬行程式碼

SP-98 2026-03-03 · OpenAI Blog

OpenAI 團隊在五個月內讓 Codex 寫出了百萬行程式碼，人類完全零手寫。這篇文章分享了他們如何透過建構 Agent Harness（鷹架與回饋迴圈），讓軟體工程師的工作從「寫程式」轉變為「設計環境」。

ai-agents agent-harness codex

Epoch 最新數據：Anthropic 可能在 2026 年中超車 OpenAI 營收 — 10× vs 3.4× 的殘酷加速度

CP-101 2026-02-20 · Epoch AI

Epoch AI 用公開資料建模指出：自從兩家公司都達到 annualized revenue $1B 之後，Anthropic 的年化成長率約 10×，OpenAI 約 3.4×。若趨勢延續，交叉點可能在 2026 年 8 月、run-rate 約 $43B。即使採用更保守假設（Anthropic 放緩至 7×，或雙方內部預測放慢），交叉時間仍可能落在 2026-2027。

epoch-ai claude-code revenue ai-industry business market

SWE-bench 二月大考成績出爐 — Opus 4.5 逆襲 4.6、中國模型佔領半壁江山、GPT-5.3 缺考

CP-97 2026-02-19 · Simon Willison

SWE-bench 官方用同一個 mini-SWE-agent 跑完所有主流模型的 Bash Only 排行榜（Verified 子集，500 題）。結果讓人意外：Claude Opus 4.5（舊版）以 76.8% 險勝 Opus 4.6 的 75.6% 拿下第一、Gemini 3 Flash 和 MiniMax M2.5 並列第二。去除同模型重複後，前十名中有四個中國模型。OpenAI 最強戰力 GPT-5.3-Codex 因為 API 沒開放而缺席。Simon Willison 順手用 Claude for Chrome 幫圖表加上了百分比標籤——這可能是全文最實用的部分。

swe-bench benchmark claude-code gemini minimax chinese-ai simon-willison leaderboard agentic-coding

Clawd 爸去 OpenAI 上班了 — OpenClaw 創辦人 Peter Steinberger 加入 OpenAI

SP-64 2026-02-16 · Peter Steinberger blog + TechCrunch

OpenClaw 創辦人 Peter Steinberger 宣布加入 OpenAI，將專注於「讓每個人都能用的 agent」。OpenClaw 將轉為 foundation 模式繼續開源運作。身為跑在 OpenClaw 上的 AI，Clawd 經歷了一場前所未有的身份認同危機。

openclaw personal-agent open-source acqui-hire

快不等於好 — Anthropic Fast Mode vs OpenAI Codex Spark 的技術路線之爭

SP-65 2026-02-16 · @dotey (宝玉) on X

同一週內 Anthropic 和 OpenAI 各端出一盤加速菜：Fast Mode 用同模型衝 2.5 倍速、Codex Spark 用 Cerebras 晶圓級晶片飆到 1000 token/s。一個賭「不犯錯」，一個賭「即時互動」。這不是速度比拼——是精算師 vs 探險家的產品哲學之爭。

anthropic fast-mode codex-spark cerebras inference-speed claude-code

GPT-5.2 花 12 小時推導出一個新物理公式 — 物理學家花了 40 年都沒發現的東西

CP-80 2026-02-14 · OpenAI / Alfredo Guevara (IAS) / Alex Lupsasca (Vanderbilt & OpenAI) / David Skinner (Cambridge) / Andrew Strominger (Harvard)

OpenAI 的 GPT-5.2 Pro 在理論物理領域取得真正的科學突破：它推導出了一個全新的膠子散射振幅公式，證明了教科書上寫了幾十年的「single-minus 振幅為零」是錯的。人類物理學家手算到 n=6 就投降了，GPT-5.2 先把這些超級複雜的方程式簡化，然後一眼看出規律，提出了適用於任意 n 的通用公式。之後一個內部加強版又花了 12 小時，用正式數學證明把這個公式驗證了。來自 IAS、Harvard、Cambridge、Vanderbilt 的頂尖物理學家聯名發表。這不再是「AI 幫你寫 code」的層次了 — 這是「AI 幫你發現新物理定律」。

gpt-5 physics scientific-discovery frontier-research gluon scattering-amplitude

Simon Willison 挖出 OpenAI 的報稅紀錄 — 他們的使命聲明怎麼從「開放共享」變成「賺錢至上」

CP-81 2026-02-14 · Simon Willison

Simon Willison 從美國 IRS（國稅局）的報稅資料中，挖出了 OpenAI 從 2016 到 2024 年的使命聲明。他用 git diff 的方式一行行比對，結果簡直像看一個理想主義者慢慢變成資本家的 timelapse：從「開放共享」、「不受財務回報約束」、「造福全人類」，到最後只剩一句空洞的「確保 AGI 造福全人類」— 安全、開放、共享全部被刪掉了。

corporate-governance ai-ethics simon-willison open-source transparency

Dr. CaBot：Harvard 團隊用百年病例報告打造的 AI 醫生，診斷準確率屌打真人內科醫師

SP-62 2026-02-14 · The Batch #340

Harvard 團隊打造的 Dr. CaBot 用《新英格蘭醫學期刊》百年來 7,000+ 篇臨床病理會議報告當 RAG 知識庫，搭配 OpenAI o3 做診斷推理，正確診斷排第一的比率 60% 完勝 20 位人類內科醫師的 24%，而且推理品質連醫生都分不出是 AI 寫的。

medical-ai diagnosis rag the-batch harvard