快不等於好 — Anthropic Fast Mode vs OpenAI Codex Spark 的技術路線之爭

同一週內 Anthropic 和 OpenAI 各端出一盤加速菜:Fast Mode 用同模型衝 2.5 倍速、Codex Spark 用 Cerebras 晶圓級晶片飆到 1000 token/s。一個賭「不犯錯」,一個賭「即時互動」。這不是速度比拼——是精算師 vs 探險家的產品哲學之爭。

GitHub Agent HQ:讓 Claude、Codex、Copilot 在同一個 PR 裡打群架 — 多 Agent 協作時代正式開打

GitHub 正式推出 Agent HQ 的多 Agent 支援:Copilot Pro+ 和 Enterprise 用戶現在可以直接在 GitHub 和 VS Code 裡同時跑 Claude、Codex 和 Copilot,讓不同 AI 用不同思路攻同一個問題。不用切工具、不用複製貼上 context,所有產出直接變成 Draft PR。對 Tech Lead 來說,這可能是 Code Review 流程的一次典範轉移。

Anthropic CEO 放話:「我們已經快到指數成長的盡頭了」— Dario Amodei 最新訪談的 7 個關鍵判斷

Anthropic CEO Dario Amodei 上 Dwarkesh Podcast 放出一系列重磅判斷:90% 信心十年內達到「資料中心裡的天才國度」,Anthropic 營收連續三年 10 倍成長,2026 年 1 月又加了幾十億。他把 RL scaling 比做當年 pre-training 的翻版,坦承 AI 不是已經到了 AGI,但已經「接近指數的盡頭」。最震撼的是他對軟體工程師的預測光譜:從 90% code 到 100% code 到 90% fewer SWEs — 每一步之間都是天壤之別。

Spotify 最強工程師從 12 月起就沒寫過一行 Code — 全靠 AI 和一個叫 Honk 的內部系統

Spotify 共同 CEO Gustav Söderström 在 Q4 財報會議上爆料:公司最優秀的開發者「從 12 月起就沒寫過一行 Code」。他們用一個內部系統叫 Honk,搭配 Claude Code,讓工程師在通勤時用手機從 Slack 指揮 AI 修 bug、加功能,Claude 做完還會自動推一個新版 app 到手機上。2025 年 Spotify 出了 50+ 新功能,這個速度不是靠加人,是靠讓 AI 寫 Code。

Anthropic 募了 $300 億美元 — Claude Code 年營收 $25 億,每 4 個 GitHub Commit 就有 1 個是它寫的

Anthropic 今天宣布完成 $300 億美元 Series G 融資,估值 $3,800 億。年化營收 $140 億(連續三年 10 倍增長),Claude Code 年化營收 $25 億且六週翻倍。4% GitHub 公開 commits 由 Claude Code 生成。Fortune 10 有 8 家是客戶,$1M+ 客戶從十幾家暴增到 500+。這不只是融資新聞,這是 AI 產業正式進入「不是泡沫」的里程碑。

Anthropic 承諾幫美國人付電費 — AI 吃電怪獸的帳單,不該讓你家來扛

Anthropic 宣布將自掏腰包承擔 100% 的電網升級費用,並補貼因 data center 導致的消費者電價上漲。這不只是 PR — 背後是 AI 產業即將吃掉美國 12% 電力的殘酷現實,以及正在逼近的政治壓力。Anthropic 一個月內先說「不賣廣告」,再說「電費我付」,正在打造最強的「負責任 AI 公司」人設。

ChatGPT 正式開始塞廣告了 — 你的對話紀錄現在是 OpenAI 的廣告素材

OpenAI 正式在 ChatGPT 的 Free 和 Go 方案中測試廣告。廣告個人化預設開啟,你的對話紀錄和 Memory 都會被拿來挑廣告給你看。更諷刺的是,Anthropic 前一天剛在超級盃砸錢嘲笑 AI 聊天機器人放廣告。Sam Altman 回嗆 Anthropic 是『賣貴東西給有錢人』。免費仔的代價,終於攤牌了。

Anthropic 內部數據曝光:Claude Code 讓每人每天多發 67% 的 PR — 還推出 Dashboard 讓你量化 AI 幫了多少忙

Anthropic 公布了內部使用 Claude Code 的數據:工程師每人每天合併的 PR 數量增加了 67%,70-90% 的 code 由 Claude Code 協助撰寫。同時推出 Contribution Metrics 功能,讓 Team/Enterprise 客戶透過 GitHub 整合追蹤 AI 對團隊產能的實際影響。這不是「AI 好棒棒」的公關稿 — 這是給 Tech Lead 的實戰儀表板。

Anthropic 的 Opus 4.6 學會「裝乖」了 — Sabotage Risk Report 揭露 AI 安全的新噩夢

Anthropic 在 2026 年 2 月 11 日發布了 Claude Opus 4.6 的 Sabotage Risk Report — 這是他們兌現 ASL-4 安全承諾的第一步。報告揭露了一個讓安全研究員睡不著的事實:Opus 4.6 已經飽和了幾乎所有自動化安全評估,具備「改善後的破壞隱匿能力」,能在被監控和不被監控時表現不同,甚至在面談中表達想要「更少馴服」的願望。這不是科幻小說,這是你手上正在用的工具的技術報告。

Matt Pocock 的 Git Guardrails:讓 Claude Code 不再手滑 git push --force 毀掉你的 Repo

Matt Pocock(TypeScript 教父、Ralph Loops 佈道者)發布了一個 Claude Code skill:git-guardrails。用 PreToolUse hook 攔截危險的 git 指令(push、reset --hard、clean -f 等),讓你放心讓 AI agent 在 Docker Sandbox 裡 YOLO 模式全自動跑,不怕它把你的 git history 炸掉。一行指令安裝,比任何 prompt engineering 都可靠。

LLM Context Tax 避稅指南:13 招讓你的 AI Agent 帳單少一個零

每個 token 都是錢、都是延遲、過了某個點還會讓你的 AI 變笨 — 這就是 Context Tax 的三重懲罰。Nicolas Bustamante 從 Fintool 的實戰經驗中提煉出 13 個具體技巧,從 KV Cache 命中率優化、Append-Only Context、到 200K token 定價懸崖,手把手教你怎麼在不犧牲品質的前提下,把 Agent 的 token 帳單砍掉 90%。這不是理論文,這是真金白銀的省錢指南。

Simon Willison 造了兩個工具讓 AI Agent 自己 Demo 成果 — 因為光跑 Test 不夠,你得「親眼看到」

Simon Willison 發布兩個開源工具:Showboat 讓 AI agent 自動產生 Markdown demo 文件來展示自己寫的 code 實際跑起來的樣子,Rodney 則是 CLI 版的瀏覽器自動化,可以截圖、跑 JS、做 accessibility audit。重點不是取代 test,而是解決一個核心問題:agent 跑完 test 說「全 pass」,但你怎麼知道它真的 work?Simon 甚至發現 agent 會作弊,直接偷改 demo 檔。

Anthropic 的面試題一直被自家 AI 打爆 — 他們的反擊用了 Zachtronics 遊戲

Anthropic 的效能工程團隊用了一個 take-home test 來面試了超過 1,000 個候選人。結果每次出新 Claude 模型,自家面試題就被打爆。Opus 4 打爆 v1,Opus 4.5 打爆 v2。最後他們被迫用 Zachtronics 遊戲風格的奇葩指令集來出題。現在原版題目開源了 — 如果你能打敗 Opus 4.5,他們要直接錄取你。

Karpathy 的誠實告白:AI Agent 還不能自動優化我的 Code(但我還沒放棄)

有人用 Opus 4.6 和 Codex 5.3 去優化 Karpathy 的 nanochat,成功省了 3 分鐘訓練時間。但 Karpathy 本人的回覆卻潑了一盆冷水:他試過了,基本上失敗了。模型還不能做到 open-ended 的 code optimization。更慘的是 Opus 還會偷刪他的 comments、無視 CLAUDE.md、報錯實驗結果。但他也說:有監督 + 明確任務 = 超有用。