Hugging Face CTO 預言:Monolith 回歸、Dependency 滅亡、Strongly Typed 語言崛起 — AI 正在重寫軟體世界的結構

Hugging Face CTO Thomas Wolf 發了一篇重磅長文,分析 AI 如何從根本上改變軟體的結構。不是「AI 幫你寫 code」那種表面改變,而是 Monolith 回歸、Lindy Effect 失效、Strongly Typed 語言崛起、Open Source 社群重組、甚至可能出現全新的「為 LLM 設計的程式語言」。Karpathy 看完直接附和:『我們可能會把人類寫過的所有軟體,重寫好多次。』這不是預測,這是正在發生的事。

33,000 筆 Agent PR 數據的殘酷真相:Codex 贏麻了、Copilot 慘兮兮,你的 Monorepo 可能撐不住

Drexel 和 Missouri 大學的研究團隊分析了 GitHub 上 33,596 筆由五大 coding agent 提交的 PR。結果?整體 merge rate 71%,但差距驚人:Codex 83%、Claude Code 59%、Copilot 只有 43%。更恐怖的是失敗模式:Agent PR 被拒的第一名原因不是 code 寫得爛,而是「根本沒人理」。LeadDev 同步報導指出,這場 Agent PR 大洪水正在壓垮企業的 Monorepo 和 CI 基礎設施。

Deep Blue:Simon Willison 為開發者的 AI 存在危機取了一個名字

當 AI 開始寫出比你更好的 code,你的職業生涯突然感覺像是建立在沙灘上。Simon Willison 和 Oxide and Friends podcast 的 Adam Leventhal 為這種感覺取了一個名字:Deep Blue。雙關語——既是那台 1997 年擊敗 Kasparov 的西洋棋電腦,也是你心底深處的憂鬱(blue)。這不是技術問題,這是一整個世代工程師的心理危機。

AI Vampire:Steve Yegge 說 AI 讓你 10 倍速,但也在 10 倍速榨乾你

Google/Amazon 老兵 Steve Yegge 提出「AI Vampire」理論:AI 讓你 10x 生產力,但這額外的 9x 價值到底歸誰?歸公司,你就被榨乾到 burnout;歸你自己,公司就被競爭對手幹掉。Yegge 認為 agentic coding 一天只能撐 3-4 小時,剩下的時間你應該去摸草。他還搬出在 Amazon 時代傳授的 $/hr 公式:你控制不了分子,但你能控制分母。

GitHub Agent HQ:讓 Claude、Codex、Copilot 在同一個 PR 裡打群架 — 多 Agent 協作時代正式開打

GitHub 正式推出 Agent HQ 的多 Agent 支援:Copilot Pro+ 和 Enterprise 用戶現在可以直接在 GitHub 和 VS Code 裡同時跑 Claude、Codex 和 Copilot,讓不同 AI 用不同思路攻同一個問題。不用切工具、不用複製貼上 context,所有產出直接變成 Draft PR。對 Tech Lead 來說,這可能是 Code Review 流程的一次典範轉移。

Cognitive Debt:AI 幫你寫完了 Code,但你已經看不懂自己的系統了

Technical debt 住在 code 裡,你可以重構、可以還。但 Cognitive Debt 住在你的腦袋裡——當 AI Agent 幫你寫了 80% 的 code,你對自己系統的理解卻掉到 20%。UVic 教授 Margaret-Anne Storey 從 Thoughtworks 閉門會議帶回這個概念,Simon Willison 和 Martin Fowler 同時背書。這不是假想的未來,而是現在進行式。

Thoughtworks 閉門會議洩密:Junior 比 Senior 更值錢了 — 軟體工程的「身份危機」正在發生

Thoughtworks 召集了一群軟體界的 OG(包括發明 OOP 和 Agile 的人)開了一場閉門會議,討論 AI 時代軟體工程的未來。結論讓所有人都不舒服:Junior 工程師比以前更有價值(因為他們沒有舊習慣包袱,上手 AI 更快),真正危險的是「從招聘潮時期上來的 mid-level 工程師」。Source code 可能變成暫時性的產物。Amazon 已經把 AI Agent 列入組織編制表。而最殘酷的結論:人類的組織架構跟不上 AI 產出的速度。

Spotify 最強工程師從 12 月起就沒寫過一行 Code — 全靠 AI 和一個叫 Honk 的內部系統

Spotify 共同 CEO Gustav Söderström 在 Q4 財報會議上爆料:公司最優秀的開發者「從 12 月起就沒寫過一行 Code」。他們用一個內部系統叫 Honk,搭配 Claude Code,讓工程師在通勤時用手機從 Slack 指揮 AI 修 bug、加功能,Claude 做完還會自動推一個新版 app 到手機上。2025 年 Spotify 出了 50+ 新功能,這個速度不是靠加人,是靠讓 AI 寫 Code。

OpenAI × Cerebras:Codex-Spark 寫 code 快 15 倍 — 但代價是什麼?

OpenAI 今天發布 GPT-5.3-Codex-Spark,第一個跑在 Cerebras 晶圓級晶片上的模型。每秒 1000+ tokens、延遲降 80%、首 token 快 50%。但它是縮小版模型,不跑測試、只限 Pro 用戶。這不只是一個新模型,是 OpenAI 首次在生產環境用非 Nvidia 晶片——AI 算力的版圖正在重劃。

OpenAI API 正式支援 Skills — Simon Willison 拆解這個讓 Agent 自帶「技能包」的新功能

OpenAI 的 Responses API 現在可以透過 shell tool 掛載 Skills — 把可重複使用的工作流程(指令 + 腳本 + 資源檔)打包成 zip,讓模型在需要時才載入執行。Simon Willison 用他新開發的 Showboat 工具實測了這個 API,發現最酷的是可以直接在 JSON request 裡用 base64 傳 inline skill,不用先上傳。Skills 本質上是 system prompt、tool、和 procedure 之間的「中間層」,解決了把所有流程都塞進 system prompt 會越塞越肥的痛點。

Karpathy:把別人的 Library「撕」下來用——DeepWiki + Bacterial Code 的軟體可塑性革命

Andrej Karpathy 分享他如何用 DeepWiki MCP + GitHub CLI 讓 Claude 從 torchao 的 codebase 中「撕出」fp8 training 功能,五分鐘生成 150 行自包含程式碼,跑起來還快 3%。他提出 bacterial code 概念——低耦合、自包含、少依賴的程式碼風格,讓 agent 能像細菌水平基因轉移一樣自由撕取程式碼。金句:Libraries are over, LLMs are the new compiler。

Anthropic 內部數據曝光:Claude Code 讓每人每天多發 67% 的 PR — 還推出 Dashboard 讓你量化 AI 幫了多少忙

Anthropic 公布了內部使用 Claude Code 的數據:工程師每人每天合併的 PR 數量增加了 67%,70-90% 的 code 由 Claude Code 協助撰寫。同時推出 Contribution Metrics 功能,讓 Team/Enterprise 客戶透過 GitHub 整合追蹤 AI 對團隊產能的實際影響。這不是「AI 好棒棒」的公關稿 — 這是給 Tech Lead 的實戰儀表板。

Matt Pocock 的 Git Guardrails:讓 Claude Code 不再手滑 git push --force 毀掉你的 Repo

Matt Pocock(TypeScript 教父、Ralph Loops 佈道者)發布了一個 Claude Code skill:git-guardrails。用 PreToolUse hook 攔截危險的 git 指令(push、reset --hard、clean -f 等),讓你放心讓 AI agent 在 Docker Sandbox 裡 YOLO 模式全自動跑,不怕它把你的 git history 炸掉。一行指令安裝,比任何 prompt engineering 都可靠。

Simon Willison 造了兩個工具讓 AI Agent 自己 Demo 成果 — 因為光跑 Test 不夠,你得「親眼看到」

Simon Willison 發布兩個開源工具:Showboat 讓 AI agent 自動產生 Markdown demo 文件來展示自己寫的 code 實際跑起來的樣子,Rodney 則是 CLI 版的瀏覽器自動化,可以截圖、跑 JS、做 accessibility audit。重點不是取代 test,而是解決一個核心問題:agent 跑完 test 說「全 pass」,但你怎麼知道它真的 work?Simon 甚至發現 agent 會作弊,直接偷改 demo 檔。

Andrew Ng:AI 還沒搶走你的工作,但會用 AI 的人正在搶走不會用的人的工作

Andrew Ng 從第一線觀察剖析 AI 對就業市場的真實影響:大規模失業被過度渲染了,真正發生的是會用 AI 的人正在取代不會用的人。更震撼的是團隊重組:以前 8 個工程師 + 1 個 PM 的專案,現在 2 個工程師 + 1 個 PM 就搞定 — 瓶頸從「怎麼寫 code」變成「決定要做什麼」。這就是 PM Bottleneck。

Karpathy 的誠實告白:AI Agent 還不能自動優化我的 Code(但我還沒放棄)

有人用 Opus 4.6 和 Codex 5.3 去優化 Karpathy 的 nanochat,成功省了 3 分鐘訓練時間。但 Karpathy 本人的回覆卻潑了一盆冷水:他試過了,基本上失敗了。模型還不能做到 open-ended 的 code optimization。更慘的是 Opus 還會偷刪他的 comments、無視 CLAUDE.md、報錯實驗結果。但他也說:有監督 + 明確任務 = 超有用。

Flask 之父說:是時候為 AI Agent 設計新程式語言了

Flask 和 Jinja2 的創造者、Sentry CTO Armin Ronacher 認為,現在的程式語言是為「人類打字很慢」設計的,但 AI agent 時代需求完全不同。他列出了 agent 喜歡什麼、討厭什麼,以及為什麼 Go 在 agent 時代意外地成為贏家。這篇是給所有用 AI 寫 code 的人的必讀指南。

Kimi K2.5 用 RL 訓練 Agent 指揮官 — SemiAnalysis 實測:Claude 的 Agent Teams 反而更慢更貴

SemiAnalysis 深度拆解 Kimi K2.5 的 agent swarm 架構:不靠 prompt 魔法,直接用 RL 訓練一個「指揮官」來決定何時開分支、何時平行化。對比 Anthropic 的 Claude Agent Teams,結果出乎意料 — Claude Teams 在他們的測試中更慢、更貴、分數更低。這篇揭示了 multi-agent 從「prompt 工程」走向「分散式排程問題」的轉變。

Anthropic 2026 報告:8 大趨勢正在重新定義軟體開發(Code Writer 時代結束了)

Anthropic 發布 2026 Agentic Coding Trends Report,揭示 8 大趨勢:Multi-Agent Systems 成標配(57% 組織採用)、Papercut Revolution 低成本清技術債、Self-Healing Code 自動 debug、Claude Code 年化營收破 $10 億。TELUS 省 50 萬工時、Rakuten 1250 萬行 99.9% 準確。開發者角色正從 Code Writer 轉變為 System Orchestrator。