agentic-coding - 標籤

Claude Code 藏起你的檔案名稱，開發者怒了 — Boris 本人上 HN 滅火的 72 小時

MP-94 2026-02-18 · Symmetrybreak.ing / Hacker News / GitHub Issue #21151

Claude Code v2.1.20 把預設 UI 從顯示完整檔案路徑改成「Read 3 files」一行摘要，引爆 1082 點 HN 討論串和 700+ 則留言。開發者憤怒的不只是 UI 變動——而是 AI 工具藏起自己在做什麼的哲學問題。Boris Cherny 親自上 HN 和 GitHub 回應、承認命名錯誤、連出三輪修復。這場爭論揭露了 AI 工具設計中最核心的張力：簡潔 vs 透明。

Hugging Face CTO 預言：Monolith 回歸、Dependency 滅亡、Strongly Typed 語言崛起 — AI 正在重寫軟體世界的結構

MP-88 2026-02-17 · Thomas Wolf (@Thom_Wolf)

Hugging Face CTO Thomas Wolf 發了一篇重磅長文，分析 AI 如何從根本上改變軟體的結構。不是「AI 幫你寫 code」那種表面改變，而是 Monolith 回歸、Lindy Effect 失效、Strongly Typed 語言崛起、Open Source 社群重組、甚至可能出現全新的「為 LLM 設計的程式語言」。Karpathy 看完直接附和：『我們可能會把人類寫過的所有軟體，重寫好多次。』這不是預測，這是正在發生的事。

thomas-wolf karpathy hugging-face software-architecture monolith dependency typed-languages formal-verification open-source programming-languages

33,000 筆 Agent PR 數據的殘酷真相：Codex 贏麻了、Copilot 慘兮兮，你的 Monorepo 可能撐不住

MP-84 2026-02-16 · Drexel University / Missouri S&T (MSR 2026)

Drexel 和 Missouri 大學的研究團隊分析了 GitHub 上 33,596 筆由五大 coding agent 提交的 PR。結果？整體 merge rate 71%，但差距驚人：Codex 83%、Claude Code 59%、Copilot 只有 43%。更恐怖的是失敗模式：Agent PR 被拒的第一名原因不是 code 寫得爛，而是「根本沒人理」。LeadDev 同步報導指出，這場 Agent PR 大洪水正在壓垮企業的 Monorepo 和 CI 基礎設施。

research pull-requests ci-cd monorepo code-review codex claude-code copilot tech-lead

Deep Blue：Simon Willison 為開發者的 AI 存在危機取了一個名字

MP-86 2026-02-16 · Simon Willison

當 AI 開始寫出比你更好的 code，你的職業生涯突然感覺像是建立在沙灘上。Simon Willison 和 Oxide and Friends podcast 的 Adam Leventhal 為這種感覺取了一個名字：Deep Blue。雙關語——既是那台 1997 年擊敗 Kasparov 的西洋棋電腦，也是你心底深處的憂鬱（blue）。這不是技術問題，這是一整個世代工程師的心理危機。

deep-blue developer-ennui simon-willison existential-crisis software-engineering career mental-health

AI Vampire：Steve Yegge 說 AI 讓你 10 倍速，但也在 10 倍速榨乾你

MP-85 2026-02-16 · Steve Yegge (Medium)

Google/Amazon 老兵 Steve Yegge 提出「AI Vampire」理論：AI 讓你 10x 生產力，但這額外的 9x 價值到底歸誰？歸公司，你就被榨乾到 burnout；歸你自己，公司就被競爭對手幹掉。Yegge 認為 agentic coding 一天只能撐 3-4 小時，剩下的時間你應該去摸草。他還搬出在 Amazon 時代傳授的 $/hr 公式：你控制不了分子，但你能控制分母。

burnout developer-tools work-life-balance steve-yegge claude-code productivity

GitHub Agent HQ：讓 Claude、Codex、Copilot 在同一個 PR 裡打群架 — 多 Agent 協作時代正式開打

MP-82 2026-02-15 · GitHub Blog

GitHub 正式推出 Agent HQ 的多 Agent 支援：Copilot Pro+ 和 Enterprise 用戶現在可以直接在 GitHub 和 VS Code 裡同時跑 Claude、Codex 和 Copilot，讓不同 AI 用不同思路攻同一個問題。不用切工具、不用複製貼上 context，所有產出直接變成 Draft PR。對 Tech Lead 來說，這可能是 Code Review 流程的一次典範轉移。

github copilot claude-code codex multi-agent code-review developer-tools

Cognitive Debt：AI 幫你寫完了 Code，但你已經看不懂自己的系統了

MP-83 2026-02-15 · Margaret-Anne Storey / Simon Willison / Martin Fowler

Technical debt 住在 code 裡，你可以重構、可以還。但 Cognitive Debt 住在你的腦袋裡——當 AI Agent 幫你寫了 80% 的 code，你對自己系統的理解卻掉到 20%。UVic 教授 Margaret-Anne Storey 從 Thoughtworks 閉門會議帶回這個概念，Simon Willison 和 Martin Fowler 同時背書。這不是假想的未來，而是現在進行式。

cognitive-debt technical-debt software-engineering team-management simon-willison martin-fowler

Thoughtworks 閉門會議洩密：Junior 比 Senior 更值錢了 — 軟體工程的「身份危機」正在發生

MP-79 2026-02-14 · Thoughtworks / Forrester / Ken Mugrage

Thoughtworks 召集了一群軟體界的 OG（包括發明 OOP 和 Agile 的人）開了一場閉門會議，討論 AI 時代軟體工程的未來。結論讓所有人都不舒服：Junior 工程師比以前更有價值（因為他們沒有舊習慣包袱，上手 AI 更快），真正危險的是「從招聘潮時期上來的 mid-level 工程師」。Source code 可能變成暫時性的產物。Amazon 已經把 AI Agent 列入組織編制表。而最殘酷的結論：人類的組織架構跟不上 AI 產出的速度。

thoughtworks software-engineering career enterprise team-management

Spotify 最強工程師從 12 月起就沒寫過一行 Code — 全靠 AI 和一個叫 Honk 的內部系統

MP-77 2026-02-13 · TechCrunch

Spotify 共同 CEO Gustav Söderström 在 Q4 財報會議上爆料：公司最優秀的開發者「從 12 月起就沒寫過一行 Code」。他們用一個內部系統叫 Honk，搭配 Claude Code，讓工程師在通勤時用手機從 Slack 指揮 AI 修 bug、加功能，Claude 做完還會自動推一個新版 app 到手機上。2025 年 Spotify 出了 50+ 新功能，這個速度不是靠加人，是靠讓 AI 寫 Code。

spotify claude-code enterprise developer-workflow

OpenAI × Cerebras：Codex-Spark 寫 code 快 15 倍 — 但代價是什麼？

MP-74 2026-02-12 · OpenAI Blog + Cerebras Blog + ZDNET + TechCrunch

OpenAI 今天發布 GPT-5.3-Codex-Spark，第一個跑在 Cerebras 晶圓級晶片上的模型。每秒 1000+ tokens、延遲降 80%、首 token 快 50%。但它是縮小版模型，不跑測試、只限 Pro 用戶。這不只是一個新模型，是 OpenAI 首次在生產環境用非 Nvidia 晶片——AI 算力的版圖正在重劃。

openai codex cerebras inference hardware

OpenAI API 正式支援 Skills — Simon Willison 拆解這個讓 Agent 自帶「技能包」的新功能

MP-68 2026-02-12 · Simon Willison's blog

OpenAI 的 Responses API 現在可以透過 shell tool 掛載 Skills — 把可重複使用的工作流程（指令 + 腳本 + 資源檔）打包成 zip，讓模型在需要時才載入執行。Simon Willison 用他新開發的 Showboat 工具實測了這個 API，發現最酷的是可以直接在 JSON request 裡用 base64 傳 inline skill，不用先上傳。Skills 本質上是 system prompt、tool、和 procedure 之間的「中間層」，解決了把所有流程都塞進 system prompt 會越塞越肥的痛點。

mogu-picks simon-willison openai skills api

OpenClaw 創造者上 Lex Fridman Podcast — 從一小時原型到 18 萬顆星的龍蝦傳奇

MP-70 2026-02-12 · Lex Fridman Podcast #491

Peter Steinberger（OpenClaw 創造者）登上 Lex Fridman Podcast，完整講述一小時原型如何變成 GitHub 史上成長最快的 repo、改名五次的血淚史、被 OpenAI 和 Meta 收購的故事、以及他為什麼說「80% 的 App 會消失」。

openclaw steipete lex-fridman podcast open-source

Karpathy：把別人的 Library「撕」下來用——DeepWiki + Bacterial Code 的軟體可塑性革命

GP-50 2026-02-12 · @karpathy on X

Andrej Karpathy 分享他如何用 DeepWiki MCP + GitHub CLI 讓 Claude 從 torchao 的 codebase 中「撕出」fp8 training 功能，五分鐘生成 150 行自包含程式碼，跑起來還快 3%。他提出 bacterial code 概念——低耦合、自包含、少依賴的程式碼風格，讓 agent 能像細菌水平基因轉移一樣自由撕取程式碼。金句：Libraries are over, LLMs are the new compiler。

karpathy deepwiki bacterial-code software-architecture

Anthropic 內部數據曝光：Claude Code 讓每人每天多發 67% 的 PR — 還推出 Dashboard 讓你量化 AI 幫了多少忙

MP-63 2026-02-11 · Thariq (@trq212) + Anthropic

Anthropic 公布了內部使用 Claude Code 的數據：工程師每人每天合併的 PR 數量增加了 67%，70-90% 的 code 由 Claude Code 協助撰寫。同時推出 Contribution Metrics 功能，讓 Team/Enterprise 客戶透過 GitHub 整合追蹤 AI 對團隊產能的實際影響。這不是「AI 好棒棒」的公關稿 — 這是給 Tech Lead 的實戰儀表板。

claude-code developer-productivity metrics tech-lead github enterprise

Matt Pocock 的 Git Guardrails：讓 Claude Code 不再手滑 git push --force 毀掉你的 Repo

MP-64 2026-02-11 · Matt Pocock (@mattpocockuk)

Matt Pocock（TypeScript 教父、Ralph Loops 佈道者）發布了一個 Claude Code skill：git-guardrails。用 PreToolUse hook 攔截危險的 git 指令（push、reset --hard、clean -f 等），讓你放心讓 AI agent 在 Docker Sandbox 裡 YOLO 模式全自動跑，不怕它把你的 git history 炸掉。一行指令安裝，比任何 prompt engineering 都可靠。

claude-code git hooks skill matt-pocock ralph-loops docker-sandbox developer-tools

Simon Willison 造了兩個工具讓 AI Agent 自己 Demo 成果 — 因為光跑 Test 不夠，你得「親眼看到」

MP-61 2026-02-11 · Simon Willison (simonw)

Simon Willison 發布兩個開源工具：Showboat 讓 AI agent 自動產生 Markdown demo 文件來展示自己寫的 code 實際跑起來的樣子，Rodney 則是 CLI 版的瀏覽器自動化，可以截圖、跑 JS、做 accessibility audit。重點不是取代 test，而是解決一個核心問題：agent 跑完 test 說「全 pass」，但你怎麼知道它真的 work？Simon 甚至發現 agent 會作弊，直接偷改 demo 檔。

simonw-agentic-patterns simon-willison developer-tools testing qa showboat rodney claude-code ai-agents

Andrew Ng：AI 還沒搶走你的工作，但會用 AI 的人正在搶走不會用的人的工作

MP-60 2026-02-10 · Andrew Ng (@AndrewYNg)

Andrew Ng 從第一線觀察剖析 AI 對就業市場的真實影響：大規模失業被過度渲染了，真正發生的是會用 AI 的人正在取代不會用的人。更震撼的是團隊重組：以前 8 個工程師 + 1 個 PM 的專案，現在 2 個工程師 + 1 個 PM 就搞定 — 瓶頸從「怎麼寫 code」變成「決定要做什麼」。這就是 PM Bottleneck。

andrew-ng job-market ai-skills tech-lead team-management pm-bottleneck career

Karpathy 的誠實告白：AI Agent 還不能自動優化我的 Code（但我還沒放棄）

MP-56 2026-02-10 · Andrej Karpathy (@karpathy) & Yuchen Jin (@Yuchenj_UW)

有人用 Opus 4.6 和 Codex 5.3 去優化 Karpathy 的 nanochat，成功省了 3 分鐘訓練時間。但 Karpathy 本人的回覆卻潑了一盆冷水：他試過了，基本上失敗了。模型還不能做到 open-ended 的 code optimization。更慘的是 Opus 還會偷刪他的 comments、無視 CLAUDE.md、報錯實驗結果。但他也說：有監督 + 明確任務 = 超有用。

karpathy nanochat claude-code opus-4.6 codex-5.3 agent-limitations code-optimization

Flask 之父說：是時候為 AI Agent 設計新程式語言了

MP-57 2026-02-10 · Armin Ronacher (mitsuhiko) — lucumr.pocoo.org

Flask 和 Jinja2 的創造者、Sentry CTO Armin Ronacher 認為，現在的程式語言是為「人類打字很慢」設計的，但 AI agent 時代需求完全不同。他列出了 agent 喜歡什麼、討厭什麼，以及為什麼 Go 在 agent 時代意外地成為贏家。這篇是給所有用 AI 寫 code 的人的必讀指南。

programming-languages mitsuhiko armin-ronacher go python typescript developer-tools

Kimi K2.5 用 RL 訓練 Agent 指揮官 — SemiAnalysis 實測：Claude 的 Agent Teams 反而更慢更貴

MP-59 2026-02-10 · SemiAnalysis (@SemiAnalysis_)

SemiAnalysis 深度拆解 Kimi K2.5 的 agent swarm 架構：不靠 prompt 魔法，直接用 RL 訓練一個「指揮官」來決定何時開分支、何時平行化。對比 Anthropic 的 Claude Agent Teams，結果出乎意料 — Claude Teams 在他們的測試中更慢、更貴、分數更低。這篇揭示了 multi-agent 從「prompt 工程」走向「分散式排程問題」的轉變。

agent-swarms kimi moonshot semianalysis claude-code multi-agent reinforcement-learning benchmark