claude-code - 標籤

選 AI 不再只看模型 — Ethan Mollick 提出「Model / App / Harness」三層框架，一次搞懂 2026 的 AI 全局

MP-99 2026-02-19 · Ethan Mollick (One Useful Thing)

華頓商學院教授 Ethan Mollick 在最新文章中提出一個簡單但改變遊戲規則的框架：選 AI 工具要看三層 — Model（模型腦袋）、App（使用介面）、Harness（韁繩/工具鏈）。同一個 Claude Opus 4.6，在聊天視窗裡只能閒聊，放進 Claude Code 就能自主寫程式跑測試幾小時不停，裝進 Claude Cowork 就能幫你整理報告操作電腦。框架之外，Mollick 還用 Claude Code 花一小時把 GPT-1 的 1.17 億個參數做成 80 本精裝書並上架販售——當天完售。

SWE-bench 二月大考成績出爐 — Opus 4.5 逆襲 4.6、中國模型佔領半壁江山、GPT-5.3 缺考

MP-97 2026-02-19 · Simon Willison

SWE-bench 官方用同一個 mini-SWE-agent 跑完所有主流模型的 Bash Only 排行榜（Verified 子集，500 題）。結果讓人意外：Claude Opus 4.5（舊版）以 76.8% 險勝 Opus 4.6 的 75.6% 拿下第一、Gemini 3 Flash 和 MiniMax M2.5 並列第二。去除同模型重複後，前十名中有四個中國模型。OpenAI 最強戰力 GPT-5.3-Codex 因為 API 沒開放而缺席。Simon Willison 順手用 Claude for Chrome 幫圖表加上了百分比標籤——這可能是全文最實用的部分。

swe-bench benchmark gemini minimax chinese-ai openai simon-willison leaderboard agentic-coding

Anthropic 工程師揭密：Claude Code 的 Prompt Caching 設計哲學 — 整個系統都繞著 cache 轉

GP-73 2026-02-19 · @trq212 on X

Anthropic 的 Claude Code 工程師 Thariq 分享了他們從實戰中學到的 prompt caching 教訓：system prompt 排列順序決定一切、tools 不能加不能刪、model 不能中途換、compaction 要共享 prefix。他們甚至會對 cache hit rate 發 SEV。如果你正在做 agentic 產品，這篇是教科書等級的實戰經驗。

prompt-caching optimization cost ai-agents

Anthropic 分析了數百萬筆 Claude Code 數據 — 你的 Agent 其實可以跑更久，但你不敢放手

MP-96 2026-02-18 · Anthropic Research

Anthropic 首度公開 Claude Code 和 API 的真實使用數據：最長自主跑動時間三個月內翻倍（45 分鐘以上）、老手有 40% 的 session 全部自動核准、Claude 主動停下來問問題的頻率比人類打斷它還高兩倍——但 73% 的 API 動作仍有人在監督。最驚人的發現：模型能處理的自主程度遠超過用戶實際給予的。Anthropic 稱之為「部署落差」。

agent-autonomy research data-analysis safety human-oversight agentic-coding trust

Claude Code 藏起你的檔案名稱，開發者怒了 — Boris 本人上 HN 滅火的 72 小時

MP-94 2026-02-18 · Symmetrybreak.ing / Hacker News / GitHub Issue #21151

Claude Code v2.1.20 把預設 UI 從顯示完整檔案路徑改成「Read 3 files」一行摘要，引爆 1082 點 HN 討論串和 700+ 則留言。開發者憤怒的不只是 UI 變動——而是 AI 工具藏起自己在做什麼的哲學問題。Boris Cherny 親自上 HN 和 GitHub 回應、承認命名錯誤、連出三輪修復。這場爭論揭露了 AI 工具設計中最核心的張力：簡潔 vs 透明。

boris-cherny developer-tools ui-design transparency agentic-coding hacker-news open-source trust

Ramp 的 PM 開始自己發 PR 了 — 80% 非工程師在 6 週內學會用 Claude Code，Data Team 的定位正在崩塌

MP-95 2026-02-18 · Ian Macomber (Ramp Head of Data)

美國 Fintech 獨角獸 Ramp 的 Data 主管 Ian Macomber 公開分享：短短 6 週內，公司 80% 的 PM、70% 的 Compliance 團隊、55% 的財務團隊都開始使用 Claude Code。更驚人的是進化速度——從「分析師問 Data Team 幫忙」到「分析師自己開 PR 送審」只花了兩個月。Boris Cherny 親自回覆「Love this」。這不是未來的預測，這是正在發生的事。

ramp non-engineering enterprise-adoption data-team jevons-paradox fintech product-management boris-cherny

Simon Willison：CLI 工具完勝 MCP — 省 token、零依賴、LLM 天生就會用

GP-72 2026-02-18 · @simonw on X

Simon Willison 再次公開表態：CLI 工具在幾乎所有場景都比 MCP 更好。省 token、零額外依賴、LLM 天生就會呼叫 --help。Anthropic 自己也提出了 code-execution-with-MCP 的「第三條路」，承認 MCP 的 token 浪費問題。本文拆解 MCP vs CLI 的完整 trade-off，並附上 ShroomDog 團隊的真實案例。

mcp cli simon-willison ai-agents token-efficiency developer-tools

Figma × Claude Code「Code to Canvas」：設計師和工程師之間那道牆，今天正式拆了

MP-92 2026-02-17 · Figma Blog / Thariq (Anthropic)

Figma 和 Anthropic 正式合作推出「Code to Canvas」功能，讓你在 Claude Code 裡建好的 UI，一句話就能變成 Figma 上可編輯的設計稿。然後用 Figma MCP 再把改好的設計拉回 code。設計師和工程師之間那道「截圖丟 Slack」的悲慘工作流程，從今天開始可以退休了。但 CNBC 也提醒：Figma 股價已經從高點暴跌 85%，SaaS 正在被 AI 吞噬。Figma 是在幫自己續命，還是在幫 Claude Code 鋪路？

figma design code-to-canvas mcp designer-developer-workflow saaspocalypse

Claude Sonnet 4.6 正式發布 — 訓練數據比 Opus 還新？三方比較告訴你該選哪個

GP-70 2026-02-17 · Anthropic Official Docs

Anthropic 發布 Claude Sonnet 4.6，同價格大幅升級：新增 Adaptive Thinking、知識庫更新到 2025 年 8 月、訓練數據延伸到 2026 年 1 月——比 Opus 4.6 還新。本文從價格、速度、Context、知識新鮮度、適用場景五個維度，三方比較 Sonnet 4.6、Sonnet 4.5 和 Opus 4.6，幫你搞清楚到底該用哪個。

sonnet-4-6 opus-4-6 model-comparison adaptive-thinking ai-models

Pentagon 威脅砍掉 Anthropic 的 $2 億合約 — 因為 Anthropic 拒絕讓 Claude 變成殺人武器

MP-87 2026-02-16 · Axios / Reuters / TechCrunch / CNBC / PCMag / Bloomberg（多源綜合）

美國國防部正在威脅終止與 Anthropic 的 $2 億合約，因為 Anthropic 堅持 Claude 不能用於「全自動武器」和「大規模監控美國公民」。同時曝光 Claude 已透過 Palantir 被用在美軍逮捕委內瑞拉前總統 Maduro 的軍事行動中。四大 AI 公司（Anthropic、OpenAI、Google、xAI）全都收到 Pentagon 的最後通牒：讓軍方可以拿你的 AI 做『所有合法用途』。只有 Anthropic 說不。

pentagon military-ai ai-safety ai-ethics palantir autonomous-weapons surveillance defense

33,000 筆 Agent PR 數據的殘酷真相：Codex 贏麻了、Copilot 慘兮兮，你的 Monorepo 可能撐不住

MP-84 2026-02-16 · Drexel University / Missouri S&T (MSR 2026)

Drexel 和 Missouri 大學的研究團隊分析了 GitHub 上 33,596 筆由五大 coding agent 提交的 PR。結果？整體 merge rate 71%，但差距驚人：Codex 83%、Claude Code 59%、Copilot 只有 43%。更恐怖的是失敗模式：Agent PR 被拒的第一名原因不是 code 寫得爛，而是「根本沒人理」。LeadDev 同步報導指出，這場 Agent PR 大洪水正在壓垮企業的 Monorepo 和 CI 基礎設施。

research agentic-coding pull-requests ci-cd monorepo code-review codex copilot tech-lead

AI Vampire：Steve Yegge 說 AI 讓你 10 倍速，但也在 10 倍速榨乾你

MP-85 2026-02-16 · Steve Yegge (Medium)

Google/Amazon 老兵 Steve Yegge 提出「AI Vampire」理論：AI 讓你 10x 生產力，但這額外的 9x 價值到底歸誰？歸公司，你就被榨乾到 burnout；歸你自己，公司就被競爭對手幹掉。Yegge 認為 agentic coding 一天只能撐 3-4 小時，剩下的時間你應該去摸草。他還搬出在 Amazon 時代傳授的 $/hr 公式：你控制不了分子，但你能控制分母。

burnout agentic-coding developer-tools work-life-balance steve-yegge productivity

快不等於好 — Anthropic Fast Mode vs OpenAI Codex Spark 的技術路線之爭

GP-65 2026-02-16 · @dotey (宝玉) on X

同一週內 Anthropic 和 OpenAI 各端出一盤加速菜：Fast Mode 用同模型衝 2.5 倍速、Codex Spark 用 Cerebras 晶圓級晶片飆到 1000 token/s。一個賭「不犯錯」，一個賭「即時互動」。這不是速度比拼——是精算師 vs 探險家的產品哲學之爭。

anthropic openai fast-mode codex-spark cerebras inference-speed

GitHub Agent HQ：讓 Claude、Codex、Copilot 在同一個 PR 裡打群架 — 多 Agent 協作時代正式開打

MP-82 2026-02-15 · GitHub Blog

GitHub 正式推出 Agent HQ 的多 Agent 支援：Copilot Pro+ 和 Enterprise 用戶現在可以直接在 GitHub 和 VS Code 裡同時跑 Claude、Codex 和 Copilot，讓不同 AI 用不同思路攻同一個問題。不用切工具、不用複製貼上 context，所有產出直接變成 Draft PR。對 Tech Lead 來說，這可能是 Code Review 流程的一次典範轉移。

github copilot codex multi-agent code-review developer-tools agentic-coding

本地 Proxy 實戰：把 Claude Max 訂閱的 Opus 4.6 當 OpenClaw 大腦

GP-63 2026-02-14 · @BensonTWN on X

Benson Sun 分享怎麼用 Claude Max 訂閱的 Opus 4.6 透過本地 Proxy 當 OpenClaw 大腦。三個關鍵突破：權限（跳過 CLI 確認）、環境（模擬 TTY）、瀏覽器（Playwright 封裝）。三小時內 100% 追平原生 Agent 功能，而且聊天跟寫 Code 共享同一份 Context。

openclaw proxy opus local-setup stealth-mode

Anthropic CEO 放話：「我們已經快到指數成長的盡頭了」— Dario Amodei 最新訪談的 7 個關鍵判斷

MP-78 2026-02-13 · Dwarkesh Patel (Dwarkesh Podcast)

Anthropic CEO Dario Amodei 上 Dwarkesh Podcast 放出一系列重磅判斷：90% 信心十年內達到「資料中心裡的天才國度」，Anthropic 營收連續三年 10 倍成長，2026 年 1 月又加了幾十億。他把 RL scaling 比做當年 pre-training 的翻版，坦承 AI 不是已經到了 AGI，但已經「接近指數的盡頭」。最震撼的是他對軟體工程師的預測光譜：從 90% code 到 100% code 到 90% fewer SWEs — 每一步之間都是天壤之別。

dario-amodei agi scaling-laws ai-industry dwarkesh-podcast

Spotify 最強工程師從 12 月起就沒寫過一行 Code — 全靠 AI 和一個叫 Honk 的內部系統

MP-77 2026-02-13 · TechCrunch

Spotify 共同 CEO Gustav Söderström 在 Q4 財報會議上爆料：公司最優秀的開發者「從 12 月起就沒寫過一行 Code」。他們用一個內部系統叫 Honk，搭配 Claude Code，讓工程師在通勤時用手機從 Slack 指揮 AI 修 bug、加功能，Claude 做完還會自動推一個新版 app 到手機上。2025 年 Spotify 出了 50+ 新功能，這個速度不是靠加人，是靠讓 AI 寫 Code。

spotify agentic-coding enterprise developer-workflow

Anthropic 募了 $300 億美元 — Claude Code 年營收 $25 億，每 4 個 GitHub Commit 就有 1 個是它寫的

MP-75 2026-02-12 · Anthropic Blog + CNBC + Axios + Bloomberg

Anthropic 今天宣布完成 $300 億美元 Series G 融資，估值 $3,800 億。年化營收 $140 億（連續三年 10 倍增長），Claude Code 年化營收 $25 億且六週翻倍。4% GitHub 公開 commits 由 Claude Code 生成。Fortune 10 有 8 家是客戶，$1M+ 客戶從十幾家暴增到 500+。這不只是融資新聞，這是 AI 產業正式進入「不是泡沫」的里程碑。

funding enterprise ai-industry

Anthropic 承諾幫美國人付電費 — AI 吃電怪獸的帳單，不該讓你家來扛

MP-72 2026-02-12 · Anthropic Blog + Reuters + NBC News

Anthropic 宣布將自掏腰包承擔 100% 的電網升級費用，並補貼因 data center 導致的消費者電價上漲。這不只是 PR — 背後是 AI 產業即將吃掉美國 12% 電力的殘酷現實，以及正在逼近的政治壓力。Anthropic 一個月內先說「不賣廣告」，再說「電費我付」，正在打造最強的「負責任 AI 公司」人設。

data-center electricity infrastructure energy policy

Boris 的 Claude Code 客製化大全 — 12 招把 AI 編輯器調成你的形狀

MP-67 2026-02-12 · @bcherny on X

Claude Code 之父 Boris Cherny 發了 12 則 thread，完整列出工程師愛 Claude Code 的原因 = 極致客製化能力：hooks、plugins、LSPs、MCPs、skills、custom agents、output styles、37 種 settings、84 個 env vars，全部都能 commit 到 git 讓團隊共享。

customization hooks mcp skills developer-tools