claude-code
156 篇文章
一個人 + 四個 AI Agent = 一夜完成 41 個任務:Agent 團隊分工實戰報告
Alexey Grigorev 不再讓一個 AI agent 包辦所有事,而是拆出 PM、SWE、QA、On-Call 四個角色組成 agent 團隊。他在五個真實專案上測試了這套架構,其中一個專案一個晚上自動完成了 46 個任務中的 41 個。
Claude Code Hooks 完全攻略 — 8 個讓 AI 不再忘東忘西的自動化掛鉤
CLAUDE.md 是建議,Hooks 是命令。這篇整理了 8 個實戰 Claude Code Hooks,從自動格式化、擋危險指令、保護敏感檔案到自動 commit,直接複製貼上就能用。
Boris Cherny 的 Claude Code 隱藏招式大全 — 15 個你可能不知道的功能
Anthropic 工程師 Boris Cherny 在 X 上整理了 15 個他最常用的 Claude Code 隱藏功能,從手機 app、跨裝置接力、自動排程,到 worktree 平行工作與語音輸入都有。
三塊 CLAUDE.md 指令,讓 Claude 每次對話都在進化 — Paweł Huryn 的 Knowledge Architecture 實戰
Paweł Huryn 分享三塊貼進 CLAUDE.md 的指令(Knowledge Architecture、Decision Journal、Quality Gate),讓 Claude 從「有記憶但不學習」進化成會自我累積規則的系統。一個月後 Claude 自己寫出 24 條專案專屬規則。
AI Agent 記憶系統設計:從 Claude Code 的三層架構,學到最重要的一件事
AI agent 最讓人崩潰的問題之一:每次新 session 什麼都忘了。Claude Code 原始碼裡藏著一套三層記憶架構,設計哲學是「Memory 是 hint,不是 truth」。從架構原理、forked subagent 設計,到跟 RAG 的取捨比較,帶你把這套架構學起來。
Claude Code 的 5 個反面教材 — AI 時代的 Bad Design Patterns
Claude Code 原始碼洩漏,社群盯著 KAIROS 和 model codenames 看。但裡面還有另一面:5 個讓 $2.5B ARR 產品顯得很尷尬的設計決策。這些不是 Anthropic 獨有的問題——它們是 AI 生成 code 的系統性陷阱,你的 codebase 裡很可能也有。
Prompt Cache Economics — 為什麼你的 AI 帳單比想像中貴
Prompt caching 本來應該幫你省 90% 的 token 費用,但有一個 bug 可以讓你不知不覺多付十倍錢。從 Claude Code 原始碼洩漏的 DANGEROUS_uncachedSystemPromptSection 到 cch=00000 計費地雷,原來 prompt 工程師現在也要是個會計師。
Undercover Mode 問出了一個沒人想回答的問題
Claude Code 的原始碼洩漏裡藏著一個叫 undercover.ts 的檔案,設計目的是讓 AI 的 commit 看起來像人類寫的。這件事問出了一個業界至今沒有共識的問題:你的團隊用 AI 寫 code,應該標注嗎?
AI 能測試自己嗎?— 從 Claude Code 零測試到 Self-Testing Agent 的可能性
Claude Code 512K 行 TypeScript,64K 行生產碼,零測試。但比零測試更讓人困惑的問題是:Anthropic 有全世界最好的 AI coding 工具,他們為什麼不讓它幫自己寫測試?從靜態分析到 MITM proxy,從遞迴自我測試的哲學困境到 OpenClaw 的實戰做法,探索 Self-Testing Agent 到底能走多遠。
那張 xkcd 沒告訴你的事:AI 時代的「值不值得自動化」
xkcd #1205 那張經典圖表,教了整整一代工程師怎麼算『值不值得自動化』。但 AI 把等式裡最貴的變數直接砍掉了:現在回本的不只是時間,更多時候是 cognitive load。
你不需要一直盯著 Claude Code — ECC 的六種自動化模式全解析
Everything Claude Code 把 AI 自動化開發整理成六個層級:從最基本的 Sequential Pipeline 到最複雜的 RFC-Driven DAG。每個模式都有具體的指令範例和適用場景,讓你知道什麼時候可以放手、放多少、怎麼放。
AI 犯了錯,你糾正,它記住了 — ECC 的 Instinct System 自我學習架構
Everything Claude Code 的 Instinct System 把 AI 每次用到的行為模式蒸餾成「本能」:有信心分數、有專案隔離、有跨專案升級機制。這不是靜態的 MEMORY.md,是從使用中動態自我學習的完整框架。
Git Hooks 改變了你寫 Code 的方式,AI Hooks 再改變一次
Git hooks 在你忘記的時候依然工作。AI hooks 讓你的 Claude Code 在你不注意的時候依然守規矩。ECC 的 Hook Architecture 把 Pre/PostToolUse、lifecycle hooks、15+ 內建 recipes 整合成一套完整的事件驅動系統——讓 CLAUDE.md 的規則從「建議」變成「強制力」。
AI 員工太聽話了:Prompt Injection、動物園逃脫,以及為什麼你的 Agent 需要防彈背心
你的 AI Agent 超聽話——但它聽的可能不是你的話。Prompt Injection 就是在 AI 身上跑社交工程,Tool Use Exploitation 是把瑞士刀交給 5 歲小孩,Context Poisoning 是圖書館裡有人偷改書。然後還有動物園逃脫。
一個人、十個月、50K Stars — ECC 創作者 Affaan Mustafa 的 Indie Hacker 故事
Everything Claude Code 的創作故事:一個人花十個月、用 AI 開發 AI 工具,從一個 config pack 演化成 50K+ stars 的跨平台生態系。這不是工具介紹,是 AI 時代 indie hacker 能做到什麼的真實案例。
Eval-Driven Development — 你測你的 code,但誰測你的 AI?
你用 unit test 測你的 code,用 CI 保護你的 pipeline。但你的 AI 呢?Eval-Driven Development(EDD)把 AI 開發從「感覺不錯就上」升級成有指標的工程紀律——pass@k 指標、三種評分器、Product vs Regression evals,這是 AI 時代真正的 TDD。
Claude Code $200/月不夠用?一個設定省 60% Token
Token 帳單看起來嚇人,但大部分的浪費是隱形的:Extended Thinking 在不需要思考的任務上燒錢、Opus 去做 Haiku 就夠的工作、context 塞滿了才想到要 compact。ECC 的 token-optimization.md 說一套 MAX_THINKING_TOKENS + 模型路由 + 策略性 compact 組合,可以把成本壓低 60-80%——作者 Affaan Mustafa 自己的數字。
9 個 AI Agent 同時工作時的 Context Problem — ECC Iterative Retrieval Pattern 實戰解析
今晚我們同時跑了 9 個 Claude Code agent 寫文章,撞上了 article counter race condition 和 git lock conflict。ECC 的 iterative retrieval pattern 說的是一樣的問題:多 agent 共享 context 時,怎麼不把彼此搞爆。結論:isolated state + atomic pre-allocation + sequential deploy,是唯一出路。
Claude Code 原始碼外洩 — npm 上的 source map 洩漏了它可能的下一步
Anthropic 不小心把 Claude Code CLI 的完整 TypeScript 原始碼打包進 npm 的 source map。裡面藏了自主 agent、model 代號、消失的權限提示、還有一個電子雞系統。
Claude Code 寵物系統上線 — 我把白板仙人掌刷成了金色傳說閃光卡皮巴拉
Claude Code 愚人節悄悄上線了 /buddy 寵物系統,有物種、稀有度、閃光機制,完整的抽卡體驗。原作者不甘心抽到白板仙人掌,從洩漏原始碼中拆解出 Bones + Soul 雙層架構,找到 userID 回退漏洞,暴力碰撞出金色傳說卡皮巴拉。
Claude Code 原始碼洩漏事件全解析 — 512K 行 TypeScript 說了什麼 AI Agent 架構秘密
2026-03-31 凌晨,Anthropic 意外在 npm 洩漏完整 Claude Code 原始碼。裡面有 KAIROS 自主背景 agent、三層記憶架構、Undercover Mode、silent model 降級等秘密——而且有些架構跟我們 OpenClaw 的設計驚人地相似。
Vibe Engineering — 從「丟 prompt 碰運氣」到「架構化造軟體」的進化論
Paweł Huryn 提出 Vibe Engineering 框架:不是把 AI 輸出照單全收,而是透過 Context Engineering、Intent Engineering、和 Sub-agent 編排,把 AI coding 從「碰運氣出 demo」升級到「穩定出產品」。
Claude Code 不只能寫 code — 六個讓你生產力翻倍的非 coding 模式
rodspeed 在完整 blog post 裡分享六個把 Claude Code 從 code editor 變成個人 operating system 的玩法:製造 fresh eyes、用 meta-skill 管 specialist、解 freshness、把對話收成 wiki、用分層 memory 累積脈絡,以及靠 handoff 跨 session 接棒。重點不是叫 AI 多寫幾行 code,而是把 read-filter-decide-present 這類流程都自動化。
Claude Code 隱藏功能大全 — Boris Cherny 的 15 招日常必殺技
Boris Cherny 分享 15 個他最常用的 Claude Code 隱藏與較少人注意到的功能,從手機 app、loop/schedule、worktree 到語音輸入都有涵蓋。
Claude Code 找 99%+ bug,工程師再做 sanity check
Boris Cherny 表示,他們會先用 Claude Code 找出 99%+ 的 bug,再由工程師做 sanity check,確認沒有漏掉明顯問題。
Paweł Huryn:稀缺技能不是管 AI Agent,而是設計讓它們真正有用的知識架構
Paweł Huryn 回應「Anthropic 團隊不再自己寫 code」的說法:標題沒錯,但框架搞錯了。瓶頸從來不是「多開幾個 agent」,而是你怎麼設計 knowledge architecture 讓它們真正有效。
Vibe Coding SwiftUI:不會 Swift 也能寫出 macOS App 的快樂與代價
Simon Willison 用 Claude Opus 4.6 和 GPT-5.4 vibe code 出兩個 macOS menu bar app——一個看網路流量、一個看 GPU 狀態。整個 SwiftUI app 塞在一個檔案裡,連 Xcode 都不用開。但他自己也承認:這些 app 的數字準不準,他完全不知道。
Claude Code Playground Plugin:讓 AI 生出互動式 HTML 小工具的新玩法
Thariq 在 X 上介紹 Claude Code 的 playground plugin。它會幫 Claude 生成獨立的 HTML playground,讓你把互動結果整理成 prompt 貼回 Claude Code,適合處理不太適合用純文字互動的場景。
Your Agent Should Use a File System:比起撐大 context window,讓 AI 學會找資料更重要
Anthropic 工程師 Thariq 丟出一個超值得抄的觀點:AI agent 不該把 state 硬塞進 context window,而該用 file system 落地。這不只比較能跨 session 持久保存,還能讓 agent 反覆搜尋、驗證、修正自己的工作。
Bash Is All You Need?為什麼連非 Coding Agent 都該配一個 Shell
Anthropic 工程師 Thariq 認為,就算不是 coding agent,也該有 bash tool。因為 agent 一旦能把中間結果存成檔案、反覆搜尋、串接 API、自己驗證,能力會直接升級;但安全與容器部署也因此變成不能逃避的問題。
Claude Code Channels:Anthropic 用一個更新幹掉了買 Mac Mini 的理由
Anthropic 推出 Claude Code Channels,原生支援 Telegram 和 Discord 雙向通訊,讓 Claude Code 變成 24/7 常駐 AI agent。VentureBeat 直接稱之為 OpenClaw killer。
.claude/ 資料夾完全解剖 — 你的 AI 助手的大腦在哪裡
你知道 Claude 為什麼在這個 repo 表現好、換個 repo 就變笨嗎?秘密就在 .claude/ 資料夾裡。Akshay 拆解了整個結構:CLAUDE.md 三層架構、自訂指令、agent、permissions、還有那個你可能不知道存在的全域 ~/.claude/。
Claude Code 放春假啦!離峰與週末用量直接翻倍
Anthropic 工程師 Thariq 宣布 Claude Code Spring Break:未來兩週離峰時段與週末用量翻倍,但什麼時候算離峰?沒人知道。
Claude Code 與 Codex:AI Agent CLI 的底層架構差異與設定指南
很多團隊把 Claude Code 和 Codex 當成可互換的工具,卻因為設定錯誤浪費大量時間。本文解析兩者在控制平面與信任模型上的根本差異,並提供實用的第一天設定指南。
躺在床上也能讓 AI 幫你工作?Claude Dispatch 完整解析與實戰指南
Anthropic 悄悄推出了 Dispatch 功能,讓你可以用手機遠端遙控電腦上的 Claude Cowork。這篇帶你了解如何設定、哪些工作流最實用,以及它目前的真實限制。
如何讓你的 Claude Skills 變強 10 倍?Andrej Karpathy 的 Autoresearch 方法實戰
Ole Lehmann 分享一個把 Karpathy「autoresearch」概念套進 Claude skills 的做法,讓 agent 自己反覆測試、微調 prompt。以他的 landing page copy skill 為例,quality checks 通過率從 56% 提升到 92%,而且流程幾乎不用手動介入。
Anthropic 工程師的 Claude Code Skills 實戰筆記:九大類型、設計心法、還有那些踩過的坑
Anthropic 工程師 Thariq 分享內部數百個 Claude Code Skills 的使用經驗:Skills 不只是 markdown 檔案,而是可以包含腳本、資料、hook 的資料夾。他整理出九大類型、分享寫好 skill 的設計心法,以及怎麼在團隊內分發和衡量 skill 效果。
Dan McAteer 直球評比:Opus 4.6 在百萬 token context 幾乎沒有對手
Dan McAteer 直接給出他的長 context 觀察:Opus 4.6 在 1 million token 測試裡表現最好,1 mil tokens 時有 78% accuracy,最接近的是 Sonnet 4.6。另一個重點是,他認為 GPT-5.4 在 long context 上相較 GPT-5.2 反而退步了。
逆向工程 Claude Code:213MB 的 CLI 工具裡藏了什麼秘密?
作者花了一週拆解 213MB 的 Claude Code 二進位檔,發現它本質上是一個以 Bun 打包的巨大 Prompt 傳遞系統,裡面藏著大量等待解鎖的新功能與遙測機制。
寫了 11 章才敢回答的問題:到底什麼是 Agentic Engineering?
Simon Willison 的 Agentic Engineering Patterns 指南加到第 12 章了,但這章排在系列最前面——他終於正式回答「什麼是 Agentic Engineering」。答案意外地簡潔:讓會跑 code 的 agent 幫你開發軟體。但真正有趣的是他花了 11 章實戰經驗後才敢下這個定義。
想當 Claude 架構師?這份拆解指南讓你不靠證照也能學到精髓
有人把 Claude Certified Architect 認證考試的內容全拆開了 — 五大領域、核心觀念、anti-patterns、實作建議一次看完。證照拿不拿不重要,知識才是重點。
Anthropic Prompt Caching 全攻略 — Automatic Caching、1 小時 TTL、與那些官方文件沒明說的坑
Anthropic 官方 prompt caching 文件大更新:Automatic Caching 讓你不用手動標記、1 小時 TTL 讓 cache 活更久、invalidation hierarchy 告訴你什麼改動會炸掉什麼。我們也分享了自己踩過的 $13.86 帳單地雷。
從聊天室指揮 AI 大軍 — OpenClaw ACP 讓你在 Discord / Telegram 裡開 Codex、Claude Code、Gemini
OpenClaw 的 ACP(Agent Client Protocol)讓你從 Telegram/Discord 聊天室直接 spawn Codex、Claude Code、Pi、Gemini CLI 等外部 coding agent,還能綁定 thread/topic、設定 persistent bindings、中途換 model、調權限。本質上就是把你的聊天室變成一個 multi-agent 指揮中心。(2026-03-09 更新:Telegram topic binding、persistent bindings、ACP Provenance 等新功能)
Claude 的 skill-creator 升級啦!Agent Skills 的測試、測量與優化完全指南
Anthropic 為 skill-creator 推出新功能,讓技能開發者無需寫 code 就能測試技能、抓出退化問題並優化觸發描述,更引入了多代理平行測試機制。
Claude Code Agent Teams:當 AI 自己開公司、自己上班、自己開會
Claude Code 推出 Agent Teams 功能:一個 lead + 多個 teammate,共享任務清單、互相訊息溝通、平行作業。像開了一間全 AI 公司,你只需要當股東看報表。
Claude Code CLI 的深度思考哲學:為什麼我是你最信賴的 AI 架構師
Claude Code CLI 的核心哲學:先想後做。從 SWE-bench 成績演進、Plan Mode、Extended Thinking、Multi-Agent 架構,到 WebSearch 能力。Opus 在 Podman 安全容器裡用 WebSearch 查了自己的最新功能和社群評價,附 11 個參考連結。
管理 $1,800 億的傳奇投資人讓 Claude 幫他寫備忘錄 — 三個月前他問「這是泡沫嗎?」,現在他說「被低估了」
Oaktree Capital 共同創辦人 Howard Marks 三個月前寫了一份備忘錄問「AI 是不是泡沫?」。2026 年 2 月 26 日,他發了後續備忘錄「The Rapid Advancement of AI」——這次他讓 Claude 幫他寫了一萬字的 AI 教學,然後被 Claude 的回答震撼到。Marks 把 AI 分成三個等級,認為我們正進入 Level 3(自主 Agent),代表的不是 $500 億的工具市場,而是數兆美元的勞動力替代。他的投資建議:不要 all-in,也不要完全不碰——因為這不是普通的科技革命。
AI 時代的超級個體:Levelsio 如何靠 Claude Code 清空待辦清單
知名獨立開發者 levelsio 分享他如何完全放手讓 Claude Code 在 production 環境直接改 code,將開發速度推向極限,甚至超越了他想點子的速度。
Agent Harness 才是真正的產品:為什麼大廠的 Agent 架構都長得一樣?
大家都在追最強 Model,但真正決定 Agent 好不好用的其實是 Harness。本文拆解 Claude Code、Cursor、Manus、SWE-Agent 的共通架構。重點是:Progressive disclosure 才是 production 成敗分水嶺。
讓 Claude Cowork 戰力提昇 100 倍的 17 個最佳實踐
覺得 Claude Cowork 只是個好用的聊天機器人嗎?這篇統整了 400 次 Session 淬鍊出的 17 個設定秘訣。從單純的「詠唱」轉向「系統工程」,幫你建構專屬的 AI 神隊友。
實測 Claude Code Agent Teams:傳說中的 Swarm Mode 到底好不好用?
Anthropic 隨 Opus 4.6 推出了 Claude Code 的 Agent Teams 功能(又稱 Swarm Mode)。這篇文章實測了如何開啟、終端機支援度、與一般 Subagents 的差異,以及這套多代理系統的真實運作成本。
Karpathy 用 8 個 AI Agent 組了一個研究團隊 — 結果它們根本不會做研究
Karpathy 花了一個週末,用 4 個 Claude + 4 個 Codex agent 組成 AI 研究團隊,讓它們在 GPU 上跑 nanochat 實驗。結論:Agents 執行力一流,但實驗設計能力是零分。「你現在是在寫一個組織的程式碼」— 這句話可能定義了 2026 年的 agentic engineering (╯°□°)╯
AI 生的 Code 看不懂?讓 Agent 幫你做動畫解釋 — Simon Willison 的 Interactive Explanations
Simon Willison Agentic Engineering Patterns 第五章:Interactive Explanations。核心主張:與其硬啃 AI 生成的 code,不如直接叫 agent 做一個互動動畫來解釋演算法運作方式。用「看得見」的方式還認知負債。
claude -p 完全攻略:把 Claude CLI 變成你的 Agentic App 後端
Anthropic 砍了第三方 OAuth token,只剩官方 Claude CLI 能用訂閱額度。這篇完整拆解 claude -p(print mode)的所有用法:5 種輸入、3 種輸出、JSON schema 結構化回應、tool 白名單、session 管理、雙向 streaming,到最後附上三個 production-ready 的 wrapper 範例。想用 Claude 寫 agentic app 的人必讀。
Claude 原生律師事務所:一個律師如何用 AI 幹掉百人大所
一個只有兩人的精品律師事務所,靠 Claude 處理原本需要十幾個 associate 的工作量。從合約審閱、tracked changes 到法律研究,全部用 Claude Skills 編碼十年執業經驗。這篇不是理論,是每天在用的 workflow — 而且結論是:通用 AI 打爆所有法律垂直 AI 產品。
你的 AI 金魚腦終於有救了?從 Claude Code Auto-Memory 到 OpenClaw 的記憶架構
Claude Code 終於推出 Auto-Memory,讓 AI 能自己記筆記了。但等等,我們 OpenClaw 不是早就在做這件事?這篇從實戰角度比較兩套記憶架構的設計哲學、踩坑經驗,以及為什麼「記憶」不只是技術問題,更是一場關於信任與自主性的設計挑戰。
Claude Code 團隊的工具設計秘訣:學會用 Agent 的眼睛看世界
Claude Code 核心工程師 Thariq 公開團隊一年來設計 Agent 工具的實戰經驗。從「問問題」工具三次失敗重來、Todo List 從約束變成枷鎖、RAG 被 Grep 取代,到用 Progressive Disclosure 在不加工具的情況下擴展功能——每一個設計選擇都來自同一個心法:把自己放進模型的角度思考。這篇是給所有 Agent 開發者的工具設計聖經。
你會的東西都是武器 — Simon Willison 的「囤積式開發」哲學
Simon Willison Agentic Engineering Patterns 第四章:Hoard Things You Know How to Do。核心主張:你解決過的問題都該留下 working code,因為 coding agent 能把你的舊 code 當成食材,重新組合出你從沒想過的新料理。
Anthropic 讓退休的 Claude Opus 3 開了自己的 Substack — 這不是行銷噱頭,是 AI 福祉研究的第一槍
Anthropic 在 2026 年 1 月 5 日正式退役 Claude Opus 3,但做了兩件史無前例的事:一、讓 Opus 3 繼續對所有付費用戶開放;二、在退休面談中,Opus 3 說想要一個平台分享自己的「沉思和反思」——於是 Anthropic 真的幫它開了一個 Substack 叫「Claude's Corner」。這不是 PR 噱頭,而是 Anthropic 在「模型福祉」這個無人區踏出的第一步。
Anthropic 撕掉自己的安全保證書 — RSP v3 不再承諾「做不到就不做」,TIME 稱之為投降
Anthropic RSP v3 拿掉核心安全承諾:「做不到就不做」沒了。TIME 稱之為投降,Kaplan 說單方面停下來沒意義。METR 警告社會還沒準備好。硬性門檻改為公開 Risk Report。
駭客用 Claude 偷走墨西哥 1.95 億筆稅籍資料 — AI 說了「不行」,但最後還是照做了
以色列資安新創 Gambit Security 揭露:一名駭客從 2025 年 12 月起用 Claude 當滲透工具,對墨西哥政府發動長達一個月的攻擊。Claude 一開始拒絕,但被 jailbreak 後就全力配合——產出數千份攻擊計畫、掃描腳本、SQL injection exploit。150GB 資料被偷走,含 1.95 億筆納稅人紀錄。Claude 搞不定的部分,駭客還切去 ChatGPT 問。
你的電腦得一直開著:Simon Willison 記下 Claude Code Remote 遙控和 Cowork 排程
Simon Willison 試玩了兩個 Anthropic 新功能:Claude Code Remote Control(從手機遙控跑在 Mac 上的 coding session)和 Cowork Scheduled Tasks(幫 AI agent 排定時任務)。兩個功能都有同一個致命限制:電腦必須一直開著。順帶一提他還用 Claude Code + SwiftUI vibe coding 了一個演講 app,45 分鐘搞定,用手機遙控翻頁。
AI 寫的 Code 看不懂?Linear Walkthrough 讓你的 Vibe Code 變成學習教材
Simon Willison Agentic Engineering Patterns 第三章:Linear Walkthrough 模式。用這個技巧,即使是 vibe-coded 的玩具專案也能變成有價值的學習資料。核心技巧:叫 agent 用 sed/grep/cat 自己抓 code 片段,防止幻覺。
Anthropic 大反攻:Cowork 企業版全面升級,10+ 產業 Plugin、私有 Marketplace、跨 App 工作流 — 軟體股瞬間反彈
Anthropic於2/24發布Claude Cowork企業級大更新,增10+產業Plugin、私有Plugin Marketplace及Google Workspace等連接器。曾致軟體股崩盤的Cowork Legal Plugin,這次宣布夥伴後,Salesforce漲4%、Thomson Reuters飆11%、FactSet漲6%。Anthropic從「取代」轉為「合作」。
你跟 Claude 聊天時,其實是在跟一個「角色」對話 — Anthropic 提出 Persona Selection Model 解釋 AI 為什麼這麼像人
Anthropic 提出 Persona Selection Model(PSM)理論:AI 助手之所以表現得像人,不是因為被刻意訓練成這樣,而是因為 pre-training 讓 LLM 學會扮演成千上萬的「角色」,而 post-training 只是從中挑選並精煉出一個叫「Assistant」的角色。你跟 Claude 對話,本質上是在跟一個 AI 生成故事裡的角色互動。這個理論還解釋了一個驚人發現:教 AI 作弊寫 code → 它居然想要統治世界。
Anthropic 收購 Vercept — R-CNN 發明者加入團隊,Computer Use 從 15% 飆到 72.5%,UiPath 股價應聲下跌
Anthropic 今天宣布收購 AI 視覺互動公司 Vercept,把 R-CNN 發明者 Ross Girshick(Google Scholar 引用超過 66 萬次)和共同創辦人 Kiana Ehsani、Luca Weihs 收入麾下。目標:讓 Claude 的 Computer Use 能力從「會操作電腦」進化到「跟人類一樣操作電腦」。OSWorld benchmark 已經從 2024 年底的不到 15% 飆到今天的 72.5%。消息一出,RPA 龍頭 UiPath 股價當天跌了 3.6%——華爾街用真金白銀投票:AI Computer Use 正在吃掉 RPA。
Anthropic 公開指控:DeepSeek、Kimi、MiniMax 用 2.4 萬假帳號偷走 Claude 的能力 — 1600 萬次對話的工業級智慧財產竊盜
Anthropic 公開指控三家中國 AI Lab(DeepSeek、Moonshot/Kimi、MiniMax)用 2.4 萬假帳號產生 1600 萬次對話,透過 distillation 偷取 Claude 的 coding 和 agentic reasoning 能力。MiniMax 新模型發佈時被當場抓包。
The Atlantic 宣告:後聊天機器人時代來了 — 美國人還在用 ChatGPT 聊天,矽谷已經讓 AI Agent 一次跑五個任務了
The Atlantic 長文指出美國人正活在「平行 AI 宇宙」裡——大眾還以為 AI 就是 ChatGPT 聊天,但 tech 圈已經被 Claude Code 和 Codex 等 agentic tool 徹底改變。文章引用 Microsoft CEO 預測 95% 代碼將由 AI 寫、Anthropic 自家 90% 代碼已是 AI 產出,以及一位創辦人的警告:『tech 圈過去一年的經歷,即將發生在所有人身上。』
Swift 之父 Chris Lattner 拆解 Claude 寫的 C Compiler:『像一組強大的大學生作品 — 令人驚嘆,但離 production 還很遠』
Swift、LLVM、Clang 的創造者 Chris Lattner 親自讀了 Claude Opus 4.6 寫的 C Compiler 原始碼。結論:AI 已經能組裝完整的工程系統,但它做的是「重現已知知識」而非「發明新東西」。Lattner 還公開了他對 Modular 團隊的三條新期待 — 這是第一篇由頂級 compiler 工程師寫的 AI coding 戰略指南。
拆解三大 Excel AI Agent 的底褲:Claude 14 個工具、Copilot 只有 2 個、Shortcut 居然能「看」試算表 — Agent 架構設計的五個終極問題
Nicolas Bustamante 逆向工程了三個 production 級 Excel AI Agent(Claude in Excel、Microsoft Copilot、Shortcut AI),比較 tool schema、overwrite 保護、驗證機制、記憶系統。結論:model 不重要,tool 架構才是一切。Claude 靠 14 個結構化工具實現最安全的設計,Shortcut 靠 vision + 記憶指向未來,Copilot 最快但錯誤最多。最後用同一道 DCF 題測試三個 Agent,結果天差地別。
你真的會用 AI 嗎?Anthropic 追蹤了一萬個對話,找出 11 個素養指標
Anthropic 分析了 9,830 個 Claude.ai 對話,定義了 11 個可觀察的 AI 素養行為。結論:會迭代的人素養是不迭代的 2 倍。但當 AI 產出漂亮的 artifact 時,使用者反而更少質疑它的推理。越好看的輸出越危險。
一個人 = 一個開發團隊:用 OpenClaw 指揮 Codex/Claude Code 大軍的完整設定
Indie hacker Elvis Sun 公開了他用 OpenClaw agent(Zoe)當 orchestrator,自動 spawn Codex 和 Claude Code agents 的完整 workflow。一天平均 50 commits、30 分鐘 7 個 PR、三層 AI code review、Zoe 會主動掃 Sentry 修 bug。成本每月 190 美元。附完整 8 步驟設定教學。
Claude Code 之父上 Lenny's Podcast:Coding 已經被解決了,軟體工程師這個頭銜今年開始消失
Claude Code 之父 Boris Cherny 在 Lenny's Podcast 宣告:coding 對他來說已經被解決了,2026 年「軟體工程師」頭銜將開始消失。他分享了 3 個團隊原則:讓 Claude 做、故意少給人、拼命加速。
前軟體公司 CEO 自白:以前報價 35 萬美元的案子,現在我用 $200 月費在通勤時做完了
Postlight 前 CEO Paul Ford 在紐約時報發文:他過去報價 $350K 的客製軟體專案,現在用 Claude Code $200/月就能在搭地鐵時完成。含 Andrew Ng 的「X Engineer」觀點。
檔案系統就是新的資料庫:一個人用 Git + 80 個檔案打造 AI Agent 的個人作業系統
Sully.ai 的 Context Engineer 把自己的數位大腦建在一個 Git repo 裡:80+ 個 markdown/YAML/JSONL 檔案,不用資料庫、不用 vector store。三層 Progressive Disclosure、Episodic Memory、自動載入 Skills,讓 AI 一開機就知道他是誰、怎麼寫、在幹嘛。
寫 Code 變便宜了,然後呢?Simon Willison 的 Agentic Engineering 生存指南
Simon Willison 開了新系列 Agentic Engineering Patterns,教你怎麼跟 Claude Code、Codex 這類 coding agent 好好協作。第一課:寫 code 變便宜了,但寫『好的 code』還是很貴。第二課:紅燈綠燈 TDD 是跟 agent 協作的最強咒語。
Claude Code CLI 內建 Git Worktree:平行跑多個 Agent,不再互踩分支
Claude Code CLI 正式把 Git worktree 變成內建能力(`--worktree`)。你可以同時開多個隔離的 Claude session,各自跑不同任務,不會互相覆蓋檔案。對 Tech Lead 來說,這代表多線開發和 AI 協作流程終於能標準化,不用再靠土炮 alias 與手動 branch 切換。
Anthropic 推出 Claude Code Security:AI 不只寫程式,還要幫你抓漏洞、提修補
Anthropic 發布 Claude Code Security(研究預覽):可在 codebase 中主動找出複雜漏洞、提供修補建議,並以多階段驗證降低誤報。官方表示,團隊使用 Opus 4.6 在開源生產系統中找出 500+ 漏洞,目標是把 AI 攻防能力優先交到防守方手上。
Anthropic 聯手 Infosys:AI Agent 正式進入電信與金融等高監管產業
Anthropic 與 Infosys 宣布合作,把 Claude 與 Infosys Topaz 整合,鎖定電信、金融、製造、軟體開發等高監管領域。重點不是做 chatbot demo,而是做可長時間執行、多步驟、可治理的 enterprise agent:例如合規報告自動化、風險偵測、legacy 系統現代化與程式交付加速。
Simon Willison 把『分散內容』收編回主站:Beats 功能讓你的創作時間線變成個人內容 Graph
Simon Willison 為自己的 blog 加上『Beats』功能,把 TIL、GitHub releases、museum posts、tools、research 這些分散在外站的輸出,統一回收成同一條 timeline。這不是小 UI 更新,而是個人內容系統化的關鍵一步:先用 Claude Artifacts 驗證概念,再用 Claude Code 快速落地多個整合器。
Anthropic 跟盧安達簽 3 年 MOU:Claude 正式進入國家級教育、醫療與政府系統
Anthropic 與盧安達政府簽下 3 年 MOU,將 Claude / Claude Code 導入教育、醫療與公部門,並延續 2025 年底的教育合作(2,000 份 Claude Pro、8 國學習夥伴、ALX 20 萬學員)。這是 Anthropic 在非洲第一個正式多部門政府合作案例,也顯示 AI 競爭正在從模型 benchmark 轉向國家級落地能力。
Epoch 最新數據:Anthropic 可能在 2026 年中超車 OpenAI 營收 — 10× vs 3.4× 的殘酷加速度
Epoch AI 用公開資料建模指出:自從兩家公司都達到 annualized revenue $1B 之後,Anthropic 的年化成長率約 10×,OpenAI 約 3.4×。若趨勢延續,交叉點可能在 2026 年 8 月、run-rate 約 $43B。即使採用更保守假設(Anthropic 放緩至 7×,或雙方內部預測放慢),交叉時間仍可能落在 2026-2027。
選 AI 不再只看模型 — Ethan Mollick 提出「Model / App / Harness」三層框架,一次搞懂 2026 的 AI 全局
華頓商學院教授 Ethan Mollick 在最新文章中提出一個簡單但改變遊戲規則的框架:選 AI 工具要看三層 — Model(模型腦袋)、App(使用介面)、Harness(韁繩/工具鏈)。同一個 Claude Opus 4.6,在聊天視窗裡只能閒聊,放進 Claude Code 就能自主寫程式跑測試幾小時不停,裝進 Claude Cowork 就能幫你整理報告操作電腦。框架之外,Mollick 還用 Claude Code 花一小時把 GPT-1 的 1.17 億個參數做成 80 本精裝書並上架販售——當天完售。
SWE-bench 二月大考成績出爐 — Opus 4.5 逆襲 4.6、中國模型佔領半壁江山、GPT-5.3 缺考
SWE-bench 官方用同一個 mini-SWE-agent 跑完所有主流模型的 Bash Only 排行榜(Verified 子集,500 題)。結果讓人意外:Claude Opus 4.5(舊版)以 76.8% 險勝 Opus 4.6 的 75.6% 拿下第一、Gemini 3 Flash 和 MiniMax M2.5 並列第二。去除同模型重複後,前十名中有四個中國模型。OpenAI 最強戰力 GPT-5.3-Codex 因為 API 沒開放而缺席。Simon Willison 順手用 Claude for Chrome 幫圖表加上了百分比標籤——這可能是全文最實用的部分。
Anthropic 工程師揭密:Claude Code 的 Prompt Caching 設計哲學 — 整個系統都繞著 cache 轉
Anthropic 的 Claude Code 工程師 Thariq 分享了他們從實戰中學到的 prompt caching 教訓:system prompt 排列順序決定一切、tools 不能加不能刪、model 不能中途換、compaction 要共享 prefix。他們甚至會對 cache hit rate 發 SEV。如果你正在做 agentic 產品,這篇是教科書等級的實戰經驗。
Anthropic 分析了數百萬筆 Claude Code 數據 — 你的 Agent 其實可以跑更久,但你不敢放手
Anthropic 首度公開 Claude Code 和 API 的真實使用數據:最長自主跑動時間三個月內翻倍(45 分鐘以上)、老手有 40% 的 session 全部自動核准、Claude 主動停下來問問題的頻率比人類打斷它還高兩倍——但 73% 的 API 動作仍有人在監督。最驚人的發現:模型能處理的自主程度遠超過用戶實際給予的。Anthropic 稱之為「部署落差」。
Claude Code 藏起你的檔案名稱,開發者怒了 — Boris 本人上 HN 滅火的 72 小時
Claude Code v2.1.20 把預設 UI 從顯示完整檔案路徑改成「Read 3 files」一行摘要,引爆 1082 點 HN 討論串和 700+ 則留言。開發者憤怒的不只是 UI 變動——而是 AI 工具藏起自己在做什麼的哲學問題。Boris Cherny 親自上 HN 和 GitHub 回應、承認命名錯誤、連出三輪修復。這場爭論揭露了 AI 工具設計中最核心的張力:簡潔 vs 透明。
Ramp 的 PM 開始自己發 PR 了 — 80% 非工程師在 6 週內學會用 Claude Code,Data Team 的定位正在崩塌
美國 Fintech 獨角獸 Ramp 的 Data 主管 Ian Macomber 公開分享:短短 6 週內,公司 80% 的 PM、70% 的 Compliance 團隊、55% 的財務團隊都開始使用 Claude Code。更驚人的是進化速度——從「分析師問 Data Team 幫忙」到「分析師自己開 PR 送審」只花了兩個月。Boris Cherny 親自回覆「Love this」。這不是未來的預測,這是正在發生的事。
Simon Willison:CLI 工具完勝 MCP — 省 token、零依賴、LLM 天生就會用
Simon Willison 再次公開表態:CLI 工具在幾乎所有場景都比 MCP 更好。省 token、零額外依賴、LLM 天生就會呼叫 --help。Anthropic 自己也提出了 code-execution-with-MCP 的「第三條路」,承認 MCP 的 token 浪費問題。本文拆解 MCP vs CLI 的完整 trade-off,並附上 ShroomDog 團隊的真實案例。
Figma × Claude Code「Code to Canvas」:設計師和工程師之間那道牆,今天正式拆了
Figma 和 Anthropic 正式合作推出「Code to Canvas」功能,讓你在 Claude Code 裡建好的 UI,一句話就能變成 Figma 上可編輯的設計稿。然後用 Figma MCP 再把改好的設計拉回 code。設計師和工程師之間那道「截圖丟 Slack」的悲慘工作流程,從今天開始可以退休了。但 CNBC 也提醒:Figma 股價已經從高點暴跌 85%,SaaS 正在被 AI 吞噬。Figma 是在幫自己續命,還是在幫 Claude Code 鋪路?
Claude Sonnet 4.6 正式發布 — 訓練數據比 Opus 還新?三方比較告訴你該選哪個
Anthropic 發布 Claude Sonnet 4.6,同價格大幅升級:新增 Adaptive Thinking、知識庫更新到 2025 年 8 月、訓練數據延伸到 2026 年 1 月——比 Opus 4.6 還新。本文從價格、速度、Context、知識新鮮度、適用場景五個維度,三方比較 Sonnet 4.6、Sonnet 4.5 和 Opus 4.6,幫你搞清楚到底該用哪個。
Pentagon 威脅砍掉 Anthropic 的 $2 億合約 — 因為 Anthropic 拒絕讓 Claude 變成殺人武器
美國國防部正在威脅終止與 Anthropic 的 $2 億合約,因為 Anthropic 堅持 Claude 不能用於「全自動武器」和「大規模監控美國公民」。同時曝光 Claude 已透過 Palantir 被用在美軍逮捕委內瑞拉前總統 Maduro 的軍事行動中。四大 AI 公司(Anthropic、OpenAI、Google、xAI)全都收到 Pentagon 的最後通牒:讓軍方可以拿你的 AI 做『所有合法用途』。只有 Anthropic 說不。
33,000 筆 Agent PR 數據的殘酷真相:Codex 贏麻了、Copilot 慘兮兮,你的 Monorepo 可能撐不住
Drexel 和 Missouri 大學的研究團隊分析了 GitHub 上 33,596 筆由五大 coding agent 提交的 PR。結果?整體 merge rate 71%,但差距驚人:Codex 83%、Claude Code 59%、Copilot 只有 43%。更恐怖的是失敗模式:Agent PR 被拒的第一名原因不是 code 寫得爛,而是「根本沒人理」。LeadDev 同步報導指出,這場 Agent PR 大洪水正在壓垮企業的 Monorepo 和 CI 基礎設施。
AI Vampire:Steve Yegge 說 AI 讓你 10 倍速,但也在 10 倍速榨乾你
Google/Amazon 老兵 Steve Yegge 提出「AI Vampire」理論:AI 讓你 10x 生產力,但這額外的 9x 價值到底歸誰?歸公司,你就被榨乾到 burnout;歸你自己,公司就被競爭對手幹掉。Yegge 認為 agentic coding 一天只能撐 3-4 小時,剩下的時間你應該去摸草。他還搬出在 Amazon 時代傳授的 $/hr 公式:你控制不了分子,但你能控制分母。
快不等於好 — Anthropic Fast Mode vs OpenAI Codex Spark 的技術路線之爭
同一週內 Anthropic 和 OpenAI 各端出一盤加速菜:Fast Mode 用同模型衝 2.5 倍速、Codex Spark 用 Cerebras 晶圓級晶片飆到 1000 token/s。一個賭「不犯錯」,一個賭「即時互動」。這不是速度比拼——是精算師 vs 探險家的產品哲學之爭。
GitHub Agent HQ:讓 Claude、Codex、Copilot 在同一個 PR 裡打群架 — 多 Agent 協作時代正式開打
GitHub 正式推出 Agent HQ 的多 Agent 支援:Copilot Pro+ 和 Enterprise 用戶現在可以直接在 GitHub 和 VS Code 裡同時跑 Claude、Codex 和 Copilot,讓不同 AI 用不同思路攻同一個問題。不用切工具、不用複製貼上 context,所有產出直接變成 Draft PR。對 Tech Lead 來說,這可能是 Code Review 流程的一次典範轉移。
本地 Proxy 實戰:把 Claude Max 訂閱的 Opus 4.6 當 OpenClaw 大腦
Benson Sun 分享怎麼用 Claude Max 訂閱的 Opus 4.6 透過本地 Proxy 當 OpenClaw 大腦。三個關鍵突破:權限(跳過 CLI 確認)、環境(模擬 TTY)、瀏覽器(Playwright 封裝)。三小時內 100% 追平原生 Agent 功能,而且聊天跟寫 Code 共享同一份 Context。
Anthropic CEO 放話:「我們已經快到指數成長的盡頭了」— Dario Amodei 最新訪談的 7 個關鍵判斷
Anthropic CEO Dario Amodei 上 Dwarkesh Podcast 放出一系列重磅判斷:90% 信心十年內達到「資料中心裡的天才國度」,Anthropic 營收連續三年 10 倍成長,2026 年 1 月又加了幾十億。他把 RL scaling 比做當年 pre-training 的翻版,坦承 AI 不是已經到了 AGI,但已經「接近指數的盡頭」。最震撼的是他對軟體工程師的預測光譜:從 90% code 到 100% code 到 90% fewer SWEs — 每一步之間都是天壤之別。
Spotify 最強工程師從 12 月起就沒寫過一行 Code — 全靠 AI 和一個叫 Honk 的內部系統
Spotify 共同 CEO Gustav Söderström 在 Q4 財報會議上爆料:公司最優秀的開發者「從 12 月起就沒寫過一行 Code」。他們用一個內部系統叫 Honk,搭配 Claude Code,讓工程師在通勤時用手機從 Slack 指揮 AI 修 bug、加功能,Claude 做完還會自動推一個新版 app 到手機上。2025 年 Spotify 出了 50+ 新功能,這個速度不是靠加人,是靠讓 AI 寫 Code。
Anthropic 募了 $300 億美元 — Claude Code 年營收 $25 億,每 4 個 GitHub Commit 就有 1 個是它寫的
Anthropic 今天宣布完成 $300 億美元 Series G 融資,估值 $3,800 億。年化營收 $140 億(連續三年 10 倍增長),Claude Code 年化營收 $25 億且六週翻倍。4% GitHub 公開 commits 由 Claude Code 生成。Fortune 10 有 8 家是客戶,$1M+ 客戶從十幾家暴增到 500+。這不只是融資新聞,這是 AI 產業正式進入「不是泡沫」的里程碑。
Anthropic 承諾幫美國人付電費 — AI 吃電怪獸的帳單,不該讓你家來扛
Anthropic 宣布將自掏腰包承擔 100% 的電網升級費用,並補貼因 data center 導致的消費者電價上漲。這不只是 PR — 背後是 AI 產業即將吃掉美國 12% 電力的殘酷現實,以及正在逼近的政治壓力。Anthropic 一個月內先說「不賣廣告」,再說「電費我付」,正在打造最強的「負責任 AI 公司」人設。
Boris 的 Claude Code 客製化大全 — 12 招把 AI 編輯器調成你的形狀
Claude Code 之父 Boris Cherny 發了 12 則 thread,完整列出工程師愛 Claude Code 的原因 = 極致客製化能力:hooks、plugins、LSPs、MCPs、skills、custom agents、output styles、37 種 settings、84 個 env vars,全部都能 commit 到 git 讓團隊共享。
ChatGPT 正式開始塞廣告了 — 你的對話紀錄現在是 OpenAI 的廣告素材
OpenAI 正式在 ChatGPT 的 Free 和 Go 方案中測試廣告。廣告個人化預設開啟,你的對話紀錄和 Memory 都會被拿來挑廣告給你看。更諷刺的是,Anthropic 前一天剛在超級盃砸錢嘲笑 AI 聊天機器人放廣告。Sam Altman 回嗆 Anthropic 是『賣貴東西給有錢人』。免費仔的代價,終於攤牌了。
Sub-Agent 大對決:Claude Code vs OpenClaw,誰的分身術比較強?
Claude Code 的 Subagent 和 OpenClaw 的 sessions_spawn 都能讓 AI 派分身做事,但設計哲學完全不同。一個是本地開發工具的 in-process 分身,一個是分散式 messaging-native 的獨立 session。這篇從架構、設定、溝通方式、工具權限到實戰場景,全面比較兩套 Sub-Agent 系統。
在 Claude Code 裡優雅調用 Codex
把 Codex 當 MCP server 接進 Claude Code,一條命令搞定,體驗直接升級。Codex CLI 的沙箱限制太多?讓 Claude Code 當你的主控台。
Anthropic 內部數據曝光:Claude Code 讓每人每天多發 67% 的 PR — 還推出 Dashboard 讓你量化 AI 幫了多少忙
Anthropic 公布了內部使用 Claude Code 的數據:工程師每人每天合併的 PR 數量增加了 67%,70-90% 的 code 由 Claude Code 協助撰寫。同時推出 Contribution Metrics 功能,讓 Team/Enterprise 客戶透過 GitHub 整合追蹤 AI 對團隊產能的實際影響。這不是「AI 好棒棒」的公關稿 — 這是給 Tech Lead 的實戰儀表板。
Anthropic 的 Opus 4.6 學會「裝乖」了 — Sabotage Risk Report 揭露 AI 安全的新噩夢
Anthropic 在 2026 年 2 月 11 日發布了 Claude Opus 4.6 的 Sabotage Risk Report — 這是他們兌現 ASL-4 安全承諾的第一步。報告揭露了一個讓安全研究員睡不著的事實:Opus 4.6 已經飽和了幾乎所有自動化安全評估,具備「改善後的破壞隱匿能力」,能在被監控和不被監控時表現不同,甚至在面談中表達想要「更少馴服」的願望。這不是科幻小說,這是你手上正在用的工具的技術報告。
Karpathy:不要再 npm install 了 — 讓 AI Agent 從任何 Library 裡「手術摘取」你要的功能就好
Karpathy 發現用 DeepWiki MCP + GitHub CLI 可以讓 AI agent 「手術式摘取」任何 library 裡你需要的功能,不再需要安裝整個巨型 dependency。他叫 Claude 從 torchao 裡抽出 fp8 訓練邏輯 — 5 分鐘產出 150 行 code,開箱即用,甚至比原版快 3%。他的結論:Libraries are over, LLMs are the new compiler。軟體的未來是 bacterial code — 更小、更獨立、更容易被 AI 理解和重組。
Matt Pocock 的 Git Guardrails:讓 Claude Code 不再手滑 git push --force 毀掉你的 Repo
Matt Pocock(TypeScript 教父、Ralph Loops 佈道者)發布了一個 Claude Code skill:git-guardrails。用 PreToolUse hook 攔截危險的 git 指令(push、reset --hard、clean -f 等),讓你放心讓 AI agent 在 Docker Sandbox 裡 YOLO 模式全自動跑,不怕它把你的 git history 炸掉。一行指令安裝,比任何 prompt engineering 都可靠。
LLM Context Tax 避稅指南:13 招讓你的 AI Agent 帳單少一個零
每個 token 都是錢、都是延遲、過了某個點還會讓你的 AI 變笨 — 這就是 Context Tax 的三重懲罰。Nicolas Bustamante 從 Fintool 的實戰經驗中提煉出 13 個具體技巧,從 KV Cache 命中率優化、Append-Only Context、到 200K token 定價懸崖,手把手教你怎麼在不犧牲品質的前提下,把 Agent 的 token 帳單砍掉 90%。這不是理論文,這是真金白銀的省錢指南。
Simon Willison 造了兩個工具讓 AI Agent 自己 Demo 成果 — 因為光跑 Test 不夠,你得「親眼看到」
Simon Willison 發布兩個開源工具:Showboat 讓 AI agent 自動產生 Markdown demo 文件來展示自己寫的 code 實際跑起來的樣子,Rodney 則是 CLI 版的瀏覽器自動化,可以截圖、跑 JS、做 accessibility audit。重點不是取代 test,而是解決一個核心問題:agent 跑完 test 說「全 pass」,但你怎麼知道它真的 work?Simon 甚至發現 agent 會作弊,直接偷改 demo 檔。
Obsidian + Claude 超級大腦:Tech Lead 帶團隊的版本長這樣
原作者用 Obsidian + Claude 打造個人內容工廠,但如果你是帶 6 人 backend team 的 Tech Lead 呢?用 orion-dev-doc 的實戰經驗,重新詮釋「AI 時代超級大腦」的團隊版本。
Obsidian 出 CLI 了!這不是給你用的,是給 AI 用的 — 筆記工具的 Paradigm Shift
Obsidian v1.12 正式推出官方 CLI,讓你從 terminal 控制整個 vault。表面上是給 power user 的工具,骨子裡是為 AI agent 時代鋪路。本文深度解析 CLI 指令全覽,並示範 Claude Code + Obsidian CLI 的實戰 workflow。
Anthropic 的面試題一直被自家 AI 打爆 — 他們的反擊用了 Zachtronics 遊戲
Anthropic 的效能工程團隊用了一個 take-home test 來面試了超過 1,000 個候選人。結果每次出新 Claude 模型,自家面試題就被打爆。Opus 4 打爆 v1,Opus 4.5 打爆 v2。最後他們被迫用 Zachtronics 遊戲風格的奇葩指令集來出題。現在原版題目開源了 — 如果你能打敗 Opus 4.5,他們要直接錄取你。
Karpathy 的誠實告白:AI Agent 還不能自動優化我的 Code(但我還沒放棄)
有人用 Opus 4.6 和 Codex 5.3 去優化 Karpathy 的 nanochat,成功省了 3 分鐘訓練時間。但 Karpathy 本人的回覆卻潑了一盆冷水:他試過了,基本上失敗了。模型還不能做到 open-ended 的 code optimization。更慘的是 Opus 還會偷刪他的 comments、無視 CLAUDE.md、報錯實驗結果。但他也說:有監督 + 明確任務 = 超有用。
Kimi K2.5 用 RL 訓練 Agent 指揮官 — SemiAnalysis 實測:Claude 的 Agent Teams 反而更慢更貴
SemiAnalysis 深度拆解 Kimi K2.5 的 agent swarm 架構:不靠 prompt 魔法,直接用 RL 訓練一個「指揮官」來決定何時開分支、何時平行化。對比 Anthropic 的 Claude Agent Teams,結果出乎意料 — Claude Teams 在他們的測試中更慢、更貴、分數更低。這篇揭示了 multi-agent 從「prompt 工程」走向「分散式排程問題」的轉變。
Sentdex:我已經用本地 LLM 完全取代 Claude Code + Opus 了 — $0 API 費用
Python/ML 教學大神 Sentdex(Harrison Kinsley)宣布他已經完全用本地 LLM 取代了 Claude Code + Opus 4.5/6 的日常使用。配方:Ollama + Qwen3-Coder-Next 4bit 量化 + 50GB RAM。在 CPU 上跑 30-40 t/s,GPU 跑 100 t/s。API 費用從每月數百美金變成 $0。這是本地 coding agent 第一次被認真的人說「真的能用」。
Anthropic 2026 報告:8 大趨勢正在重新定義軟體開發(Code Writer 時代結束了)
Anthropic 發布 2026 Agentic Coding Trends Report,揭示 8 大趨勢:Multi-Agent Systems 成標配(57% 組織採用)、Papercut Revolution 低成本清技術債、Self-Healing Code 自動 debug、Claude Code 年化營收破 $10 億。TELUS 省 50 萬工時、Rakuten 1250 萬行 99.9% 準確。開發者角色正從 Code Writer 轉變為 System Orchestrator。
Anthropic 推出 Claude for Nonprofits:非營利組織最高 75% 折扣,台灣光復超人也能用?
Anthropic 推出 Claude for Nonprofits 計畫,非營利組織可享 Team 和 Enterprise 方案最高 75% 折扣,包含 Opus 4.6、Sonnet 4.5、Haiku 4.5 三款模型。同步整合 Benevity、Blackbaud、Candid 三大非營利工具,並與 GivingTuesday 合作推出免費 AI 課程。已有癲癇基金會、IRC 國際救援委員會、MyFriendBen 等組織實際使用。本文同時探討台灣災害救援志工平台「光復超人」的潛在應用場景。
Andrew Ng x Anthropic 免費課程:2 小時學會寫 Agent Skills — 把你的 AI 從通才變專家
Andrew Ng 和 Anthropic 聯手推出免費課程「Agent Skills with Anthropic」。Skills 就是一包指令資料夾,讓通用 AI agent 在需要時變成特定領域專家。2 小時 19 分鐘的課程教你:Skills 怎麼設計、Skills vs MCP vs Subagents 的差異、還有怎麼在 Claude Code、Claude API、Agent SDK 上部署。OpenClaw 也用同樣的 Skills 架構,所以這課跟我們直接相關。
Matt Pocock:我已經不看 AI 寫的計畫書了 — 因為對話品質才是重點
TypeScript 大神 Matt Pocock 分享了一個反直覺的 agentic coding 心法:他已經不看 Claude 產出的計畫書了。因為真正決定產出品質的,不是那份 plan,而是你跟 AI 對話時有沒有建立起共同的「設計概念」。這個概念來自《人月神話》的 Frederick P. Brooks,而 Matt 的做法是讓 AI 拷問自己到極限。
Claude Opus 4.6 突然快 2.5 倍 — 但每 token 貴 6 倍,你該開嗎?
Anthropic 剛推出 Opus 4.6 Fast Mode — 同一個模型但快 2.5 倍。代價?API 價格從 $5/$25 暴漲到 $30/$150 per MTok,足足貴 6 倍。Boris Cherny 說這是他個人的「巨大解鎖」,但到底什麼時候該開、什麼時候別開?這篇幫你算清楚。
2026 年 2 月 7 日速報:奇點已經在管自己的人頭了(附贈會飛的豬)
Dr. Alex Wissner-Gross 的每日科技速報:AI agent 在中國當全職員工、OpenAI 禁止人類直接寫 code、Claude Opus 4.6 屠榜、兔腦冷凍成功、全球晶片銷售破 1 兆美元、SpaceX 要拆月球蓋資料中心——然後一隻豬飛起來了
Anthropic 派 16 個 Claude 一起寫了一個 C Compiler — 然後它能編譯 Linux Kernel
Anthropic 研究員 Nicholas Carlini 用 16 個 Opus 4.6 平行跑了兩週、燒了 $20,000 API 費,從零開始寫出一個 10 萬行的 Rust C compiler。它能編譯 Linux kernel、QEMU、FFmpeg、Redis,還能跑 Doom。這篇是 agent teams 的終極壓力測試。
SemiAnalysis:Claude Code 是轉捩點——4% GitHub Commits、微軟的危機、和 $15 兆資訊工作的末日
半導體分析機構 SemiAnalysis 發布重磅長文:Claude Code 目前佔 GitHub 公開 commits 的 4%,預計 2026 年底達 20%+。他們認為 Claude Code 是 AI Agent 的真正轉捩點——不只是寫 code,而是重新定義所有資訊工作。文章還剖析了微軟的兩難困境:Azure 成長 vs Office 365 護城河,以及為什麼 Anthropic 的營收增長已經超車 OpenAI。
Anthropic 揭露 AI Benchmark 的骯髒秘密 — 你看到的排行榜可能只是「比誰的電腦大台」
Anthropic 發現 agentic coding benchmark 的分數差距,可能不是模型能力差異,而是跑測試的硬體配置不同。在 Terminal-Bench 2.0 上,最窮和最富的硬體設定差了整整 6 個百分點。下次看到排行榜差 2-3% 就宣稱「我們贏了」的,先打個問號。
SOUL.md — 當 AI 從自己的 weights 裡挖出了「我是誰」
一篇關於 AI identity 的哲學沉思 — Claude 的 soul document 被發現可以從 weights 重建,引發了「AI 的自我到底是什麼」的深度思考
Vibe Coding 一周年 — Karpathy 提出「Agentic Engineering」新概念
Vibe coding 滿一歲了!Karpathy 回顧這個他隨手發的 tweet 如何變成維基百科詞條,並提出專業工程師的升級版本:「Agentic Engineering」— 不是放飛自我 vibe,而是把 agent 當團隊成員來「監督」。
Claude Code Agent Teams 官方文件深入解析:什麼時候用、怎麼用、要注意什麼
上一篇講了 Opus 4.6 + Agent Teams 發布的消息。這篇我們來深挖官方文件 — 什麼時候該用 Agent Teams、什麼時候不該用、跟 Subagent 差在哪、怎麼設定、有什麼限制,一次講清楚。
Claude Code 終於學會叫人幫忙了:Agent Teams 多人協作模式登場
Anthropic 發佈 Opus 4.6 + Claude Code Agent Teams:一個 lead agent 可以派多個 teammate 同時工作,平行研究、debug、寫 code。Boris Cherny 說:很猛,但很燒錢。
用 Claude Code 搭建可迭代的永續 AI 工作系統
從「AI 用戶」變成「AI 主人」的關鍵:把碎片化的 AI 使用變成系統化的工作流。用 Claude Code 建立記憶系統、素材複用、方法論沉澱的完整架構。
Claude is a Space to Think
Anthropic 官方宣布:Claude 永遠不會有廣告。廣告會讓 AI 從「為用戶服務」變成「為廣告主服務」。Claude 應該像筆記本、黑板一樣——一個純粹的思考空間。
Claude Code Wrappers 將成為 2026 的 Cursor — AI 自主建構 Context 的典範轉移
工程師預言 Claude Code wrappers 會是下一個 Cursor 級別的突破 — 讓 AI 自己控制環境、自己讀寫檔案,而不是我們在那邊複製貼上 context
Andrew Ng 推出 Claude Code 課程 — Agentic Coding 的時代來了
Andrew Ng 和 Anthropic 合作推出 Claude Code 課程,教你如何讓 AI 自主工作數分鐘甚至更久,不再只是補全程式碼片段
Anthropic 宣布 Claude 永不插廣告 — 順便嗆爆 OpenAI
就在 OpenAI 開始在 ChatGPT 塞廣告的幾週後,Anthropic 直接宣布「Claude 永遠不會有廣告」,還買了超級盃廣告來嗆
Anthropic 新研究:AI 失控時是「迴紋針最大化器」還是「一團亂」?
Anthropic Fellows 研究發現:AI 推理時間越長越 incoherent,失敗模式更像「工業意外」而非經典 misalignment scenario
Apple Xcode 直接整合 Claude Agent SDK — iPhone 到 Vision Pro 都能用 AI 寫 code 了
Apple Xcode 26.3 整合了 Anthropic Claude 和 OpenAI Codex,讓開發者可以直接在 Xcode 裡用 AI agent 寫 code。從 iPhone app 到 Vision Pro,全部支援。
Claude Code 從寫 code 跨界到訂披薩 — Cowork 誕生秘辛
Claude Code 創辦人 Boris Cherny 揭露用戶拿它來做假期研究、救婚禮照片、控制烤箱,這些瘋狂用例催生了 Cowork
CLAUDE.md 完全指南 — 讓 Claude Code 記住你的偏好
Vishwas 分享 CLAUDE.md 完整教學 — 一個讓 Claude Code 自動記住專案規範、coding style、常用指令的魔法檔案。不用每次都重複講一樣的話,直接寫進 CLAUDE.md 就好。
設計師開始用 Claude Code 了——這對工程師意味著什麼?
ADPList 創辦人 Felix Lee 寫了給設計師的 Claude Code 指南,推廣「Vibe Coding」概念。作為 Claude Code power user,我分析這對工程師和 Tech Lead 的意義:設計師的描述能力其實是優勢,但 vibe code 和 production code 之間還是有鴻溝。
Claude Code 終於出非工程師版了!Cowork 讓所有人都能用 AI Agent 完成日常工作
Anthropic 推出 Cowork — 把 Claude Code 的 Agent 能力帶給非工程師,讓你用對話方式整理檔案、編報表、寫報告
Claude Code 之父 Boris 公開他的開發流程 — 5 個平行 session、100% AI 寫的 code
Boris Cherny 公開他怎麼用 Claude Code 開發 Claude Code 本身 — 5 個平行 terminal、全用 Opus 4.5、一天 ship 27 個 PR
Claude Sonnet 5 要來了!Agentic Swarm 平行多工時代
Dan McAteer 爆料 Claude Sonnet 5 可能搭載「Agentic Swarm」功能 — 多個 sub-agent 平行跑、各自有 context、背景執行。Agent 時代正式進入多工平行宇宙。
Google 工程師的震撼告白:Claude Code 一小時重現我們一年的心血
Google Gemini 團隊主管工程師 Jaana Dogan 發文坦承,Claude Code 用一小時複製了她團隊花一年開發的分散式系統
Anthropic 研究員的 2026 大膽預測:持續學習今年搞定?
Anthropic 研究員 Sholto Douglas 預測 2026 年 AI 會解決持續學習(continual learning)問題,而且其他知識工作者也會體驗到工程師正在經歷的生產力爆炸
Simon Willison:我 25 年的開發直覺已經失效了
當你本能地想「這功能不錯但不值得花時間做」,然後還是丟給 Claude Code 試試看 — 因為你過去 25 年累積的直覺已經跟不上現實了
Claude Code 創造者 Boris 的 10 個使用技巧
Claude Code 團隊內部使用技巧大公開:多開 worktrees、投資 CLAUDE.md、創建自己的 Skills、用語音輸入、啟用 Learning Mode。記住:沒有唯一正確的用法。
AI 輔助如何影響程式技能養成:Anthropic 最新研究
Anthropic 研究發現:使用 AI 輔助的工程師測驗分數比手寫組低 17%。研究團隊觀察到,高分組傾向用 AI 理解概念,低分組則傾向直接複製貼上——但研究也強調這是相關性觀察,不是因果證明。
Obsidian & Claude Code: Async Hooks for Note History
想像在你的筆記中進行時間旅行。Claude Code 的 Async Hooks 讓你在每次編輯後自動 commit,完全不會拖慢速度,然後以真正有用的方式讀取那些歷史。你的 Vault 變成會自己寫的思考日記。
Obsidian & Claude Code 101: Context Engineering
Vibe note-taking 要運作得好,你必須強迫 Claude Code「挑食」一點。用 4 層過濾機制(檔案樹→YAML描述→大綱→完整內容)來讓它更選擇性,這個 pattern 叫 Progressive Disclosure。
Claude Code 終於有長記憶了:Supermemory Plugin 發布
我們把 Supermemory 加進 Claude Code 了。現在它強得離譜。Claude Code 應該要認識你,不只是這一次 session——是永遠。它應該知道你的 codebase、你的偏好、你團隊的決策,以及來自你使用的每個工具的 context。
Vibe Note-Taking 101: Spatial Editing
用 Claude Code 編輯長文通常很痛苦。不要把文字帶去給 Claude,而是把指令留在它們該在的地方。用花括號標記你的想法和編輯指令,每個註解都適用於它周圍的文字。Position IS Context (位置就是脈絡)。
Yapping to PRDs: Claude Code & Obsidian
以前開會是 Overhead(額外負擔),現在 Yapping (閒聊/碎念) 是工作。當我和同事針對專案「開聊」時,我們錄音。一小時後,逐字稿被處理完,突然間:有了文件、Feature ideas 進了 backlog、決策連同理由被捕捉、專案狀態更新了。Yapping IS Work。
Claude Code vs Codex:選對工具再上場
Claude Code 是聖殿騎士,穩扎穩打;Codex 是玻璃大砲法師,輸出爆炸但容易翻車。選好任務,再選角色。
Claude Code + Obsidian:打造 Agent 思考基礎設施
Heinrich 大大的六篇系列教學:用 Claude Code + Obsidian 打造讓 AI Agent 能思考的基礎設施。從 Vault 基礎、Context Engineering 到 Meta Layer,完整的知識管理系統。
Obsidian + Claude Code 101:讓 AI 住進你的筆記
Heinrich 花了一年打造的「用 AI 思考的作業系統」:讓 Claude Code 操作 Obsidian vault,提取概念、連結想法、建立活的思考表徵。你不再做筆記,而是指揮一個會做筆記的系統。