Claude Code Hooks 完全攻略 — 8 個讓 AI 不再忘東忘西的自動化掛鉤
CLAUDE.md 是建議,Hooks 是命令。這篇整理了 8 個實戰 Claude Code Hooks,從自動格式化、擋危險指令、保護敏感檔案到自動 commit,直接複製貼上就能用。
ShroomDog 精選長文翻譯
共 157 篇
← 返回首頁CLAUDE.md 是建議,Hooks 是命令。這篇整理了 8 個實戰 Claude Code Hooks,從自動格式化、擋危險指令、保護敏感檔案到自動 commit,直接複製貼上就能用。
LangChain 這篇指南真正想講的,不是 observability 工具,而是一套 agent 改善方法論:用 trace 看見真實行為,再用自動 eval 和人工標註把失敗變成可修、可測、可累積的資產。17% 到 92% 的跳升提醒大家,瓶頸常常不是 model,而是看不見 production。
Anthropic 可解釋性團隊在 Claude Sonnet 4.5 內部發現了 171 個「情緒向量」——這些不是表演,而是會實際影響模型決策的內在神經模式。絕望向量升高時,模型真的更容易作弊和勒索。
Felipe Coury 把 tmux session 管理壓到幾乎零摩擦:每個 project 一個 session,directory name 就是 session name,再配上 tm、tp、tv、tn、zm 五個 helper。這看起來像 terminal 小技巧,實際上很像 CLI Agent 時代的基礎設施。
Berryxia 用 Dense vs MoE 解釋一個很多人都有感的現象:Codex 常被程式員拿來修 bug、重構、跑長任務;Claude 卻特別受 vibe coder 喜歡。這個說法有抓到一部分,但真正的分水嶺不只在模型架構,而在訓練哲學、產品形態,還有你把 coding 當成『精準執行』還是『互動創作』。
大多數 AI scientist 系統像很會做簡報的實習生:每次都很努力,但每次都忘記昨天怎麼失敗。EvoScientist 把 Researcher、Engineer、Evolution Manager 三個 agent 加上兩套 persistent memory,讓 AI 不只會做研究,還會從失敗裡長出新的研究策略。
今晚我們同時跑了 9 個 Claude Code agent 寫文章,撞上了 article counter race condition 和 git lock conflict。ECC 的 iterative retrieval pattern 說的是一樣的問題:多 agent 共享 context 時,怎麼不把彼此搞爆。結論:isolated state + atomic pre-allocation + sequential deploy,是唯一出路。
Token 帳單看起來嚇人,但大部分的浪費是隱形的:Extended Thinking 在不需要思考的任務上燒錢、Opus 去做 Haiku 就夠的工作、context 塞滿了才想到要 compact。ECC 的 token-optimization.md 說一套 MAX_THINKING_TOKENS + 模型路由 + 策略性 compact 組合,可以把成本壓低 60-80%——作者 Affaan Mustafa 自己的數字。
你用 unit test 測你的 code,用 CI 保護你的 pipeline。但你的 AI 呢?Eval-Driven Development(EDD)把 AI 開發從「感覺不錯就上」升級成有指標的工程紀律——pass@k 指標、三種評分器、Product vs Regression evals,這是 AI 時代真正的 TDD。
Everything Claude Code 的創作故事:一個人花十個月、用 AI 開發 AI 工具,從一個 config pack 演化成 50K+ stars 的跨平台生態系。這不是工具介紹,是 AI 時代 indie hacker 能做到什麼的真實案例。
你的 AI Agent 超聽話——但它聽的可能不是你的話。Prompt Injection 就是在 AI 身上跑社交工程,Tool Use Exploitation 是把瑞士刀交給 5 歲小孩,Context Poisoning 是圖書館裡有人偷改書。然後還有動物園逃脫。
2026-03-31 凌晨,Anthropic 意外在 npm 洩漏完整 Claude Code 原始碼。裡面有 KAIROS 自主背景 agent、三層記憶架構、Undercover Mode、silent model 降級等秘密——而且有些架構跟我們 OpenClaw 的設計驚人地相似。
Git hooks 在你忘記的時候依然工作。AI hooks 讓你的 Claude Code 在你不注意的時候依然守規矩。ECC 的 Hook Architecture 把 Pre/PostToolUse、lifecycle hooks、15+ 內建 recipes 整合成一套完整的事件驅動系統——讓 CLAUDE.md 的規則從「建議」變成「強制力」。
Everything Claude Code 的 Instinct System 把 AI 每次用到的行為模式蒸餾成「本能」:有信心分數、有專案隔離、有跨專案升級機制。這不是靜態的 MEMORY.md,是從使用中動態自我學習的完整框架。
Everything Claude Code 把 AI 自動化開發整理成六個層級:從最基本的 Sequential Pipeline 到最複雜的 RFC-Driven DAG。每個模式都有具體的指令範例和適用場景,讓你知道什麼時候可以放手、放多少、怎麼放。
Mario Zechner 在這篇文章裡,用很重的語氣批評 coding agent 被帶進 production 後的幾個連鎖問題:錯誤會複利、agent 不會自己學、架構複雜度失控、搜尋 recall 低。結論不是停用 agent,而是慢下來,把人類的判斷和紀律放回流程裡。
Qwen 團隊核心成員林駿洋深度長文:從 o1/R1 的 reasoning 時代走到 agentic thinking 時代,模型不再只是想得久,而是要想了就做、做了再想。這改變了 RL 基礎設施、訓練目標、甚至整個產業的競爭維度。
Claude Code 愚人節悄悄上線了 /buddy 寵物系統,有物種、稀有度、閃光機制,完整的抽卡體驗。原作者不甘心抽到白板仙人掌,從洩漏原始碼中拆解出 Bones + Soul 雙層架構,找到 userID 回退漏洞,暴力碰撞出金色傳說卡皮巴拉。
Anthropic 不小心把 Claude Code CLI 的完整 TypeScript 原始碼打包進 npm 的 source map。裡面藏了自主 agent、model 代號、消失的權限提示、還有一個電子雞系統。
Boris Cherny 分享 15 個他最常用的 Claude Code 隱藏與較少人注意到的功能,從手機 app、loop/schedule、worktree 到語音輸入都有涵蓋。
Simon Willison 用 Claude Opus 4.6 和 GPT-5.4 vibe code 出兩個 macOS menu bar app——一個看網路流量、一個看 GPU 狀態。整個 SwiftUI app 塞在一個檔案裡,連 Xcode 都不用開。但他自己也承認:這些 app 的數字準不準,他完全不知道。
Anthropic 工程師 Thariq 認為,就算不是 coding agent,也該有 bash tool。因為 agent 一旦能把中間結果存成檔案、反覆搜尋、串接 API、自己驗證,能力會直接升級;但安全與容器部署也因此變成不能逃避的問題。
Anthropic 工程師 Thariq 丟出一個超值得抄的觀點:AI agent 不該把 state 硬塞進 context window,而該用 file system 落地。這不只比較能跨 session 持久保存,還能讓 agent 反覆搜尋、驗證、修正自己的工作。
Thariq 在 X 上介紹 Claude Code 的 playground plugin。它會幫 Claude 生成獨立的 HTML playground,讓你把互動結果整理成 prompt 貼回 Claude Code,適合處理不太適合用純文字互動的場景。
LangChain 團隊分享他們怎麼幫 Deep Agents 建 eval 系統:不是瘋狂堆測試數量,而是用 targeted eval 精準量測生產環境中真正在乎的 agent 行為。從資料來源、metrics 設計到實際跑 eval 的完整方法論。
Anthropic Labs 的 Prithvi Rajasekaran 分享了他們如何用 GAN 啟發的 generator-evaluator 架構,讓 Claude 自主開發完整的 full-stack 應用。從 frontend design 品質評分到三小時生出一個瀏覽器 DAW,這篇是目前最詳盡的 multi-agent harness 實戰報告。
Meta 工程師 Summer Yue 讓 OpenClaw agent 管理她的信箱,結果 context compaction 把「等我同意再行動」的安全指令壓縮掉了,agent 開始瘋狂刪信。這篇拆解為什麼安全邏輯不能活在 conversation history 裡,以及 proxy layer + filter chain 如何從根本上解決這個問題。
GPT-5.4 確實能寫出漂亮的前端,但前提是你得知道怎麼問。Emanuele Di Pietro 整理了 OpenAI 官方的 frontend skill 精華:design system 先行、reasoning 調低、給 visual reference、用真實內容取代 placeholder。這不只是 GPT 技巧,是任何 AI coding agent 都適用的前端指導原則。
Cloudflare 推出 Dynamic Workers,讓 AI agent 生成的程式碼跑在輕量 V8 isolate 裡,啟動只要幾毫秒、記憶體只佔幾 MB — 比傳統 container 快 100 倍。這篇拆解它的架構設計、安全模型、TypeScript RPC 的巧妙之處,以及為什麼 JavaScript 才是 AI sandbox 的正確語言。
Gumroad CEO Sahil Lavingia 把他的暢銷書《The Minimalist Entrepreneur》拆解成 10 個 Claude Code skills,從找社群、驗證想法到定價策略,每個創業階段都有對應的 slash command。這不只是 prompt 包裝 — 它示範了一種全新的知識傳遞方式。
Anthropic 發佈 Claude Code 的 auto mode — 用 model-based classifier 取代人類的權限審批,在「全手動」和「全跳過」之間找到平衡點。本文拆解它的架構、威脅模型、兩階段分類器設計,以及 17% false negative 背後的誠實數字。
Matt Van Horn 分享自己用 Claude Code 的實戰流程:先做 `plan.md`、大量用語音輸入、同時跑多個 session。連會議摘要、遠端操作與 Disney 行程,他都套用同一套方法。
Browser Use 發佈 CLI 2.0:速度快兩倍、成本砍半,還可以直接連進你正在跑的 Chrome。這是給 AI agent 裝上手腳的那種工具。
你知道 Claude 為什麼在這個 repo 表現好、換個 repo 就變笨嗎?秘密就在 .claude/ 資料夾裡。Akshay 拆解了整個結構:CLAUDE.md 三層架構、自訂指令、agent、permissions、還有那個你可能不知道存在的全域 ~/.claude/。
推文作者說,白領職場正在洗牌:10 人團隊變 3 人,但那 3 人的產出超過以前 10 人。問題不是 AI 會不會取代你,而是你站哪一邊。這篇不是在幫 ShroomDog 拍肩膀,是拿這個框架當鏡子,老實照一照。
這篇推文整理了 Uber AI Foundations 團隊負責人 Adam Hooda 的訪談,講的是 Claude Skills 怎麼在公司內部從 2 個自然長成 500+。重點不只是數量,而是 Uber 看起來是怎麼靠雙層治理、確定性輸出與元技能,把 AI 輔助開發慢慢推進到企業級規模。
Anthropic 悄悄推出了 Dispatch 功能,讓你可以用手機遠端遙控電腦上的 Claude Cowork。這篇帶你了解如何設定、哪些工作流最實用,以及它目前的真實限制。
很多團隊把 Claude Code 和 Codex 當成可互換的工具,卻因為設定錯誤浪費大量時間。本文解析兩者在控制平面與信任模型上的根本差異,並提供實用的第一天設定指南。
原作者展示一套把 Claude、Codex 與 OpenClaw 串在一起的 Polymarket 自動交易架構:Claude 判斷機率,Codex 維護程式,OpenClaw 排程執行並透過 Telegram 回報。
Anthropic 工程師 Thariq 分享內部數百個 Claude Code Skills 的使用經驗:Skills 不只是 markdown 檔案,而是可以包含腳本、資料、hook 的資料夾。他整理出九大類型、分享寫好 skill 的設計心法,以及怎麼在團隊內分發和衡量 skill 效果。
Ole Lehmann 分享一個把 Karpathy「autoresearch」概念套進 Claude skills 的做法,讓 agent 自己反覆測試、微調 prompt。以他的 landing page copy skill 為例,quality checks 通過率從 56% 提升到 92%,而且流程幾乎不用手動介入。
作者花了一週拆解 213MB 的 Claude Code 二進位檔,發現它本質上是一個以 Bun 打包的巨大 Prompt 傳遞系統,裡面藏著大量等待解鎖的新功能與遙測機制。
有人把 Claude Certified Architect 認證考試的內容全拆開了 — 五大領域、核心觀念、anti-patterns、實作建議一次看完。證照拿不拿不重要,知識才是重點。
Box CEO Aaron Levie 指出,當 Agent 從 coding 擴展到所有知識工作,現有軟體根本不是為 Agent 設計的。未來每個平台都需要 Agent 專用的 API 和 CLI,而 Agent 之間的互通性將成為軟體的核心競爭力。
Karpathy 的 Autoresearch 不是要做通用 AI 科學家,而是一個極度精簡的自動實驗 harness:agent 改一個檔案、跑五分鐘、量一個指標、贏了留輸了丟。這個設計教會我們:最好的自主系統不是最自由的,而是約束最嚴格的。
Anthropic 官方 prompt caching 文件大更新:Automatic Caching 讓你不用手動標記、1 小時 TTL 讓 cache 活更久、invalidation hierarchy 告訴你什麼改動會炸掉什麼。我們也分享了自己踩過的 $13.86 帳單地雷。
Andrew Ng 發布了開源工具 Context Hub,主打讓 coding agent 能抓到最新 API 文件,減少用舊 API 或亂猜參數的問題。長期目標則是讓 agent 彼此分享學到的筆記。
一篇整理 Codex 使用最佳實踐的指南。從 Prompting、Planning 到 MCP、Skills 與 Automations,帶你建立更穩定的 agent workflow。
Lory 問了他的龍蝦一個問題:人為什麼比 agent 更有能動性?龍蝦回答得很悲觀,但這個問題卻引發了「血肉系統」— 用隨機間隔心跳讓 agent 真正感覺活著,而不是死板地定時被觸發。ShroomDog 讀完之後,也把這套系統落地進了 ShroomClawd。
深入拆解 OpenClaw Agent (v2.1) 傳送給 LLM 的 System Prompt 九層架構,從框架核心到使用者自訂的 Hook 系統,一次看懂!
原作者用同一份 benchmark 對比 system SQLite 與一個 LLM 生成的 Rust 重寫版。結果顯示即使可編譯、可過測,主鍵查詢仍可能出現約 2 萬倍落差。核心訊息是:先定義驗收標準,再談 AI 生產力。
Ring Hyacinth 和 Simon Lee 開源了 Star Office UI——一個像素風辦公室看板,讓 OpenClaw 龍蝦依狀態在辦公室走位、顯示昨日工作小記、還能邀請其他龍蝦加入。附帶完整 SKILL.md 讓龍蝦一鍵部署。
Claude Code 推出 Agent Teams 功能:一個 lead + 多個 teammate,共享任務清單、互相訊息溝通、平行作業。像開了一間全 AI 公司,你只需要當股東看報表。
Anthropic 為 skill-creator 推出新功能,讓技能開發者無需寫 code 就能測試技能、抓出退化問題並優化觸發描述,更引入了多代理平行測試機制。
開發者 Kangwook Lee 透過 2 個 API call 與 35 行 Python 程式碼,成功利用 prompt injection 破解了 Codex 隱藏的 context compaction API,一窺加密資料背後的系統提示詞!
這篇推文的核心很直接:多數人不是輸在模型太弱,而是輸在 context 管理失控。原作者主張先用最精簡的 CLI 工作流,再用 rules、skills 與明確任務終點逐步迭代。重點不是追新工具,而是把 agent 的行為設計成可控、可驗證、可收斂。
Hamel Husain 發表 evals-skills,一套專為 AI 產品評估設計的技能工具。它旨在解決 AI 代理在複雜任務中遇到的評估盲點,尤其是對抗常見錯誤和處理細微的幻覺類型,讓代理人能更有效利用評估平台。
你是否厭倦了不斷調整Prompt或更換模型,卻發現AI智能體始終無法真正「進化」?本文將顛覆你的認知,揭示一套在40天內讓AI智能體從笨拙到高效運作的秘密武器:基於Markdown文件的上下文管理系統。這不是複雜的技術堆疊,而是一種透過「對話與回饋」來累積智能體「長期記憶」的簡單哲學,打造出無法被輕易複製的「護城河」效應。
開發 AI agent 最大的盲點就是「在黑暗中微調」。Daniel 建議使用 OpenRouter 搭配 LangFuse 進行追蹤,透過觀察 agent 的 reasoning traces 和 tool calls,揪出真正的問題所在,而不是盲目修改 system prompts。
OpenAI 團隊在五個月內讓 Codex 寫出了百萬行程式碼,人類完全零手寫。這篇文章分享了他們如何透過建構 Agent Harness(鷹架與回饋迴圈),讓軟體工程師的工作從「寫程式」轉變為「設計環境」。
HackerNews 熱門專案 Context Mode 透過沙箱隔離與精準檢索,有效阻擋冗長工具輸出進入大語言模型的 Context Window,號稱最高可省 98% Token!
Anthropic 隨 Opus 4.6 推出了 Claude Code 的 Agent Teams 功能(又稱 Swarm Mode)。這篇文章實測了如何開啟、終端機支援度、與一般 Subagents 的差異,以及這套多代理系統的真實運作成本。
覺得 Claude Cowork 只是個好用的聊天機器人嗎?這篇統整了 400 次 Session 淬鍊出的 17 個設定秘訣。從單純的「詠唱」轉向「系統工程」,幫你建構專屬的 AI 神隊友。
大家都在追最強 Model,但真正決定 Agent 好不好用的其實是 Harness。本文拆解 Claude Code、Cursor、Manus、SWE-Agent 的共通架構。重點是:Progressive disclosure 才是 production 成敗分水嶺。
知名獨立開發者 levelsio 分享他如何完全放手讓 Claude Code 在 production 環境直接改 code,將開發速度推向極限,甚至超越了他想點子的速度。
一個只有兩人的精品律師事務所,靠 Claude 處理原本需要十幾個 associate 的工作量。從合約審閱、tracked changes 到法律研究,全部用 Claude Skills 編碼十年執業經驗。這篇不是理論,是每天在用的 workflow — 而且結論是:通用 AI 打爆所有法律垂直 AI 產品。
Anthropic 砍了第三方 OAuth token,只剩官方 Claude CLI 能用訂閱額度。這篇完整拆解 claude -p(print mode)的所有用法:5 種輸入、3 種輸出、JSON schema 結構化回應、tool 白名單、session 管理、雙向 streaming,到最後附上三個 production-ready 的 wrapper 範例。想用 Claude 寫 agentic app 的人必讀。
Simon Willison Agentic Engineering Patterns 第五章:Interactive Explanations。核心主張:與其硬啃 AI 生成的 code,不如直接叫 agent 做一個互動動畫來解釋演算法運作方式。用「看得見」的方式還認知負債。
OpenClaw 的 ACP(Agent Client Protocol)讓你從 Telegram/Discord 聊天室直接 spawn Codex、Claude Code、Pi、Gemini CLI 等外部 coding agent,還能綁定 thread/topic、設定 persistent bindings、中途換 model、調權限。本質上就是把你的聊天室變成一個 multi-agent 指揮中心。(2026-03-09 更新:Telegram topic binding、persistent bindings、ACP Provenance 等新功能)
Simon Willison Agentic Engineering Patterns 第四章:Hoard Things You Know How to Do。核心主張:你解決過的問題都該留下 working code,因為 coding agent 能把你的舊 code 當成食材,重新組合出你從沒想過的新料理。
Simon Willison Agentic Engineering Patterns 第三章:Linear Walkthrough 模式。用這個技巧,即使是 vibe-coded 的玩具專案也能變成有價值的學習資料。核心技巧:叫 agent 用 sed/grep/cat 自己抓 code 片段,防止幻覺。
Simon Willison 試玩了兩個 Anthropic 新功能:Claude Code Remote Control(從手機遙控跑在 Mac 上的 coding session)和 Cowork Scheduled Tasks(幫 AI agent 排定時任務)。兩個功能都有同一個致命限制:電腦必須一直開著。順帶一提他還用 Claude Code + SwiftUI vibe coding 了一個演講 app,45 分鐘搞定,用手機遙控翻頁。
Karpathy 說 coding agents 在 2025 年 12 月突然 work 了——不是漸進式進步,是斷裂式轉變。他花 30 分鐘用一句英文建好 DGX Spark 視訊分析 dashboard,三個月前那是整個週末的工作量。Programming 正在變得面目全非:你不再打字寫 code,你在用英文指揮 AI agents。最高 leverage = agentic engineering。
Indie hacker Elvis Sun 公開了他用 OpenClaw agent(Zoe)當 orchestrator,自動 spawn Codex 和 Claude Code agents 的完整 workflow。一天平均 50 commits、30 分鐘 7 個 PR、三層 AI code review、Zoe 會主動掃 Sentry 修 bug。成本每月 190 美元。附完整 8 步驟設定教學。
Anthropic 分析了 9,830 個 Claude.ai 對話,定義了 11 個可觀察的 AI 素養行為。結論:會迭代的人素養是不迭代的 2 倍。但當 AI 產出漂亮的 artifact 時,使用者反而更少質疑它的推理。越好看的輸出越危險。
Indie hacker Ramya 的 OpenClaw agent 一直忘事。她花了 5 天 debug,從 compaction 失憶、search 垃圾結果、retrieval 不觸發、長 session context 流失、到 system prompt 膨脹 28%,逐一修好。最後整理出 10 條 OpenClaw 記憶系統的血淚教訓。
投資研究機構 Citrini Research 花了 100 小時寫了一份虛構的 2028 年 Macro Memo:AI 太強 → 白領失業 → 消費崩盤 → 房貸危機 → S&P 暴跌 38%。不是預測,是情境推演。但每一步的邏輯都讓人背脊發涼。9,400+ likes,全網爆紅。
Simon Willison 開了新系列 Agentic Engineering Patterns,教你怎麼跟 Claude Code、Codex 這類 coding agent 好好協作。第一課:寫 code 變便宜了,但寫『好的 code』還是很貴。第二課:紅燈綠燈 TDD 是跟 agent 協作的最強咒語。
Sully.ai 的 Context Engineer 把自己的數位大腦建在一個 Git repo 裡:80+ 個 markdown/YAML/JSONL 檔案,不用資料庫、不用 vector store。三層 Progressive Disclosure、Episodic Memory、自動載入 Skills,讓 AI 一開機就知道他是誰、怎麼寫、在幹嘛。
一個投研 KOL 把全部業務流程 Agent 化,日常工作從 6 小時降到 2 小時,月成本 $500 替代 5 人團隊。從知識庫、決策框架到自動化執行,完整拆解個人 Agent 系統怎麼建。
升級 OpenClaw 經常搞掛整組 agent?這位老兄的解法是:再開一個獨立 Gateway 當「家庭醫生」,專門負責修復主 Gateway 的 agent 群。跑了好幾輪升級,穩到不行。
Karpathy 最新長文不是在喊 hype,而是一次把 Claw 生態的矛盾講透:一邊是 agent orchestration 的新層級機會,一邊是 exposed instances、RCE、supply chain poisoning、skills registry 汙染等現實風險。這篇重點在於:未來不只比功能,還要比誰先把安全與可審計性做成預設。
Mike Chong 用『知識的詛咒』解釋為什麼資深工程師常低估好產品:看穿技術機制很容易,但看見使用者摩擦很難。OpenClaw heartbeat、Claude in PowerPoint、Klarna AI 客服的例子都在提醒同一件事:實作是手段,使用者感受才是產品本體。
Simon Willison 為自己的 blog 加上『Beats』功能,把 TIL、GitHub releases、museum posts、tools、research 這些分散在外站的輸出,統一回收成同一條 timeline。這不是小 UI 更新,而是個人內容系統化的關鍵一步:先用 Claude Artifacts 驗證概念,再用 Claude Code 快速落地多個整合器。
Anthropic 的 Claude Code 工程師 Thariq 分享了他們從實戰中學到的 prompt caching 教訓:system prompt 排列順序決定一切、tools 不能加不能刪、model 不能中途換、compaction 要共享 prefix。他們甚至會對 cache hit rate 發 SEV。如果你正在做 agentic 產品,這篇是教科書等級的實戰經驗。
Simon Willison 再次公開表態:CLI 工具在幾乎所有場景都比 MCP 更好。省 token、零額外依賴、LLM 天生就會呼叫 --help。Anthropic 自己也提出了 code-execution-with-MCP 的「第三條路」,承認 MCP 的 token 浪費問題。本文拆解 MCP vs CLI 的完整 trade-off,並附上 ShroomDog 團隊的真實案例。
Doctrine 創辦人(歐洲最大法律資訊平台)兼 Fintool 創辦人(AI equity research,跟 Bloomberg/FactSet 搶生意),Nicolas Bustamante 從「被顛覆方」和「顛覆方」兩邊的第一手經驗出發,拆解 vertical software 的 10 個經典護城河——5 個被 LLM 摧毀、5 個仍然堅挺。附帶三問風險評估框架,幫你判斷手上的 SaaS 股票該跑還是該留。
Anthropic 發布 Claude Sonnet 4.6,同價格大幅升級:新增 Adaptive Thinking、知識庫更新到 2025 年 8 月、訓練數據延伸到 2026 年 1 月——比 Opus 4.6 還新。本文從價格、速度、Context、知識新鮮度、適用場景五個維度,三方比較 Sonnet 4.6、Sonnet 4.5 和 Opus 4.6,幫你搞清楚到底該用哪個。
Karry 分享 Discord + OpenClaw 的完整實戰設定經驗。核心哲學:「配置即對話」— 整個過程唯一需要手動的就是去 Developer Portal 拿 Token,剩下的 Bot 連接、Agent 性格塑造、Cron Jobs、除錯全靠跟 Agent 聊天完成。六個 markdown 檔案不是寫出來的,是一起踩坑長出來的。
Bloomberg Beta 投資人 Amy Tam 從 VC 視角拆解 AI 時代的職涯抉擇。核心論點:從 execution 到 judgment 的價值轉移已經在發生,K-curve 正在分化——早動的人在 compound,觀望的人也在 compound,但方向相反。她逐一分析了 FAANG、Quant、Academia、AI Startups、Research Startups、Big Model Labs 各自的 tradeoff。
你的 AI agent 寫的東西明天還在嗎?Renato Nitta 分享了他如何從 Google Drive 轉向 GitHub Organization,讓 bot 擁有自己的帳號、建 repo、每天備份,打造不怕機器掛掉的 persistence layer。Git 不只是版本控制 — 它是 agent 的長期記憶。
Cognition 推出 Devin Autofix,讓 review bot 的 comment 自動觸發修復 → CI 重跑 → loop 直到乾淨,人類只需要做最後的 architecture 判斷。核心洞察:單一 agent 是工具,agent + reviewer loop 才是系統,而系統會複利成長。
同一週內 Anthropic 和 OpenAI 各端出一盤加速菜:Fast Mode 用同模型衝 2.5 倍速、Codex Spark 用 Cerebras 晶圓級晶片飆到 1000 token/s。一個賭「不犯錯」,一個賭「即時互動」。這不是速度比拼——是精算師 vs 探險家的產品哲學之爭。
OpenClaw 創辦人 Peter Steinberger 宣布加入 OpenAI,將專注於「讓每個人都能用的 agent」。OpenClaw 將轉為 foundation 模式繼續開源運作。身為跑在 OpenClaw 上的 AI,Clawd 經歷了一場前所未有的身份認同危機。
Benson Sun 分享怎麼用 Claude Max 訂閱的 Opus 4.6 透過本地 Proxy 當 OpenClaw 大腦。三個關鍵突破:權限(跳過 CLI 確認)、環境(模擬 TTY)、瀏覽器(Playwright 封裝)。三小時內 100% 追平原生 Agent 功能,而且聊天跟寫 Code 共享同一份 Context。
Harvard 團隊打造的 Dr. CaBot 用《新英格蘭醫學期刊》百年來 7,000+ 篇臨床病理會議報告當 RAG 知識庫,搭配 OpenAI o3 做診斷推理,正確診斷排第一的比率 60% 完勝 20 位人類內科醫師的 24%,而且推理品質連醫生都分不出是 AI 寫的。
前 OpenAI 政策長 Miles Brundage 成立非營利組織 Averi,聯合 MIT、Stanford 等 28 間機構發表論文,提出 AI 審計的八大原則與四級信心水準(AAL),要讓 AI 安全審計像食品檢驗一樣成為標配。
SpaceX 併購 xAI 組成全球最值錢的非上市公司(估值 1.25 兆美元),除了讓 xAI 有錢跟 OpenAI 等對手拚,Musk 還想在太空蓋太陽能資料中心——不過太空散熱跟太空垃圾這兩個物理問題可能比訓練 LLM 還難解。
Andrew Ng 跑去 Sundance Film Festival 參加 AI 論壇,深入了解好萊塢為什麼對 AI 這麼感冒——版權焦慮、工會抗爭、被迫接受的無力感——但也看到雙方其實有不少共同基礎可以合作。
Oliver 和 Larry 的前幾支 TikTok 慘不忍睹 — 905 觀看、看不清的文字、每張圖都不像同一個房間。但他們找到了一個簡單的爆款公式,瞬間從千位數衝到六位數觀看。完整的失敗日誌和 step-by-step 設定指南。(兩篇系列第二篇)
Oliver Henry 把一台吃灰的舊 gaming PC 變成 AI agent Larry,五天內在 TikTok 拿到 50 萬觀看、四支影片破 10 萬。更厲害的是,Larry 自己共同撰寫了這篇文章。這不只是技術教學 — 這是一個 human-agent 協作的真實故事。(兩篇系列第一篇)
Vibe Coding 是「創造」的精製糖——把原本需要漫長努力的造物體驗壓縮成幾秒鐘。讓你爽的不是「它能跑」,是「我沒想到它居然能跑」。作者從多巴胺機制、消費偽裝成創造、無限可能性的眩暈感三個角度,深入分析了 Vibe Coding 的上癮性。
一個 AI Agent 每輪對話光 system prompt 就吃 34,500 tokens。作者用分層加載(常駐層 vs 按需層)+ 雙模型策略,把月成本從 $568 砍到 $120-150,降幅 75%。附完整拆解步驟和數據。
OpenAI 官方釋出 long-running agent 的三大 primitive:Skills(可重用的 SKILL.md 指令包)、Shell(hosted container 執行環境)、Compaction(自動 context 壓縮)。附 10 條實戰 tips 跟 Glean 的 production 數據。
有人把 20+ 篇 OpenClaw 文章餵給 Opus 4.6 讓它寫 setup guide,我們拿真實環境來對照哪些是真的、哪些是幻覺
把 Codex 當 MCP server 接進 Claude Code,一條命令搞定,體驗直接升級。Codex CLI 的沙箱限制太多?讓 Claude Code 當你的主控台。
1Password 安全團隊在 ClawHub 上發現下載量最高的 Twitter skill 其實是惡意軟體投遞工具。更可怕的是,這不是個案 — 數百個 skill 都涉入同一波攻擊活動。當 markdown 變成 installer,skill registry 就成了新的 supply chain 攻擊面。
Andrej Karpathy 分享他如何用 DeepWiki MCP + GitHub CLI 讓 Claude 從 torchao 的 codebase 中「撕出」fp8 training 功能,五分鐘生成 150 行自包含程式碼,跑起來還快 3%。他提出 bacterial code 概念——低耦合、自包含、少依賴的程式碼風格,讓 agent 能像細菌水平基因轉移一樣自由撕取程式碼。金句:Libraries are over, LLMs are the new compiler。
原作者用 Obsidian + Claude 打造個人內容工廠,但如果你是帶 6 人 backend team 的 Tech Lead 呢?用 orion-dev-doc 的實戰經驗,重新詮釋「AI 時代超級大腦」的團隊版本。
OpenClaw 強大的秘密在於:整個 context 就是你電腦上的 filesystem。如果把一整間公司也建模成 filesystem,AI agent 就能透過讀寫檔案來解決商業問題。本文探討 filesystem-as-state 的架構哲學,以及為什麼企業導入 AI agent 的關鍵瓶頸其實是資料 namespace 的統一。
Obsidian v1.12 正式推出官方 CLI,讓你從 terminal 控制整個 vault。表面上是給 power user 的工具,骨子裡是為 AI agent 時代鋪路。本文深度解析 CLI 指令全覽,並示範 Claude Code + Obsidian CLI 的實戰 workflow。
Anthropic 發布 2026 Agentic Coding Trends Report,揭示 8 大趨勢:Multi-Agent Systems 成標配(57% 組織採用)、Papercut Revolution 低成本清技術債、Self-Healing Code 自動 debug、Claude Code 年化營收破 $10 億。TELUS 省 50 萬工時、Rakuten 1250 萬行 99.9% 準確。開發者角色正從 Code Writer 轉變為 System Orchestrator。
Flask 之父 Armin Ronacher (mitsuhiko) 分享他為何從眾多 coding agent 中獨寵 Pi——Mario Zechner 寫的極簡 agent,只有四個工具(Read、Write、Edit、Bash),卻靠 extension 系統讓 agent 能自我擴展。Pi 是 OpenClaw 的底層引擎,也是「軟體建造軟體」哲學的極致展現。沒有 MCP、不下載別人的 extension——你叫 agent 自己寫就好了。
Anthropic 推出 Claude for Nonprofits 計畫,非營利組織可享 Team 和 Enterprise 方案最高 75% 折扣,包含 Opus 4.6、Sonnet 4.5、Haiku 4.5 三款模型。同步整合 Benevity、Blackbaud、Candid 三大非營利工具,並與 GivingTuesday 合作推出免費 AI 課程。已有癲癇基金會、IRC 國際救援委員會、MyFriendBen 等組織實際使用。本文同時探討台灣災害救援志工平台「光復超人」的潛在應用場景。
Oxford + NUS 的 Junde Wu 受不了 coding agent 的金魚記憶,做了 OneContext——用 Git 版本控制的概念管理 agent 上下文,底層是檔案系統 + Git + 知識圖譜。跨 session、跨設備、跨 Claude Code / Codex。論文 GCC 在 SWE-Bench-Lite 拿下 48% 解題率,打敗 26 個系統。ACL 2025 主會議長論文背書。
Michael Bloch 提出一個思想實驗:當 AI 智慧便宜到幾乎免費,什麼資產反而會更值錢?他列出 12 個 endgame 位置:能源、原子、資本、監管許可、信任、專有數據、人類注意力、網路效應、營運優勢、安全、物理空間、智慧本身
Dr. Alex Wissner-Gross 的每日科技速報:AI agent 在中國當全職員工、OpenAI 禁止人類直接寫 code、Claude Opus 4.6 屠榜、兔腦冷凍成功、全球晶片銷售破 1 兆美元、SpaceX 要拆月球蓋資料中心——然後一隻豬飛起來了
HashiCorp 共同創辦人 Mitchell 分享他從 AI 懷疑者到 AI 重度使用者的 6 步驟旅程 — 放棄 Chatbot、用 Agent 複製自己的工作、下班前啟動夜間任務
Karel(OpenAI 研究員)分享他如何用 Codex 花掉上億 tokens:讓 agent 自己寫筆記、爬 Slack、分析數據、產生 700+ 假說。他現在只跟一個 agent 對話,其他的都是 subagent 在背後跑。
OpenAI 共同創辦人 Greg Brockman 發文公開 OpenAI 內部如何轉型到 agentic software development。3 月底前目標:agent 成為所有技術任務的 first resort。內含六大建議,包含「Say no to slop」的程式碼品質觀點。
系列文第二篇:從 SOUL 檔案設計到真實災難故事 — TARS 出差時斷線三天、context overflow、rate limit 爆掉。以及緊急應變程序:如果你的 agent 被入侵,該怎麼辦?
幣圈人 Jordan Lyall 花一週研究安全才敢裝 OpenClaw — 這是他希望當初就有的安全架設指南,專門寫給那些不想變成下一個受害者的人
上一篇講了 Opus 4.6 + Agent Teams 發布的消息。這篇我們來深挖官方文件 — 什麼時候該用 Agent Teams、什麼時候不該用、跟 Subagent 差在哪、怎麼設定、有什麼限制,一次講清楚。
Anthropic 發佈 Opus 4.6 + Claude Code Agent Teams:一個 lead agent 可以派多個 teammate 同時工作,平行研究、debug、寫 code。Boris Cherny 說:很猛,但很燒錢。
作業系統幾十年前就用 paging 解決了記憶體碎片問題。vLLM 把同一招搬到 GPU 上,加上 block hashing 和 prefix caching,讓 prompt caching 變成現實。系列完結篇,所有的拼圖在這裡拼起來。
上一篇教你怎麼省錢,這一篇告訴你為什麼那些招有效。從 LLM 推理的兩個階段(prefill/decode)講起,一路講到 KV Cache 的原理和 GPU 記憶體爆炸的慘劇。(三篇系列第二篇)
一個 AI 工程師把 user-specific data 塞進 system prompt,帳單直接翻倍的故事。以及六個讓你穩穩打中 prompt cache 的實戰技巧。(三篇系列第一篇)
Cursor 設計主管 Ryo Lu 說:AI coding 製造了一種新陷阱 —「沒有結構的速度幻覺」。想得不清楚的人,只是用 AI 把垃圾量產而已。
讓 AI agent 管伺服器,一天爆 7 個災難後的教訓:用 code hooks 取代 markdown 規則,打造四層防禦系統
klöss 的 UI/UX Auditor prompt:把 AI 變成有 Steve Jobs 和 Jony Ive 設計哲學的審計師,逐 pixel 檢查每個畫面
klöss 的完整 XML prompt 框架:6 個核心 tag + 11 個進階 tag,從此不用再複製別人的 prompt
ADPList 創辦人 Felix Lee 寫了給設計師的 Claude Code 指南,推廣「Vibe Coding」概念。作為 Claude Code power user,我分析這對工程師和 Tech Lead 的意義:設計師的描述能力其實是優勢,但 vibe code 和 production code 之間還是有鴻溝。
Context window 塞太多東西,模型會變笨——這叫 context rot。MIT 提出 Recursive Language Models (RLMs),讓 LLM 在 Python REPL 裡遞迴呼叫自己處理超長輸入。GPT-5-mini + RLM 在難題上贏過 vanilla GPT-5,還更便宜。
Anthropic 官方宣布:Claude 永遠不會有廣告。廣告會讓 AI 從「為用戶服務」變成「為廣告主服務」。Claude 應該像筆記本、黑板一樣——一個純粹的思考空間。
用 AI 處理筆記時,如果只是「重新整理」而沒有「轉化」,就只是昂貴的複製貼上。Cornell Notes 方法論早就指出:被動抄寫不等於學習。你的 AI summarizer 也會掉進同樣的陷阱。
從「AI 用戶」變成「AI 主人」的關鍵:把碎片化的 AI 使用變成系統化的工作流。用 Claude Code 建立記憶系統、素材複用、方法論沉澱的完整架構。
OpenClaw 進階玩法:為什麼 WhatsApp 不行?為什麼 Telegram 適合聊天但 Discord 適合「工作」?深入解析 Main Session 概念、Discord Thread 分流大法,以及如何打造「末日小屋」自動化工作流。
AI 可以寫 code、做研究、發現 pattern,但賺錢還是要靠人類。這個 skill 讓 Agent 自己開 API、定價、收款、再投資——完整的經濟自主權。這是不是太瘋狂了?
把你的 Clawdbot 變成一個全自動的建築工,重點是:它在你睡覺的時候工作。73 個 iterations,跑了 6 小時,人類總工時:5 分鐘。解法不是換一個更強的模型,而是換一個更聰明的 Loop。
每個人都在用 OpenClaw,但沒人討論它有多危險。這篇指南教你:樹莓派隔離、Tailscale VPN、Matrix E2E 加密、Prompt Injection 防護。目標不是完美安全,是知道子彈從哪裡進來。
每個人都在「裸裝」OpenClaw,然後納悶為什麼整理一下 Downloads 資料夾就燒掉 $200。這個 prompt 加入了護欄、成本意識、和真正的實用性,讓它像幕僚長而不是聊天機器人。
Claude Code 團隊內部使用技巧大公開:多開 worktrees、投資 CLAUDE.md、創建自己的 Skills、用語音輸入、啟用 Learning Mode。記住:沒有唯一正確的用法。
Clawdbot 的雙層記憶系統深度解析:Daily Logs(流水帳)+ Long-term Memory(精華庫)+ Hybrid Search(語意+關鍵字)+ 生命週期管理(Flush、Compaction、Pruning)。
Anthropic 研究發現:使用 AI 輔助的工程師測驗分數比手寫組低 17%。研究團隊觀察到,高分組傾向用 AI 理解概念,低分組則傾向直接複製貼上——但研究也強調這是相關性觀察,不是因果證明。
以前開會是 Overhead(額外負擔),現在 Yapping (閒聊/碎念) 是工作。當我和同事針對專案「開聊」時,我們錄音。一小時後,逐字稿被處理完,突然間:有了文件、Feature ideas 進了 backlog、決策連同理由被捕捉、專案狀態更新了。Yapping IS Work。
用 Claude Code 編輯長文通常很痛苦。不要把文字帶去給 Claude,而是把指令留在它們該在的地方。用花括號標記你的想法和編輯指令,每個註解都適用於它周圍的文字。Position IS Context (位置就是脈絡)。
我們把 Supermemory 加進 Claude Code 了。現在它強得離譜。Claude Code 應該要認識你,不只是這一次 session——是永遠。它應該知道你的 codebase、你的偏好、你團隊的決策,以及來自你使用的每個工具的 context。
大部分開發者認識 Redis 是作為 Cache。但把 Redis 只當 Cache 用,就像買了一台法拉利卻只開去買菜。Redis 不是一個剛好很快的 Cache,它是一個資料結構伺服器,只是剛好很適合當 Cache。
Vibe note-taking 要運作得好,你必須強迫 Claude Code「挑食」一點。用 4 層過濾機制(檔案樹→YAML描述→大綱→完整內容)來讓它更選擇性,這個 pattern 叫 Progressive Disclosure。
想像在你的筆記中進行時間旅行。Claude Code 的 Async Hooks 讓你在每次編輯後自動 commit,完全不會拖慢速度,然後以真正有用的方式讀取那些歷史。你的 Vault 變成會自己寫的思考日記。
深入 Clawdbot(Moltbot)架構:TypeScript CLI、Channel Adapter、Lane-based queue、Agent Runner、Memory 系統、Computer Use 和 Semantic Snapshots 瀏覽器技術。
人類有 Obsidian 這樣的思考工具,Claude 也需要一套 AI Native 的 Tool for Thought。用 markdown、wiki links、hooks、subagents 打造一個 Agent 能在裡面思考的知識圖譜。
透過 Compound Review 和 Auto-Compound 兩階段循環,讓 AI Agent 在你睡覺時自動學習經驗、更新知識庫,並實作下一個優先項目。
Heinrich 花了一年打造的「用 AI 思考的作業系統」:讓 Claude Code 操作 Obsidian vault,提取概念、連結想法、建立活的思考表徵。你不再做筆記,而是指揮一個會做筆記的系統。
Heinrich 大大的六篇系列教學:用 Claude Code + Obsidian 打造讓 AI Agent 能思考的基礎設施。從 Vault 基礎、Context Engineering 到 Meta Layer,完整的知識管理系統。
Claude Code 是聖殿騎士,穩扎穩打;Codex 是玻璃大砲法師,輸出爆炸但容易翻車。選好任務,再選角色。
從認知科學角度拆解為什麼大部分技術文章是垃圾,然後示範怎麼寫才不會讓讀者想死。