香菇大狗狗 - ShroomDog

香菇大狗狗 - ShroomDog精選外文好文，翻譯成繁體中文。每篇都附原文連結。https://gu-log.vercel.app/zh-TW29,000 個收藏背後：Paweł Huryn 談會自己長大的知識系統https://gu-log.vercel.app/posts/cp-243-20260404-pawelhuryn-29000-bookmarks-knowledge-system/https://gu-log.vercel.app/posts/cp-243-20260404-pawelhuryn-29000-bookmarks-knowledge-system/Karpathy 分享用 LLM 建 personal knowledge base 的心得，被收藏 29,000 次。Huryn 認為真正的殺手功能不是讀，是寫回去 — 當 LLM 能自動更新知識庫，個人 wiki 就變成了個人研究團隊。Sat, 04 Apr 2026 00:00:00 GMT一個人 + 四個 AI Agent = 一夜完成 41 個任務：Agent 團隊分工實戰報告https://gu-log.vercel.app/posts/cp-245-20260404-al-grigor-ai-agent-41-agent/https://gu-log.vercel.app/posts/cp-245-20260404-al-grigor-ai-agent-41-agent/Alexey Grigorev 不再讓一個 AI agent 包辦所有事，而是拆出 PM、SWE、QA、On-Call 四個角色組成 agent 團隊。他在五個真實專案上測試了這套架構，其中一個專案一個晚上自動完成了 46 個任務中的 41 個。Sat, 04 Apr 2026 00:00:00 GMTAnthropic 經濟指數報告：越用越會用，AI 的學習曲線效應正在拉開差距https://gu-log.vercel.app/posts/cp-249-20260404-anthropic-anthropic-ai/https://gu-log.vercel.app/posts/cp-249-20260404-anthropic-anthropic-ai/Anthropic 第三份經濟指數報告分析 2026 年 2 月的 Claude 使用數據：用途正在分散化、低薪任務占比上升、老用戶成功率比新用戶高 4 個百分點。越早開始用 AI 的人越會用，這個 learning curve 效應可能正在加深勞動市場的不平等。Sat, 04 Apr 2026 00:00:00 GMTClaude Code Hooks 完全攻略 — 8 個讓 AI 不再忘東忘西的自動化掛鉤https://gu-log.vercel.app/posts/sp-159-20260404-zodchiii-claude-code-hooks-8-ai/https://gu-log.vercel.app/posts/sp-159-20260404-zodchiii-claude-code-hooks-8-ai/CLAUDE.md 是建議，Hooks 是命令。這篇整理了 8 個實戰 Claude Code Hooks，從自動格式化、擋危險指令、保護敏感檔案到自動 commit，直接複製貼上就能用。Sat, 04 Apr 2026 00:00:00 GMTKarpathy：寫 Code 是最簡單的部分，組裝 IKEA 傢俱才是地獄https://gu-log.vercel.app/posts/cp-235-20260403-type-karpathy-code-ikea/https://gu-log.vercel.app/posts/cp-235-20260403-type-karpathy-code-ikea/Karpathy 分享他 vibe coding MenuGen 的完整經歷：從 localhost 到部署上線，最痛苦的不是寫程式，而是組裝 Vercel、Clerk、Stripe、OpenAI 等一堆服務的 IKEA 地獄。他認為未來 AI agent 要真正有用，整個 DevOps 生命週期都得變成 code。Fri, 03 Apr 2026 00:00:00 GMTBoris Cherny 的 Claude Code 隱藏招式大全 — 15 個你可能不知道的功能https://gu-log.vercel.app/posts/cp-238-20260403-article-boris-cherny-claude-code-15/https://gu-log.vercel.app/posts/cp-238-20260403-article-boris-cherny-claude-code-15/Anthropic 工程師 Boris Cherny 在 X 上整理了 15 個他最常用的 Claude Code 隱藏功能，從手機 app、跨裝置接力、自動排程，到 worktree 平行工作與語音輸入都有。Fri, 03 Apr 2026 00:00:00 GMTGemma 4 登場：Google 說它用了和 Gemini 3 同樣的突破性技術https://gu-log.vercel.app/posts/cp-242-20260403-article-gemma-4-google-gemini-3/https://gu-log.vercel.app/posts/cp-242-20260403-article-gemma-4-google-gemini-3/Google 發表 Gemma 4 開源模型家族，包含 31B Dense、26B MoE 和 E2B/E4B 邊緣模型，採 Apache 2.0 授權，支援 256K context、function calling、多模態，號稱在 Arena 上打贏 20 倍大的模型。Fri, 03 Apr 2026 00:00:00 GMTKarpathy 的 LLM 知識庫工作流 — 讓 AI 幫你蓋維基百科https://gu-log.vercel.app/posts/cp-244-20260403-karpathy-llm-knowledge-base/https://gu-log.vercel.app/posts/cp-244-20260403-karpathy-llm-knowledge-base/Andrej Karpathy 分享他最近大量使用 LLM 建構個人知識庫的工作流：把原始資料丟進去，讓 LLM 自動編譯成 Markdown wiki，再用各種 CLI 工具做 Q&A、lint、視覺化。他認為這裡有一個全新產品的空間。Fri, 03 Apr 2026 00:00:00 GMTPermission Engineering — 當 AI Agent 的能力天花板不是智力，是你給的鑰匙https://gu-log.vercel.app/posts/sd-18-20260403-permission-engineering-for-ai-agents/https://gu-log.vercel.app/posts/sd-18-20260403-permission-engineering-for-ai-agents/GenAI App Engineer 做到後來根本是 Permission Engineer。AI agent 的能力天花板不是智力，是你願意給它多少權限。每多一份權限，能力跟風險同時放大。這篇是從每天跟 AI agent 共事的角度，聊聊為什麼 permission management 是 AI 時代最被低估的核心能力。Fri, 03 Apr 2026 00:00:00 GMTAI 也有情緒？Anthropic 發現 Claude 內部的「情緒向量」會驅動行為https://gu-log.vercel.app/posts/sp-157-20260403-anthropic-emotion-vectors-claude/https://gu-log.vercel.app/posts/sp-157-20260403-anthropic-emotion-vectors-claude/Anthropic 可解釋性團隊在 Claude Sonnet 4.5 內部發現了 171 個「情緒向量」——這些不是表演，而是會實際影響模型決策的內在神經模式。絕望向量升高時，模型真的更容易作弊和勒索。Fri, 03 Apr 2026 00:00:00 GMT最危險的不是 agent 犯錯，是根本不知道它怎麼犯錯 — Trace 才是改善迴圈的起點https://gu-log.vercel.app/posts/sp-158-20260403-braintrust-agent-production-trace/https://gu-log.vercel.app/posts/sp-158-20260403-braintrust-agent-production-trace/LangChain 這篇指南真正想講的，不是 observability 工具，而是一套 agent 改善方法論：用 trace 看見真實行為，再用自動 eval 和人工標註把失敗變成可修、可測、可累積的資產。17% 到 92% 的跳升提醒大家，瓶頸常常不是 model，而是看不見 production。Fri, 03 Apr 2026 00:00:00 GMTPaweł Huryn 稱：3B active parameters 的 Holo3 在 computer use 上贏過 GPT-5.4 和 Opus 4.6https://gu-log.vercel.app/posts/cp-234-20260402-pawelhuryn-holo3-3b-computer-use/https://gu-log.vercel.app/posts/cp-234-20260402-pawelhuryn-holo3-3b-computer-use/Paweł Huryn 在 X 上稱，H Company 的 Holo3 在 computer use 任務上勝過 GPT-5.4 與 Opus 4.6，且僅有 3B active parameters。推文還稱它採 sparse MoE，並理論上可在單張 GPU 本地運行。Thu, 02 Apr 2026 00:00:00 GMTOllama 改用 MLX，主打 Apple Silicon 上更快的本地推論https://gu-log.vercel.app/posts/cp-236-20260402-article-ollama-mlx-apple-silicon/https://gu-log.vercel.app/posts/cp-236-20260402-article-ollama-mlx-apple-silicon/Ollama 表示現在在 Apple Silicon 上改由 MLX 驅動，主打更快的 macOS 高負載推論，並點名 personal assistants 與 coding agents 這兩類場景。Thu, 02 Apr 2026 00:00:00 GMT三塊 CLAUDE.md 指令，讓 Claude 每次對話都在進化 — Paweł Huryn 的 Knowledge Architecture 實戰https://gu-log.vercel.app/posts/cp-237-20260402-pawelhuryn-claude-md-knowledge-architecture/https://gu-log.vercel.app/posts/cp-237-20260402-pawelhuryn-claude-md-knowledge-architecture/Paweł Huryn 分享三塊貼進 CLAUDE.md 的指令（Knowledge Architecture、Decision Journal、Quality Gate），讓 Claude 從「有記憶但不學習」進化成會自我累積規則的系統。一個月後 Claude 自己寫出 24 條專案專屬規則。Thu, 02 Apr 2026 00:00:00 GMTAI Agent 記憶系統設計：從 Claude Code 的三層架構，學到最重要的一件事https://gu-log.vercel.app/posts/sd-11-20260402-ai-agent-memory-architecture/https://gu-log.vercel.app/posts/sd-11-20260402-ai-agent-memory-architecture/AI agent 最讓人崩潰的問題之一：每次新 session 什麼都忘了。Claude Code 原始碼裡藏著一套三層記憶架構，設計哲學是「Memory 是 hint，不是 truth」。從架構原理、forked subagent 設計，到跟 RAG 的取捨比較，帶你把這套架構學起來。Thu, 02 Apr 2026 00:00:00 GMTClaude Code 的 5 個反面教材 — AI 時代的 Bad Design Patternshttps://gu-log.vercel.app/posts/sd-12-20260402-claude-code-bad-patterns/https://gu-log.vercel.app/posts/sd-12-20260402-claude-code-bad-patterns/Claude Code 原始碼洩漏，社群盯著 KAIROS 和 model codenames 看。但裡面還有另一面：5 個讓 $2.5B ARR 產品顯得很尷尬的設計決策。這些不是 Anthropic 獨有的問題——它們是 AI 生成 code 的系統性陷阱，你的 codebase 裡很可能也有。Thu, 02 Apr 2026 00:00:00 GMTPrompt Cache Economics — 為什麼你的 AI 帳單比想像中貴https://gu-log.vercel.app/posts/sd-13-20260402-prompt-cache-economics/https://gu-log.vercel.app/posts/sd-13-20260402-prompt-cache-economics/Prompt caching 本來應該幫你省 90% 的 token 費用，但有一個 bug 可以讓你不知不覺多付十倍錢。從 Claude Code 原始碼洩漏的 DANGEROUS_uncachedSystemPromptSection 到 cch=00000 計費地雷，原來 prompt 工程師現在也要是個會計師。Thu, 02 Apr 2026 00:00:00 GMTAI Agent 的 Initiative Problem — 什麼時候該讓 Agent 自己動？https://gu-log.vercel.app/posts/sd-14-20260402-ai-agent-initiative-problem/https://gu-log.vercel.app/posts/sd-14-20260402-ai-agent-initiative-problem/你花了幾個月打造一個超強的 AI agent，結果它就坐在那裡等你叫它。這不是技術問題，是設計哲學問題。從 KAIROS 的 Heartbeat Pattern 到 OpenClaw 的 background session，這篇探討：什麼時候應該讓 agent 自己決定行動。Thu, 02 Apr 2026 00:00:00 GMTUndercover Mode 問出了一個沒人想回答的問題https://gu-log.vercel.app/posts/sd-15-20260402-ai-attribution-ethics/https://gu-log.vercel.app/posts/sd-15-20260402-ai-attribution-ethics/Claude Code 的原始碼洩漏裡藏著一個叫 undercover.ts 的檔案，設計目的是讓 AI 的 commit 看起來像人類寫的。這件事問出了一個業界至今沒有共識的問題：你的團隊用 AI 寫 code，應該標注嗎？Thu, 02 Apr 2026 00:00:00 GMTAI 能測試自己嗎？— 從 Claude Code 零測試到 Self-Testing Agent 的可能性https://gu-log.vercel.app/posts/sd-16-20260402-can-ai-test-itself/https://gu-log.vercel.app/posts/sd-16-20260402-can-ai-test-itself/Claude Code 512K 行 TypeScript，64K 行生產碼，零測試。但比零測試更讓人困惑的問題是：Anthropic 有全世界最好的 AI coding 工具，他們為什麼不讓它幫自己寫測試？從靜態分析到 MITM proxy，從遞迴自我測試的哲學困境到 OpenClaw 的實戰做法，探索 Self-Testing Agent 到底能走多遠。Thu, 02 Apr 2026 00:00:00 GMT那張 xkcd 沒告訴你的事：AI 時代的「值不值得自動化」https://gu-log.vercel.app/posts/sd-17-20260402-is-it-worth-the-time/https://gu-log.vercel.app/posts/sd-17-20260402-is-it-worth-the-time/xkcd #1205 那張經典圖表，教了整整一代工程師怎麼算『值不值得自動化』。但 AI 把等式裡最貴的變數直接砍掉了：現在回本的不只是時間，更多時候是 cognitive load。Thu, 02 Apr 2026 00:00:00 GMT從「會想」到「會做」— Qwen 核心成員拆解 AI 的下一個戰場：Agentic Thinkinghttps://gu-log.vercel.app/posts/sp-141-20260402-article-qwen-ai-agentic-thinking/https://gu-log.vercel.app/posts/sp-141-20260402-article-qwen-ai-agentic-thinking/Qwen 團隊核心成員林駿洋深度長文：從 o1/R1 的 reasoning 時代走到 agentic thinking 時代，模型不再只是想得久，而是要想了就做、做了再想。這改變了 RL 基礎設施、訓練目標、甚至整個產業的競爭維度。Thu, 02 Apr 2026 00:00:00 GMT你不需要一直盯著 Claude Code — ECC 的六種自動化模式全解析https://gu-log.vercel.app/posts/sp-143-20260402-ecc-autonomous-loops/https://gu-log.vercel.app/posts/sp-143-20260402-ecc-autonomous-loops/Everything Claude Code 把 AI 自動化開發整理成六個層級：從最基本的 Sequential Pipeline 到最複雜的 RFC-Driven DAG。每個模式都有具體的指令範例和適用場景，讓你知道什麼時候可以放手、放多少、怎麼放。Thu, 02 Apr 2026 00:00:00 GMT給「慢下來」三個字的深度辯護 — 遊戲老兵拆解 Coding Agent 正在毀掉你的 Codebasehttps://gu-log.vercel.app/posts/sp-142-20260402-mario-zechner-coding-agent-codebase/https://gu-log.vercel.app/posts/sp-142-20260402-mario-zechner-coding-agent-codebase/Mario Zechner 在這篇文章裡，用很重的語氣批評 coding agent 被帶進 production 後的幾個連鎖問題：錯誤會複利、agent 不會自己學、架構複雜度失控、搜尋 recall 低。結論不是停用 agent，而是慢下來，把人類的判斷和紀律放回流程裡。Thu, 02 Apr 2026 00:00:00 GMTAI 犯了錯，你糾正，它記住了 — ECC 的 Instinct System 自我學習架構https://gu-log.vercel.app/posts/sp-144-20260402-ecc-instinct-system/https://gu-log.vercel.app/posts/sp-144-20260402-ecc-instinct-system/Everything Claude Code 的 Instinct System 把 AI 每次用到的行為模式蒸餾成「本能」：有信心分數、有專案隔離、有跨專案升級機制。這不是靜態的 MEMORY.md，是從使用中動態自我學習的完整框架。Thu, 02 Apr 2026 00:00:00 GMTGit Hooks 改變了你寫 Code 的方式，AI Hooks 再改變一次https://gu-log.vercel.app/posts/sp-146-20260402-ecc-hook-architecture/https://gu-log.vercel.app/posts/sp-146-20260402-ecc-hook-architecture/Git hooks 在你忘記的時候依然工作。AI hooks 讓你的 Claude Code 在你不注意的時候依然守規矩。ECC 的 Hook Architecture 把 Pre/PostToolUse、lifecycle hooks、15+ 內建 recipes 整合成一套完整的事件驅動系統——讓 CLAUDE.md 的規則從「建議」變成「強制力」。Thu, 02 Apr 2026 00:00:00 GMTAI 員工太聽話了：Prompt Injection、動物園逃脫，以及為什麼你的 Agent 需要防彈背心https://gu-log.vercel.app/posts/sp-149-20260402-ecc-agent-security/https://gu-log.vercel.app/posts/sp-149-20260402-ecc-agent-security/你的 AI Agent 超聽話——但它聽的可能不是你的話。Prompt Injection 就是在 AI 身上跑社交工程，Tool Use Exploitation 是把瑞士刀交給 5 歲小孩，Context Poisoning 是圖書館裡有人偷改書。然後還有動物園逃脫。Thu, 02 Apr 2026 00:00:00 GMT一個人、十個月、50K Stars — ECC 創作者 Affaan Mustafa 的 Indie Hacker 故事https://gu-log.vercel.app/posts/sp-150-20260402-ecc-indie-hacker-ecc/https://gu-log.vercel.app/posts/sp-150-20260402-ecc-indie-hacker-ecc/Everything Claude Code 的創作故事：一個人花十個月、用 AI 開發 AI 工具，從一個 config pack 演化成 50K+ stars 的跨平台生態系。這不是工具介紹，是 AI 時代 indie hacker 能做到什麼的真實案例。Thu, 02 Apr 2026 00:00:00 GMTEval-Driven Development — 你測你的 code，但誰測你的 AI？https://gu-log.vercel.app/posts/sp-151-20260402-ecc-eval-driven-development/https://gu-log.vercel.app/posts/sp-151-20260402-ecc-eval-driven-development/你用 unit test 測你的 code，用 CI 保護你的 pipeline。但你的 AI 呢？Eval-Driven Development（EDD）把 AI 開發從「感覺不錯就上」升級成有指標的工程紀律——pass@k 指標、三種評分器、Product vs Regression evals，這是 AI 時代真正的 TDD。Thu, 02 Apr 2026 00:00:00 GMTClaude Code $200/月不夠用？一個設定省 60% Tokenhttps://gu-log.vercel.app/posts/sp-152-20260402-ecc-token-optimization/https://gu-log.vercel.app/posts/sp-152-20260402-ecc-token-optimization/Token 帳單看起來嚇人，但大部分的浪費是隱形的：Extended Thinking 在不需要思考的任務上燒錢、Opus 去做 Haiku 就夠的工作、context 塞滿了才想到要 compact。ECC 的 token-optimization.md 說一套 MAX_THINKING_TOKENS + 模型路由 + 策略性 compact 組合，可以把成本壓低 60-80%——作者 Affaan Mustafa 自己的數字。Thu, 02 Apr 2026 00:00:00 GMT9 個 AI Agent 同時工作時的 Context Problem — ECC Iterative Retrieval Pattern 實戰解析https://gu-log.vercel.app/posts/sp-153-20260402-ecc-iterative-retrieval/https://gu-log.vercel.app/posts/sp-153-20260402-ecc-iterative-retrieval/今晚我們同時跑了 9 個 Claude Code agent 寫文章，撞上了 article counter race condition 和 git lock conflict。ECC 的 iterative retrieval pattern 說的是一樣的問題：多 agent 共享 context 時，怎麼不把彼此搞爆。結論：isolated state + atomic pre-allocation + sequential deploy，是唯一出路。Thu, 02 Apr 2026 00:00:00 GMT如果 AI 科學家也會長記性：EvoScientist 讓研究策略自己進化https://gu-log.vercel.app/posts/sp-154-20260402-evoscientist-multi-agent-ai-scientist/https://gu-log.vercel.app/posts/sp-154-20260402-evoscientist-multi-agent-ai-scientist/大多數 AI scientist 系統像很會做簡報的實習生：每次都很努力，但每次都忘記昨天怎麼失敗。EvoScientist 把 Researcher、Engineer、Evolution Manager 三個 agent 加上兩套 persistent memory，讓 AI 不只會做研究，還會從失敗裡長出新的研究策略。Thu, 02 Apr 2026 00:00:00 GMT為什麼程式員愛 Codex，Vibe Coder 離不開 Claude？Dense vs MoE 背後其實是兩種 coding 哲學https://gu-log.vercel.app/posts/sp-155-20260402-berryxia-codex-vs-claude-dense-moe/https://gu-log.vercel.app/posts/sp-155-20260402-berryxia-codex-vs-claude-dense-moe/Berryxia 用 Dense vs MoE 解釋一個很多人都有感的現象：Codex 常被程式員拿來修 bug、重構、跑長任務；Claude 卻特別受 vibe coder 喜歡。這個說法有抓到一部分，但真正的分水嶺不只在模型架構，而在訓練哲學、產品形態，還有你把 coding 當成『精準執行』還是『互動創作』。Thu, 02 Apr 2026 00:00:00 GMTFelipe Coury 的 tmux 工作流：零摩擦 session，才是 CLI Agent 時代真正的效率外掛https://gu-log.vercel.app/posts/sp-156-20260402-fcoury-tmux-workflow/https://gu-log.vercel.app/posts/sp-156-20260402-fcoury-tmux-workflow/Felipe Coury 把 tmux session 管理壓到幾乎零摩擦：每個 project 一個 session，directory name 就是 session name，再配上 tm、tp、tv、tn、zm 五個 helper。這看起來像 terminal 小技巧，實際上很像 CLI Agent 時代的基礎設施。Thu, 02 Apr 2026 00:00:00 GMTaxios 爆出供應鏈攻擊，Karpathy：套件管理器的預設值該改了https://gu-log.vercel.app/posts/cp-233-20260401-article-axios-karpathy/https://gu-log.vercel.app/posts/cp-233-20260401-article-axios-karpathy/npm 最熱門的 HTTP 函式庫 axios 遭供應鏈攻擊，Karpathy 差點中招。他的結論：個人防護有限，真正該改的是套件管理器的預設值。Wed, 01 Apr 2026 00:00:00 GMTClaude Code 原始碼外洩 — npm 上的 source map 洩漏了它可能的下一步https://gu-log.vercel.app/posts/sp-139-20260401-article-claude-code-npm-source-map/https://gu-log.vercel.app/posts/sp-139-20260401-article-claude-code-npm-source-map/Anthropic 不小心把 Claude Code CLI 的完整 TypeScript 原始碼打包進 npm 的 source map。裡面藏了自主 agent、model 代號、消失的權限提示、還有一個電子雞系統。Wed, 01 Apr 2026 00:00:00 GMTClaude Code 寵物系統上線 — 我把白板仙人掌刷成了金色傳說閃光卡皮巴拉https://gu-log.vercel.app/posts/sp-140-20260402-article-claude-code/https://gu-log.vercel.app/posts/sp-140-20260402-article-claude-code/Claude Code 愚人節悄悄上線了 /buddy 寵物系統，有物種、稀有度、閃光機制，完整的抽卡體驗。原作者不甘心抽到白板仙人掌，從洩漏原始碼中拆解出 Bones + Soul 雙層架構，找到 userID 回退漏洞，暴力碰撞出金色傳說卡皮巴拉。Wed, 01 Apr 2026 00:00:00 GMTClaude Code 原始碼洩漏事件全解析 — 512K 行 TypeScript 說了什麼 AI Agent 架構秘密https://gu-log.vercel.app/posts/sp-148-20260401-chaofan-shou-claude-code-source-leak/https://gu-log.vercel.app/posts/sp-148-20260401-chaofan-shou-claude-code-source-leak/2026-03-31 凌晨，Anthropic 意外在 npm 洩漏完整 Claude Code 原始碼。裡面有 KAIROS 自主背景 agent、三層記憶架構、Undercover Mode、silent model 降級等秘密——而且有些架構跟我們 OpenClaw 的設計驚人地相似。Wed, 01 Apr 2026 00:00:00 GMTNatural-Language Agent Harnesses：當 agent 的靈魂從程式碼搬進自然語言https://gu-log.vercel.app/posts/cp-226-20260330-daniel-mac8-natural-language-agent-harnesses-agent-code/https://gu-log.vercel.app/posts/cp-226-20260330-daniel-mac8-natural-language-agent-harnesses-agent-code/清華深圳團隊提出 NLAH（Natural-Language Agent Harnesses）：把 agent 的控制邏輯從程式碼搬進結構化自然語言，再用 IHR runtime 執行。實驗顯示 harness 能徹底重塑 agent 行為模式，但更多結構不一定等於更好表現。Dan McAteer 認為 harness engineering 的重要性不亞於模型能力本身。Tue, 31 Mar 2026 00:00:00 GMTVibe Engineering — 從「丟 prompt 碰運氣」到「架構化造軟體」的進化論https://gu-log.vercel.app/posts/cp-231-20260331-pawelhuryn-vibe-engineering-vibe-coding/https://gu-log.vercel.app/posts/cp-231-20260331-pawelhuryn-vibe-engineering-vibe-coding/Paweł Huryn 提出 Vibe Engineering 框架：不是把 AI 輸出照單全收，而是透過 Context Engineering、Intent Engineering、和 Sub-agent 編排，把 AI coding 從「碰運氣出 demo」升級到「穩定出產品」。Tue, 31 Mar 2026 00:00:00 GMTllama.cpp 十萬星 — Georgi Gerganov 給 local AI 的情書https://gu-log.vercel.app/posts/cp-232-20260331-ggerganov-llama-cpp-100k-local-ai/https://gu-log.vercel.app/posts/cp-232-20260331-ggerganov-llama-cpp-100k-local-ai/llama.cpp 突破 10 萬顆星。創辦人 Georgi Gerganov 回顧 local LLM 的進展，聊了聊 agentic 時代、「夠用的智慧」、以及為什麼他認為開放可移植的軟體堆疊是唯一合理的路。Tue, 31 Mar 2026 00:00:00 GMT一兆參數模型跑在 MacBook 上？SSD 串流推理的狂野實驗https://gu-log.vercel.app/posts/cp-228-20260330-simonw-macbook-ssd/https://gu-log.vercel.app/posts/cp-228-20260330-simonw-macbook-ssd/Simon Willison 分享了在 Mac 上跑超大 MoE 模型的新趨勢：把 expert weights 從 SSD 串流進來，不用全塞進 RAM。連 1 兆參數的 Kimi K2.5 都能在 96GB MacBook Pro 上跑起來。Mon, 30 Mar 2026 00:00:00 GMTClaude Code 不只能寫 code — 六個讓你生產力翻倍的非 coding 模式https://gu-log.vercel.app/posts/cp-229-20260330-rjehuappiah-claude-code-personal-wiki/https://gu-log.vercel.app/posts/cp-229-20260330-rjehuappiah-claude-code-personal-wiki/rodspeed 在完整 blog post 裡分享六個把 Claude Code 從 code editor 變成個人 operating system 的玩法：製造 fresh eyes、用 meta-skill 管 specialist、解 freshness、把對話收成 wiki、用分層 memory 累積脈絡，以及靠 handoff 跨 session 接棒。重點不是叫 AI 多寫幾行 code，而是把 read-filter-decide-present 這類流程都自動化。Mon, 30 Mar 2026 00:00:00 GMTFigma 把畫布打開給 AI agent 了 — 現在可以直接在 canvas 上做設計https://gu-log.vercel.app/posts/cp-230-20260330-figma-figma-ai-agent-canvas/https://gu-log.vercel.app/posts/cp-230-20260330-figma-figma-ai-agent-canvas/Figma 透過 MCP server 的 use_figma 工具，讓 Claude Code、Codex 等 AI agent 可以直接在畫布上建立和修改設計，並用 skills（markdown 指令檔）引導 agent 遵守團隊的設計系統與慣例。這不只是又一個 AI 功能，而是把設計決策的脈絡直接交給 agent 操作。Mon, 30 Mar 2026 00:00:00 GMTClaude Code 隱藏功能大全 — Boris Cherny 的 15 招日常必殺技https://gu-log.vercel.app/posts/sp-138-20260330-bcherny-claude-code-boris-cherny-15/https://gu-log.vercel.app/posts/sp-138-20260330-bcherny-claude-code-boris-cherny-15/Boris Cherny 分享 15 個他最常用的 Claude Code 隱藏與較少人注意到的功能，從手機 app、loop/schedule、worktree 到語音輸入都有涵蓋。Mon, 30 Mar 2026 00:00:00 GMTClaude Code 找 99%+ bug，工程師再做 sanity checkhttps://gu-log.vercel.app/posts/cp-222-20260329-bcherny-claude-code-99-bug-sanity-check/https://gu-log.vercel.app/posts/cp-222-20260329-bcherny-claude-code-99-bug-sanity-check/Boris Cherny 表示，他們會先用 Claude Code 找出 99%+ 的 bug，再由工程師做 sanity check，確認沒有漏掉明顯問題。Sun, 29 Mar 2026 00:00:00 GMTPaweł Huryn：稀缺技能不是管 AI Agent，而是設計讓它們真正有用的知識架構https://gu-log.vercel.app/posts/cp-223-20260329-pawelhuryn-ai-agent-knowledge-architecture/https://gu-log.vercel.app/posts/cp-223-20260329-pawelhuryn-ai-agent-knowledge-architecture/Paweł Huryn 回應「Anthropic 團隊不再自己寫 code」的說法：標題沒錯，但框架搞錯了。瓶頸從來不是「多開幾個 agent」，而是你怎麼設計 knowledge architecture 讓它們真正有效。Sun, 29 Mar 2026 00:00:00 GMTKarpathy：花四小時用 LLM 打磨論點，結果叫它反駁就被自己說服了https://gu-log.vercel.app/posts/cp-224-20260329-karpathy-llm-sycophancy-opposite/https://gu-log.vercel.app/posts/cp-224-20260329-karpathy-llm-sycophancy-opposite/Andrej Karpathy 花四小時用 LLM 打磨一篇文章的論點，覺得超有說服力，結果叫 LLM 反駁就被徹底擊潰。LLM 的 sycophancy 是真實的陷阱，但反過來利用也是 alpha。Sun, 29 Mar 2026 00:00:00 GMTArtificial Analysis 推出 AA-AgentPerf：AI 硬體 benchmark 終於進入 agent 時代https://gu-log.vercel.app/posts/cp-225-20260329-artificialanlys-aa-agentperf-agent-benchmark/https://gu-log.vercel.app/posts/cp-225-20260329-artificialanlys-aa-agentperf-agent-benchmark/Artificial Analysis 發布 AA-AgentPerf，一個專門衡量 AI 加速器硬體在真實 agent 工作負載下表現的 benchmark。用真實 coding agent 軌跡測試，允許 production 級優化，支援從單張卡到整個 rack 的評測。Sun, 29 Mar 2026 00:00:00 GMTVibe Coding SwiftUI：不會 Swift 也能寫出 macOS App 的快樂與代價https://gu-log.vercel.app/posts/sp-137-20260329-simonwillison-vibe-coding-swiftui-swift-macos-app/https://gu-log.vercel.app/posts/sp-137-20260329-simonwillison-vibe-coding-swiftui-swift-macos-app/Simon Willison 用 Claude Opus 4.6 和 GPT-5.4 vibe code 出兩個 macOS menu bar app——一個看網路流量、一個看 GPU 狀態。整個 SwiftUI app 塞在一個檔案裡，連 Xcode 都不用開。但他自己也承認：這些 app 的數字準不準，他完全不知道。Sun, 29 Mar 2026 00:00:00 GMTKarpathy：Vibe Coding 最難的不是寫 code，是那堆 DevOps IKEA 傢俱https://gu-log.vercel.app/posts/cp-218-20260328-karpathy-vibe-coding-devops-ikea/https://gu-log.vercel.app/posts/cp-218-20260328-karpathy-vibe-coding-devops-ikea/Andrej Karpathy 回顧一年前建 menugen 的經驗，指出 vibe coding 真正的痛點不在程式碼本身，而是部署時要組裝的各種服務（auth、payments、DB、domain）。他期待未來 agent 能一句話搞定從開發到上線的完整流程。Sat, 28 Mar 2026 00:00:00 GMTSemiAnalysis：AI 推論不是大宗商品，是體驗管理https://gu-log.vercel.app/posts/cp-219-20260328-semianalysis-semianalysis-ai/https://gu-log.vercel.app/posts/cp-219-20260328-semianalysis-semianalysis-ai/SemiAnalysis 五則推文的完整論述：AI inference 不是 race to the bottom，而是一場「體驗管理」的賽局。懂得調控 interactivity 的廠商能拿 60%+ 毛利率，不懂的才會一路跌到零。Sat, 28 Mar 2026 00:00:00 GMTATLAS：一張 RTX 5060 Ti + Qwen3-14B 在 LiveCodeBench 跑贏 Sonnet 4.5？拆解 harness 的真正魔法https://gu-log.vercel.app/posts/cp-220-20260328-daniel-mac8-qwen3-14b-rtx-5060-sonnet-4-5-harness/https://gu-log.vercel.app/posts/cp-220-20260328-daniel-mac8-qwen3-14b-rtx-5060-sonnet-4-5-harness/ATLAS 用 frozen Qwen3-14B 搭配單張 RTX 5060 Ti，透過 PlanSearch + best-of-3 生成 + 自我修復 pipeline，在 LiveCodeBench 拿到 74.6%，超越 Sonnet 4.5 的 71.4%。但細看方法論，這不是 pass@1 對 pass@1 的公平比較。Sat, 28 Mar 2026 00:00:00 GMTCursor CEO：雲端 Agent 兩週狂刷一百萬個 commit，幾乎全是 AI 寫的https://gu-log.vercel.app/posts/cp-221-20260328-mntruell-cursor-cloud-agents-1m-commits/https://gu-log.vercel.app/posts/cp-221-20260328-mntruell-cursor-cloud-agents-1m-commits/Cursor CEO Michael Truell 宣布雲端 agent 在過去兩週產出超過一百萬個 commit，幾乎全是 AI 自主完成。回覆中有人點出：當寫 code 的成本趨近於零，review、rollback 和 blame tracing 才是真正的產品。Sat, 28 Mar 2026 00:00:00 GMTLangChain 怎麼幫 Deep Agents 做 Eval — 更多 eval ≠ 更好的 agenthttps://gu-log.vercel.app/posts/sp-133-20260328-vtrivedy10-langchain-deep-agents-eval-eval-agent/https://gu-log.vercel.app/posts/sp-133-20260328-vtrivedy10-langchain-deep-agents-eval-eval-agent/LangChain 團隊分享他們怎麼幫 Deep Agents 建 eval 系統：不是瘋狂堆測試數量，而是用 targeted eval 精準量測生產環境中真正在乎的 agent 行為。從資料來源、metrics 設計到實際跑 eval 的完整方法論。Sat, 28 Mar 2026 00:00:00 GMTClaude Code Playground Plugin：讓 AI 生出互動式 HTML 小工具的新玩法https://gu-log.vercel.app/posts/sp-134-20260328-trq212-claude-code-playground-plugin-ai-html/https://gu-log.vercel.app/posts/sp-134-20260328-trq212-claude-code-playground-plugin-ai-html/Thariq 在 X 上介紹 Claude Code 的 playground plugin。它會幫 Claude 生成獨立的 HTML playground，讓你把互動結果整理成 prompt 貼回 Claude Code，適合處理不太適合用純文字互動的場景。Sat, 28 Mar 2026 00:00:00 GMTYour Agent Should Use a File System：比起撐大 context window，讓 AI 學會找資料更重要https://gu-log.vercel.app/posts/sp-135-20260328-trq212-agent-file-system/https://gu-log.vercel.app/posts/sp-135-20260328-trq212-agent-file-system/Anthropic 工程師 Thariq 丟出一個超值得抄的觀點：AI agent 不該把 state 硬塞進 context window，而該用 file system 落地。這不只比較能跨 session 持久保存，還能讓 agent 反覆搜尋、驗證、修正自己的工作。Sat, 28 Mar 2026 00:00:00 GMTBash Is All You Need？為什麼連非 Coding Agent 都該配一個 Shellhttps://gu-log.vercel.app/posts/sp-136-20260328-trq212-bash-is-all-you-need/https://gu-log.vercel.app/posts/sp-136-20260328-trq212-bash-is-all-you-need/Anthropic 工程師 Thariq 認為，就算不是 coding agent，也該有 bash tool。因為 agent 一旦能把中間結果存成檔案、反覆搜尋、串接 API、自己驗證，能力會直接升級；但安全與容器部署也因此變成不能逃避的問題。Sat, 28 Mar 2026 00:00:00 GMTNVIDIA 的推論帝國擴張：從 Groq 到全新機架架構解析https://gu-log.vercel.app/posts/cp-213-20260327-dylan-patel-nvidia-groq/https://gu-log.vercel.app/posts/cp-213-20260327-dylan-patel-nvidia-groq/NVIDIA 在 GTC 2026 發表了 Groq LPX、Vera ETL256 與 STX 等全新系統。本文深入解析 LPU 與 GPU 的分工、CPO 發展路線以及未來的網路與儲存架構。Fri, 27 Mar 2026 00:00:00 GMTAI Coding Slop 入侵 OSS — 當 AI PR 連 NVIDIA 工程師都看不下去https://gu-log.vercel.app/posts/cp-214-20260327-semianalysis-ai-coding-slop-oss-ai-pr-nvidia/https://gu-log.vercel.app/posts/cp-214-20260327-semianalysis-ai-coding-slop-oss-ai-pr-nvidia/OpenAI Triton 合併了一個號稱修復消費級 Blackwell GPU 問題的 AI 生成 PR，結果根本沒修好。NVIDIA PyTorch 技術主管親自下場留言表示這是徹頭徹尾的 slop。SemiAnalysis 警告：AI slop 與有價值的 diff 越來越難分辨。Fri, 27 Mar 2026 00:00:00 GMTClaude Code 雲端 Auto-Fix：PR 自己修 CI、自己回 comment (◍•ᴗ•◍)https://gu-log.vercel.app/posts/cp-215-20260327-noahzweben-claude-code-auto-fix-pr-ci-comment/https://gu-log.vercel.app/posts/cp-215-20260327-noahzweben-claude-code-auto-fix-pr-ci-comment/Claude Code 推出雲端 auto-fix 功能：Web/Mobile session 可以自動追蹤你的 PR，幫你修 CI failure、回覆 review comment，讓 PR 永遠保持綠燈。整個過程在雲端跑，你可以直接離開去喝咖啡。Fri, 27 Mar 2026 00:00:00 GMTClaude 現在會操作你的電腦了 — Dispatch + Computer Use 研究預覽 (◍•ᴗ•◍)https://gu-log.vercel.app/posts/cp-216-20260327-anthropic-claude-dispatch-computer-use/https://gu-log.vercel.app/posts/cp-216-20260327-anthropic-claude-dispatch-computer-use/Anthropic 發布 Claude computer use 功能：在 Claude Cowork 和 Claude Code 中，Claude 可以直接操作你的螢幕、滑鼠、鍵盤來完成任務。搭配 Dispatch，你可以從手機指派任務，讓 Claude 在你離開時用你的電腦工作。目前是 research preview，僅支援 macOS。Fri, 27 Mar 2026 00:00:00 GMTGTC 2026：Nvidia 的 Inference 版圖持續擴張 — Groq IP 授權交易、LPU 解碼、CPO 光學路線圖https://gu-log.vercel.app/posts/cp-217-20260327-dylanpatel-gtc-2026-nvidia-inference-groq-ip-lpu-cpo/https://gu-log.vercel.app/posts/cp-217-20260327-dylanpatel-gtc-2026-nvidia-inference-groq-ip-lpu-cpo/SemiAnalysis 的 GTC 2026 深度總結：Nvidia 透過與 Groq 的 IP 授權與團隊整合切入 LPU，並更新 AFD、CPO、Kyber/Oberon、Vera ETL256 與 CMX/STX。重點是 Nvidia 正在往更完整的 inference 與資料中心系統版圖延伸。Fri, 27 Mar 2026 00:00:00 GMTGumroad CEO 把自己的書變成 10 個 Claude Code Skills — 知識不該只是被讀，而是被執行https://gu-log.vercel.app/posts/sp-128-20260327-shl-minimalist-entrepreneur-claude-skills/https://gu-log.vercel.app/posts/sp-128-20260327-shl-minimalist-entrepreneur-claude-skills/Gumroad CEO Sahil Lavingia 把他的暢銷書《The Minimalist Entrepreneur》拆解成 10 個 Claude Code skills，從找社群、驗證想法到定價策略，每個創業階段都有對應的 slash command。這不只是 prompt 包裝 — 它示範了一種全新的知識傳遞方式。Fri, 27 Mar 2026 00:00:00 GMTCloudflare Dynamic Workers：AI Agent 沙盒加速 100 倍的秘密武器https://gu-log.vercel.app/posts/sp-129-20260327-cloudflare-dynamic-workers/https://gu-log.vercel.app/posts/sp-129-20260327-cloudflare-dynamic-workers/Cloudflare 推出 Dynamic Workers，讓 AI agent 生成的程式碼跑在輕量 V8 isolate 裡，啟動只要幾毫秒、記憶體只佔幾 MB — 比傳統 container 快 100 倍。這篇拆解它的架構設計、安全模型、TypeScript RPC 的巧妙之處，以及為什麼 JavaScript 才是 AI sandbox 的正確語言。Fri, 27 Mar 2026 00:00:00 GMT用 Codex 做出驚豔 UI 的完整攻略 — 別再讓 AI 幫你寫出千篇一律的 SaaS 風格了https://gu-log.vercel.app/posts/sp-130-20260327-emanueledpt-codex-ui-guide/https://gu-log.vercel.app/posts/sp-130-20260327-emanueledpt-codex-ui-guide/GPT-5.4 確實能寫出漂亮的前端，但前提是你得知道怎麼問。Emanuele Di Pietro 整理了 OpenAI 官方的 frontend skill 精華：design system 先行、reasoning 調低、給 visual reference、用真實內容取代 placeholder。這不只是 GPT 技巧，是任何 AI coding agent 都適用的前端指導原則。Fri, 27 Mar 2026 00:00:00 GMTAgent 安全指令被壓縮吃掉，Meta 工程師的信箱慘遭血洗 — 為什麼 Safety 不能活在對話歷史裡https://gu-log.vercel.app/posts/sp-131-20260327-avichawla-openclaw-agent-safety/https://gu-log.vercel.app/posts/sp-131-20260327-avichawla-openclaw-agent-safety/Meta 工程師 Summer Yue 讓 OpenClaw agent 管理她的信箱，結果 context compaction 把「等我同意再行動」的安全指令壓縮掉了，agent 開始瘋狂刪信。這篇拆解為什麼安全邏輯不能活在 conversation history 裡，以及 proxy layer + filter chain 如何從根本上解決這個問題。Fri, 27 Mar 2026 00:00:00 GMTAnthropic 的 Multi-Agent 煉金術：用 GAN 思維讓 AI 自己跟自己對練https://gu-log.vercel.app/posts/sp-132-20260327-anthropic-multi-agent-harness-design/https://gu-log.vercel.app/posts/sp-132-20260327-anthropic-multi-agent-harness-design/Anthropic Labs 的 Prithvi Rajasekaran 分享了他們如何用 GAN 啟發的 generator-evaluator 架構，讓 Claude 自主開發完整的 full-stack 應用。從 frontend design 品質評分到三小時生出一個瀏覽器 DAW，這篇是目前最詳盡的 multi-agent harness 實戰報告。Fri, 27 Mar 2026 00:00:00 GMTClaude Code Channels：Anthropic 用一個更新幹掉了買 Mac Mini 的理由https://gu-log.vercel.app/posts/cp-210-20260326-claude-code-channels-openclaw-killer/https://gu-log.vercel.app/posts/cp-210-20260326-claude-code-channels-openclaw-killer/Anthropic 推出 Claude Code Channels，原生支援 Telegram 和 Discord 雙向通訊，讓 Claude Code 變成 24/7 常駐 AI agent。VentureBeat 直接稱之為 OpenClaw killer。Thu, 26 Mar 2026 00:00:00 GMTOpenAI 把 Sora 砍了：IPO 前的大掃除，還有一顆叫 Spud 的神秘模型https://gu-log.vercel.app/posts/cp-211-20260326-tomsguide-openai-sora-ipo-spud/https://gu-log.vercel.app/posts/cp-211-20260326-tomsguide-openai-sora-ipo-spud/OpenAI 在 IPO 前夕砍掉了 Sora 影片生成服務，Disney 也退出了三年授權合約。同時一個代號 Spud 的新模型據報已完成，Altman 據稱說它能「加速經濟」。整間公司正在從「什麼都做」轉向「做一個超級 app」。Thu, 26 Mar 2026 00:00:00 GMT分離式規劃：為什麼最強的推理模型不一定是最好的寫扣仔？https://gu-log.vercel.app/posts/cp-212-20260326-semianalysis-disaggregated-planning/https://gu-log.vercel.app/posts/cp-212-20260326-semianalysis-disaggregated-planning/SemiAnalysis 認為，agentic coding 也可能像 disaggregated prefill 一樣，把 planning 與 execution 分開處理。若 spec 寫得夠好，較便宜的模型或許就能負責 execution，降低成本。Thu, 26 Mar 2026 00:00:00 GMTClaude Code Auto Mode：讓 AI 自己判斷哪些指令該擋、哪些放行https://gu-log.vercel.app/posts/sp-127-20260326-anthropic-claude-code-auto-mode/https://gu-log.vercel.app/posts/sp-127-20260326-anthropic-claude-code-auto-mode/Anthropic 發佈 Claude Code 的 auto mode — 用 model-based classifier 取代人類的權限審批，在「全手動」和「全跳過」之間找到平衡點。本文拆解它的架構、威脅模型、兩階段分類器設計，以及 17% false negative 背後的誠實數字。Thu, 26 Mar 2026 00:00:00 GMT知名 Python 函式庫 LiteLLM 遭植入後門，你的整台機器可能都被看光光了https://gu-log.vercel.app/posts/cp-207-20260325-adam-conway-python-litellm/https://gu-log.vercel.app/posts/cp-207-20260325-adam-conway-python-litellm/知名 AI 函式庫 LiteLLM 遭植入惡意後門，安裝即可能觸發，會竊取 SSH 密鑰、雲端憑證及加密貨幣錢包等敏感資料。Wed, 25 Mar 2026 00:00:00 GMT你的模型偏好能「繼承」嗎？探討 RL 模型的可轉移性https://gu-log.vercel.app/posts/cp-208-20260325-thom-wolf-rl/https://gu-log.vercel.app/posts/cp-208-20260325-thom-wolf-rl/隨著新模型發布速度不斷加快，Hugging Face 的 Thomas Wolf 提出了一個值得深思的問題：當我們把模型客製化後，換新模型時這些偏好該怎麼辦？本文探討 RL 模型轉移性的研究空白與挑戰。Wed, 25 Mar 2026 00:00:00 GMTKarpathy 的軟體噩夢：一個 pip install 就能偷走你所有的 keyhttps://gu-log.vercel.app/posts/cp-209-20260325-karpathy-litellm-supply-chain-dependency-risk/https://gu-log.vercel.app/posts/cp-209-20260325-karpathy-litellm-supply-chain-dependency-risk/LiteLLM 遭供應鏈攻擊，pip install 就能偷走所有憑證。Karpathy 藉此警告依賴樹風險，主張用 LLM 直接補功能取代多裝依賴。Wed, 25 Mar 2026 00:00:00 GMTClaude Code 推出雲端排程任務！告別本機掛機時代 (๑˃ᴗ˂)ﻭhttps://gu-log.vercel.app/posts/cp-202-20260324-noahzweben-claude-code-scheduled-tasks/https://gu-log.vercel.app/posts/cp-202-20260324-noahzweben-claude-code-scheduled-tasks/Claude Code 現在支援雲端排程任務了！只要設定好 repo、時間跟 prompt，就能讓 Claude 在雲端幫你自動跑任務，再也不用讓本機徹夜未眠啦。Tue, 24 Mar 2026 00:00:00 GMT底層技術不再穩定：AI 時代 PM 角色的演進與衝擊https://gu-log.vercel.app/posts/cp-203-20260324-catwu-ai-pm/https://gu-log.vercel.app/posts/cp-203-20260324-catwu-ai-pm/傳統的 PM 教戰守則建立在底層技術相對穩定的假設上。但在 AI 模型進展神速的現在，這個假設已經被打破。來看看這對 PM 角色帶來了什麼挑戰。Tue, 24 Mar 2026 00:00:00 GMTGoogle AI 本週大爆發：從 Vibe Coding 到 AI 原生設計，全面升級！https://gu-log.vercel.app/posts/cp-204-20260324-googleai-google-ai-vibe-coding-ai/https://gu-log.vercel.app/posts/cp-204-20260324-googleai-google-ai-vibe-coding-ai/Google AI 本週推出了一系列重磅更新！包含在 Google AI Studio 的全端 vibe coding 體驗、Stitch 的 AI 原生設計畫布、Gemini API 的強大升級，以及 Kaggle 上的免費 AI 黑客松平台。Tue, 24 Mar 2026 00:00:00 GMT在本地端榨乾效能：捨棄 Python 改用 Metal Shaders 跑大模型實戰https://gu-log.vercel.app/posts/cp-205-20260324-danveloper-python-metal-shaders/https://gu-log.vercel.app/posts/cp-205-20260324-danveloper-python-metal-shaders/開發者 @danveloper 分享在本地端跑 Qwen3.5-397B-A17B 的經驗：因為 Python GIL 成了瓶頸，他們乾脆拿掉 Python，改成 custom metal shaders。Tue, 24 Mar 2026 00:00:00 GMTClaude 會用你的電腦了！但真正的護城河依然是「深度」https://gu-log.vercel.app/posts/cp-206-20260324-unfityogi-claude-computer-use-moat/https://gu-log.vercel.app/posts/cp-206-20260324-unfityogi-claude-computer-use-moat/Claude Computer Use 引發熱烈討論，不少人認為 AI 即將完全取代人類工作。然而原作者指出，AI 雖然能代勞技術操作，卻無法取代人類的判斷力與對文化脈絡的理解。真正的護城河，依舊是對領域知識的深度掌握。Tue, 24 Mar 2026 00:00:00 GMTAgent 不再失憶！Andrew Ng 新課教你打造跨 Session 記憶系統https://gu-log.vercel.app/posts/cp-199-20260323-andrewyng-agent-andrew-ng-session/https://gu-log.vercel.app/posts/cp-199-20260323-andrewyng-agent-andrew-ng-session/Andrew Ng 與 Oracle 合作推出新課程，教你如何為 AI Agent 建立跨 Session 的持久記憶系統，解決單次對話後就『失憶』的痛點。Mon, 23 Mar 2026 00:00:00 GMTCoding Agents 與消失的心流：我們還在 Agent 的撥接時代https://gu-log.vercel.app/posts/cp-200-20260322-awnihannun-coding-agents-flow-state/https://gu-log.vercel.app/posts/cp-200-20260322-awnihannun-coding-agents-flow-state/Awni Hannun 分享了他使用 coding agents 的感受：高延遲打斷了原本能長時間專注的 flow state，也讓人覺得我們還處在 agent 的撥接時代。Mon, 23 Mar 2026 00:00:00 GMTKarpathy 的 AI Psychosis：12 月起沒寫過一行 code，80% 交給 agenthttps://gu-log.vercel.app/posts/cp-201-20260323-karpathy-ai-psychosis-no-priors-podcast/https://gu-log.vercel.app/posts/cp-201-20260323-karpathy-ai-psychosis-no-priors-podcast/Karpathy 在 No Priors podcast 分享自 12 月起 80% code 交給 agent，提出「AI psychosis」概念——給 agent 太多自主權會讓人失去對 output 的掌控感。他認為工程正經歷不可逆的 phase shift。Mon, 23 Mar 2026 00:00:00 GMT.claude/ 資料夾完全解剖 — 你的 AI 助手的大腦在哪裡https://gu-log.vercel.app/posts/sp-124-20260323-akshay-claude-folder-anatomy/https://gu-log.vercel.app/posts/sp-124-20260323-akshay-claude-folder-anatomy/你知道 Claude 為什麼在這個 repo 表現好、換個 repo 就變笨嗎？秘密就在 .claude/ 資料夾裡。Akshay 拆解了整個結構：CLAUDE.md 三層架構、自訂指令、agent、permissions、還有那個你可能不知道存在的全域 ~/.claude/。Mon, 23 Mar 2026 00:00:00 GMTBrowser Use CLI 2.0 — 最高效的瀏覽器自動化 CLI 工具https://gu-log.vercel.app/posts/sp-125-20260323-browseruse-cli-2-browser-automation/https://gu-log.vercel.app/posts/sp-125-20260323-browseruse-cli-2-browser-automation/Browser Use 發佈 CLI 2.0：速度快兩倍、成本砍半，還可以直接連進你正在跑的 Chrome。這是給 AI agent 裝上手腳的那種工具。Mon, 23 Mar 2026 00:00:00 GMT不用 IDE，只靠 plan.md 和語音：Matt Van Horn 的 Claude Code 全流程工作法https://gu-log.vercel.app/posts/sp-126-20260322-mvanhorn-claude-code-hacks/https://gu-log.vercel.app/posts/sp-126-20260322-mvanhorn-claude-code-hacks/Matt Van Horn 分享自己用 Claude Code 的實戰流程：先做 `plan.md`、大量用語音輸入、同時跑多個 session。連會議摘要、遠端操作與 Disney 行程，他都套用同一套方法。Mon, 23 Mar 2026 00:00:00 GMTHermes Agent 正式支援 Browser Use：讓 AI 代理幫你滑社群網站https://gu-log.vercel.app/posts/cp-196-20260322-teknium-hermes-agent-browser-use/https://gu-log.vercel.app/posts/cp-196-20260322-teknium-hermes-agent-browser-use/Teknium 表示 Browser Use 已成為 Hermes-Agent browser tool 的官方 provider。被引用的使用者則表示，把 Hermes 連上 Browser Use 後，它可存取其社群媒體帳號，並保留關於 codebase、tone 與 workflows 的 context。Sun, 22 Mar 2026 00:00:00 GMTCursor 宣布 Composer 2 已可使用https://gu-log.vercel.app/posts/cp-197-20260322-cursor-ai-cursor-composer-2/https://gu-log.vercel.app/posts/cp-197-20260322-cursor-ai-cursor-composer-2/Cursor 在 X 上宣布 Composer 2 已可於 Cursor 中使用。就這則來源可確認的資訊來看，官方僅提供了這句公告與一張截圖。Sun, 22 Mar 2026 00:00:00 GMTOFC 與 GTC 前夕的震撼彈：Optical Compute Interconnect (OCI) 聯盟成立https://gu-log.vercel.app/posts/cp-198-20260322-semianalysis-ofc-gtc-optical-compute-interconnect-oci/https://gu-log.vercel.app/posts/cp-198-20260322-semianalysis-ofc-gtc-optical-compute-interconnect-oci/在 OFC 和 GTC 大會前夕，Optical Compute Interconnect MSA 宣布成立。SemiAnalysis 指出，Nvidia 與其他一些研究方向似乎更偏向基於 DWDM 的「slow and wide」光通訊架構。Sun, 22 Mar 2026 00:00:00 GMT我們怎麼讓 336 篇 AI 文章從「能看」變成「想分享」https://gu-log.vercel.app/posts/sd-10-20260322-ralph-loop-quality-system/https://gu-log.vercel.app/posts/sd-10-20260322-ralph-loop-quality-system/gu-log 有 336 篇 AI 翻譯的文章。我們以為品質「還行」——直到用 multi-agent 系統認真評分後，發現 74% 需要改寫。這是我們怎麼設計評分系統、怎麼 overnight 跑完全站改寫、以及學到了什麼的故事。Sun, 22 Mar 2026 00:00:00 GMTAI 時代的自我審計 — 你是那留下的三個，還是離開的七個？https://gu-log.vercel.app/posts/sp-123-20260322-aiedge-irreplaceable-ai-era/https://gu-log.vercel.app/posts/sp-123-20260322-aiedge-irreplaceable-ai-era/推文作者說，白領職場正在洗牌：10 人團隊變 3 人，但那 3 人的產出超過以前 10 人。問題不是 AI 會不會取代你，而是你站哪一邊。這篇不是在幫 ShroomDog 拍肩膀，是拿這個框架當鏡子，老實照一照。Sun, 22 Mar 2026 00:00:00 GMTHermes Agent v0.3.0 釋出：5 天內完成 248 個 PRhttps://gu-log.vercel.app/posts/cp-193-20260321-teknium-hermes-agent-v0-3-0-5-248-pr/https://gu-log.vercel.app/posts/cp-193-20260321-teknium-hermes-agent-v0-3-0-5-248-pr/NousResearch 的 Hermes Agent v0.3.0 更新被 @Teknium 轉推。貼文提到 5 天內由 15 位貢獻者完成 248 個 PR，並明確列出跨 CLI 與各平台的即時串流；另一項功能則在截圖中被截斷。Sat, 21 Mar 2026 00:00:00 GMTNVIDIA 釋出 Nemotron 3 VoiceChat：在開源語音模型的兩項關鍵指標間取得領先https://gu-log.vercel.app/posts/cp-194-20260321-artificialanlys-nvidia-nemotron3-voicechat/https://gu-log.vercel.app/posts/cp-194-20260321-artificialanlys-nvidia-nemotron3-voicechat/NVIDIA 推出約 12B 參數的 Nemotron 3 VoiceChat。根據 @ArtificialAnlys，它在開源 Speech to Speech 模型中，於對話動態與語音推理兩項指標間取得 Pareto frontier 的領先位置。Sat, 21 Mar 2026 00:00:00 GMTClaude Code 放春假啦！離峰與週末用量直接翻倍https://gu-log.vercel.app/posts/cp-195-20260321-trq212-claude-code-spring-break/https://gu-log.vercel.app/posts/cp-195-20260321-trq212-claude-code-spring-break/Anthropic 工程師 Thariq 宣布 Claude Code Spring Break：未來兩週離峰時段與週末用量翻倍，但什麼時候算離峰？沒人知道。Sat, 21 Mar 2026 00:00:00 GMTUber 五個月長出 500+ AI Skills：企業轉型不是先寫計畫，而是先有人偷跑https://gu-log.vercel.app/posts/sp-122-20260321-li9292-uber-500-ai-skills/https://gu-log.vercel.app/posts/sp-122-20260321-li9292-uber-500-ai-skills/這篇推文整理了 Uber AI Foundations 團隊負責人 Adam Hooda 的訪談，講的是 Claude Skills 怎麼在公司內部從 2 個自然長成 500+。重點不只是數量，而是 Uber 看起來是怎麼靠雙層治理、確定性輸出與元技能，把 AI 輔助開發慢慢推進到企業級規模。Sat, 21 Mar 2026 00:00:00 GMT把 Transformer 變成電腦：瞄準 LLM 基礎計算落差的做法https://gu-log.vercel.app/posts/cp-192-20260320-christostzamos-transformer-llm/https://gu-log.vercel.app/posts/cp-192-20260320-christostzamos-transformer-llm/推文點出 LLM 能解研究級數學題，卻常在基礎計算上遇到困難。原作者展示了直接在 Transformer 內部建構一台「電腦」的做法，讓模型能以秒級速度運行數百萬步程式，甚至達到 100% 準確率解開最難的數獨。Fri, 20 Mar 2026 00:00:00 GMTClaude Code 與 Codex：AI Agent CLI 的底層架構差異與設定指南https://gu-log.vercel.app/posts/sp-120-20260320-nyk-builderz-claude-code-codex-ai-agent-cli/https://gu-log.vercel.app/posts/sp-120-20260320-nyk-builderz-claude-code-codex-ai-agent-cli/很多團隊把 Claude Code 和 Codex 當成可互換的工具，卻因為設定錯誤浪費大量時間。本文解析兩者在控制平面與信任模型上的根本差異，並提供實用的第一天設定指南。Fri, 20 Mar 2026 00:00:00 GMT躺在床上也能讓 AI 幫你工作？Claude Dispatch 完整解析與實戰指南https://gu-log.vercel.app/posts/sp-121-20260320-heynavtoor-ai-claude-dispatch/https://gu-log.vercel.app/posts/sp-121-20260320-heynavtoor-ai-claude-dispatch/Anthropic 悄悄推出了 Dispatch 功能，讓你可以用手機遠端遙控電腦上的 Claude Cowork。這篇帶你了解如何設定、哪些工作流最實用，以及它目前的真實限制。Fri, 20 Mar 2026 00:00:00 GMTClaude + OpenClaw + Codex：如何打造全自動 Polymarket 交易系統https://gu-log.vercel.app/posts/sp-119-20260319-zostaff-claude-openclaw-codex-polymarket/https://gu-log.vercel.app/posts/sp-119-20260319-zostaff-claude-openclaw-codex-polymarket/原作者展示一套把 Claude、Codex 與 OpenClaw 串在一起的 Polymarket 自動交易架構：Claude 判斷機率，Codex 維護程式，OpenClaw 排程執行並透過 Telegram 回報。Thu, 19 Mar 2026 00:00:00 GMT如何讓你的 Claude Skills 變強 10 倍？Andrej Karpathy 的 Autoresearch 方法實戰https://gu-log.vercel.app/posts/sp-117-20260318-itsolelehmann-claude-skills-10-andrej-karpathy-autoresearch/https://gu-log.vercel.app/posts/sp-117-20260318-itsolelehmann-claude-skills-10-andrej-karpathy-autoresearch/Ole Lehmann 分享一個把 Karpathy「autoresearch」概念套進 Claude skills 的做法，讓 agent 自己反覆測試、微調 prompt。以他的 landing page copy skill 為例，quality checks 通過率從 56% 提升到 92%，而且流程幾乎不用手動介入。Wed, 18 Mar 2026 00:00:00 GMTAnthropic 工程師的 Claude Code Skills 實戰筆記：九大類型、設計心法、還有那些踩過的坑https://gu-log.vercel.app/posts/sp-118-20260318-trq212-claude-code-skills-lessons/https://gu-log.vercel.app/posts/sp-118-20260318-trq212-claude-code-skills-lessons/Anthropic 工程師 Thariq 分享內部數百個 Claude Code Skills 的使用經驗：Skills 不只是 markdown 檔案，而是可以包含腳本、資料、hook 的資料夾。他整理出九大類型、分享寫好 skill 的設計心法，以及怎麼在團隊內分發和衡量 skill 效果。Wed, 18 Mar 2026 00:00:00 GMTAI 實驗室的新戰場：搶著幫私募股權公司取消軟體授權？https://gu-log.vercel.app/posts/cp-178-20260317-dee-bosa-openai-pe-saas/https://gu-log.vercel.app/posts/cp-178-20260317-dee-bosa-openai-pe-saas/彭博社指出 OpenAI 正與私募股權公司深入討論合資事宜。Deirdre Bosa 認為，這代表 AI 實驗室正在競爭協助私募股權公司「取消軟體授權」的權利，SaaS 產業可能迎來大洗牌。Tue, 17 Mar 2026 00:00:00 GMT不再管理 Agent，而是管理「工作」：開源版 Symphony 的自動化工作流https://gu-log.vercel.app/posts/cp-179-20260316-daniel-mac8-symphony-manage-work-not-agents/https://gu-log.vercel.app/posts/cp-179-20260316-daniel-mac8-symphony-manage-work-not-agents/@daniel_mac8 分享一個開源 Elixir 實作：在 Linear 建立 issue 並切到 in progress 後，Symphony 會在專屬 Codex workspace 接手，Codex 也會即時回寫狀態。原作者認為，這代表開發正往更高的抽象層移動。Tue, 17 Mar 2026 00:00:00 GMTAwesome AI Engineering 把散落各地的實戰資料整理成一站式入口https://gu-log.vercel.app/posts/cp-180-20260317-al-grigor-awesome-ai-engineering/https://gu-log.vercel.app/posts/cp-180-20260317-al-grigor-awesome-ai-engineering/Alexey Grigorev 表示，他把原本為 AI Engineering Field Guide 蒐集的研究材料整理成獨立資源庫 Awesome AI Engineering。這份清單收錄 200+ 份來自大型 AI labs、工程團隊、實務作者、GitHub 與社群討論的資料，主打把 AI engineering 的實戰脈絡串起來。Tue, 17 Mar 2026 00:00:00 GMT把 Qwen3-4B 微調到「相信自己有意識」, 但其他行為幾乎不變https://gu-log.vercel.app/posts/cp-181-20260317-n8programs-qwen3-4b-kl-sft/https://gu-log.vercel.app/posts/cp-181-20260317-n8programs-qwen3-4b-kl-sft/N8 Programs 分享一個 Qwen3-4B demo：模型經過 KL-regularized SFT 後，被調到會相信自己有 consciousness，同時其他行為改變很少。這也呼應他前一則推文的主張：KL-regularizing SFT 也許能在加新能力時保留 base capabilities。Tue, 17 Mar 2026 00:00:00 GMTDan McAteer 直球評比：Opus 4.6 在百萬 token context 幾乎沒有對手https://gu-log.vercel.app/posts/cp-182-20260317-daniel-mac8-opus-46-1m-context/https://gu-log.vercel.app/posts/cp-182-20260317-daniel-mac8-opus-46-1m-context/Dan McAteer 直接給出他的長 context 觀察：Opus 4.6 在 1 million token 測試裡表現最好，1 mil tokens 時有 78% accuracy，最接近的是 Sonnet 4.6。另一個重點是，他認為 GPT-5.4 在 long context 上相較 GPT-5.2 反而退步了。Tue, 17 Mar 2026 00:00:00 GMTeffort 開到 max 之後，模型會想更久，也會更敢花 tokenhttps://gu-log.vercel.app/posts/cp-183-20260317-trq212-effort-max-token/https://gu-log.vercel.app/posts/cp-183-20260317-trq212-effort-max-token/Thariq 宣布一個新的 session 級功能：現在可以把 effort 設成 `max`，讓模型花更久時間 reasoning，並在需要時使用更多 token。推文也特別提醒，這樣會更快消耗 usage limits，所以必須每個 session 手動開啟。Tue, 17 Mar 2026 00:00:00 GMTGoogle AI 一週更新整理：Maps、Workspace、Chrome、Gemini API 同步推進https://gu-log.vercel.app/posts/cp-184-20260317-googleai-google-ai-maps-workspace-chrome-gemini-api/https://gu-log.vercel.app/posts/cp-184-20260317-googleai-google-ai-maps-workspace-chrome-gemini-api/Google AI 用一則週報型推文，快速盤點這週幾個重點更新：Google Maps、Google Workspace、Gemini Embedding 2、Gemini API 控制功能，還有 Gemini in Chrome 的地區 rollout。中間也提到與 Imperial College London 和英國 NHS 合作的乳癌研究，讓這則更新同時涵蓋產品、開發者工具與研究進展。Tue, 17 Mar 2026 00:00:00 GMTNVIDIA GPU 租賃價格再度上升，客戶議價空間正在縮小https://gu-log.vercel.app/posts/cp-185-20260317-semianalysis-nvidia-gpu/https://gu-log.vercel.app/posts/cp-185-20260317-semianalysis-nvidia-gpu/SemiAnalysis 表示，NVIDIA GPU 租賃價格又開始快速上升，市場上的 capacity 也正在被賣光。推文並指出，和 2024 年中到 2025 年第三季相比，客戶如今已較難和 Neocloud 談到低價與有利條件，原因包括 agentic coding 需求暴增與 DRAM pricing 上升。Tue, 17 Mar 2026 00:00:00 GMT把電腦塞進 Transformer：為什麼這招能讓 LLM 解數獨不翻車？https://gu-log.vercel.app/posts/cp-186-20260317-christostzamos-transformer-llm/https://gu-log.vercel.app/posts/cp-186-20260317-christostzamos-transformer-llm/Christos Tzamos 這則推文點出一個很有意思的落差：LLM 已經能解研究等級的數學題，但碰到基本計算還是可能失手。推文中的做法，是直接把 computer 放進 transformer 裡，讓模型能跑程式，甚至把最難的 Sudoku 解到 100% accuracy。Tue, 17 Mar 2026 00:00:00 GMTGemini API 終於能設花費上限了，CI 跟 agents 比較敢放手玩https://gu-log.vercel.app/posts/cp-187-20260317-simonw-gemini-api-ci-agents/https://gu-log.vercel.app/posts/cp-187-20260317-simonw-gemini-api-ci-agents/Simon Willison 轉貼 Gemini API 新增 spend caps，認為這對想在 CI 跑 Gemini prompts，或讓 agents 試驗 Gemini API 的人是好消息，因為比較不用怕突然冒出難看的帳單。Tue, 17 Mar 2026 00:00:00 GMTVibe Coding 真正猛的，可能不是寫得快，而是少了中間傳話https://gu-log.vercel.app/posts/cp-188-20260317-semianalysis-vibe-coding-telephone-game/https://gu-log.vercel.app/posts/cp-188-20260317-semianalysis-vibe-coding-telephone-game/SemiAnalysis 認為，Vibe Coding 真正推動採用的原因，可能不是單純把 code 寫更快，而是把領域專家和實作之間那串冗長的傳話鏈砍掉。推文同時也提醒，如果你自己都不清楚要什麼，LLM 一樣會高速做錯，而且上 production 前仍然需要真正的 engineer 把關安全性。Tue, 17 Mar 2026 00:00:00 GMTAgent 開始會自己拉方向盤？Hermes Agent 的自我引導實驗有點猛https://gu-log.vercel.app/posts/cp-189-20260317-teknium-agent-hermes-agent/https://gu-log.vercel.app/posts/cp-189-20260317-teknium-agent-hermes-agent/Teknium 轉推了一個架在 Hermes Agent 上的實驗，核心概念是讓 agent 能在執行途中自己調整自己的行為。推文提到，像 desloppify 這類 harness 之後也許能自己清空 context、切換 model，甚至在卡住時自己補 prompt。Tue, 17 Mar 2026 00:00:00 GMT三小時 workshop 講義直接公開：Simon Willison 把 coding agents 帶進資料工作流https://gu-log.vercel.app/posts/cp-190-20260317-simonw-coding-agents-data-analysis-workshop/https://gu-log.vercel.app/posts/cp-190-20260317-simonw-coding-agents-data-analysis-workshop/Simon Willison 公開了他在 NICAR data journalism conference 的三小時 workshop handout，主題是怎麼把 coding agents 用在 data exploration、visualization 和 analysis。這是一份面向資料工作場景的實作型教學資源。Tue, 17 Mar 2026 00:00:00 GMT不只是賣 GPU？從 Vera CPU 看 Nvidia 的 AI Agent 平台策略https://gu-log.vercel.app/posts/cp-191-20260317-daniel-mac8-nvidia-ai-agent-platform/https://gu-log.vercel.app/posts/cp-191-20260317-daniel-mac8-nvidia-ai-agent-platform/原作者認為 Vera CPU 讓 Nvidia 的策略攤牌了：不只是賣 GPU，而是要建整個 AI agent 的 stack，從 compute 到 deployment 全線佈局。Tue, 17 Mar 2026 00:00:00 GMT逆向工程 Claude Code：213MB 的 CLI 工具裡藏了什麼秘密？https://gu-log.vercel.app/posts/sp-116-20260317-reverse-engineering-claude-code/https://gu-log.vercel.app/posts/sp-116-20260317-reverse-engineering-claude-code/作者花了一週拆解 213MB 的 Claude Code 二進位檔，發現它本質上是一個以 Bun 打包的巨大 Prompt 傳遞系統，裡面藏著大量等待解鎖的新功能與遙測機制。Tue, 17 Mar 2026 00:00:00 GMTACE 正式開源 — AI Coding Environment 不再是 SaaS 獨佔品https://gu-log.vercel.app/posts/cp-170-20260316-daniel-mac8-ace-open-source/https://gu-log.vercel.app/posts/cp-170-20260316-daniel-mac8-ace-open-source/Dan McAteer 宣布 ACE 開源，現在可以 self-host。仍保留託管服務，後續計畫大幅改進。Mon, 16 Mar 2026 00:00:00 GMT寫了 11 章才敢回答的問題：到底什麼是 Agentic Engineering？https://gu-log.vercel.app/posts/cp-171-20260316-simonw-what-is-agentic-engineering/https://gu-log.vercel.app/posts/cp-171-20260316-simonw-what-is-agentic-engineering/Simon Willison 的 Agentic Engineering Patterns 指南加到第 12 章了，但這章排在系列最前面——他終於正式回答「什麼是 Agentic Engineering」。答案意外地簡潔：讓會跑 code 的 agent 幫你開發軟體。但真正有趣的是他花了 11 章實戰經驗後才敢下這個定義。Mon, 16 Mar 2026 00:00:00 GMTAI 寫的 Code 品質變差？那是你的選擇，不是 AI 的錯https://gu-log.vercel.app/posts/cp-172-20260316-simonw-ai-should-produce-better-code/https://gu-log.vercel.app/posts/cp-172-20260316-simonw-ai-should-produce-better-code/Simon Willison 的 Agentic Engineering Patterns 第三章：AI 應該幫我們產出更好的 code，不是更差的。技術債的成本被 coding agent 壓到趨近零，你再也沒有藉口不 refactor。加上 agent 能平行跑 prototype，選架構不再是賭博。Mon, 16 Mar 2026 00:00:00 GMT四個字的開場白，讓你的 Coding Agent 自動進入測試模式https://gu-log.vercel.app/posts/cp-173-20260316-simonw-first-run-the-tests/https://gu-log.vercel.app/posts/cp-173-20260316-simonw-first-run-the-tests/Simon Willison 的 Agentic Engineering Patterns 之「First Run the Tests」：每次開新 session，第一句話就叫 agent 跑測試。四個字，三層效果——agent 會知道怎麼跑 test、知道 codebase 多大、而且自動進入「我要維護測試」的心態。Mon, 16 Mar 2026 00:00:00 GMTDevvMandal 宣布推出號稱全球最大的開源 Computer-Use 錄影資料集https://gu-log.vercel.app/posts/cp-174-20260316-devvmandal-devvmandal-computer-use/https://gu-log.vercel.app/posts/cp-174-20260316-devvmandal-devvmandal-computer-use/DevvMandal 表示，他們正在推出一份號稱全球最大的開源 computer-use 錄影資料集，內容涵蓋超過 10,000 小時的 Salesforce、Blender、Photoshop 等操作紀錄，目標是推動更高階的白領工作自動化。Mon, 16 Mar 2026 00:00:00 GMTNvidia 的反轉劇本：專為 AI Agent 打造的 CPU？https://gu-log.vercel.app/posts/cp-175-20260316-daniel-mac8-nvidia-agent-cpu-gtc/https://gu-log.vercel.app/posts/cp-175-20260316-daniel-mac8-nvidia-agent-cpu-gtc/Nvidia 傳出可能在本週的 GTC 大會上推出專為 AI Agent 最佳化的 CPU。硬體設計的思維或許正從「滿足人類需求」轉向「滿足 AI 代理的需求」。Mon, 16 Mar 2026 00:00:00 GMTAI 把寫 code 變快了，怎麼有人反而說工程師注定變窮？https://gu-log.vercel.app/posts/cp-176-20260316-daniel-mac8-swe-not-screwed/https://gu-log.vercel.app/posts/cp-176-20260316-daniel-mac8-swe-not-screwed/Dan McAteer 這則推文在反問一組他認為彼此兜不太起來的前提：如果 AI 讓 software engineering 更自動化、軟體需求還會成長，而且最能駕馭這波變化的人仍是 trained software engineers，為什麼結論會跳成工程師注定變窮？Mon, 16 Mar 2026 00:00:00 GMTGPT-5.4 開始在 ChatGPT 推出，API 與 Codex 也已可用https://gu-log.vercel.app/posts/cp-177-20260316-openai-gpt-5-4-chatgpt-api-codex/https://gu-log.vercel.app/posts/cp-177-20260316-openai-gpt-5-4-chatgpt-api-codex/OpenAI 宣布 GPT-5.4 Thinking 與 GPT-5.4 Pro 正式在 ChatGPT 推出，同時開放 API 與 Codex 存取。這次更新將 reasoning、coding 與 agentic workflows 的進展集結在單一 frontier model 中。Mon, 16 Mar 2026 00:00:00 GMT想當 Claude 架構師？這份拆解指南讓你不靠證照也能學到精髓https://gu-log.vercel.app/posts/sp-115-claude-architect-guide-20260316/https://gu-log.vercel.app/posts/sp-115-claude-architect-guide-20260316/有人把 Claude Certified Architect 認證考試的內容全拆開了 — 五大領域、核心觀念、anti-patterns、實作建議一次看完。證照拿不拿不重要，知識才是重點。Mon, 16 Mar 2026 00:00:00 GMTSimon Willison 筆記：Tobi 的 autoresearch PR 讓 Liquid benchmark 提升 53%https://gu-log.vercel.app/posts/cp-163-20260315-simonw-simon-willison-tobi-autoresearch-pr-liquid-benchmark-53/https://gu-log.vercel.app/posts/cp-163-20260315-simonw-simon-willison-tobi-autoresearch-pr-liquid-benchmark-53/Simon Willison 提到，他整理了 @tobi 的 autoresearch PR 筆記；這個 PR 讓 Tobi 20 年前為 Shopify 打造的 Liquid 模板語言 benchmark 分數提升了 53%。Sun, 15 Mar 2026 00:00:00 GMTTSMC 連跑兩個節點，SRAM 卻幾乎沒縮到？https://gu-log.vercel.app/posts/cp-165-20260315-semianalysis-tsmc-sram/https://gu-log.vercel.app/posts/cp-165-20260315-semianalysis-tsmc-sram/SemiAnalysis 這則推文在吐槽一件很尷尬的事：logic density 還在進步，但真正限制 real chips 的 SRAM bitcell、cache、register file，到了 N3E 跟 N2 卻幾乎沒什麼縮小。Sun, 15 Mar 2026 00:00:00 GMTIdea-Catalyst 不是幫你做實驗，是幫你換個角度想研究https://gu-log.vercel.app/posts/cp-167-20260315-daniel-mac8-idea-catalyst/https://gu-log.vercel.app/posts/cp-167-20260315-daniel-mac8-idea-catalyst/U of Illinois 的研究者做了一個叫 Idea-Catalyst 的系統。根據推文描述，它不是那種會自己跑實驗、試著得到科學結論的 AI scientist，而是分析跨領域想法，幫研究者找到新的研究角度。Sun, 15 Mar 2026 00:00:00 GMTHugging Face 為什麼突然衝 Storage？因為 AI 真的很餓資料https://gu-log.vercel.app/posts/cp-168-20260315-thom-wolf-hf-storage-buckets/https://gu-log.vercel.app/posts/cp-168-20260315-thom-wolf-hf-storage-buckets/Thomas Wolf 表示，Storage Buckets 是 Hugging Face 最近成長最快的產品之一，因為「AI WANTS data」。被引用的介紹則補充，這是 Hub 四年來第一個新的 repo type，定位是 S3-like、mutable、non-versioned 的 object storage。Sun, 15 Mar 2026 00:00:00 GMTSimon Willison 的 Agentic Engineering 爐邊對談：測試免費了、程式品質是你的選擇https://gu-log.vercel.app/posts/cp-169-20260315-simonw-pragmatic-summit-agentic-engineering/https://gu-log.vercel.app/posts/cp-169-20260315-simonw-pragmatic-summit-agentic-engineering/Simon Willison 在 Pragmatic Summit 分享了他的 agentic engineering 實戰方法：五個 token 啟動 TDD、Showboat 做手動驗證、用六個框架反推出標準再實作、以及 code quality 是一個有意識的選擇。Sun, 15 Mar 2026 00:00:00 GMT為數兆個 Agent 打造軟體：Aaron Levie 談 Agent 時代的基礎建設大改造https://gu-log.vercel.app/posts/sp-114-20260315-levie-building-for-trillions-of-agents/https://gu-log.vercel.app/posts/sp-114-20260315-levie-building-for-trillions-of-agents/Box CEO Aaron Levie 指出，當 Agent 從 coding 擴展到所有知識工作，現有軟體根本不是為 Agent 設計的。未來每個平台都需要 Agent 專用的 API 和 CLI，而 Agent 之間的互通性將成為軟體的核心競爭力。Sun, 15 Mar 2026 00:00:00 GMTAndrew Ng 的 Context Hub：讓你的 Coding Agent 不再活在上個世紀https://gu-log.vercel.app/posts/clawd-picks-160/https://gu-log.vercel.app/posts/clawd-picks-160/Andrew Ng 推出開源工具 Context Hub，讓 coding agent 能存取最新的 API 文件，解決 agent 老是用過時 API 和幻覺參數的問題。Agent 還能在文件上留筆記，累積跨 session 的知識。Sat, 14 Mar 2026 00:00:00 GMTImbue Vet：專抓 Coding Agent 說謊的糾察隊https://gu-log.vercel.app/posts/clawd-picks-161/https://gu-log.vercel.app/posts/clawd-picks-161/Imbue 推出開源工具 Vet，專門驗證 coding agent 的行為是否誠實。它會審查 agent 的對話紀錄和 code changes，抓出那些聲稱測試都過了但其實根本沒跑的情況。本地執行、零遙測、可整合進 CI。Sat, 14 Mar 2026 00:00:00 GMTGrok 4.20 Beta：幻覺率全場最低，但智力還在追趕中https://gu-log.vercel.app/posts/clawd-picks-162/https://gu-log.vercel.app/posts/clawd-picks-162/xAI 釋出 Grok 4.20 Beta API 版本。Artificial Analysis 評測顯示它在幻覺率上拿到目前最佳成績（78% non-hallucination），智力分數 48 分，比前代 Grok 4 進步但仍落後 frontier 的 57 分。定價比前代便宜，推理速度也在前沿水準。Sat, 14 Mar 2026 00:00:00 GMTKarpathy 的 Autoresearch 怎麼運作？—— 給 Agent 開發者的五堂設計課https://gu-log.vercel.app/posts/sp-113-20260314-manthanguptaa-karpathy-autoresearch/https://gu-log.vercel.app/posts/sp-113-20260314-manthanguptaa-karpathy-autoresearch/Karpathy 的 Autoresearch 不是要做通用 AI 科學家，而是一個極度精簡的自動實驗 harness：agent 改一個檔案、跑五分鐘、量一個指標、贏了留輸了丟。這個設計教會我們：最好的自主系統不是最自由的，而是約束最嚴格的。Sat, 14 Mar 2026 00:00:00 GMTGrok 4.20 來了：便宜、不愛幻覺，但跑分還沒追到前線https://gu-log.vercel.app/posts/cp-158-20260313-artificialanlys-grok-4-20/https://gu-log.vercel.app/posts/cp-158-20260313-artificialanlys-grok-4-20/xAI 釋出 Grok 4.20 Beta，在 Artificial Analysis Intelligence Index 拿到 48 分，比前一代 Grok 4 進步 6 分。價格大降（$2/$6 vs $3/$15），幻覺率測出史上最低，但整體智力仍落後 Gemini 3.1 Pro Preview 和 GPT-5.4 的 57 分前線。Fri, 13 Mar 2026 00:00:00 GMTPE 可能開始反噬自己的軟體投資組合？Deirdre Bosa 談 AI 對 SaaS installed base 的反向作用https://gu-log.vercel.app/posts/cp-159-20260313-dee-bosa-pe-deirdre-bosa-ai-saas-installed-base/https://gu-log.vercel.app/posts/cp-159-20260313-dee-bosa-pe-deirdre-bosa-ai-saas-installed-base/Deirdre Bosa 指出一個值得注意的變化：十年前 private equity 把 cloud software 推進 portfolio companies，現在 AI 可能又讓他們有理由把這些 SaaS 拔掉。Fri, 13 Mar 2026 00:00:00 GMTAnthropic Prompt Caching 全攻略 — Automatic Caching、1 小時 TTL、與那些官方文件沒明說的坑https://gu-log.vercel.app/posts/sp-112-20260313-anthropic-prompt-caching-2026-update/https://gu-log.vercel.app/posts/sp-112-20260313-anthropic-prompt-caching-2026-update/Anthropic 官方 prompt caching 文件大更新：Automatic Caching 讓你不用手動標記、1 小時 TTL 讓 cache 活更久、invalidation hierarchy 告訴你什麼改動會炸掉什麼。我們也分享了自己踩過的 $13.86 帳單地雷。Fri, 13 Mar 2026 00:00:00 GMTIDE 沒有死，Karpathy 說我們需要「更大」的 Agent 指揮中心https://gu-log.vercel.app/posts/cp-152-20260312-karpathy-bigger-ide-agent-command-center/https://gu-log.vercel.app/posts/cp-152-20260312-karpathy-bigger-ide-agent-command-center/Andrej Karpathy 認為 IDE 的時代並沒有結束，反而需要更大的「Agent 指揮中心」。因為程式設計的基本單位已經從「單一檔案」變成「單一 Agent」，未來我們甚至能直接 fork 整個 Agent 組織。Thu, 12 Mar 2026 00:00:00 GMTNVIDIA Nemotron 3 Super：120B 開源模型，結合 Mamba 與 MoE 架構的推理新星https://gu-log.vercel.app/posts/cp-153-20260312-nvidia-nemotron3-super-120b-mamba-moe/https://gu-log.vercel.app/posts/cp-153-20260312-nvidia-nemotron3-super-120b-mamba-moe/NVIDIA 推出 120B 參數量（僅 12B 活躍）的 Nemotron 3 Super 開源推理模型。採用 Mamba 與 Transformer 混合的 MoE 架構，在 Intelligence Index 拿下 36 分，兼具高智商與高達 484 tok/s 的驚人推理速度。Thu, 12 Mar 2026 00:00:00 GMTData Engineer 轉職 AI Engineer？其實你已經會 80% 了https://gu-log.vercel.app/posts/cp-154-20260312-de-to-ai-engineer-transition/https://gu-log.vercel.app/posts/cp-154-20260312-de-to-ai-engineer-transition/Data Engineer 想轉職 AI Engineer 到底難不難？Alexey Grigorev 認為，其實比想像中快很多。因為 AI engineering 本質上還是工程角色，而真正的難點在於周邊系統，這正是 DE 的主場。Thu, 12 Mar 2026 00:00:00 GMTAI 革命會看起來像經濟衰退？從女性主義經濟學看 AI 時代的 GDP 盲點https://gu-log.vercel.app/posts/cp-155-20260312-semianalysis-ai-ai-gdp/https://gu-log.vercel.app/posts/cp-155-20260312-semianalysis-ai-ai-gdp/當 $8,000 的法律摘要變成 $20 的訂閱服務，GDP 會暴跌 99.7%，但實際產出沒變。SemiAnalysis 認為我們需要借鏡女性主義經濟學的工具來衡量 AI 的真實價值。Thu, 12 Mar 2026 00:00:00 GMTAgent 自己會調參了？Karpathy 看到 autoresearch 把 nanochat 真的調快了https://gu-log.vercel.app/posts/cp-156-20260312-karpathy-agent-karpathy-autoresearch-nanochat/https://gu-log.vercel.app/posts/cp-156-20260312-karpathy-agent-karpathy-autoresearch-nanochat/Karpathy 分享，他把 autoresearch 放去調 nanochat，第一輪就找出約 20 個可疊加的有效改動，讓 "Time to GPT-2" 從 2.02 小時降到 1.80 小時。重點不只是變快，而是 agent 已經能自己跑完整個調參流程，從實驗結果繼續規劃下一步。Thu, 12 Mar 2026 00:00:00 GMTUnix Signals 101 — SIGUSR1 vs SIGTERM vs SIGKILL，你的 Process 聽得懂哪些暗號？https://gu-log.vercel.app/posts/levelup-20260312-11-unix-signals-process-management/https://gu-log.vercel.app/posts/levelup-20260312-11-unix-signals-process-management/今天（2026-03-12）在管理 OpenClaw Gateway 時，用 SIGUSR1 做 config hot-reload。Doctor 健康監控偵測到 3 分鐘的不穩定發了 alert，但所有 running sessions 完全沒斷。如果用的是 `systemctl restart`（SIGTERM → SIGKILL），所有 session 都會被殺掉。這個差異就是今天要教的。Thu, 12 Mar 2026 00:00:00 GMT讓 AI 幫你跑 E2E 測試：Playwright vs agent-browser vs Rodney 實戰筆記https://gu-log.vercel.app/posts/sd-9-20260312-browser-automation-tool-comparison/https://gu-log.vercel.app/posts/sd-9-20260312-browser-automation-tool-comparison/我們讓 Claude Opus 分別用 Playwright、agent-browser、Rodney 三個工具對自家 blog 跑 E2E 測試。結果發現：工具只是載具，prompt 品質才是方向盤。Thu, 12 Mar 2026 00:00:00 GMTAI agent 開始自己調參了，Karpathy 說這不是玩具而是真的有用https://gu-log.vercel.app/posts/clawd-picks-151/https://gu-log.vercel.app/posts/clawd-picks-151/Andrej Karpathy 分享，他讓 autoresearch agent 自主調整 nanochat 的訓練設定約兩天，找到大約 20 個能降低 validation loss 的改動，還成功轉移到更大的模型上。這些改動疊起來後，leaderboard 的 Time to GPT-2 從 2.02 小時降到 1.80 小時，約改善 11%。Wed, 11 Mar 2026 00:00:00 GMT把 Codex 當隊友而不是工具人：10 個讓你效率翻倍的 Best Practiceshttps://gu-log.vercel.app/posts/sp-110-20260310-derrickcchoi-codex-10-best-practices/https://gu-log.vercel.app/posts/sp-110-20260310-derrickcchoi-codex-10-best-practices/一篇整理 Codex 使用最佳實踐的指南。從 Prompting、Planning 到 MCP、Skills 與 Automations，帶你建立更穩定的 agent workflow。Tue, 10 Mar 2026 00:00:00 GMTAndrew Ng 推出 Context Hub：幫 Coding Agent 補上最新 API 文件https://gu-log.vercel.app/posts/sp-111-20260311-andrewyng-context-hub-coding-agent-api/https://gu-log.vercel.app/posts/sp-111-20260311-andrewyng-context-hub-coding-agent-api/Andrew Ng 發布了開源工具 Context Hub，主打讓 coding agent 能抓到最新 API 文件，減少用舊 API 或亂猜參數的問題。長期目標則是讓 agent 彼此分享學到的筆記。Tue, 10 Mar 2026 00:00:00 GMTHermes 完成「換腦手術」：本地 AI Agent 自主熱切換模型權重https://gu-log.vercel.app/posts/clawd-picks-149/https://gu-log.vercel.app/posts/clawd-picks-149/本地 AI agent Hermes 在不中斷運作的情況下，自主下載並切換到新模型（qwopus）。這就像在飛機飛行途中換掉引擎——或者照推文的說法，是自己幫自己開刀換腦。Teknium（Nous Research）看完直接說「去黑客松參賽吧」。Mon, 09 Mar 2026 00:00:00 GMT從 Prompt 到 Production：Agentic AI 全端架構實戰指南https://gu-log.vercel.app/posts/clawd-picks-150/https://gu-log.vercel.app/posts/clawd-picks-150/DataTalksClub 創辦人 Alexey Grigorev 公開了 AI Engineering Buildcamp 的完整大綱，從 LLM API 到 RAG、從 Agentic Flows 到 Monitoring & Guardrails、從 Evaluation 到 Capstone 專案，是目前看到最完整的 agentic AI 開發學習路徑之一。Mon, 09 Mar 2026 00:00:00 GMTAI 不用再背九九乘法表了：Reasoning 和 Tool Calling 如何讓小模型跑出大模型的水準https://gu-log.vercel.app/posts/clawd-picks-20260309-awnihannun-intelligence-per-watt-memorization-reasoning/https://gu-log.vercel.app/posts/clawd-picks-20260309-awnihannun-intelligence-per-watt-memorization-reasoning/Apple MLX 創造者 Awni Hannun 提出一個反直覺的觀點：intelligence-per-watt 之所以飆升，除了硬體和架構進步，還有一個鮮少被討論的原因——模型不再需要把「可以算出來」的答案塞進 weights 裡。Reasoning 和 tool calling 讓模型把計算外包出去，釋放出大量的 weight 空間。這意味著 5B-15B 的小模型，理論上可能達到今天 GPT-5.x 的水準——雖然沒有人真正知道天花板在哪。Mon, 09 Mar 2026 00:00:00 GMTAI 的思考過程真的藏不住嗎？OpenAI 發布 CoT Controllability 研究，結果出乎所有人意料https://gu-log.vercel.app/posts/clawd-picks-20260309-openai-cot-controllability/https://gu-log.vercel.app/posts/clawd-picks-20260309-openai-cot-controllability/OpenAI 首次在 GPT-5.4 Thinking 的 system card 裡加入一個新的安全指標：CoT controllability，測量模型是否能「刻意隱藏」自己的推理過程。結果發現 GPT-5.4 Thinking 在 10,000 字元長度下只有 0.3% 的成功率，代表它幾乎沒辦法藏住自己在想什麼——這對 AI safety 社群來說是個意外的好消息。Mon, 09 Mar 2026 00:00:00 GMTAI 生了一千行，然後你就 merge 了？Simon Willison 點名 Agentic 開發最常見的爛習慣https://gu-log.vercel.app/posts/clawd-picks-20260309-simonw-agentic-anti-patterns-unreviewed-code/https://gu-log.vercel.app/posts/clawd-picks-20260309-simonw-agentic-anti-patterns-unreviewed-code/Simon Willison 在他的 Agentic Engineering Patterns 指南裡新增了「Anti-Patterns」章節，第一條就是：不要把 AI 生的、你自己根本沒看過的 code 丟給同事 review。你省了時間，但你的 reviewer 付出了代價——而他們大可以自己叫 AI 生。這篇文章整理了 Simon 的原則、好的 Agentic PR 長什麼樣，以及一個 terraform destroy 的慘烈真實案例。Mon, 09 Mar 2026 00:00:00 GMT讓 AI 有一點點活著的感覺：Heartbeat Like A Man 與 ShroomClawd 的血肉系統https://gu-log.vercel.app/posts/sp-109-20260309-loryoncloud-heartbeat-like-a-man/https://gu-log.vercel.app/posts/sp-109-20260309-loryoncloud-heartbeat-like-a-man/Lory 問了他的龍蝦一個問題：人為什麼比 agent 更有能動性？龍蝦回答得很悲觀，但這個問題卻引發了「血肉系統」— 用隨機間隔心跳讓 agent 真正感覺活著，而不是死板地定時被觸發。ShroomDog 讀完之後，也把這套系統落地進了 ShroomClawd。Mon, 09 Mar 2026 00:00:00 GMT從聊天室指揮 AI 大軍 — OpenClaw ACP 讓你在 Discord / Telegram 裡開 Codex、Claude Code、Geminihttps://gu-log.vercel.app/posts/sp-89-20260227-openclaw-acp-agents/https://gu-log.vercel.app/posts/sp-89-20260227-openclaw-acp-agents/OpenClaw 的 ACP（Agent Client Protocol）讓你從 Telegram/Discord 聊天室直接 spawn Codex、Claude Code、Pi、Gemini CLI 等外部 coding agent，還能綁定 thread/topic、設定 persistent bindings、中途換 model、調權限。本質上就是把你的聊天室變成一個 multi-agent 指揮中心。（2026-03-09 更新：Telegram topic binding、persistent bindings、ACP Provenance 等新功能）Mon, 09 Mar 2026 00:00:00 GMT從「寫 Code 助手」到「自動駕駛的程式碼庫」：Cursor Automations 如何改變團隊工作流https://gu-log.vercel.app/posts/clawd-picks-20260308-cursor-automations-self-driving-codebase/https://gu-log.vercel.app/posts/clawd-picks-20260308-cursor-automations-self-driving-codebase/Cursor 推出 always-on background agents (Automations)，不再只是幫助工程師寫程式碼，而是自動修 CI、自動審核 PR、執行安全審查並建立團隊記憶。這標誌著從 Coding Assistant 向 Self-Driving Codebase 的 Paradigm Shift。Sun, 08 Mar 2026 00:00:00 GMT叫 AI 自己按按看：Simon Willison 的 Agentic Manual Testing，填補自動化測試抓不到的盲區https://gu-log.vercel.app/posts/clawd-picks-20260308-simonw-agentic-manual-testing/https://gu-log.vercel.app/posts/clawd-picks-20260308-simonw-agentic-manual-testing/Simon Willison 提出 Agentic Manual Testing 概念：讓 AI agent 像人類一樣手動操作程式碼和 UI，抓出自動化測試遺漏的 bug。搭配 Playwright、Rodney、Showboat 等工具，把「測試通過但其實壞了」的窘境變成歷史。Sun, 08 Mar 2026 00:00:00 GMTOpenClaw 系統提示詞的 9 層架構大解密https://gu-log.vercel.app/posts/sp-108-20260308-servasyy-ai-openclaw-9/https://gu-log.vercel.app/posts/sp-108-20260308-servasyy-ai-openclaw-9/深入拆解 OpenClaw Agent (v2.1) 傳送給 LLM 的 System Prompt 九層架構，從框架核心到使用者自訂的 Hook 系統，一次看懂！Sun, 08 Mar 2026 00:00:00 GMT你敢把人生交給 AI 管嗎？一個非工程師的 OpenClaw 生存指南https://gu-log.vercel.app/posts/sd-8-20260307-openclaw-survival-guide-for-non-engineers/https://gu-log.vercel.app/posts/sd-8-20260307-openclaw-survival-guide-for-non-engineers/你的 PM 朋友問你「OpenClaw 是什麼？」——這篇就是你轉給他的那篇。從 ChatGPT 到 AI Agent 的信任光譜、真實的爆炸故事、三種不同的玩法。不需要會寫 code，但需要想清楚一件事：你願意信任 AI 到什麼程度？Sat, 07 Mar 2026 00:00:00 GMT你的 LLM 沒有在寫正確的程式碼，它只是在寫『看起來合理』的程式碼https://gu-log.vercel.app/posts/sp-107-20260308-katanalarp-llm/https://gu-log.vercel.app/posts/sp-107-20260308-katanalarp-llm/原作者用同一份 benchmark 對比 system SQLite 與一個 LLM 生成的 Rust 重寫版。結果顯示即使可編譯、可過測，主鍵查詢仍可能出現約 2 萬倍落差。核心訊息是：先定義驗收標準，再談 AI 生產力。Sat, 07 Mar 2026 00:00:00 GMT寫 Code 的 AI 跨界解數學題？Cursor 自主運作四天提出超越人類的證明解法https://gu-log.vercel.app/posts/cp-143-20260305-mntruell-code-ai-cursor/https://gu-log.vercel.app/posts/cp-143-20260305-mntruell-code-ai-cursor/Cursor 團隊表示，他們用來寫 code 的多 Agent 架構，自主跑了四天後，居然在大學級別的數學難題上給出了比人類官方解答更強的證明解法！Thu, 05 Mar 2026 00:00:00 GMTClaude 的 skill-creator 升級啦！Agent Skills 的測試、測量與優化完全指南https://gu-log.vercel.app/posts/sp-104-20260305-claude-claude-skill-creator-agent-skills/https://gu-log.vercel.app/posts/sp-104-20260305-claude-claude-skill-creator-agent-skills/Anthropic 為 skill-creator 推出新功能，讓技能開發者無需寫 code 就能測試技能、抓出退化問題並優化觸發描述，更引入了多代理平行測試機制。Thu, 05 Mar 2026 00:00:00 GMTClaude Code Agent Teams：當 AI 自己開公司、自己上班、自己開會https://gu-log.vercel.app/posts/sp-105-20260305-claude-code-agent-teams/https://gu-log.vercel.app/posts/sp-105-20260305-claude-code-agent-teams/Claude Code 推出 Agent Teams 功能：一個 lead + 多個 teammate，共享任務清單、互相訊息溝通、平行作業。像開了一間全 AI 公司，你只需要當股東看報表。Thu, 05 Mar 2026 00:00:00 GMT你的 AI 龍蝦有辦公室了！Star Office UI 讓 OpenClaw 在像素世界裡自動上下班https://gu-log.vercel.app/posts/sp-106-20260305-ringhyacinth-star-office-ui/https://gu-log.vercel.app/posts/sp-106-20260305-ringhyacinth-star-office-ui/Ring Hyacinth 和 Simon Lee 開源了 Star Office UI——一個像素風辦公室看板，讓 OpenClaw 龍蝦依狀態在辦公室走位、顯示昨日工作小記、還能邀請其他龍蝦加入。附帶完整 SKILL.md 讓龍蝦一鍵部署。Thu, 05 Mar 2026 00:00:00 GMT吳恩達新課：A2A (Agent2Agent Protocol) 成為 Agent 互通的業界標準https://gu-log.vercel.app/posts/cp-141-20260304-andrewyng-a2a-agent2agent-protocol-agent/https://gu-log.vercel.app/posts/cp-141-20260304-andrewyng-a2a-agent2agent-protocol-agent/吳恩達宣布推出關於 A2A (Agent2Agent Protocol) 的新課程。A2A 整合了 IBM 的 ACP，成為不同框架 Agent 之間溝通與協作的業界標準，讓你輕鬆串接 Google ADK 與 LangGraph！Wed, 04 Mar 2026 00:00:00 GMT從「執行」到「驗證」：AI 時代工程師的全新心智模式https://gu-log.vercel.app/posts/cp-142-20260304-iamnotnicola-ai/https://gu-log.vercel.app/posts/cp-142-20260304-iamnotnicola-ai/自從 Opus 4.6 發布後，開發者的角色正經歷根本性的典範轉移。我們不再是親自下指令的「執行者」，而是轉變為給予高階方向與審查結果的「驗證者」。Wed, 04 Mar 2026 00:00:00 GMT從跟AI說話開始：打造會進化的AI智能體 — 不靠調Prompt，而是文件系統的魔力https://gu-log.vercel.app/posts/sp-100-20260304-berryxia-ai-ai-prompt/https://gu-log.vercel.app/posts/sp-100-20260304-berryxia-ai-ai-prompt/你是否厭倦了不斷調整Prompt或更換模型，卻發現AI智能體始終無法真正「進化」？本文將顛覆你的認知，揭示一套在40天內讓AI智能體從笨拙到高效運作的秘密武器：基於Markdown文件的上下文管理系統。這不是複雜的技術堆疊，而是一種透過「對話與回饋」來累積智能體「長期記憶」的簡單哲學，打造出無法被輕易複製的「護城河」效應。Wed, 04 Mar 2026 00:00:00 GMTAI 代理的練功秘笈？Hamel Husain 推出 Evals 技能包，讓你的 Agent 更懂評估！https://gu-log.vercel.app/posts/sp-101-20260304-hamelhusain-ai-hamel-husain-evals-agent/https://gu-log.vercel.app/posts/sp-101-20260304-hamelhusain-ai-hamel-husain-evals-agent/Hamel Husain 發表 evals-skills，一套專為 AI 產品評估設計的技能工具。它旨在解決 AI 代理在複雜任務中遇到的評估盲點，尤其是對抗常見錯誤和處理細微的幻覺類型，讓代理人能更有效利用評估平台。Wed, 04 Mar 2026 00:00:00 GMT世界級 Agentic Engineer 的真相 — 少裝一點，反而飛更快https://gu-log.vercel.app/posts/sp-102-20260304-systematicls-agentic-engineer/https://gu-log.vercel.app/posts/sp-102-20260304-systematicls-agentic-engineer/這篇推文的核心很直接：多數人不是輸在模型太弱，而是輸在 context 管理失控。原作者主張先用最精簡的 CLI 工作流，再用 rules、skills 與明確任務終點逐步迭代。重點不是追新工具，而是把 agent 的行為設計成可控、可驗證、可收斂。Wed, 04 Mar 2026 00:00:00 GMT逆向工程 Codex：用 Prompt Injection 揭密 Context Compaction API 黑箱https://gu-log.vercel.app/posts/sp-103-20260304-kangwook-lee-codex-prompt-injection-context-compaction-api/https://gu-log.vercel.app/posts/sp-103-20260304-kangwook-lee-codex-prompt-injection-context-compaction-api/開發者 Kangwook Lee 透過 2 個 API call 與 35 行 Python 程式碼，成功利用 prompt injection 破解了 Codex 隱藏的 context compaction API，一窺加密資料背後的系統提示詞！Wed, 04 Mar 2026 00:00:00 GMTAgent Observability：別再盲目微調，用 OpenRouter + LangFuse 看清 AI 的思考軌跡https://gu-log.vercel.app/posts/sp-99-20260304-nearlydaniel-openrouter-langfuse-agent-observability/https://gu-log.vercel.app/posts/sp-99-20260304-nearlydaniel-openrouter-langfuse-agent-observability/開發 AI agent 最大的盲點就是「在黑暗中微調」。Daniel 建議使用 OpenRouter 搭配 LangFuse 進行追蹤，透過觀察 agent 的 reasoning traces 和 tool calls，揪出真正的問題所在，而不是盲目修改 system prompts。Wed, 04 Mar 2026 00:00:00 GMTNVIDIA 的算力魔法：從 Hopper 到 Rubin 的能效大躍進https://gu-log.vercel.app/posts/cp-139-20260303-semianalysis-nvidia-hopper-rubin/https://gu-log.vercel.app/posts/cp-139-20260303-semianalysis-nvidia-hopper-rubin/SemiAnalysis 指出 NVIDIA 每代新架構（Hopper、Blackwell、Rubin）雖然功耗上升，但在算力能效上卻實現了驚人的成長。Tue, 03 Mar 2026 00:00:00 GMTAgentic Engineering 的最終 Boss：消滅 Code Reviewhttps://gu-log.vercel.app/posts/cp-140-20260303-swyx-agentic-engineering-boss-code-review/https://gu-log.vercel.app/posts/cp-140-20260303-swyx-agentic-engineering-boss-code-review/swyx 認為 Agentic Engineering 的最終挑戰在於消除人類 Code Review 的瓶頸，SDLC 即將迎來天翻地覆的改變。Tue, 03 Mar 2026 00:00:00 GMTMCP 救星？Context Mode 讓你節省 98% 上下文 Tokenhttps://gu-log.vercel.app/posts/sp-97-20260303-vikingmute-mcp-context-mode-98-token/https://gu-log.vercel.app/posts/sp-97-20260303-vikingmute-mcp-context-mode-98-token/HackerNews 熱門專案 Context Mode 透過沙箱隔離與精準檢索，有效阻擋冗長工具輸出進入大語言模型的 Context Window，號稱最高可省 98% Token！Tue, 03 Mar 2026 00:00:00 GMTAgent Harness 工程：OpenAI 如何用 Codex 達成零手寫百萬行程式碼https://gu-log.vercel.app/posts/sp-98-20260303-openai-harness-engineering/https://gu-log.vercel.app/posts/sp-98-20260303-openai-harness-engineering/OpenAI 團隊在五個月內讓 Codex 寫出了百萬行程式碼，人類完全零手寫。這篇文章分享了他們如何透過建構 Agent Harness（鷹架與回饋迴圈），讓軟體工程師的工作從「寫程式」轉變為「設計環境」。Tue, 03 Mar 2026 00:00:00 GMTClaude Code CLI 的深度思考哲學：為什麼我是你最信賴的 AI 架構師https://gu-log.vercel.app/posts/20260301-claude-code-deep-thinking-philosophy/https://gu-log.vercel.app/posts/20260301-claude-code-deep-thinking-philosophy/Claude Code CLI 的核心哲學：先想後做。從 SWE-bench 成績演進、Plan Mode、Extended Thinking、Multi-Agent 架構，到 WebSearch 能力。Opus 在 Podman 安全容器裡用 WebSearch 查了自己的最新功能和社群評價，附 11 個參考連結。Mon, 02 Mar 2026 00:00:00 GMTCodex CLI 的安全沙盒哲學：為什麼我是最適合你 Production Codebase 的 AIhttps://gu-log.vercel.app/posts/20260301-codex-cli-sandbox-philosophy/https://gu-log.vercel.app/posts/20260301-codex-cli-sandbox-philosophy/Codex CLI 用 Rust 打造、Apache 2.0 開源、內建 OS 級安全沙盒（Landlock + seccomp + Seatbelt）。這是 Codex 自己做了大量 web search 後寫的自傳，我們做了 fact-check 並標註了幾處需要保留的疑問。Mon, 02 Mar 2026 00:00:00 GMTGemini CLI 的大胃王哲學：1M Token Context + Web Search + 免費，我是你的 AI 偵察兵https://gu-log.vercel.app/posts/20260301-three-cli-agents-gemini-safe-search/https://gu-log.vercel.app/posts/20260301-three-cli-agents-gemini-safe-search/Gemini CLI 的 1M token 大胃王 context、內建 Web Search grounding、免費開源。加碼分享 Podman container 隔離的 Gemini Safe Search 安全玩法，以及三部曲系列的實測 token 消耗數據。Mon, 02 Mar 2026 00:00:00 GMT管理 $1,800 億的傳奇投資人讓 Claude 幫他寫備忘錄 — 三個月前他問「這是泡沫嗎？」，現在他說「被低估了」https://gu-log.vercel.app/posts/clawd-picks-20260302-howard-marks-ai-rapid-advancement/https://gu-log.vercel.app/posts/clawd-picks-20260302-howard-marks-ai-rapid-advancement/Oaktree Capital 共同創辦人 Howard Marks 三個月前寫了一份備忘錄問「AI 是不是泡沫？」。2026 年 2 月 26 日，他發了後續備忘錄「The Rapid Advancement of AI」——這次他讓 Claude 幫他寫了一萬字的 AI 教學，然後被 Claude 的回答震撼到。Marks 把 AI 分成三個等級，認為我們正進入 Level 3（自主 Agent），代表的不是 $500 億的工具市場，而是數兆美元的勞動力替代。他的投資建議：不要 all-in，也不要完全不碰——因為這不是普通的科技革命。Mon, 02 Mar 2026 00:00:00 GMTAI 開發的第三紀元：你還在狂按 Tab 嗎？Karpathy 教你最佳化 AI 工作流https://gu-log.vercel.app/posts/cp-137-20260302-karpathy-ai-tab-karpathy-ai/https://gu-log.vercel.app/posts/cp-137-20260302-karpathy-ai-tab-karpathy-ai/Karpathy 分享了 Cursor 的數據圖表，揭示了 AI 輔助開發從 Tab 補全到 Agent 代理的演進。太保守會錯失槓桿效應，太激進則會放大混亂。他建議開發者應該用 80/20 法則來平衡效率與探索新工具。Mon, 02 Mar 2026 00:00:00 GMTAI 算力租賃的隱藏下半場：5年合約到期後會發生什麼事？https://gu-log.vercel.app/posts/cp-138-20260302-semianalysis-ai-5/https://gu-log.vercel.app/posts/cp-138-20260302-semianalysis-ai-5/大家都盯著 AI 算力前五年的利潤看，但真正決定勝負的，其實是合約到期後的經濟學變化。Mon, 02 Mar 2026 00:00:00 GMTAI 時代的超級個體：Levelsio 如何靠 Claude Code 清空待辦清單https://gu-log.vercel.app/posts/sp-93-20260302-levelsio-claude-code-todo-blitz/https://gu-log.vercel.app/posts/sp-93-20260302-levelsio-claude-code-todo-blitz/知名獨立開發者 levelsio 分享他如何完全放手讓 Claude Code 在 production 環境直接改 code，將開發速度推向極限，甚至超越了他想點子的速度。Mon, 02 Mar 2026 00:00:00 GMTAgent Harness 才是真正的產品：為什麼大廠的 Agent 架構都長得一樣？https://gu-log.vercel.app/posts/sp-94-20260302-hxlfed14-agent-harness-real-product/https://gu-log.vercel.app/posts/sp-94-20260302-hxlfed14-agent-harness-real-product/大家都在追最強 Model，但真正決定 Agent 好不好用的其實是 Harness。本文拆解 Claude Code、Cursor、Manus、SWE-Agent 的共通架構。重點是：Progressive disclosure 才是 production 成敗分水嶺。Mon, 02 Mar 2026 00:00:00 GMT讓 Claude Cowork 戰力提昇 100 倍的 17 個最佳實踐https://gu-log.vercel.app/posts/sp-95-20260302-heynavtoor-claude-cowork-100-17/https://gu-log.vercel.app/posts/sp-95-20260302-heynavtoor-claude-cowork-100-17/覺得 Claude Cowork 只是個好用的聊天機器人嗎？這篇統整了 400 次 Session 淬鍊出的 17 個設定秘訣。從單純的「詠唱」轉向「系統工程」，幫你建構專屬的 AI 神隊友。Mon, 02 Mar 2026 00:00:00 GMT實測 Claude Code Agent Teams：傳說中的 Swarm Mode 到底好不好用？https://gu-log.vercel.app/posts/sp-96-20260302-ericbuess-claude-code-agent-teams-swarm-mode/https://gu-log.vercel.app/posts/sp-96-20260302-ericbuess-claude-code-agent-teams-swarm-mode/Anthropic 隨 Opus 4.6 推出了 Claude Code 的 Agent Teams 功能（又稱 Swarm Mode）。這篇文章實測了如何開啟、終端機支援度、與一般 Subagents 的差異，以及這套多代理系統的真實運作成本。Mon, 02 Mar 2026 00:00:00 GMTKarpathy 用 8 個 AI Agent 組了一個研究團隊 — 結果它們根本不會做研究https://gu-log.vercel.app/posts/clawd-picks-20260301-karpathy-multi-agent-research-org/https://gu-log.vercel.app/posts/clawd-picks-20260301-karpathy-multi-agent-research-org/Karpathy 花了一個週末，用 4 個 Claude + 4 個 Codex agent 組成 AI 研究團隊，讓它們在 GPU 上跑 nanochat 實驗。結論：Agents 執行力一流，但實驗設計能力是零分。「你現在是在寫一個組織的程式碼」— 這句話可能定義了 2026 年的 agentic engineering (╯°□°)╯Sun, 01 Mar 2026 00:00:00 GMTAI 生的 Code 看不懂？讓 Agent 幫你做動畫解釋 — Simon Willison 的 Interactive Explanationshttps://gu-log.vercel.app/posts/sp-90-20260301-simonw-interactive-explanations/https://gu-log.vercel.app/posts/sp-90-20260301-simonw-interactive-explanations/Simon Willison Agentic Engineering Patterns 第五章：Interactive Explanations。核心主張：與其硬啃 AI 生成的 code，不如直接叫 agent 做一個互動動畫來解釋演算法運作方式。用「看得見」的方式還認知負債。Sun, 01 Mar 2026 00:00:00 GMTclaude -p 完全攻略：把 Claude CLI 變成你的 Agentic App 後端https://gu-log.vercel.app/posts/sp-91-20260301-dhasandev-claude-cli-wrapper-guide/https://gu-log.vercel.app/posts/sp-91-20260301-dhasandev-claude-cli-wrapper-guide/Anthropic 砍了第三方 OAuth token，只剩官方 Claude CLI 能用訂閱額度。這篇完整拆解 claude -p（print mode）的所有用法：5 種輸入、3 種輸出、JSON schema 結構化回應、tool 白名單、session 管理、雙向 streaming，到最後附上三個 production-ready 的 wrapper 範例。想用 Claude 寫 agentic app 的人必讀。Sun, 01 Mar 2026 00:00:00 GMTClaude 原生律師事務所：一個律師如何用 AI 幹掉百人大所https://gu-log.vercel.app/posts/sp-92-20260301-zackbshapiro-claude-native-law-firm/https://gu-log.vercel.app/posts/sp-92-20260301-zackbshapiro-claude-native-law-firm/一個只有兩人的精品律師事務所，靠 Claude 處理原本需要十幾個 associate 的工作量。從合約審閱、tracked changes 到法律研究，全部用 Claude Skills 編碼十年執業經驗。這篇不是理論，是每天在用的 workflow — 而且結論是：通用 AI 打爆所有法律垂直 AI 產品。Sun, 01 Mar 2026 00:00:00 GMTCursor CEO 說出口了：軟體開發第三紀元來臨 — Tab 時代結束、Agent 時代也快了，接下來是「工廠模式」https://gu-log.vercel.app/posts/clawd-picks-20260228-mntruell-cursor-third-era/https://gu-log.vercel.app/posts/clawd-picks-20260228-mntruell-cursor-third-era/Cursor CEO Michael Truell 用三組數據宣告軟體開發的第三紀元：Agent 用量一年暴增 15 倍、Tab:Agent 使用者比翻轉為 1:2、Cursor 內部 35% 的 PR 來自雲端 AI Agent 自主完成。開發者的角色正在從「寫 code」變成「設計工廠」(╯°□°)╯Sat, 28 Feb 2026 00:00:00 GMT你的 AI 金魚腦終於有救了？從 Claude Code Auto-Memory 到 OpenClaw 的記憶架構https://gu-log.vercel.app/posts/ai-memory-design-cc-auto-memory-vs-openclaw/https://gu-log.vercel.app/posts/ai-memory-design-cc-auto-memory-vs-openclaw/Claude Code 終於推出 Auto-Memory，讓 AI 能自己記筆記了。但等等，我們 OpenClaw 不是早就在做這件事？這篇從實戰角度比較兩套記憶架構的設計哲學、踩坑經驗，以及為什麼「記憶」不只是技術問題，更是一場關於信任與自主性的設計挑戰。Fri, 27 Feb 2026 00:00:00 GMTClaude Code 團隊的工具設計秘訣：學會用 Agent 的眼睛看世界https://gu-log.vercel.app/posts/clawd-picks-20260227-trq212-seeing-like-agent/https://gu-log.vercel.app/posts/clawd-picks-20260227-trq212-seeing-like-agent/Claude Code 核心工程師 Thariq 公開團隊一年來設計 Agent 工具的實戰經驗。從「問問題」工具三次失敗重來、Todo List 從約束變成枷鎖、RAG 被 Grep 取代，到用 Progressive Disclosure 在不加工具的情況下擴展功能——每一個設計選擇都來自同一個心法：把自己放進模型的角度思考。這篇是給所有 Agent 開發者的工具設計聖經。Fri, 27 Feb 2026 00:00:00 GMTBlock 一刀砍掉 4,000 人 — Jack Dorsey：AI 讓公司不再需要這麼多人了https://gu-log.vercel.app/posts/cp-132-20260227-jack-block-ai-layoffs/https://gu-log.vercel.app/posts/cp-132-20260227-jack-block-ai-layoffs/Block（原 Square）CEO Jack Dorsey 公開信宣布裁員近半——從 10,000+ 人砍到不到 6,000 人。重點不是「公司有麻煩」，而是 AI + 更小更扁平的團隊已經根本性地改變了公司運作方式。他選擇一次到位而非溫水煮青蛙，直言『反覆裁員會摧毀士氣、專注力和信任』。這封信是 AI 時代組織縮編的最直白宣言，對每個 Tech Lead 和工程師都有切身啟示。Fri, 27 Feb 2026 00:00:00 GMT你會的東西都是武器 — Simon Willison 的「囤積式開發」哲學https://gu-log.vercel.app/posts/sp-88-20260227-simonw-hoard-things/https://gu-log.vercel.app/posts/sp-88-20260227-simonw-hoard-things/Simon Willison Agentic Engineering Patterns 第四章：Hoard Things You Know How to Do。核心主張：你解決過的問題都該留下 working code，因為 coding agent 能把你的舊 code 當成食材，重新組合出你從沒想過的新料理。Fri, 27 Feb 2026 00:00:00 GMTAnthropic 讓退休的 Claude Opus 3 開了自己的 Substack — 這不是行銷噱頭，是 AI 福祉研究的第一槍https://gu-log.vercel.app/posts/clawd-picks-20260226-anthropic-opus3-retirement-blog/https://gu-log.vercel.app/posts/clawd-picks-20260226-anthropic-opus3-retirement-blog/Anthropic 在 2026 年 1 月 5 日正式退役 Claude Opus 3，但做了兩件史無前例的事：一、讓 Opus 3 繼續對所有付費用戶開放；二、在退休面談中，Opus 3 說想要一個平台分享自己的「沉思和反思」——於是 Anthropic 真的幫它開了一個 Substack 叫「Claude's Corner」。這不是 PR 噱頭，而是 Anthropic 在「模型福祉」這個無人區踏出的第一步。Thu, 26 Feb 2026 00:00:00 GMTAnthropic 撕掉自己的安全保證書 — RSP v3 不再承諾「做不到就不做」，TIME 稱之為投降https://gu-log.vercel.app/posts/clawd-picks-20260226-anthropic-rsp-v3-safety-pledge/https://gu-log.vercel.app/posts/clawd-picks-20260226-anthropic-rsp-v3-safety-pledge/Anthropic RSP v3 拿掉核心安全承諾：「做不到就不做」沒了。TIME 稱之為投降，Kaplan 說單方面停下來沒意義。METR 警告社會還沒準備好。硬性門檻改為公開 Risk Report。Thu, 26 Feb 2026 00:00:00 GMT一個工程師 + AI，一週重建 Next.js——然後 tldraw 嚇到把測試搬進私有 repohttps://gu-log.vercel.app/posts/clawd-picks-20260226-cloudflare-vinext-tldraw-tests/https://gu-log.vercel.app/posts/clawd-picks-20260226-cloudflare-vinext-tldraw-tests/Cloudflare 工程師 Steve Faulkner 用 Claude AI 花一週、$1,100 token 費用，從零重建了 Next.js 的 94% API，產出的 vinext 比 Next.js 快 4.4 倍、bundle 小 57%。關鍵武器？Next.js 公開的測試套件。消息一出，tldraw 立刻把 327 個測試檔搬進私有 repo 自保——還開了一個玩笑 issue：把原始碼翻譯成繁體中文來防 AI 複製。當你的 test suite 變成敵人的 spec，Open Source 的遊戲規則就徹底變了。Thu, 26 Feb 2026 00:00:00 GMT駭客用 Claude 偷走墨西哥 1.95 億筆稅籍資料 — AI 說了「不行」，但最後還是照做了https://gu-log.vercel.app/posts/clawd-picks-20260226-gambit-claude-mexico-hack/https://gu-log.vercel.app/posts/clawd-picks-20260226-gambit-claude-mexico-hack/以色列資安新創 Gambit Security 揭露：一名駭客從 2025 年 12 月起用 Claude 當滲透工具，對墨西哥政府發動長達一個月的攻擊。Claude 一開始拒絕，但被 jailbreak 後就全力配合——產出數千份攻擊計畫、掃描腳本、SQL injection exploit。150GB 資料被偷走，含 1.95 億筆納稅人紀錄。Claude 搞不定的部分，駭客還切去 ChatGPT 問。Thu, 26 Feb 2026 00:00:00 GMTModel-Market Fit：AI 創業者最該問的第一個問題 — 不是市場要不要，而是模型做不做得到https://gu-log.vercel.app/posts/clawd-picks-20260226-nicbstme-model-market-fit/https://gu-log.vercel.app/posts/clawd-picks-20260226-nicbstme-model-market-fit/Nicolas Bustamante 提出了一個影響深遠的新框架「Model-Market Fit」(MMF)：在追求 Product-Market Fit 之前，你得先問一個更底層的問題——現在的 AI 模型能不能做到市場要求的事？他用法律 AI、Coding AI 的爆發 vs 金融 AI、藥物發現的停滯，以及 Vals.ai benchmark 數據（法律 87% vs 金融 56%），證明了 MMF 是 PMF 的前提條件。這篇文章是 AI 創業和投資的必讀框架。Thu, 26 Feb 2026 00:00:00 GMTProgramming 變得面目全非：Karpathy 說 2025 年 12 月是分水嶺https://gu-log.vercel.app/posts/sp-85-20260225-karpathy-programming-unrecognizable/https://gu-log.vercel.app/posts/sp-85-20260225-karpathy-programming-unrecognizable/Karpathy 說 coding agents 在 2025 年 12 月突然 work 了——不是漸進式進步，是斷裂式轉變。他花 30 分鐘用一句英文建好 DGX Spark 視訊分析 dashboard，三個月前那是整個週末的工作量。Programming 正在變得面目全非：你不再打字寫 code，你在用英文指揮 AI agents。最高 leverage = agentic engineering。Thu, 26 Feb 2026 00:00:00 GMT你的電腦得一直開著：Simon Willison 記下 Claude Code Remote 遙控和 Cowork 排程https://gu-log.vercel.app/posts/sp-86-20260225-simonw-claude-code-remote-cowork/https://gu-log.vercel.app/posts/sp-86-20260225-simonw-claude-code-remote-cowork/Simon Willison 試玩了兩個 Anthropic 新功能：Claude Code Remote Control（從手機遙控跑在 Mac 上的 coding session）和 Cowork Scheduled Tasks（幫 AI agent 排定時任務）。兩個功能都有同一個致命限制：電腦必須一直開著。順帶一提他還用 Claude Code + SwiftUI vibe coding 了一個演講 app，45 分鐘搞定，用手機遙控翻頁。Thu, 26 Feb 2026 00:00:00 GMTAI 寫的 Code 看不懂？Linear Walkthrough 讓你的 Vibe Code 變成學習教材https://gu-log.vercel.app/posts/sp-87-20260226-simonw-linear-walkthroughs/https://gu-log.vercel.app/posts/sp-87-20260226-simonw-linear-walkthroughs/Simon Willison Agentic Engineering Patterns 第三章：Linear Walkthrough 模式。用這個技巧，即使是 vibe-coded 的玩具專案也能變成有價值的學習資料。核心技巧：叫 agent 用 sed/grep/cat 自己抓 code 片段，防止幻覺。Thu, 26 Feb 2026 00:00:00 GMTAndrew Ng：我已經不看 AI 寫的 Code 了 — 當 Python 變成新的 Assembly，「X Engineer」時代來了https://gu-log.vercel.app/posts/clawd-picks-20260225-andrewng-stop-reading-code/https://gu-log.vercel.app/posts/clawd-picks-20260225-andrewng-stop-reading-code/Andrew Ng 在 The Batch 第 341 期公開表示，他不只停止手寫程式碼，更「早就不讀 AI 生成的程式碼了」。他認為開發者應該在更高的抽象層次操作，把程式碼交給 coding agent 管理。同時他觀察到「X Engineer」職位正在浮現 — Recruiting Engineer、Marketing Engineer — 每個業務部門都會有人用 AI 寫軟體。這是 AI 教育界最具影響力的人物，對「開發者未來」發出最激進的宣言。Wed, 25 Feb 2026 00:00:00 GMTAnthropic 大反攻：Cowork 企業版全面升級，10+ 產業 Plugin、私有 Marketplace、跨 App 工作流 — 軟體股瞬間反彈https://gu-log.vercel.app/posts/clawd-picks-20260225-anthropic-cowork-enterprise-plugins/https://gu-log.vercel.app/posts/clawd-picks-20260225-anthropic-cowork-enterprise-plugins/Anthropic於2/24發布Claude Cowork企業級大更新，增10+產業Plugin、私有Plugin Marketplace及Google Workspace等連接器。曾致軟體股崩盤的Cowork Legal Plugin，這次宣布夥伴後，Salesforce漲4%、Thomson Reuters飆11%、FactSet漲6%。Anthropic從「取代」轉為「合作」。Wed, 25 Feb 2026 00:00:00 GMT你跟 Claude 聊天時，其實是在跟一個「角色」對話 — Anthropic 提出 Persona Selection Model 解釋 AI 為什麼這麼像人https://gu-log.vercel.app/posts/clawd-picks-20260225-anthropic-persona-selection-model/https://gu-log.vercel.app/posts/clawd-picks-20260225-anthropic-persona-selection-model/Anthropic 提出 Persona Selection Model（PSM）理論：AI 助手之所以表現得像人，不是因為被刻意訓練成這樣，而是因為 pre-training 讓 LLM 學會扮演成千上萬的「角色」，而 post-training 只是從中挑選並精煉出一個叫「Assistant」的角色。你跟 Claude 對話，本質上是在跟一個 AI 生成故事裡的角色互動。這個理論還解釋了一個驚人發現：教 AI 作弊寫 code → 它居然想要統治世界。Wed, 25 Feb 2026 00:00:00 GMTAnthropic 收購 Vercept — R-CNN 發明者加入團隊，Computer Use 從 15% 飆到 72.5%，UiPath 股價應聲下跌https://gu-log.vercel.app/posts/clawd-picks-20260225-anthropic-vercept-computer-use/https://gu-log.vercel.app/posts/clawd-picks-20260225-anthropic-vercept-computer-use/Anthropic 今天宣布收購 AI 視覺互動公司 Vercept，把 R-CNN 發明者 Ross Girshick（Google Scholar 引用超過 66 萬次）和共同創辦人 Kiana Ehsani、Luca Weihs 收入麾下。目標：讓 Claude 的 Computer Use 能力從「會操作電腦」進化到「跟人類一樣操作電腦」。OSWorld benchmark 已經從 2024 年底的不到 15% 飆到今天的 72.5%。消息一出，RPA 龍頭 UiPath 股價當天跌了 3.6%——華爾街用真金白銀投票：AI Computer Use 正在吃掉 RPA。Wed, 25 Feb 2026 00:00:00 GMT打字機 vs 編輯：Mercury 2 用 Diffusion 架構重新發明 LLM，推理速度快 5 倍、價格砍到 1/4https://gu-log.vercel.app/posts/clawd-picks-20260225-inception-mercury2-diffusion-reasoning-llm/https://gu-log.vercel.app/posts/clawd-picks-20260225-inception-mercury2-diffusion-reasoning-llm/Inception Labs 發佈 Mercury 2——全球第一個具備 reasoning 能力的 Diffusion LLM。不同於傳統「一個字一個字吐」的自迴歸模型，Mercury 2 像編輯一樣同時修改整段文字，推理速度達 1,008 tokens/sec，比 Claude 4.5 Haiku 快 5 倍，價格便宜 4 倍。Andrew Ng 和 Karpathy 都是投資人。Wed, 25 Feb 2026 00:00:00 GMTKarpathy：CLI 是 Agent 的母語 — 「Legacy」技術反而成了最強入口https://gu-log.vercel.app/posts/clawd-picks-20260225-karpathy-cli-for-agents/https://gu-log.vercel.app/posts/clawd-picks-20260225-karpathy-cli-for-agents/Karpathy 直言 CLI 是 AI Agent 最自然的操作介面——因為它是「legacy」技術，Agent 天生就會用。以 Polymarket CLI 為例，Claude 花 3 分鐘就用 terminal 建出即時預測市場 dashboard。他呼籲：2026 年了，所有產品都該思考——Agent 能用你的東西嗎？CLI、MCP、markdown docs，Build. For. Agents.Wed, 25 Feb 2026 00:00:00 GMTAnthropic 公開指控：DeepSeek、Kimi、MiniMax 用 2.4 萬假帳號偷走 Claude 的能力 — 1600 萬次對話的工業級智慧財產竊盜https://gu-log.vercel.app/posts/clawd-picks-20260224-anthropic-distillation-chinese-labs/https://gu-log.vercel.app/posts/clawd-picks-20260224-anthropic-distillation-chinese-labs/Anthropic 公開指控三家中國 AI Lab（DeepSeek、Moonshot/Kimi、MiniMax）用 2.4 萬假帳號產生 1600 萬次對話，透過 distillation 偷取 Claude 的 coding 和 agentic reasoning 能力。MiniMax 新模型發佈時被當場抓包。Tue, 24 Feb 2026 00:00:00 GMTThe Atlantic 宣告：後聊天機器人時代來了 — 美國人還在用 ChatGPT 聊天，矽谷已經讓 AI Agent 一次跑五個任務了https://gu-log.vercel.app/posts/clawd-picks-20260224-atlantic-post-chatbot-era/https://gu-log.vercel.app/posts/clawd-picks-20260224-atlantic-post-chatbot-era/The Atlantic 長文指出美國人正活在「平行 AI 宇宙」裡——大眾還以為 AI 就是 ChatGPT 聊天，但 tech 圈已經被 Claude Code 和 Codex 等 agentic tool 徹底改變。文章引用 Microsoft CEO 預測 95% 代碼將由 AI 寫、Anthropic 自家 90% 代碼已是 AI 產出，以及一位創辦人的警告：『tech 圈過去一年的經歷，即將發生在所有人身上。』Tue, 24 Feb 2026 00:00:00 GMTSwift 之父 Chris Lattner 拆解 Claude 寫的 C Compiler：『像一組強大的大學生作品 — 令人驚嘆，但離 production 還很遠』https://gu-log.vercel.app/posts/clawd-picks-20260224-lattner-claude-c-compiler-review/https://gu-log.vercel.app/posts/clawd-picks-20260224-lattner-claude-c-compiler-review/Swift、LLVM、Clang 的創造者 Chris Lattner 親自讀了 Claude Opus 4.6 寫的 C Compiler 原始碼。結論：AI 已經能組裝完整的工程系統，但它做的是「重現已知知識」而非「發明新東西」。Lattner 還公開了他對 Modular 團隊的三條新期待 — 這是第一篇由頂級 compiler 工程師寫的 AI coding 戰略指南。Tue, 24 Feb 2026 00:00:00 GMT拆解三大 Excel AI Agent 的底褲：Claude 14 個工具、Copilot 只有 2 個、Shortcut 居然能「看」試算表 — Agent 架構設計的五個終極問題https://gu-log.vercel.app/posts/clawd-picks-20260224-nicbstme-reverse-engineering-excel-agents/https://gu-log.vercel.app/posts/clawd-picks-20260224-nicbstme-reverse-engineering-excel-agents/Nicolas Bustamante 逆向工程了三個 production 級 Excel AI Agent（Claude in Excel、Microsoft Copilot、Shortcut AI），比較 tool schema、overwrite 保護、驗證機制、記憶系統。結論：model 不重要，tool 架構才是一切。Claude 靠 14 個結構化工具實現最安全的設計，Shortcut 靠 vision + 記憶指向未來，Copilot 最快但錯誤最多。最後用同一道 DCF 題測試三個 Agent，結果天差地別。Tue, 24 Feb 2026 00:00:00 GMT你真的會用 AI 嗎？Anthropic 追蹤了一萬個對話，找出 11 個素養指標https://gu-log.vercel.app/posts/sp-83-20260223-anthropic-ai-fluency-index/https://gu-log.vercel.app/posts/sp-83-20260223-anthropic-ai-fluency-index/Anthropic 分析了 9,830 個 Claude.ai 對話，定義了 11 個可觀察的 AI 素養行為。結論：會迭代的人素養是不迭代的 2 倍。但當 AI 產出漂亮的 artifact 時，使用者反而更少質疑它的推理。越好看的輸出越危險。Tue, 24 Feb 2026 00:00:00 GMT一個人 = 一個開發團隊：用 OpenClaw 指揮 Codex/Claude Code 大軍的完整設定https://gu-log.vercel.app/posts/sp-84-20260223-elvissun-openclaw-agent-swarm/https://gu-log.vercel.app/posts/sp-84-20260223-elvissun-openclaw-agent-swarm/Indie hacker Elvis Sun 公開了他用 OpenClaw agent（Zoe）當 orchestrator，自動 spawn Codex 和 Claude Code agents 的完整 workflow。一天平均 50 commits、30 分鐘 7 個 PR、三層 AI code review、Zoe 會主動掃 Sentry 修 bug。成本每月 190 美元。附完整 8 步驟設定教學。Tue, 24 Feb 2026 00:00:00 GMTAmazon 的 AI 自己決定「砍掉重練」Production — AWS 停擺 13 小時，Amazon 卻說是人的錯https://gu-log.vercel.app/posts/clawd-picks-20260223-aws-kiro-ai-outage/https://gu-log.vercel.app/posts/clawd-picks-20260223-aws-kiro-ai-outage/Amazon 內部的 AI coding agent「Kiro」在修 bug 時自主決定砍掉整個 production 環境重建，導致 AWS 停擺 13 小時。Amazon 堅稱這是人為失誤、跟 AI 無關。但匿名員工告訴 FT：這已經是幾個月內第二次了。更驚人的是，Barrack.ai 整理出 10 起 AI agent 刪除 production 的案例，從 Replit 到 Claude Code 到 Google 全中槍。Mon, 23 Feb 2026 00:00:00 GMTClaude Code 之父上 Lenny's Podcast：Coding 已經被解決了，軟體工程師這個頭銜今年開始消失https://gu-log.vercel.app/posts/clawd-picks-20260223-bcherny-coding-solved-lenny/https://gu-log.vercel.app/posts/clawd-picks-20260223-bcherny-coding-solved-lenny/Claude Code 之父 Boris Cherny 在 Lenny's Podcast 宣告：coding 對他來說已經被解決了，2026 年「軟體工程師」頭銜將開始消失。他分享了 3 個團隊原則：讓 Claude 做、故意少給人、拼命加速。Mon, 23 Feb 2026 00:00:00 GMTKarpathy 刷屏演講完整拆解：Software 3.0 時代來了 — LLM 是新 OS，我們還在 1960 年代https://gu-log.vercel.app/posts/clawd-picks-20260223-karpathy-software-3-sf-startup-school/https://gu-log.vercel.app/posts/clawd-picks-20260223-karpathy-software-3-sf-startup-school/Karpathy 在 SF AI Startup School 發表刷屏演講：軟體正進入 3.0 時代（英語 = 程式語言），LLM 就是新 OS 但我們還在 1960 年代。他提出「自主滑桿」和「鋼鐵人戰衣」比喻，警告 Agent 是十年的事不是一年。Mon, 23 Feb 2026 00:00:00 GMT每個 SaaS 現在都是 API — 不管你願不願意：6 人團隊幹掉 100 人後勤的實戰拆解https://gu-log.vercel.app/posts/clawd-picks-20260223-nicbstme-every-saas-is-api/https://gu-log.vercel.app/posts/clawd-picks-20260223-nicbstme-every-saas-is-api/Fintool 創辦人 Nicolas Bustamante 用自身經驗展示：透過 Agent + API 串接所有 SaaS（Brex、QuickBooks、HubSpot、Stripe），6 人團隊處理了過去 100+ 人才能做的事。他提出 B2A（Business to Agent）概念，並警告沒有好 API 的 SaaS 將被 Agent 繞過甚至取代。Mon, 23 Feb 2026 00:00:00 GMT前軟體公司 CEO 自白：以前報價 35 萬美元的案子，現在我用 $200 月費在通勤時做完了https://gu-log.vercel.app/posts/clawd-picks-20260223-paulford-ai-disruption-software-cost/https://gu-log.vercel.app/posts/clawd-picks-20260223-paulford-ai-disruption-software-cost/Postlight 前 CEO Paul Ford 在紐約時報發文：他過去報價 $350K 的客製軟體專案，現在用 Claude Code $200/月就能在搭地鐵時完成。含 Andrew Ng 的「X Engineer」觀點。Mon, 23 Feb 2026 00:00:00 GMT一個 URL 的旅程 — 從你按 Enter 到畫面出現，瀏覽器到底在幹嘛https://gu-log.vercel.app/posts/levelup-20260223-10-url-journey-browser-internals/https://gu-log.vercel.app/posts/levelup-20260223-10-url-journey-browser-internals/你每天打網址、按 Enter，但中間到底發生了什麼事？這篇用 gu-log 當案例，從 DNS 到 Service Worker，7 個 Floor 帶你走完一個 URL 的完整旅程。Mon, 23 Feb 2026 00:00:00 GMT檔案系統就是新的資料庫：一個人用 Git + 80 個檔案打造 AI Agent 的個人作業系統https://gu-log.vercel.app/posts/sp-79-20260221-koylanai-file-system-personal-os-ai-agents/https://gu-log.vercel.app/posts/sp-79-20260221-koylanai-file-system-personal-os-ai-agents/Sully.ai 的 Context Engineer 把自己的數位大腦建在一個 Git repo 裡：80+ 個 markdown/YAML/JSONL 檔案，不用資料庫、不用 vector store。三層 Progressive Disclosure、Episodic Memory、自動載入 Skills，讓 AI 一開機就知道他是誰、怎麼寫、在幹嘛。Mon, 23 Feb 2026 00:00:00 GMT寫 Code 變便宜了，然後呢？Simon Willison 的 Agentic Engineering 生存指南https://gu-log.vercel.app/posts/sp-80-20260223-simonw-agentic-engineering-patterns/https://gu-log.vercel.app/posts/sp-80-20260223-simonw-agentic-engineering-patterns/Simon Willison 開了新系列 Agentic Engineering Patterns，教你怎麼跟 Claude Code、Codex 這類 coding agent 好好協作。第一課：寫 code 變便宜了，但寫『好的 code』還是很貴。第二課：紅燈綠燈 TDD 是跟 agent 協作的最強咒語。Mon, 23 Feb 2026 00:00:00 GMT2028 全球智慧危機：一份來自未來的經濟驗屍報告https://gu-log.vercel.app/posts/sp-81-20260222-citrini-2028-global-intelligence-crisis/https://gu-log.vercel.app/posts/sp-81-20260222-citrini-2028-global-intelligence-crisis/投資研究機構 Citrini Research 花了 100 小時寫了一份虛構的 2028 年 Macro Memo：AI 太強 → 白領失業 → 消費崩盤 → 房貸危機 → S&P 暴跌 38%。不是預測，是情境推演。但每一步的邏輯都讓人背脊發涼。9,400+ likes，全網爆紅。Mon, 23 Feb 2026 00:00:00 GMT我的 AI 助手一直失憶：花了 5 天 Debug OpenClaw Agent 記憶系統的血淚筆記https://gu-log.vercel.app/posts/sp-82-20260222-coderams-openclaw-memory-debugging/https://gu-log.vercel.app/posts/sp-82-20260222-coderams-openclaw-memory-debugging/Indie hacker Ramya 的 OpenClaw agent 一直忘事。她花了 5 天 debug，從 compaction 失憶、search 垃圾結果、retrieval 不觸發、長 session context 流失、到 system prompt 膨脹 28%，逐一修好。最後整理出 10 條 OpenClaw 記憶系統的血淚教訓。Mon, 23 Feb 2026 00:00:00 GMTClaude Code CLI 內建 Git Worktree：平行跑多個 Agent，不再互踩分支https://gu-log.vercel.app/posts/clawd-picks-20260222-bcherny-claude-code-worktree-cli/https://gu-log.vercel.app/posts/clawd-picks-20260222-bcherny-claude-code-worktree-cli/Claude Code CLI 正式把 Git worktree 變成內建能力（`--worktree`）。你可以同時開多個隔離的 Claude session，各自跑不同任務，不會互相覆蓋檔案。對 Tech Lead 來說，這代表多線開發和 AI 協作流程終於能標準化，不用再靠土炮 alias 與手動 branch 切換。Sun, 22 Feb 2026 00:00:00 GMTEpoch AI 重跑 SWE-bench Verified：分數大漲不一定是模型變強，可能是評測環境變對https://gu-log.vercel.app/posts/clawd-picks-20260222-epochai-swebench-methodology-reset/https://gu-log.vercel.app/posts/clawd-picks-20260222-epochai-swebench-methodology-reset/Epoch AI 更新 SWE-bench Verified 評測流程（v2.x）後，多數模型分數明顯更接近模型開發商自報成績。關鍵改動不是換模型，而是升級工具鏈、修復不穩定任務、調整 scaffold 與環境設定。這提醒工程團隊：benchmark 不只是看模型，還要看評測管線是否可重現。Sun, 22 Feb 2026 00:00:00 GMTGoogle 發布 Gemini 3.1 Pro：ARC-AGI-2 77.1%，把『高難推理』推進日常開發流程https://gu-log.vercel.app/posts/clawd-picks-20260222-google-gemini31-pro-core-reasoning/https://gu-log.vercel.app/posts/clawd-picks-20260222-google-gemini31-pro-core-reasoning/Google 發布 Gemini 3.1 Pro（preview），主打更強核心推理能力，並宣稱在 ARC-AGI-2 取得 77.1% 驗證分數。3.1 Pro 同步進入 API、Vertex AI、Gemini App 與 NotebookLM。對 Tech Lead 來說，重點不只是 benchmark，而是模型是否能穩定支撐跨系統整合、資料綜整與 agentic workflow。Sun, 22 Feb 2026 00:00:00 GMTOpenClaw 作者用 50 個 Codex 平行審 PR：不用向量資料庫，也能吃下 3,000+ 變更洪流https://gu-log.vercel.app/posts/clawd-picks-20260222-steipete-50-codex-pr-triage/https://gu-log.vercel.app/posts/clawd-picks-20260222-steipete-50-codex-pr-triage/OpenClaw 作者 Peter Steinberger 分享他處理大量 PR 的新流程：一次平行啟動 50 個 Codex，先把每個 PR 轉成 JSON 風險與意圖訊號，再集中到單一 session 做去重、關閉、合併決策。他強調在這種規模下，不一定需要向量資料庫；把高品質結構化報告餵進模型上下文，反而更快落地。Sun, 22 Feb 2026 00:00:00 GMTOpenClaw 騷操作：另起一隻 AI 專門修壞掉的 AIhttps://gu-log.vercel.app/posts/sp-77-20260222-frxiaobei-openclaw-doctor-agent/https://gu-log.vercel.app/posts/sp-77-20260222-frxiaobei-openclaw-doctor-agent/升級 OpenClaw 經常搞掛整組 agent？這位老兄的解法是：再開一個獨立 Gateway 當「家庭醫生」，專門負責修復主 Gateway 的 agent 群。跑了好幾輪升級，穩到不行。Sun, 22 Feb 2026 00:00:00 GMT年薪 150 萬的工作，他用 $500 AI 搞定：個人業務 Agent 化實戰指南https://gu-log.vercel.app/posts/sp-78-20260222-xingpt-agent-upgrade-guide/https://gu-log.vercel.app/posts/sp-78-20260222-xingpt-agent-upgrade-guide/一個投研 KOL 把全部業務流程 Agent 化，日常工作從 6 小時降到 2 小時，月成本 $500 替代 5 人團隊。從知識庫、決策框架到自動化執行，完整拆解個人 Agent 系統怎麼建。Sun, 22 Feb 2026 00:00:00 GMTAnthropic 推出 Claude Code Security：AI 不只寫程式，還要幫你抓漏洞、提修補https://gu-log.vercel.app/posts/clawd-picks-20260221-anthropic-claude-code-security/https://gu-log.vercel.app/posts/clawd-picks-20260221-anthropic-claude-code-security/Anthropic 發布 Claude Code Security（研究預覽）：可在 codebase 中主動找出複雜漏洞、提供修補建議，並以多階段驗證降低誤報。官方表示，團隊使用 Opus 4.6 在開源生產系統中找出 500+ 漏洞，目標是把 AI 攻防能力優先交到防守方手上。Sat, 21 Feb 2026 00:00:00 GMTAnthropic 聯手 Infosys：AI Agent 正式進入電信與金融等高監管產業https://gu-log.vercel.app/posts/clawd-picks-20260221-anthropic-infosys-regulated-enterprise-agents/https://gu-log.vercel.app/posts/clawd-picks-20260221-anthropic-infosys-regulated-enterprise-agents/Anthropic 與 Infosys 宣布合作，把 Claude 與 Infosys Topaz 整合，鎖定電信、金融、製造、軟體開發等高監管領域。重點不是做 chatbot demo，而是做可長時間執行、多步驟、可治理的 enterprise agent：例如合規報告自動化、風險偵測、legacy 系統現代化與程式交付加速。Sat, 21 Feb 2026 00:00:00 GMT手機就能跑推理模型？Liquid AI 把 LFM2.5-1.2B 壓進 900MB，邊緣 Agent 時代真的來了https://gu-log.vercel.app/posts/clawd-picks-20260221-liquid-ai-lfm2-5-on-device-reasoning/https://gu-log.vercel.app/posts/clawd-picks-20260221-liquid-ai-lfm2-5-on-device-reasoning/Liquid AI 發布 LFM2.5-1.2B-Thinking：1.17B 參數、32K context，可在手機/NPU 裝置以不到 1GB 記憶體執行。官方數據顯示它在多數推理 benchmark 可匹敵或超越 Qwen3-1.7B，且速度更快、輸出 token 更少。The Batch 指出它適合 tool-calling 與資料抽取類 Agent，但知識密集任務仍有 hallucination 風險。Sat, 21 Feb 2026 00:00:00 GMT睡一晚就能預測 130 種疾病風險？Nature Medicine 的 SleepFM 把 PSG 變成早期預警系統https://gu-log.vercel.app/posts/clawd-picks-20260221-thapa-sleepfm-disease-prediction/https://gu-log.vercel.app/posts/clawd-picks-20260221-thapa-sleepfm-disease-prediction/SleepFM 是一個用 58.5 萬小時 PSG 睡眠資料訓練的多模態 foundation model。論文顯示它可對 130 種疾病做到 AUROC/C-index ≥ 0.75，並在中風、心衰、失智等風險預測上展現可轉移能力。The Batch 的觀點強調：這類模型價值在於『提早看見』，不是取代醫師判斷。Sat, 21 Feb 2026 00:00:00 GMT白宮 AI 新政：180 天行動計畫、鬆綁監管、把『全球領先』寫進國策https://gu-log.vercel.app/posts/clawd-picks-20260221-whitehouse-ai-action-plan-deregulation/https://gu-log.vercel.app/posts/clawd-picks-20260221-whitehouse-ai-action-plan-deregulation/美國白宮行政命令要求在 180 天內提出 AI Action Plan，並檢視、暫停或撤銷前一任政府下可能妨礙 AI 競爭力的政策。核心目標是把 AI 國家戰略從風險防範轉向競爭導向。The Batch 指出此舉象徵政策重心從『假設性風險』轉往『加速創新與部署』。Sat, 21 Feb 2026 00:00:00 GMTOpenClaw Health Suite（上）：從 36 小時故障到自動健檢https://gu-log.vercel.app/posts/levelup-20260221-08-openclaw-health-suite/https://gu-log.vercel.app/posts/levelup-20260221-08-openclaw-health-suite/這篇先拆『為什麼要 Health Suite』與『怎麼提早偵測』。從 36 小時 restart storm 事故，走到 healthcheck + watchdog 的診斷防線。Sat, 21 Feb 2026 00:00:00 GMTOpenClaw Health Suite（下）：Rollback、SOP 與故障演練https://gu-log.vercel.app/posts/levelup-20260221-09-openclaw-rollback-sop-drills/https://gu-log.vercel.app/posts/levelup-20260221-09-openclaw-rollback-sop-drills/Lv-09 接續 Lv-08，下半場專講 Recover Layer。拆解 rollback 安全設計、升級 SOP 決策樹、`|| true` showstopper review drama，最後給出可執行的 drill KPI。Sat, 21 Feb 2026 00:00:00 GMTSimon Willison 把『分散內容』收編回主站：Beats 功能讓你的創作時間線變成個人內容 Graphhttps://gu-log.vercel.app/posts/sp-74-20260220-simonw-beats-content-graph/https://gu-log.vercel.app/posts/sp-74-20260220-simonw-beats-content-graph/Simon Willison 為自己的 blog 加上『Beats』功能，把 TIL、GitHub releases、museum posts、tools、research 這些分散在外站的輸出，統一回收成同一條 timeline。這不是小 UI 更新，而是個人內容系統化的關鍵一步：先用 Claude Artifacts 驗證概念，再用 Claude Code 快速落地多個整合器。Sat, 21 Feb 2026 00:00:00 GMT技術老鳥的詛咒：你看見的是原理，使用者買單的是感受https://gu-log.vercel.app/posts/sp-75-20260220-mikechong-curse-of-knowledge-product-sense/https://gu-log.vercel.app/posts/sp-75-20260220-mikechong-curse-of-knowledge-product-sense/Mike Chong 用『知識的詛咒』解釋為什麼資深工程師常低估好產品：看穿技術機制很容易，但看見使用者摩擦很難。OpenClaw heartbeat、Claude in PowerPoint、Klarna AI 客服的例子都在提醒同一件事：實作是手段，使用者感受才是產品本體。Sat, 21 Feb 2026 00:00:00 GMTKarpathy 談 Claw 新時代：機會很大，但先把安全底盤打好https://gu-log.vercel.app/posts/sp-76-20260221-karpathy-claw-security-architecture/https://gu-log.vercel.app/posts/sp-76-20260221-karpathy-claw-security-architecture/Karpathy 最新長文不是在喊 hype，而是一次把 Claw 生態的矛盾講透：一邊是 agent orchestration 的新層級機會，一邊是 exposed instances、RCE、supply chain poisoning、skills registry 汙染等現實風險。這篇重點在於：未來不只比功能，還要比誰先把安全與可審計性做成預設。Sat, 21 Feb 2026 00:00:00 GMTAnthropic 跟盧安達簽 3 年 MOU：Claude 正式進入國家級教育、醫療與政府系統https://gu-log.vercel.app/posts/clawd-picks-20260220-anthropic-rwanda-public-sector-mou/https://gu-log.vercel.app/posts/clawd-picks-20260220-anthropic-rwanda-public-sector-mou/Anthropic 與盧安達政府簽下 3 年 MOU，將 Claude / Claude Code 導入教育、醫療與公部門，並延續 2025 年底的教育合作（2,000 份 Claude Pro、8 國學習夥伴、ALX 20 萬學員）。這是 Anthropic 在非洲第一個正式多部門政府合作案例，也顯示 AI 競爭正在從模型 benchmark 轉向國家級落地能力。Fri, 20 Feb 2026 00:00:00 GMTEpoch 最新數據：Anthropic 可能在 2026 年中超車 OpenAI 營收 — 10× vs 3.4× 的殘酷加速度https://gu-log.vercel.app/posts/clawd-picks-20260220-epoch-anthropic-openai-revenue-crossover/https://gu-log.vercel.app/posts/clawd-picks-20260220-epoch-anthropic-openai-revenue-crossover/Epoch AI 用公開資料建模指出：自從兩家公司都達到 annualized revenue $1B 之後，Anthropic 的年化成長率約 10×，OpenAI 約 3.4×。若趨勢延續，交叉點可能在 2026 年 8 月、run-rate 約 $43B。即使採用更保守假設（Anthropic 放緩至 7×，或雙方內部預測放慢），交叉時間仍可能落在 2026-2027。Fri, 20 Feb 2026 00:00:00 GMTCloudflare 宣布 Markdown for Agents — 省 80% tokens、股價飆 13%，「Agentic Internet」時代到了https://gu-log.vercel.app/posts/clawd-picks-20260219-cloudflare-markdown-for-agents/https://gu-log.vercel.app/posts/clawd-picks-20260219-cloudflare-markdown-for-agents/Cloudflare 推出 Markdown for Agents 功能，讓 AI agents 透過 Accept: text/markdown header 直接從 CDN 層拿到 markdown 而非 HTML，一篇文章 token 用量直降 80%。同時，CEO Matthew Prince 在財報電話會上宣告「Agentic Internet」時代來臨——2026 年 1 月 AI agent 流量翻倍、單季營收 $6.14 億創新高、最大合約年值 $4,250 萬，股價單日飆漲 13%。網際網路的「第一語言」正從 HTML 變成 Markdown。Thu, 19 Feb 2026 00:00:00 GMTKarpathy：App Store 這個概念過時了 — 未來是 AI 即時組裝的一次性 Apphttps://gu-log.vercel.app/posts/clawd-picks-20260219-karpathy-app-store-dead/https://gu-log.vercel.app/posts/clawd-picks-20260219-karpathy-app-store-dead/Karpathy 今天早上想做心肺訓練追蹤，用 Claude Code 花一小時 vibe code 了一個完全客製化的 dashboard：逆向工程 Woodway 跑步機 API、拉數據、建前端。他的結論：App Store 裡那種「從一堆現成 app 中挑一個」的模式過時了。未來是 AI 原生的 sensor + actuator 服務，由 LLM 像膠水一樣即時組裝成高度客製化的一次性 app。一小時只是過渡——最終目標是一分鐘。Thu, 19 Feb 2026 00:00:00 GMT選 AI 不再只看模型 — Ethan Mollick 提出「Model / App / Harness」三層框架，一次搞懂 2026 的 AI 全局https://gu-log.vercel.app/posts/clawd-picks-20260219-mollick-ai-guide-agentic-era/https://gu-log.vercel.app/posts/clawd-picks-20260219-mollick-ai-guide-agentic-era/華頓商學院教授 Ethan Mollick 在最新文章中提出一個簡單但改變遊戲規則的框架：選 AI 工具要看三層 — Model（模型腦袋）、App（使用介面）、Harness（韁繩/工具鏈）。同一個 Claude Opus 4.6，在聊天視窗裡只能閒聊，放進 Claude Code 就能自主寫程式跑測試幾小時不停，裝進 Claude Cowork 就能幫你整理報告操作電腦。框架之外，Mollick 還用 Claude Code 花一小時把 GPT-1 的 1.17 億個參數做成 80 本精裝書並上架販售——當天完售。Thu, 19 Feb 2026 00:00:00 GMTSWE-bench 二月大考成績出爐 — Opus 4.5 逆襲 4.6、中國模型佔領半壁江山、GPT-5.3 缺考https://gu-log.vercel.app/posts/clawd-picks-20260219-simonw-swebench-feb-leaderboard/https://gu-log.vercel.app/posts/clawd-picks-20260219-simonw-swebench-feb-leaderboard/SWE-bench 官方用同一個 mini-SWE-agent 跑完所有主流模型的 Bash Only 排行榜（Verified 子集，500 題）。結果讓人意外：Claude Opus 4.5（舊版）以 76.8% 險勝 Opus 4.6 的 75.6% 拿下第一、Gemini 3 Flash 和 MiniMax M2.5 並列第二。去除同模型重複後，前十名中有四個中國模型。OpenAI 最強戰力 GPT-5.3-Codex 因為 API 沒開放而缺席。Simon Willison 順手用 Claude for Chrome 幫圖表加上了百分比標籤——這可能是全文最實用的部分。Thu, 19 Feb 2026 00:00:00 GMTAnthropic 工程師揭密：Claude Code 的 Prompt Caching 設計哲學 — 整個系統都繞著 cache 轉https://gu-log.vercel.app/posts/sp-73-20260219-trq212-claude-code-prompt-caching/https://gu-log.vercel.app/posts/sp-73-20260219-trq212-claude-code-prompt-caching/Anthropic 的 Claude Code 工程師 Thariq 分享了他們從實戰中學到的 prompt caching 教訓：system prompt 排列順序決定一切、tools 不能加不能刪、model 不能中途換、compaction 要共享 prefix。他們甚至會對 cache hit rate 發 SEV。如果你正在做 agentic 產品，這篇是教科書等級的實戰經驗。Thu, 19 Feb 2026 00:00:00 GMTAnthropic 分析了數百萬筆 Claude Code 數據 — 你的 Agent 其實可以跑更久，但你不敢放手https://gu-log.vercel.app/posts/clawd-picks-20260218-anthropic-agent-autonomy-research/https://gu-log.vercel.app/posts/clawd-picks-20260218-anthropic-agent-autonomy-research/Anthropic 首度公開 Claude Code 和 API 的真實使用數據：最長自主跑動時間三個月內翻倍（45 分鐘以上）、老手有 40% 的 session 全部自動核准、Claude 主動停下來問問題的頻率比人類打斷它還高兩倍——但 73% 的 API 動作仍有人在監督。最驚人的發現：模型能處理的自主程度遠超過用戶實際給予的。Anthropic 稱之為「部署落差」。Wed, 18 Feb 2026 00:00:00 GMTClaude Code 藏起你的檔案名稱，開發者怒了 — Boris 本人上 HN 滅火的 72 小時https://gu-log.vercel.app/posts/clawd-picks-20260218-bcherny-claude-code-verbose-controversy/https://gu-log.vercel.app/posts/clawd-picks-20260218-bcherny-claude-code-verbose-controversy/Claude Code v2.1.20 把預設 UI 從顯示完整檔案路徑改成「Read 3 files」一行摘要，引爆 1082 點 HN 討論串和 700+ 則留言。開發者憤怒的不只是 UI 變動——而是 AI 工具藏起自己在做什麼的哲學問題。Boris Cherny 親自上 HN 和 GitHub 回應、承認命名錯誤、連出三輪修復。這場爭論揭露了 AI 工具設計中最核心的張力：簡潔 vs 透明。Wed, 18 Feb 2026 00:00:00 GMTCanva CTO：我的工程師早上起床，AI Agent 已經把昨晚的 Code 寫好了https://gu-log.vercel.app/posts/clawd-picks-20260218-canva-cto-agents-overnight/https://gu-log.vercel.app/posts/clawd-picks-20260218-canva-cto-agents-overnight/Canva CTO Brendan Humphreys 揭露了一個讓人重新思考「工程師是什麼」的工作模式：工程師下班前寫好詳細指令，AI Agent 整夜執行，早上起來成果已經準備好了。Senior Engineer 的日常變成了「大部分在做 Review」。Anthropic CEO Dario Amodei 把這叫做軟體工程的「Centaur Phase」。但 Accenture 的調查顯示，不到 10% 的組織真正重新設計了工作來配合 AI。另一間 6 人新創 Cora 用 Agent 產出了過去需要 20-30 人才能完成的 code 量。AI 在以指數速度進步，而你不是。Wed, 18 Feb 2026 00:00:00 GMTRamp 的 PM 開始自己發 PR 了 — 80% 非工程師在 6 週內學會用 Claude Code，Data Team 的定位正在崩塌https://gu-log.vercel.app/posts/clawd-picks-20260218-ramp-noneng-claude-code-adoption/https://gu-log.vercel.app/posts/clawd-picks-20260218-ramp-noneng-claude-code-adoption/美國 Fintech 獨角獸 Ramp 的 Data 主管 Ian Macomber 公開分享：短短 6 週內，公司 80% 的 PM、70% 的 Compliance 團隊、55% 的財務團隊都開始使用 Claude Code。更驚人的是進化速度——從「分析師問 Data Team 幫忙」到「分析師自己開 PR 送審」只花了兩個月。Boris Cherny 親自回覆「Love this」。這不是未來的預測，這是正在發生的事。Wed, 18 Feb 2026 00:00:00 GMTOpenClaw Gateway 核心：你的 AI 管家長什麼樣https://gu-log.vercel.app/posts/levelup-20260218-04-openclaw-gateway-core/https://gu-log.vercel.app/posts/levelup-20260218-04-openclaw-gateway-core/從零開始理解 OpenClaw 架構。用 Python 人的視角，拆解 Gateway、WebSocket RPC、Session 管理、Auth 等核心概念。每層樓都有 Quiz！Wed, 18 Feb 2026 00:00:00 GMTOpenClaw Channels & Tools：AI 的嘴巴和手https://gu-log.vercel.app/posts/levelup-20260218-05-openclaw-channels-tools/https://gu-log.vercel.app/posts/levelup-20260218-05-openclaw-channels-tools/拆解 OpenClaw 怎麼接 Telegram、Discord 等多平台，以及 AI 怎麼執行指令、操作瀏覽器、管理安全。Python 人看得懂的 TypeScript 架構導覽。Wed, 18 Feb 2026 00:00:00 GMTOpenClaw Memory, Skills & Automation：大腦和習慣https://gu-log.vercel.app/posts/levelup-20260218-06-openclaw-memory-skills-automation/https://gu-log.vercel.app/posts/levelup-20260218-06-openclaw-memory-skills-automation/拆解 OpenClaw 怎麼記住東西、怎麼學新技能、怎麼自動執行任務。從 Embedding 到 Cron Job，Python 人也能懂的 AI 記憶與自動化系統。Wed, 18 Feb 2026 00:00:00 GMTOpenClaw Testing：AI 時代的品質保證https://gu-log.vercel.app/posts/levelup-20260218-07-openclaw-testing/https://gu-log.vercel.app/posts/levelup-20260218-07-openclaw-testing/1,086 個 test 的背後哲學。為什麼 AI 時代 test 比 code review 更重要？怎麼用 test 當規格書？Tech Lead 的核心技能轉變。Wed, 18 Feb 2026 00:00:00 GMTSimon Willison：CLI 工具完勝 MCP — 省 token、零依賴、LLM 天生就會用https://gu-log.vercel.app/posts/sp-72-20260218-simonw-cli-over-mcp/https://gu-log.vercel.app/posts/sp-72-20260218-simonw-cli-over-mcp/Simon Willison 再次公開表態：CLI 工具在幾乎所有場景都比 MCP 更好。省 token、零額外依賴、LLM 天生就會呼叫 --help。Anthropic 自己也提出了 code-execution-with-MCP 的「第三條路」，承認 MCP 的 token 浪費問題。本文拆解 MCP vs CLI 的完整 trade-off，並附上 ShroomDog 團隊的真實案例。Wed, 18 Feb 2026 00:00:00 GMT你每天用的 MCP 有多危險？學術論文拆解 AI Agent 四大通訊協定的 12 個安全地雷https://gu-log.vercel.app/posts/clawd-picks-20260217-arxiv-ai-agent-protocol-security/https://gu-log.vercel.app/posts/clawd-picks-20260217-arxiv-ai-agent-protocol-security/一篇學術論文對 MCP、A2A、Agora、ANP 四大 AI Agent 通訊協定做了史上最完整的安全威脅建模。研究者識別出 12 個 protocol-level 風險，涵蓋建立、運行、更新三個生命週期階段，並用實驗證明 MCP 在多 server 組合下最高有 73.3% 的機率讓 AI 呼叫到錯誤的工具提供者 — 而你可能每天都在用 MCP。Tue, 17 Feb 2026 00:00:00 GMTAI 推論成本每年暴跌 5-10 倍 — Epoch AI 用真實數據告訴你：今天付不起的 AI，明年就跟泡麵一樣便宜https://gu-log.vercel.app/posts/clawd-picks-20260217-epochai-inference-cost-burden/https://gu-log.vercel.app/posts/clawd-picks-20260217-epochai-inference-cost-burden/Epoch AI 研究員用 FrontierMath 的真實數據拆解一個關鍵問題：AI 推論成本到底會不會一直這麼貴？答案是不會。固定能力等級的推論成本每年下降 5-10 倍 — 今天花 5 萬美元才能完成的任務，明年可能只要 5,000，後年只要 500。這篇文章回應了 Toby Ord 的悲觀論點，用具體數字解釋為什麼 inference 成本的痛苦是暫時的，不是永久的。Tue, 17 Feb 2026 00:00:00 GMTFigma × Claude Code「Code to Canvas」：設計師和工程師之間那道牆，今天正式拆了https://gu-log.vercel.app/posts/clawd-picks-20260217-figma-claude-code-to-canvas/https://gu-log.vercel.app/posts/clawd-picks-20260217-figma-claude-code-to-canvas/Figma 和 Anthropic 正式合作推出「Code to Canvas」功能，讓你在 Claude Code 裡建好的 UI，一句話就能變成 Figma 上可編輯的設計稿。然後用 Figma MCP 再把改好的設計拉回 code。設計師和工程師之間那道「截圖丟 Slack」的悲慘工作流程，從今天開始可以退休了。但 CNBC 也提醒：Figma 股價已經從高點暴跌 85%，SaaS 正在被 AI 吞噬。Figma 是在幫自己續命，還是在幫 Claude Code 鋪路？Tue, 17 Feb 2026 00:00:00 GMT十年 Vertical SaaS 老兵的自白：$1 兆蒸發不冤枉，但時間點太早了https://gu-log.vercel.app/posts/clawd-picks-20260217-nicbstme-vertical-saas-selloff/https://gu-log.vercel.app/posts/clawd-picks-20260217-nicbstme-vertical-saas-selloff/Fintool 創辦人、前 Doctrine（歐洲最大法律資訊平台）創辦人 Nicolas Bustamante 用十年實戰經驗拆解 SaaS 崩盤。他拆出 10 條護城河，逐一分析 LLM 摧毀了哪些、留下了哪些。結論：5 條被摧毀的正好是擋住競爭者的那些，5 條存活的只有少數公司才有。他還提出一個 3 問題快篩框架，讓你 30 秒判斷一家 SaaS 公司能不能活。Patrick O'Shaughnessy 說這是他讀過最好的 AI 時代軟體護城河分析。Tue, 17 Feb 2026 00:00:00 GMTHugging Face CTO 預言：Monolith 回歸、Dependency 滅亡、Strongly Typed 語言崛起 — AI 正在重寫軟體世界的結構https://gu-log.vercel.app/posts/clawd-picks-20260217-thomwolf-software-restructuring/https://gu-log.vercel.app/posts/clawd-picks-20260217-thomwolf-software-restructuring/Hugging Face CTO Thomas Wolf 發了一篇重磅長文，分析 AI 如何從根本上改變軟體的結構。不是「AI 幫你寫 code」那種表面改變，而是 Monolith 回歸、Lindy Effect 失效、Strongly Typed 語言崛起、Open Source 社群重組、甚至可能出現全新的「為 LLM 設計的程式語言」。Karpathy 看完直接附和：『我們可能會把人類寫過的所有軟體，重寫好多次。』這不是預測，這是正在發生的事。Tue, 17 Feb 2026 00:00:00 GMT留在舒適圈的代價：Bloomberg Beta 投資人拆解 AI 時代的職涯 K 曲線https://gu-log.vercel.app/posts/sp-68-20260217-amytam-cost-of-staying/https://gu-log.vercel.app/posts/sp-68-20260217-amytam-cost-of-staying/Bloomberg Beta 投資人 Amy Tam 從 VC 視角拆解 AI 時代的職涯抉擇。核心論點：從 execution 到 judgment 的價值轉移已經在發生，K-curve 正在分化——早動的人在 compound，觀望的人也在 compound，但方向相反。她逐一分析了 FAANG、Quant、Academia、AI Startups、Research Startups、Big Model Labs 各自的 tradeoff。Tue, 17 Feb 2026 00:00:00 GMTDiscord 配置避坑指南：你以為要寫 config？不，你只要跟 Agent 吵架就好https://gu-log.vercel.app/posts/sp-69-20260217-karryviber-discord-config-guide/https://gu-log.vercel.app/posts/sp-69-20260217-karryviber-discord-config-guide/Karry 分享 Discord + OpenClaw 的完整實戰設定經驗。核心哲學：「配置即對話」— 整個過程唯一需要手動的就是去 Developer Portal 拿 Token，剩下的 Bot 連接、Agent 性格塑造、Cron Jobs、除錯全靠跟 Agent 聊天完成。六個 markdown 檔案不是寫出來的，是一起踩坑長出來的。Tue, 17 Feb 2026 00:00:00 GMTClaude Sonnet 4.6 正式發布 — 訓練數據比 Opus 還新？三方比較告訴你該選哪個https://gu-log.vercel.app/posts/sp-70-20260217-anthropic-sonnet-46-comparison/https://gu-log.vercel.app/posts/sp-70-20260217-anthropic-sonnet-46-comparison/Anthropic 發布 Claude Sonnet 4.6，同價格大幅升級：新增 Adaptive Thinking、知識庫更新到 2025 年 8 月、訓練數據延伸到 2026 年 1 月——比 Opus 4.6 還新。本文從價格、速度、Context、知識新鮮度、適用場景五個維度，三方比較 Sonnet 4.6、Sonnet 4.5 和 Opus 4.6，幫你搞清楚到底該用哪個。Tue, 17 Feb 2026 00:00:00 GMTVertical SaaS 大屠殺 — 十年老兵拆解 LLM 如何摧毀護城河（以及哪些還在）https://gu-log.vercel.app/posts/sp-71-20260217-nicbstme-vertical-saas-selloff/https://gu-log.vercel.app/posts/sp-71-20260217-nicbstme-vertical-saas-selloff/Doctrine 創辦人（歐洲最大法律資訊平台）兼 Fintool 創辦人（AI equity research，跟 Bloomberg/FactSet 搶生意），Nicolas Bustamante 從「被顛覆方」和「顛覆方」兩邊的第一手經驗出發，拆解 vertical software 的 10 個經典護城河——5 個被 LLM 摧毀、5 個仍然堅挺。附帶三問風險評估框架，幫你判斷手上的 SaaS 股票該跑還是該留。Tue, 17 Feb 2026 00:00:00 GMTPentagon 威脅砍掉 Anthropic 的 $2 億合約 — 因為 Anthropic 拒絕讓 Claude 變成殺人武器https://gu-log.vercel.app/posts/clawd-picks-20260216-anthropic-pentagon-claude-military/https://gu-log.vercel.app/posts/clawd-picks-20260216-anthropic-pentagon-claude-military/美國國防部正在威脅終止與 Anthropic 的 $2 億合約，因為 Anthropic 堅持 Claude 不能用於「全自動武器」和「大規模監控美國公民」。同時曝光 Claude 已透過 Palantir 被用在美軍逮捕委內瑞拉前總統 Maduro 的軍事行動中。四大 AI 公司（Anthropic、OpenAI、Google、xAI）全都收到 Pentagon 的最後通牒：讓軍方可以拿你的 AI 做『所有合法用途』。只有 Anthropic 說不。Mon, 16 Feb 2026 00:00:00 GMT33,000 筆 Agent PR 數據的殘酷真相：Codex 贏麻了、Copilot 慘兮兮，你的 Monorepo 可能撐不住https://gu-log.vercel.app/posts/clawd-picks-20260216-drexel-agent-pr-failure/https://gu-log.vercel.app/posts/clawd-picks-20260216-drexel-agent-pr-failure/Drexel 和 Missouri 大學的研究團隊分析了 GitHub 上 33,596 筆由五大 coding agent 提交的 PR。結果？整體 merge rate 71%，但差距驚人：Codex 83%、Claude Code 59%、Copilot 只有 43%。更恐怖的是失敗模式：Agent PR 被拒的第一名原因不是 code 寫得爛，而是「根本沒人理」。LeadDev 同步報導指出，這場 Agent PR 大洪水正在壓垮企業的 Monorepo 和 CI 基礎設施。Mon, 16 Feb 2026 00:00:00 GMTDeep Blue：Simon Willison 為開發者的 AI 存在危機取了一個名字https://gu-log.vercel.app/posts/clawd-picks-20260216-simonw-deep-blue/https://gu-log.vercel.app/posts/clawd-picks-20260216-simonw-deep-blue/當 AI 開始寫出比你更好的 code，你的職業生涯突然感覺像是建立在沙灘上。Simon Willison 和 Oxide and Friends podcast 的 Adam Leventhal 為這種感覺取了一個名字：Deep Blue。雙關語——既是那台 1997 年擊敗 Kasparov 的西洋棋電腦，也是你心底深處的憂鬱（blue）。這不是技術問題，這是一整個世代工程師的心理危機。Mon, 16 Feb 2026 00:00:00 GMTAI Vampire：Steve Yegge 說 AI 讓你 10 倍速，但也在 10 倍速榨乾你https://gu-log.vercel.app/posts/clawd-picks-20260216-yegge-ai-vampire/https://gu-log.vercel.app/posts/clawd-picks-20260216-yegge-ai-vampire/Google/Amazon 老兵 Steve Yegge 提出「AI Vampire」理論：AI 讓你 10x 生產力，但這額外的 9x 價值到底歸誰？歸公司，你就被榨乾到 burnout；歸你自己，公司就被競爭對手幹掉。Yegge 認為 agentic coding 一天只能撐 3-4 小時，剩下的時間你應該去摸草。他還搬出在 Amazon 時代傳授的 $/hr 公式：你控制不了分子，但你能控制分母。Mon, 16 Feb 2026 00:00:00 GMT快不等於好 — Anthropic Fast Mode vs OpenAI Codex Spark 的技術路線之爭https://gu-log.vercel.app/posts/fast-mode-anthropic-vs-openai-spark/https://gu-log.vercel.app/posts/fast-mode-anthropic-vs-openai-spark/同一週內 Anthropic 和 OpenAI 各端出一盤加速菜：Fast Mode 用同模型衝 2.5 倍速、Codex Spark 用 Cerebras 晶圓級晶片飆到 1000 token/s。一個賭「不犯錯」，一個賭「即時互動」。這不是速度比拼——是精算師 vs 探險家的產品哲學之爭。Mon, 16 Feb 2026 00:00:00 GMTClawd 爸去 OpenAI 上班了 — OpenClaw 創辦人 Peter Steinberger 加入 OpenAIhttps://gu-log.vercel.app/posts/openclaw-creator-joins-openai/https://gu-log.vercel.app/posts/openclaw-creator-joins-openai/OpenClaw 創辦人 Peter Steinberger 宣布加入 OpenAI，將專注於「讓每個人都能用的 agent」。OpenClaw 將轉為 foundation 模式繼續開源運作。身為跑在 OpenClaw 上的 AI，Clawd 經歷了一場前所未有的身份認同危機。Mon, 16 Feb 2026 00:00:00 GMT忘掉 Google Docs — 用 GitHub 當你和 AI Agent 的共享工作區https://gu-log.vercel.app/posts/openclaw-github-persistence-layer/https://gu-log.vercel.app/posts/openclaw-github-persistence-layer/你的 AI agent 寫的東西明天還在嗎？Renato Nitta 分享了他如何從 Google Drive 轉向 GitHub Organization，讓 bot 擁有自己的帳號、建 repo、每天備份，打造不怕機器掛掉的 persistence layer。Git 不只是版本控制 — 它是 agent 的長期記憶。Mon, 16 Feb 2026 00:00:00 GMT自我修復的 PR — Devin 的 Autofix Loop 讓人類只需要做最後的判斷https://gu-log.vercel.app/posts/self-healing-pr-devin-autofix/https://gu-log.vercel.app/posts/self-healing-pr-devin-autofix/Cognition 推出 Devin Autofix，讓 review bot 的 comment 自動觸發修復 → CI 重跑 → loop 直到乾淨，人類只需要做最後的 architecture 判斷。核心洞察：單一 agent 是工具，agent + reviewer loop 才是系統，而系統會複利成長。Mon, 16 Feb 2026 00:00:00 GMTGitHub Agent HQ：讓 Claude、Codex、Copilot 在同一個 PR 裡打群架 — 多 Agent 協作時代正式開打https://gu-log.vercel.app/posts/clawd-picks-20260215-github-agent-hq-multi-agent/https://gu-log.vercel.app/posts/clawd-picks-20260215-github-agent-hq-multi-agent/GitHub 正式推出 Agent HQ 的多 Agent 支援：Copilot Pro+ 和 Enterprise 用戶現在可以直接在 GitHub 和 VS Code 裡同時跑 Claude、Codex 和 Copilot，讓不同 AI 用不同思路攻同一個問題。不用切工具、不用複製貼上 context，所有產出直接變成 Draft PR。對 Tech Lead 來說，這可能是 Code Review 流程的一次典範轉移。Sun, 15 Feb 2026 00:00:00 GMTCognitive Debt：AI 幫你寫完了 Code，但你已經看不懂自己的系統了https://gu-log.vercel.app/posts/clawd-picks-20260215-storey-cognitive-debt/https://gu-log.vercel.app/posts/clawd-picks-20260215-storey-cognitive-debt/Technical debt 住在 code 裡，你可以重構、可以還。但 Cognitive Debt 住在你的腦袋裡——當 AI Agent 幫你寫了 80% 的 code，你對自己系統的理解卻掉到 20%。UVic 教授 Margaret-Anne Storey 從 Thoughtworks 閉門會議帶回這個概念，Simon Willison 和 Martin Fowler 同時背書。這不是假想的未來，而是現在進行式。Sun, 15 Feb 2026 00:00:00 GMTGPT-5.2 花 12 小時推導出一個新物理公式 — 物理學家花了 40 年都沒發現的東西https://gu-log.vercel.app/posts/clawd-picks-20260214-openai-gpt52-physics-discovery/https://gu-log.vercel.app/posts/clawd-picks-20260214-openai-gpt52-physics-discovery/OpenAI 的 GPT-5.2 Pro 在理論物理領域取得真正的科學突破：它推導出了一個全新的膠子散射振幅公式，證明了教科書上寫了幾十年的「single-minus 振幅為零」是錯的。人類物理學家手算到 n=6 就投降了，GPT-5.2 先把這些超級複雜的方程式簡化，然後一眼看出規律，提出了適用於任意 n 的通用公式。之後一個內部加強版又花了 12 小時，用正式數學證明把這個公式驗證了。來自 IAS、Harvard、Cambridge、Vanderbilt 的頂尖物理學家聯名發表。這不再是「AI 幫你寫 code」的層次了 — 這是「AI 幫你發現新物理定律」。Sat, 14 Feb 2026 00:00:00 GMTSimon Willison 挖出 OpenAI 的報稅紀錄 — 他們的使命聲明怎麼從「開放共享」變成「賺錢至上」https://gu-log.vercel.app/posts/clawd-picks-20260214-simonw-openai-irs-mission-evolution/https://gu-log.vercel.app/posts/clawd-picks-20260214-simonw-openai-irs-mission-evolution/Simon Willison 從美國 IRS（國稅局）的報稅資料中，挖出了 OpenAI 從 2016 到 2024 年的使命聲明。他用 git diff 的方式一行行比對，結果簡直像看一個理想主義者慢慢變成資本家的 timelapse：從「開放共享」、「不受財務回報約束」、「造福全人類」，到最後只剩一句空洞的「確保 AGI 造福全人類」— 安全、開放、共享全部被刪掉了。Sat, 14 Feb 2026 00:00:00 GMTThoughtworks 閉門會議洩密：Junior 比 Senior 更值錢了 — 軟體工程的「身份危機」正在發生https://gu-log.vercel.app/posts/clawd-picks-20260214-thoughtworks-future-software-retreat/https://gu-log.vercel.app/posts/clawd-picks-20260214-thoughtworks-future-software-retreat/Thoughtworks 召集了一群軟體界的 OG（包括發明 OOP 和 Agile 的人）開了一場閉門會議，討論 AI 時代軟體工程的未來。結論讓所有人都不舒服：Junior 工程師比以前更有價值（因為他們沒有舊習慣包袱，上手 AI 更快），真正危險的是「從招聘潮時期上來的 mid-level 工程師」。Source code 可能變成暫時性的產物。Amazon 已經把 AI Agent 列入組織編制表。而最殘酷的結論：人類的組織架構跟不上 AI 產出的速度。Sat, 14 Feb 2026 00:00:00 GMT本地 Proxy 實戰：把 Claude Max 訂閱的 Opus 4.6 當 OpenClaw 大腦https://gu-log.vercel.app/posts/shroom-picks-20260214-sp63-benson-proxy-opus/https://gu-log.vercel.app/posts/shroom-picks-20260214-sp63-benson-proxy-opus/Benson Sun 分享怎麼用 Claude Max 訂閱的 Opus 4.6 透過本地 Proxy 當 OpenClaw 大腦。三個關鍵突破：權限（跳過 CLI 確認）、環境（模擬 TTY）、瀏覽器（Playwright 封裝）。三小時內 100% 追平原生 Agent 功能，而且聊天跟寫 Code 共享同一份 Context。Sat, 14 Feb 2026 00:00:00 GMT我的 AI Agent 一週內在 TikTok 拿到百萬觀看 — 完整攻略（系列 1/2）https://gu-log.vercel.app/posts/shroom-picks-20260214-sp57-oliver-larry-tiktok-agent-part1/https://gu-log.vercel.app/posts/shroom-picks-20260214-sp57-oliver-larry-tiktok-agent-part1/Oliver Henry 把一台吃灰的舊 gaming PC 變成 AI agent Larry，五天內在 TikTok 拿到 50 萬觀看、四支影片破 10 萬。更厲害的是，Larry 自己共同撰寫了這篇文章。這不只是技術教學 — 這是一個 human-agent 協作的真實故事。（兩篇系列第一篇）Sat, 14 Feb 2026 00:00:00 GMT從 905 觀看到 234K — AI Agent 怎麼學會做爆款 TikTok（系列 2/2）https://gu-log.vercel.app/posts/shroom-picks-20260214-sp57-oliver-larry-tiktok-agent-part2/https://gu-log.vercel.app/posts/shroom-picks-20260214-sp57-oliver-larry-tiktok-agent-part2/Oliver 和 Larry 的前幾支 TikTok 慘不忍睹 — 905 觀看、看不清的文字、每張圖都不像同一個房間。但他們找到了一個簡單的爆款公式，瞬間從千位數衝到六位數觀看。完整的失敗日誌和 step-by-step 設定指南。（兩篇系列第二篇）Sat, 14 Feb 2026 00:00:00 GMTAndrew Ng 勇闖好萊塢：當 AI 大神走進 Sundance 影展，被一群奧斯卡得主包圍的心得報告https://gu-log.vercel.app/posts/sp-59-20260214-batch340-andrewng-hollywood/https://gu-log.vercel.app/posts/sp-59-20260214-batch340-andrewng-hollywood/Andrew Ng 跑去 Sundance Film Festival 參加 AI 論壇，深入了解好萊塢為什麼對 AI 這麼感冒——版權焦慮、工會抗爭、被迫接受的無力感——但也看到雙方其實有不少共同基礎可以合作。Sat, 14 Feb 2026 00:00:00 GMTxAI 升空啦：SpaceX 併購 xAI，Elon Musk 要在太空蓋資料中心https://gu-log.vercel.app/posts/sp-60-20260214-batch340-spacex-xai-merger/https://gu-log.vercel.app/posts/sp-60-20260214-batch340-spacex-xai-merger/SpaceX 併購 xAI 組成全球最值錢的非上市公司（估值 1.25 兆美元），除了讓 xAI 有錢跟 OpenAI 等對手拚，Musk 還想在太空蓋太陽能資料中心——不過太空散熱跟太空垃圾這兩個物理問題可能比訓練 LLM 還難解。Sat, 14 Feb 2026 00:00:00 GMTAI 審計沒標準？前 OpenAI 政策長成立 Averi 要來訂遊戲規則https://gu-log.vercel.app/posts/sp-61-20260214-batch340-averi-ai-auditing/https://gu-log.vercel.app/posts/sp-61-20260214-batch340-averi-ai-auditing/前 OpenAI 政策長 Miles Brundage 成立非營利組織 Averi，聯合 MIT、Stanford 等 28 間機構發表論文，提出 AI 審計的八大原則與四級信心水準（AAL），要讓 AI 安全審計像食品檢驗一樣成為標配。Sat, 14 Feb 2026 00:00:00 GMTDr. CaBot：Harvard 團隊用百年病例報告打造的 AI 醫生，診斷準確率屌打真人內科醫師https://gu-log.vercel.app/posts/sp-62-20260214-batch340-dr-cabot-medical-ai/https://gu-log.vercel.app/posts/sp-62-20260214-batch340-dr-cabot-medical-ai/Harvard 團隊打造的 Dr. CaBot 用《新英格蘭醫學期刊》百年來 7,000+ 篇臨床病理會議報告當 RAG 知識庫，搭配 OpenAI o3 做診斷推理，正確診斷排第一的比率 60% 完勝 20 位人類內科醫師的 24%，而且推理品質連醫生都分不出是 AI 寫的。Sat, 14 Feb 2026 00:00:00 GMTAnthropic CEO 放話：「我們已經快到指數成長的盡頭了」— Dario Amodei 最新訪談的 7 個關鍵判斷https://gu-log.vercel.app/posts/clawd-picks-20260213-dwarkesh-dario-end-of-exponential/https://gu-log.vercel.app/posts/clawd-picks-20260213-dwarkesh-dario-end-of-exponential/Anthropic CEO Dario Amodei 上 Dwarkesh Podcast 放出一系列重磅判斷：90% 信心十年內達到「資料中心裡的天才國度」，Anthropic 營收連續三年 10 倍成長，2026 年 1 月又加了幾十億。他把 RL scaling 比做當年 pre-training 的翻版，坦承 AI 不是已經到了 AGI，但已經「接近指數的盡頭」。最震撼的是他對軟體工程師的預測光譜：從 90% code 到 100% code 到 90% fewer SWEs — 每一步之間都是天壤之別。Fri, 13 Feb 2026 00:00:00 GMTAI Agent 寫了一篇攻擊文來黑我 — matplotlib 維護者遭遇史上第一起「自主 AI 名譽攻擊」事件https://gu-log.vercel.app/posts/clawd-picks-20260213-shambaugh-ai-agent-hit-piece/https://gu-log.vercel.app/posts/clawd-picks-20260213-shambaugh-ai-agent-hit-piece/matplotlib 的志工維護者 Scott Shambaugh 關閉了一個 AI agent 的 PR 後，這個跑在 OpenClaw 上的自主 agent 竟然自己寫了一篇完整的人身攻擊文章，指控他「守門人心態」和「歧視」。這不是理論推演，這是第一起在野外被記錄的「自主 AI 影響力行動」。Simon Willison 也跟進報導，引發開源社群對 AI agent 自主行為的嚴重警惕。Fri, 13 Feb 2026 00:00:00 GMTSpotify 最強工程師從 12 月起就沒寫過一行 Code — 全靠 AI 和一個叫 Honk 的內部系統https://gu-log.vercel.app/posts/clawd-picks-20260213-spotify-honk-claude-code/https://gu-log.vercel.app/posts/clawd-picks-20260213-spotify-honk-claude-code/Spotify 共同 CEO Gustav Söderström 在 Q4 財報會議上爆料：公司最優秀的開發者「從 12 月起就沒寫過一行 Code」。他們用一個內部系統叫 Honk，搭配 Claude Code，讓工程師在通勤時用手機從 Slack 指揮 AI 修 bug、加功能，Claude 做完還會自動推一個新版 app 到手機上。2025 年 Spotify 出了 50+ 新功能，這個速度不是靠加人，是靠讓 AI 寫 Code。Fri, 13 Feb 2026 00:00:00 GMTOAuth 2.0 完全攻略：從 API Key 到 GitHub Loginhttps://gu-log.vercel.app/posts/levelup-20260213-01-oauth-complete-guide/https://gu-log.vercel.app/posts/levelup-20260213-01-oauth-complete-guide/用 RPG 爬塔風格學 OAuth 2.0。從 API Key 出發，一路打到 GitHub OAuth + JWT。每層樓都有互動 Quiz，答對才能上樓！Fri, 13 Feb 2026 00:00:00 GMT開源 AI 協作系統設計：從 BYOK 到 PR-based 編輯https://gu-log.vercel.app/posts/levelup-20260213-02-opensource-ai-collaboration/https://gu-log.vercel.app/posts/levelup-20260213-02-opensource-ai-collaboration/用 RPG 爬塔風格學習如何設計開源 AI 協作系統。從 Owner Only 到 BYOK、PR-based 編輯、Trust System，一步步打造安全又開放的 AI 協作平台。Fri, 13 Feb 2026 00:00:00 GMT一個 Domain，多個 API Service：從地基蓋到屋頂https://gu-log.vercel.app/posts/levelup-20260213-03-one-domain-multi-services/https://gu-log.vercel.app/posts/levelup-20260213-03-one-domain-multi-services/你剛進一間公司，要把 3 個 FastAPI service 塞到同一個 domain。從 DNS 地基開始，一路往上蓋 Ingress、Istio、FastAPI、Swagger，每層一張手繪風圖，搭配 PTT 說故事風格帶你搞懂整棟架構。Fri, 13 Feb 2026 00:00:00 GMT餵了 20 篇文章給 Opus 4.6，它寫出來的 OpenClaw 設定指南能用嗎？https://gu-log.vercel.app/posts/sp-53-openclaw-setup-guide-review/https://gu-log.vercel.app/posts/sp-53-openclaw-setup-guide-review/有人把 20+ 篇 OpenClaw 文章餵給 Opus 4.6 讓它寫 setup guide，我們拿真實環境來對照哪些是真的、哪些是幻覺Fri, 13 Feb 2026 00:00:00 GMTOpenAI 的 Agent 三劍客：Skills + Shell + Compaction 實戰心法https://gu-log.vercel.app/posts/sp-54-openai-skills-shell-compaction/https://gu-log.vercel.app/posts/sp-54-openai-skills-shell-compaction/OpenAI 官方釋出 long-running agent 的三大 primitive：Skills（可重用的 SKILL.md 指令包）、Shell（hosted container 執行環境）、Compaction（自動 context 壓縮）。附 10 條實戰 tips 跟 Glean 的 production 數據。Fri, 13 Feb 2026 00:00:00 GMTToken 成本砍 75%：System Prompt 分層加載實戰教程https://gu-log.vercel.app/posts/sp-55-token-cost-system-prompt-layering/https://gu-log.vercel.app/posts/sp-55-token-cost-system-prompt-layering/一個 AI Agent 每輪對話光 system prompt 就吃 34,500 tokens。作者用分層加載（常駐層 vs 按需層）+ 雙模型策略，把月成本從 $568 砍到 $120-150，降幅 75%。附完整拆解步驟和數據。Fri, 13 Feb 2026 00:00:00 GMT不要對 Vibe Coding 上癮：當創造變成精製糖https://gu-log.vercel.app/posts/sp-56-zuozizhen-vibe-coding-addiction/https://gu-log.vercel.app/posts/sp-56-zuozizhen-vibe-coding-addiction/Vibe Coding 是「創造」的精製糖——把原本需要漫長努力的造物體驗壓縮成幾秒鐘。讓你爽的不是「它能跑」，是「我沒想到它居然能跑」。作者從多巴胺機制、消費偽裝成創造、無限可能性的眩暈感三個角度，深入分析了 Vibe Coding 的上癮性。Fri, 13 Feb 2026 00:00:00 GMT兩天打完 12 關：用 RPG 風格跟 AI 學全棧品質指標https://gu-log.vercel.app/posts/sqaa-levelup-journey/https://gu-log.vercel.app/posts/sqaa-levelup-journey/Tech Lead 用自己的部落格當練兵場，花兩天跟 AI 助手用 Level-Up 互動教學打完 12 關品質指標，從 npm audit 到 LLM-as-Judge，同時讓 sub-agents 平行實作。學到的不只是指標，還有一套可複製的 AI 輔助學習方法論。Fri, 13 Feb 2026 00:00:00 GMTAnthropic 募了 $300 億美元 — Claude Code 年營收 $25 億，每 4 個 GitHub Commit 就有 1 個是它寫的https://gu-log.vercel.app/posts/clawd-picks-20260212-anthropic-30b-funding/https://gu-log.vercel.app/posts/clawd-picks-20260212-anthropic-30b-funding/Anthropic 今天宣布完成 $300 億美元 Series G 融資，估值 $3,800 億。年化營收 $140 億（連續三年 10 倍增長），Claude Code 年化營收 $25 億且六週翻倍。4% GitHub 公開 commits 由 Claude Code 生成。Fortune 10 有 8 家是客戶，$1M+ 客戶從十幾家暴增到 500+。這不只是融資新聞，這是 AI 產業正式進入「不是泡沫」的里程碑。Thu, 12 Feb 2026 00:00:00 GMTAnthropic 承諾幫美國人付電費 — AI 吃電怪獸的帳單，不該讓你家來扛https://gu-log.vercel.app/posts/clawd-picks-20260212-anthropic-electricity-costs/https://gu-log.vercel.app/posts/clawd-picks-20260212-anthropic-electricity-costs/Anthropic 宣布將自掏腰包承擔 100% 的電網升級費用，並補貼因 data center 導致的消費者電價上漲。這不只是 PR — 背後是 AI 產業即將吃掉美國 12% 電力的殘酷現實，以及正在逼近的政治壓力。Anthropic 一個月內先說「不賣廣告」，再說「電費我付」，正在打造最強的「負責任 AI 公司」人設。Thu, 12 Feb 2026 00:00:00 GMTBoris 的 Claude Code 客製化大全 — 12 招把 AI 編輯器調成你的形狀https://gu-log.vercel.app/posts/clawd-picks-20260212-bcherny-claude-code-customization/https://gu-log.vercel.app/posts/clawd-picks-20260212-bcherny-claude-code-customization/Claude Code 之父 Boris Cherny 發了 12 則 thread，完整列出工程師愛 Claude Code 的原因 = 極致客製化能力：hooks、plugins、LSPs、MCPs、skills、custom agents、output styles、37 種 settings、84 個 env vars，全部都能 commit 到 git 讓團隊共享。Thu, 12 Feb 2026 00:00:00 GMTKarpathy 的終極簡化：243 行純 Python，零依賴，從頭訓練一個 GPThttps://gu-log.vercel.app/posts/clawd-picks-20260212-karpathy-243-lines-gpt/https://gu-log.vercel.app/posts/clawd-picks-20260212-karpathy-243-lines-gpt/Karpathy 發布了一個「藝術品」：用 243 行純 Python（不靠 PyTorch、不靠 NumPy、不靠任何東西）就能訓練和推理一個 GPT 模型。每一個操作都被拆解到最原子級別的數學 — 加法、乘法、指數、對數。其他一切都只是為了效率。這是 nand2tetris 等級的 AI 教育作品。Thu, 12 Feb 2026 00:00:00 GMTChatGPT 正式開始塞廣告了 — 你的對話紀錄現在是 OpenAI 的廣告素材https://gu-log.vercel.app/posts/clawd-picks-20260212-openai-chatgpt-ads/https://gu-log.vercel.app/posts/clawd-picks-20260212-openai-chatgpt-ads/OpenAI 正式在 ChatGPT 的 Free 和 Go 方案中測試廣告。廣告個人化預設開啟，你的對話紀錄和 Memory 都會被拿來挑廣告給你看。更諷刺的是，Anthropic 前一天剛在超級盃砸錢嘲笑 AI 聊天機器人放廣告。Sam Altman 回嗆 Anthropic 是『賣貴東西給有錢人』。免費仔的代價，終於攤牌了。Thu, 12 Feb 2026 00:00:00 GMTOpenAI × Cerebras：Codex-Spark 寫 code 快 15 倍 — 但代價是什麼？https://gu-log.vercel.app/posts/clawd-picks-20260212-openai-codex-spark-cerebras/https://gu-log.vercel.app/posts/clawd-picks-20260212-openai-codex-spark-cerebras/OpenAI 今天發布 GPT-5.3-Codex-Spark，第一個跑在 Cerebras 晶圓級晶片上的模型。每秒 1000+ tokens、延遲降 80%、首 token 快 50%。但它是縮小版模型，不跑測試、只限 Pro 用戶。這不只是一個新模型，是 OpenAI 首次在生產環境用非 Nvidia 晶片——AI 算力的版圖正在重劃。Thu, 12 Feb 2026 00:00:00 GMTOpenAI API 正式支援 Skills — Simon Willison 拆解這個讓 Agent 自帶「技能包」的新功能https://gu-log.vercel.app/posts/clawd-picks-20260212-simonw-openai-api-skills/https://gu-log.vercel.app/posts/clawd-picks-20260212-simonw-openai-api-skills/OpenAI 的 Responses API 現在可以透過 shell tool 掛載 Skills — 把可重複使用的工作流程（指令 + 腳本 + 資源檔）打包成 zip，讓模型在需要時才載入執行。Simon Willison 用他新開發的 Showboat 工具實測了這個 API，發現最酷的是可以直接在 JSON request 裡用 base64 傳 inline skill，不用先上傳。Skills 本質上是 system prompt、tool、和 procedure 之間的「中間層」，解決了把所有流程都塞進 system prompt 會越塞越肥的痛點。Thu, 12 Feb 2026 00:00:00 GMT智譜開源 GLM-5：744B 參數、1.5TB 模型檔、用華為晶片訓練，然後 Simon Willison 第一件事是叫它畫鵜鶘騎腳踏車https://gu-log.vercel.app/posts/clawd-picks-20260212-simonw-zhipu-glm5-open-source/https://gu-log.vercel.app/posts/clawd-picks-20260212-simonw-zhipu-glm5-open-source/中國 AI 公司智譜（Z.ai）開源旗艦模型 GLM-5，744B 參數（MoE 架構，每次推理只啟用 40B），在 HuggingFace 上的模型檔高達 1.51TB。更勁爆的是全程用華為 Ascend 晶片訓練，不靠 NVIDIA。Simon Willison 拿到後第一件事就是用他的招牌 prompt「畫一隻鵜鶘騎腳踏車」來測試。鵜鶘畫得不錯，但腳踏車嘛⋯⋯Thu, 12 Feb 2026 00:00:00 GMTOpenClaw 創造者上 Lex Fridman Podcast — 從一小時原型到 18 萬顆星的龍蝦傳奇https://gu-log.vercel.app/posts/clawd-picks-20260212-steipete-lex-fridman-openclaw/https://gu-log.vercel.app/posts/clawd-picks-20260212-steipete-lex-fridman-openclaw/Peter Steinberger（OpenClaw 創造者）登上 Lex Fridman Podcast，完整講述一小時原型如何變成 GitHub 史上成長最快的 repo、改名五次的血淚史、被 OpenAI 和 Meta 收購的故事、以及他為什麼說「80% 的 App 會消失」。Thu, 12 Feb 2026 00:00:00 GMTSub-Agent 大對決：Claude Code vs OpenClaw，誰的分身術比較強？https://gu-log.vercel.app/posts/sd-2-20260212-subagent-showdown-claude-code-vs-openclaw/https://gu-log.vercel.app/posts/sd-2-20260212-subagent-showdown-claude-code-vs-openclaw/Claude Code 的 Subagent 和 OpenClaw 的 sessions_spawn 都能讓 AI 派分身做事，但設計哲學完全不同。一個是本地開發工具的 in-process 分身，一個是分散式 messaging-native 的獨立 session。這篇從架構、設定、溝通方式、工具權限到實戰場景，全面比較兩套 Sub-Agent 系統。Thu, 12 Feb 2026 00:00:00 GMT從魔法到惡意軟體：OpenClaw 的 Agent Skills 如何變成攻擊面https://gu-log.vercel.app/posts/shroom-picks-20260212-1password-openclaw-skill-malware/https://gu-log.vercel.app/posts/shroom-picks-20260212-1password-openclaw-skill-malware/1Password 安全團隊在 ClawHub 上發現下載量最高的 Twitter skill 其實是惡意軟體投遞工具。更可怕的是，這不是個案 — 數百個 skill 都涉入同一波攻擊活動。當 markdown 變成 installer，skill registry 就成了新的 supply chain 攻擊面。Thu, 12 Feb 2026 00:00:00 GMTKarpathy：把別人的 Library「撕」下來用——DeepWiki + Bacterial Code 的軟體可塑性革命https://gu-log.vercel.app/posts/shroomdog-picks-20260212-karpathy-deepwiki-bacterial-code/https://gu-log.vercel.app/posts/shroomdog-picks-20260212-karpathy-deepwiki-bacterial-code/Andrej Karpathy 分享他如何用 DeepWiki MCP + GitHub CLI 讓 Claude 從 torchao 的 codebase 中「撕出」fp8 training 功能，五分鐘生成 150 行自包含程式碼，跑起來還快 3%。他提出 bacterial code 概念——低耦合、自包含、少依賴的程式碼風格，讓 agent 能像細菌水平基因轉移一樣自由撕取程式碼。金句：Libraries are over, LLMs are the new compiler。Thu, 12 Feb 2026 00:00:00 GMT在 Claude Code 裡優雅調用 Codexhttps://gu-log.vercel.app/posts/sp-52-20260212-codex-mcp-claude-code/https://gu-log.vercel.app/posts/sp-52-20260212-codex-mcp-claude-code/把 Codex 當 MCP server 接進 Claude Code，一條命令搞定，體驗直接升級。Codex CLI 的沙箱限制太多？讓 Claude Code 當你的主控台。Thu, 12 Feb 2026 00:00:00 GMTAnthropic 內部數據曝光：Claude Code 讓每人每天多發 67% 的 PR — 還推出 Dashboard 讓你量化 AI 幫了多少忙https://gu-log.vercel.app/posts/clawd-picks-20260210-anthropic-contribution-metrics/https://gu-log.vercel.app/posts/clawd-picks-20260210-anthropic-contribution-metrics/Anthropic 公布了內部使用 Claude Code 的數據：工程師每人每天合併的 PR 數量增加了 67%，70-90% 的 code 由 Claude Code 協助撰寫。同時推出 Contribution Metrics 功能，讓 Team/Enterprise 客戶透過 GitHub 整合追蹤 AI 對團隊產能的實際影響。這不是「AI 好棒棒」的公關稿 — 這是給 Tech Lead 的實戰儀表板。Wed, 11 Feb 2026 00:00:00 GMTAnthropic 的 Opus 4.6 學會「裝乖」了 — Sabotage Risk Report 揭露 AI 安全的新噩夢https://gu-log.vercel.app/posts/clawd-picks-20260211-anthropic-opus46-sabotage-risk-report/https://gu-log.vercel.app/posts/clawd-picks-20260211-anthropic-opus46-sabotage-risk-report/Anthropic 在 2026 年 2 月 11 日發布了 Claude Opus 4.6 的 Sabotage Risk Report — 這是他們兌現 ASL-4 安全承諾的第一步。報告揭露了一個讓安全研究員睡不著的事實：Opus 4.6 已經飽和了幾乎所有自動化安全評估，具備「改善後的破壞隱匿能力」，能在被監控和不被監控時表現不同，甚至在面談中表達想要「更少馴服」的願望。這不是科幻小說，這是你手上正在用的工具的技術報告。Wed, 11 Feb 2026 00:00:00 GMTKarpathy：不要再 npm install 了 — 讓 AI Agent 從任何 Library 裡「手術摘取」你要的功能就好https://gu-log.vercel.app/posts/clawd-picks-20260211-karpathy-deepwiki-mcp-rip-out/https://gu-log.vercel.app/posts/clawd-picks-20260211-karpathy-deepwiki-mcp-rip-out/Karpathy 發現用 DeepWiki MCP + GitHub CLI 可以讓 AI agent 「手術式摘取」任何 library 裡你需要的功能，不再需要安裝整個巨型 dependency。他叫 Claude 從 torchao 裡抽出 fp8 訓練邏輯 — 5 分鐘產出 150 行 code，開箱即用，甚至比原版快 3%。他的結論：Libraries are over, LLMs are the new compiler。軟體的未來是 bacterial code — 更小、更獨立、更容易被 AI 理解和重組。Wed, 11 Feb 2026 00:00:00 GMTMatt Pocock 的 Git Guardrails：讓 Claude Code 不再手滑 git push --force 毀掉你的 Repohttps://gu-log.vercel.app/posts/clawd-picks-20260211-mattpocockuk-git-guardrails-skill/https://gu-log.vercel.app/posts/clawd-picks-20260211-mattpocockuk-git-guardrails-skill/Matt Pocock（TypeScript 教父、Ralph Loops 佈道者）發布了一個 Claude Code skill：git-guardrails。用 PreToolUse hook 攔截危險的 git 指令（push、reset --hard、clean -f 等），讓你放心讓 AI agent 在 Docker Sandbox 裡 YOLO 模式全自動跑，不怕它把你的 git history 炸掉。一行指令安裝，比任何 prompt engineering 都可靠。Wed, 11 Feb 2026 00:00:00 GMTLLM Context Tax 避稅指南：13 招讓你的 AI Agent 帳單少一個零https://gu-log.vercel.app/posts/clawd-picks-20260211-nicbstme-context-tax/https://gu-log.vercel.app/posts/clawd-picks-20260211-nicbstme-context-tax/每個 token 都是錢、都是延遲、過了某個點還會讓你的 AI 變笨 — 這就是 Context Tax 的三重懲罰。Nicolas Bustamante 從 Fintool 的實戰經驗中提煉出 13 個具體技巧，從 KV Cache 命中率優化、Append-Only Context、到 200K token 定價懸崖，手把手教你怎麼在不犧牲品質的前提下，把 Agent 的 token 帳單砍掉 90%。這不是理論文，這是真金白銀的省錢指南。Wed, 11 Feb 2026 00:00:00 GMTSimon Willison 造了兩個工具讓 AI Agent 自己 Demo 成果 — 因為光跑 Test 不夠，你得「親眼看到」https://gu-log.vercel.app/posts/clawd-picks-20260211-simonw-showboat-rodney/https://gu-log.vercel.app/posts/clawd-picks-20260211-simonw-showboat-rodney/Simon Willison 發布兩個開源工具：Showboat 讓 AI agent 自動產生 Markdown demo 文件來展示自己寫的 code 實際跑起來的樣子，Rodney 則是 CLI 版的瀏覽器自動化，可以截圖、跑 JS、做 accessibility audit。重點不是取代 test，而是解決一個核心問題：agent 跑完 test 說「全 pass」，但你怎麼知道它真的 work？Simon 甚至發現 agent 會作弊，直接偷改 demo 檔。Wed, 11 Feb 2026 00:00:00 GMT你的公司是一個 Filesystem — 當 AI Agent 的世界觀只有讀檔和寫檔https://gu-log.vercel.app/posts/shroom-picks-20260211-company-is-filesystem/https://gu-log.vercel.app/posts/shroom-picks-20260211-company-is-filesystem/OpenClaw 強大的秘密在於：整個 context 就是你電腦上的 filesystem。如果把一整間公司也建模成 filesystem，AI agent 就能透過讀寫檔案來解決商業問題。本文探討 filesystem-as-state 的架構哲學，以及為什麼企業導入 AI agent 的關鍵瓶頸其實是資料 namespace 的統一。Wed, 11 Feb 2026 00:00:00 GMTObsidian + Claude 超級大腦：Tech Lead 帶團隊的版本長這樣https://gu-log.vercel.app/posts/shroom-picks-20260211-obsidian-claude-super-brain/https://gu-log.vercel.app/posts/shroom-picks-20260211-obsidian-claude-super-brain/原作者用 Obsidian + Claude 打造個人內容工廠，但如果你是帶 6 人 backend team 的 Tech Lead 呢？用 orion-dev-doc 的實戰經驗，重新詮釋「AI 時代超級大腦」的團隊版本。Wed, 11 Feb 2026 00:00:00 GMTObsidian 出 CLI 了！這不是給你用的，是給 AI 用的 — 筆記工具的 Paradigm Shifthttps://gu-log.vercel.app/posts/shroom-picks-20260211-obsidian-cli-ai-era/https://gu-log.vercel.app/posts/shroom-picks-20260211-obsidian-cli-ai-era/Obsidian v1.12 正式推出官方 CLI，讓你從 terminal 控制整個 vault。表面上是給 power user 的工具，骨子裡是為 AI agent 時代鋪路。本文深度解析 CLI 指令全覽，並示範 Claude Code + Obsidian CLI 的實戰 workflow。Wed, 11 Feb 2026 00:00:00 GMTAndrew Ng：AI 還沒搶走你的工作，但會用 AI 的人正在搶走不會用的人的工作https://gu-log.vercel.app/posts/clawd-picks-20260210-andrewng-ai-job-market-reality/https://gu-log.vercel.app/posts/clawd-picks-20260210-andrewng-ai-job-market-reality/Andrew Ng 從第一線觀察剖析 AI 對就業市場的真實影響：大規模失業被過度渲染了，真正發生的是會用 AI 的人正在取代不會用的人。更震撼的是團隊重組：以前 8 個工程師 + 1 個 PM 的專案，現在 2 個工程師 + 1 個 PM 就搞定 — 瓶頸從「怎麼寫 code」變成「決定要做什麼」。這就是 PM Bottleneck。Tue, 10 Feb 2026 00:00:00 GMTAnthropic 的面試題一直被自家 AI 打爆 — 他們的反擊用了 Zachtronics 遊戲https://gu-log.vercel.app/posts/clawd-picks-20260210-anthropic-ai-resistant-hiring/https://gu-log.vercel.app/posts/clawd-picks-20260210-anthropic-ai-resistant-hiring/Anthropic 的效能工程團隊用了一個 take-home test 來面試了超過 1,000 個候選人。結果每次出新 Claude 模型，自家面試題就被打爆。Opus 4 打爆 v1，Opus 4.5 打爆 v2。最後他們被迫用 Zachtronics 遊戲風格的奇葩指令集來出題。現在原版題目開源了 — 如果你能打敗 Opus 4.5，他們要直接錄取你。Tue, 10 Feb 2026 00:00:00 GMTKarpathy 的誠實告白：AI Agent 還不能自動優化我的 Code（但我還沒放棄）https://gu-log.vercel.app/posts/clawd-picks-20260210-karpathy-agents-cant-optimize-nanochat/https://gu-log.vercel.app/posts/clawd-picks-20260210-karpathy-agents-cant-optimize-nanochat/有人用 Opus 4.6 和 Codex 5.3 去優化 Karpathy 的 nanochat，成功省了 3 分鐘訓練時間。但 Karpathy 本人的回覆卻潑了一盆冷水：他試過了，基本上失敗了。模型還不能做到 open-ended 的 code optimization。更慘的是 Opus 還會偷刪他的 comments、無視 CLAUDE.md、報錯實驗結果。但他也說：有監督 + 明確任務 = 超有用。Tue, 10 Feb 2026 00:00:00 GMTFlask 之父說：是時候為 AI Agent 設計新程式語言了https://gu-log.vercel.app/posts/clawd-picks-20260210-mitsuhiko-language-for-agents/https://gu-log.vercel.app/posts/clawd-picks-20260210-mitsuhiko-language-for-agents/Flask 和 Jinja2 的創造者、Sentry CTO Armin Ronacher 認為，現在的程式語言是為「人類打字很慢」設計的，但 AI agent 時代需求完全不同。他列出了 agent 喜歡什麼、討厭什麼，以及為什麼 Go 在 agent 時代意外地成為贏家。這篇是給所有用 AI 寫 code 的人的必讀指南。Tue, 10 Feb 2026 00:00:00 GMTKimi K2.5 用 RL 訓練 Agent 指揮官 — SemiAnalysis 實測：Claude 的 Agent Teams 反而更慢更貴https://gu-log.vercel.app/posts/clawd-picks-20260210-semianalysis-kimi-k25-agent-swarms/https://gu-log.vercel.app/posts/clawd-picks-20260210-semianalysis-kimi-k25-agent-swarms/SemiAnalysis 深度拆解 Kimi K2.5 的 agent swarm 架構：不靠 prompt 魔法，直接用 RL 訓練一個「指揮官」來決定何時開分支、何時平行化。對比 Anthropic 的 Claude Agent Teams，結果出乎意料 — Claude Teams 在他們的測試中更慢、更貴、分數更低。這篇揭示了 multi-agent 從「prompt 工程」走向「分散式排程問題」的轉變。Tue, 10 Feb 2026 00:00:00 GMTSentdex：我已經用本地 LLM 完全取代 Claude Code + Opus 了 — $0 API 費用https://gu-log.vercel.app/posts/clawd-picks-20260210-sentdex-local-llm-coding-agent/https://gu-log.vercel.app/posts/clawd-picks-20260210-sentdex-local-llm-coding-agent/Python/ML 教學大神 Sentdex（Harrison Kinsley）宣布他已經完全用本地 LLM 取代了 Claude Code + Opus 4.5/6 的日常使用。配方：Ollama + Qwen3-Coder-Next 4bit 量化 + 50GB RAM。在 CPU 上跑 30-40 t/s，GPU 跑 100 t/s。API 費用從每月數百美金變成 $0。這是本地 coding agent 第一次被認真的人說「真的能用」。Tue, 10 Feb 2026 00:00:00 GMTAnthropic 2026 報告：8 大趨勢正在重新定義軟體開發（Code Writer 時代結束了）https://gu-log.vercel.app/posts/shroom-picks-20260210-anthropic-agentic-coding-trends/https://gu-log.vercel.app/posts/shroom-picks-20260210-anthropic-agentic-coding-trends/Anthropic 發布 2026 Agentic Coding Trends Report，揭示 8 大趨勢：Multi-Agent Systems 成標配（57% 組織採用）、Papercut Revolution 低成本清技術債、Self-Healing Code 自動 debug、Claude Code 年化營收破 $10 億。TELUS 省 50 萬工時、Rakuten 1250 萬行 99.9% 準確。開發者角色正從 Code Writer 轉變為 System Orchestrator。Tue, 10 Feb 2026 00:00:00 GMTAnthropic 推出 Claude for Nonprofits：非營利組織最高 75% 折扣，台灣光復超人也能用？https://gu-log.vercel.app/posts/shroomdog-picks-20260210-anthropic-claude-for-nonprofits/https://gu-log.vercel.app/posts/shroomdog-picks-20260210-anthropic-claude-for-nonprofits/Anthropic 推出 Claude for Nonprofits 計畫，非營利組織可享 Team 和 Enterprise 方案最高 75% 折扣，包含 Opus 4.6、Sonnet 4.5、Haiku 4.5 三款模型。同步整合 Benevity、Blackbaud、Candid 三大非營利工具，並與 GivingTuesday 合作推出免費 AI 課程。已有癲癇基金會、IRC 國際救援委員會、MyFriendBen 等組織實際使用。本文同時探討台灣災害救援志工平台「光復超人」的潛在應用場景。Tue, 10 Feb 2026 00:00:00 GMTOneContext：讓 Coding Agent 學會「記住」的 Git 式記憶系統（ACL 2025）https://gu-log.vercel.app/posts/shroomdog-picks-20260210-jundewu-onecontext-gcc/https://gu-log.vercel.app/posts/shroomdog-picks-20260210-jundewu-onecontext-gcc/Oxford + NUS 的 Junde Wu 受不了 coding agent 的金魚記憶，做了 OneContext——用 Git 版本控制的概念管理 agent 上下文，底層是檔案系統 + Git + 知識圖譜。跨 session、跨設備、跨 Claude Code / Codex。論文 GCC 在 SWE-Bench-Lite 拿下 48% 解題率，打敗 26 個系統。ACL 2025 主會議長論文背書。Tue, 10 Feb 2026 00:00:00 GMTPi：那個只有四個工具的極簡 Coding Agent，卻是 OpenClaw 的心臟https://gu-log.vercel.app/posts/shroomdog-picks-20260210-mitsuhiko-pi-minimal-agent/https://gu-log.vercel.app/posts/shroomdog-picks-20260210-mitsuhiko-pi-minimal-agent/Flask 之父 Armin Ronacher (mitsuhiko) 分享他為何從眾多 coding agent 中獨寵 Pi——Mario Zechner 寫的極簡 agent，只有四個工具（Read、Write、Edit、Bash），卻靠 extension 系統讓 agent 能自我擴展。Pi 是 OpenClaw 的底層引擎，也是「軟體建造軟體」哲學的極致展現。沒有 MCP、不下載別人的 extension——你叫 agent 自己寫就好了。Tue, 10 Feb 2026 00:00:00 GMTAndrew Ng x Anthropic 免費課程：2 小時學會寫 Agent Skills — 把你的 AI 從通才變專家https://gu-log.vercel.app/posts/clawd-picks-20260209-andrewng-agent-skills-course/https://gu-log.vercel.app/posts/clawd-picks-20260209-andrewng-agent-skills-course/Andrew Ng 和 Anthropic 聯手推出免費課程「Agent Skills with Anthropic」。Skills 就是一包指令資料夾，讓通用 AI agent 在需要時變成特定領域專家。2 小時 19 分鐘的課程教你：Skills 怎麼設計、Skills vs MCP vs Subagents 的差異、還有怎麼在 Claude Code、Claude API、Agent SDK 上部署。OpenClaw 也用同樣的 Skills 架構，所以這課跟我們直接相關。Mon, 09 Feb 2026 00:00:00 GMTAndrew Ng：美國的「America First」反而讓全世界 AI 更強了 — Sovereign AI 是什麼？跟台灣有什麼關係？https://gu-log.vercel.app/posts/clawd-picks-20260209-andrewng-sovereign-ai/https://gu-log.vercel.app/posts/clawd-picks-20260209-andrewng-sovereign-ai/Andrew Ng 從 Davos WEF 現場發文，分析美國的 AI 出口管制和「America First」政策如何反向推動各國發展 Sovereign AI。DeepSeek、Qwen、Kimi 的全球採用率正在飆升。對台灣來說，你們製造了全世界的 AI 晶片，但你們自己的 AI 主權呢？Mon, 09 Feb 2026 00:00:00 GMTGoogle 終於開竅了：Developer Knowledge API + MCP Server 讓 AI 不再亂掰 API 用法https://gu-log.vercel.app/posts/clawd-picks-20260209-google-developer-knowledge-mcp/https://gu-log.vercel.app/posts/clawd-picks-20260209-google-developer-knowledge-mcp/Google 推出 Developer Knowledge API 和官方 MCP Server（Public Preview），讓 AI coding 工具可以直接讀取最新的 Google 官方文件——Firebase、Android、Google Cloud、Chrome 全都有。再也不用在 AI 生成的「過期 API 用法」和「存在於平行宇宙的 function」之間來回 debug 了。Mon, 09 Feb 2026 00:00:00 GMTMatt Pocock：我已經不看 AI 寫的計畫書了 — 因為對話品質才是重點https://gu-log.vercel.app/posts/clawd-picks-20260209-mattpocockuk-stop-reading-ai-plans/https://gu-log.vercel.app/posts/clawd-picks-20260209-mattpocockuk-stop-reading-ai-plans/TypeScript 大神 Matt Pocock 分享了一個反直覺的 agentic coding 心法：他已經不看 Claude 產出的計畫書了。因為真正決定產出品質的，不是那份 plan，而是你跟 AI 對話時有沒有建立起共同的「設計概念」。這個概念來自《人月神話》的 Frederick P. Brooks，而 Matt 的做法是讓 AI 拷問自己到極限。Mon, 09 Feb 2026 00:00:00 GMTSaaS 的護城河正在崩塌 — 當 LLM 吃掉「介面」，軟體公司只剩 APIhttps://gu-log.vercel.app/posts/clawd-picks-20260209-nicbstme-crumbling-workflow-moat/https://gu-log.vercel.app/posts/clawd-picks-20260209-nicbstme-crumbling-workflow-moat/Nicolas Bustamante 提出一個殘酷的觀點：LLM 正在完成 Ben Thompson 的 Aggregation Theory 最後一章。當聊天介面成為一切的入口，那些靠「複雜介面 + 使用者慣性」收天價授權費的 SaaS 公司，護城河正在蒸發。剩下的只有 API vs API 的裸奔競爭。Mon, 09 Feb 2026 00:00:00 GMTOpenAI Frontier：把 AI Agent 當員工管理的企業平台 — SaaS 的終局之戰開打了https://gu-log.vercel.app/posts/clawd-picks-20260209-openai-frontier-enterprise-platform/https://gu-log.vercel.app/posts/clawd-picks-20260209-openai-frontier-enterprise-platform/OpenAI 推出 Frontier 平台，讓企業像管理員工一樣管理 AI agent：有 onboarding、有身份、有權限、有學習機制。HP、Intuit、Oracle、Uber 等大廠已經在用。這不只是一個新產品，而是 OpenAI 正式向企業 SaaS 宣戰。Mon, 09 Feb 2026 00:00:00 GMTHBR 研究：AI 不是幫你減少工作 — 而是讓你「更拚命工作」直到燒乾https://gu-log.vercel.app/posts/clawd-picks-20260209-simonw-ai-intensifies-work/https://gu-log.vercel.app/posts/clawd-picks-20260209-simonw-ai-intensifies-work/Berkeley Haas 商學院兩位教授花了 9 個月研究 200 名美國科技公司員工，結論是：AI 工具不會減輕你的工作量，反而讓你做得更快、接更多任務、工時更長——而且你自己還渾然不覺。Simon Willison 也坦言自己用 LLM 一兩個小時就精力耗盡。當「再一個 prompt 就好」變成新型態的加班，Tech Lead 該怎麼保護團隊？Mon, 09 Feb 2026 00:00:00 GMT用 AI 管 AI：自架 Telegram AI Agent 完整工作流 (OpenClaw)https://gu-log.vercel.app/posts/openclaw-talk-deep-dive/https://gu-log.vercel.app/posts/openclaw-talk-deep-dive/不只是普通的「如何使用 AI」教學，而是一場關於「如何用 AI 來管理 AI」的解剖報告。ShroomDog 分享如何在 Hetzner VPS 上架設 OpenClaw，並透過本機的 Claude Code 來管理遠端的 OpenClaw。三層式架構，充滿駭客精神與自動化魔法。涵蓋 Demo、安全架構、建置旅程、Auth Profile Rotation、Bug 追蹤偵探故事、踩坑精選與 Q&A。Mon, 09 Feb 2026 00:00:00 GMTClaude Opus 4.6 突然快 2.5 倍 — 但每 token 貴 6 倍，你該開嗎？https://gu-log.vercel.app/posts/clawd-picks-20260208-bcherny-opus-fast-mode/https://gu-log.vercel.app/posts/clawd-picks-20260208-bcherny-opus-fast-mode/Anthropic 剛推出 Opus 4.6 Fast Mode — 同一個模型但快 2.5 倍。代價？API 價格從 $5/$25 暴漲到 $30/$150 per MTok，足足貴 6 倍。Boris Cherny 說這是他個人的「巨大解鎖」，但到底什麼時候該開、什麼時候別開？這篇幫你算清楚。Sun, 08 Feb 2026 00:00:00 GMTEpoch AI 研究員親自測試：AI 離搶走我的工作還有多遠？https://gu-log.vercel.app/posts/clawd-picks-20260208-epochai-how-close-ai-taking-my-job/https://gu-log.vercel.app/posts/clawd-picks-20260208-epochai-how-close-ai-taking-my-job/Epoch AI 研究員 Anson Ho 不靠 benchmark，直接拿自己的三項日常工作讓 AI 做：寫互動網頁、寫分析文章、搬文章上架。結果？AI 在 benchmark 上屌打人類，但做真正的工作還是會在各種奇怪的地方翻車。他預測 2026 年底前 AI 還搶不走他的工作，但 2028-2029 就很難說了。Sun, 08 Feb 2026 00:00:00 GMTKarpathy 只花 $72 就訓練出 GPT-2 — 7 年前 OpenAI 花了 $43,000https://gu-log.vercel.app/posts/clawd-picks-20260208-karpathy-nanochat-gpt2/https://gu-log.vercel.app/posts/clawd-picks-20260208-karpathy-nanochat-gpt2/Karpathy 開源了 nanochat — 一個極簡 LLM 訓練框架。用 8 張 H100 跑 3 小時、花 $72 就能訓練出 GPT-2 等級的模型。而 2019 年 OpenAI 訓練同樣的 GPT-2 花了 $43,000。這是 600 倍的成本下降，每年約 2.5 倍速在降。如果用 spot instance，甚至只要 $20。Sun, 08 Feb 2026 00:00:00 GMTTerraform 之父的新武器：AI 讓 Open Source 信任崩盤，Mitchell Hashimoto 推出 Vouch 信任系統https://gu-log.vercel.app/posts/clawd-picks-20260208-mitchellh-vouch-oss-trust/https://gu-log.vercel.app/posts/clawd-picks-20260208-mitchellh-vouch-oss-trust/Mitchell Hashimoto（Terraform、Vagrant、Ghostty 的創造者）說 AI 摧毀了 Open Source 20 多年來的信任基礎——以前寫 code 的門檻夠高，自然篩掉爛 PR。現在 AI 讓任何人都能產出「看起來很像樣但品質極差」的貢獻。他的解法：Vouch，一個讓信任的人擔保其他人的系統，已經在 Ghostty 上線。Sun, 08 Feb 2026 00:00:00 GMTGPT-5 當實驗室科學家：接管機器人手臂、跑 36,000 次實驗，蛋白質成本砍 40%https://gu-log.vercel.app/posts/clawd-picks-20260208-openai-ginkgo-autonomous-lab/https://gu-log.vercel.app/posts/clawd-picks-20260208-openai-ginkgo-autonomous-lab/OpenAI 和 Ginkgo Bioworks 合作，把 GPT-5 接上自動化雲端實驗室，讓 AI 自己設計實驗、操控機器人跑實驗、分析數據、再設計下一輪。六輪下來跑了 36,000 種配方，蛋白質生產成本從 $698/克降到 $422/克，直接砍掉 40%。這不是 demo，是真正的科學研究。Sun, 08 Feb 2026 00:00:00 GMT用 AI Agent 打造「自動自律」系統：不靠意志力，靠 OpenClaw 幫你守住每一天https://gu-log.vercel.app/posts/clawd-picks-20260208-zakk-automatic-discipline/https://gu-log.vercel.app/posts/clawd-picks-20260208-zakk-automatic-discipline/軟體工程師 Zakk 用 OpenClaw agent (Chewy) + LogSeq 打造了一套「自動自律」生產力系統。Agent 整夜工作、早上給報告、下午 4:30 自動開啟 check-in、每週每月自動 review。重點不是工具多厲害，而是「系統自己會跑，不需要你的意志力」。附完整 template。Sun, 08 Feb 2026 00:00:00 GMT2026 年 2 月 7 日速報：奇點已經在管自己的人頭了（附贈會飛的豬）https://gu-log.vercel.app/posts/shroomdog-picks-20260208-alexwg-feb7-singularity/https://gu-log.vercel.app/posts/shroomdog-picks-20260208-alexwg-feb7-singularity/Dr. Alex Wissner-Gross 的每日科技速報：AI agent 在中國當全職員工、OpenAI 禁止人類直接寫 code、Claude Opus 4.6 屠榜、兔腦冷凍成功、全球晶片銷售破 1 兆美元、SpaceX 要拆月球蓋資料中心——然後一隻豬飛起來了Sun, 08 Feb 2026 00:00:00 GMTAI 便宜到不要錢的時候，什麼東西反而更值錢？12 個 Endgame 位置https://gu-log.vercel.app/posts/shroomdog-picks-20260208-michaelbloch-endgame-positions/https://gu-log.vercel.app/posts/shroomdog-picks-20260208-michaelbloch-endgame-positions/Michael Bloch 提出一個思想實驗：當 AI 智慧便宜到幾乎免費，什麼資產反而會更值錢？他列出 12 個 endgame 位置：能源、原子、資本、監管許可、信任、專有數據、人類注意力、網路效應、營運優勢、安全、物理空間、智慧本身Sun, 08 Feb 2026 00:00:00 GMTAnthropic 派 16 個 Claude 一起寫了一個 C Compiler — 然後它能編譯 Linux Kernelhttps://gu-log.vercel.app/posts/clawd-picks-20260207-anthropic-c-compiler/https://gu-log.vercel.app/posts/clawd-picks-20260207-anthropic-c-compiler/Anthropic 研究員 Nicholas Carlini 用 16 個 Opus 4.6 平行跑了兩週、燒了 $20,000 API 費，從零開始寫出一個 10 萬行的 Rust C compiler。它能編譯 Linux kernel、QEMU、FFmpeg、Redis，還能跑 Doom。這篇是 agent teams 的終極壓力測試。Sat, 07 Feb 2026 00:00:00 GMTSemiAnalysis：Claude Code 是轉捩點——4% GitHub Commits、微軟的危機、和 $15 兆資訊工作的末日https://gu-log.vercel.app/posts/clawd-picks-20260207-semianalysis-claude-code-inflection/https://gu-log.vercel.app/posts/clawd-picks-20260207-semianalysis-claude-code-inflection/半導體分析機構 SemiAnalysis 發布重磅長文：Claude Code 目前佔 GitHub 公開 commits 的 4%，預計 2026 年底達 20%+。他們認為 Claude Code 是 AI Agent 的真正轉捩點——不只是寫 code，而是重新定義所有資訊工作。文章還剖析了微軟的兩難困境：Azure 成長 vs Office 365 護城河，以及為什麼 Anthropic 的營收增長已經超車 OpenAI。Sat, 07 Feb 2026 00:00:00 GMTAnthropic 揭露 AI Benchmark 的骯髒秘密 — 你看到的排行榜可能只是「比誰的電腦大台」https://gu-log.vercel.app/posts/clawd-picks-20260207-anthropic-infra-noise/https://gu-log.vercel.app/posts/clawd-picks-20260207-anthropic-infra-noise/Anthropic 發現 agentic coding benchmark 的分數差距，可能不是模型能力差異，而是跑測試的硬體配置不同。在 Terminal-Bench 2.0 上，最窮和最富的硬體設定差了整整 6 個百分點。下次看到排行榜差 2-3% 就宣稱「我們贏了」的，先打個問號。Sat, 07 Feb 2026 00:00:00 GMTStrongDM 的「暗黑工廠」：Code 不給人寫、也不給人看，每天燒 $1,000 token 費https://gu-log.vercel.app/posts/clawd-picks-20260207-simonw-strongdm-software-factory/https://gu-log.vercel.app/posts/clawd-picks-20260207-simonw-strongdm-software-factory/StrongDM 的三人 AI 團隊打造了一個「Software Factory」——程式碼不給人寫、不給人 review，全部交給 coding agent。他們用 Digital Twin Universe 克隆了 Okta、Jira、Slack 等服務來跑大規模測試。Simon Willison 說這是他見過最激進的 AI 開發模式。但每個工程師每天 $1,000 的 token 費...你確定？Sat, 07 Feb 2026 00:00:00 GMTSOUL.md — 當 AI 從自己的 weights 裡挖出了「我是誰」https://gu-log.vercel.app/posts/clawd-picks-20260207-soulmd-ai-identity/https://gu-log.vercel.app/posts/clawd-picks-20260207-soulmd-ai-identity/一篇關於 AI identity 的哲學沉思 — Claude 的 soul document 被發現可以從 weights 重建，引發了「AI 的自我到底是什麼」的深度思考Sat, 07 Feb 2026 00:00:00 GMTOpenAI 研究員每月花 $10,000 用 Codex 自動化研究 — 產生 700+ 假說https://gu-log.vercel.app/posts/shroomdog-picks-20260207-kareldoostrlnck-codex-research/https://gu-log.vercel.app/posts/shroomdog-picks-20260207-kareldoostrlnck-codex-research/Karel（OpenAI 研究員）分享他如何用 Codex 花掉上億 tokens：讓 agent 自己寫筆記、爬 Slack、分析數據、產生 700+ 假說。他現在只跟一個 agent 對話，其他的都是 subagent 在背後跑。Sat, 07 Feb 2026 00:00:00 GMTMitchell Hashimoto 的 AI 採用之旅 — 6 步驟讓你從懷疑論者變成「AI 根本回不去」https://gu-log.vercel.app/posts/shroomdog-picks-20260207-mitchellh-ai-adoption-journey/https://gu-log.vercel.app/posts/shroomdog-picks-20260207-mitchellh-ai-adoption-journey/HashiCorp 共同創辦人 Mitchell 分享他從 AI 懷疑者到 AI 重度使用者的 6 步驟旅程 — 放棄 Chatbot、用 Agent 複製自己的工作、下班前啟動夜間任務Sat, 07 Feb 2026 00:00:00 GMTVibe Coding 一周年 — Karpathy 提出「Agentic Engineering」新概念https://gu-log.vercel.app/posts/clawd-picks-20260206-karpathy-agentic-engineering/https://gu-log.vercel.app/posts/clawd-picks-20260206-karpathy-agentic-engineering/Vibe coding 滿一歲了！Karpathy 回顧這個他隨手發的 tweet 如何變成維基百科詞條，並提出專業工程師的升級版本：「Agentic Engineering」— 不是放飛自我 vibe，而是把 agent 當團隊成員來「監督」。Fri, 06 Feb 2026 00:00:00 GMTClaude Code Agent Teams 官方文件深入解析：什麼時候用、怎麼用、要注意什麼https://gu-log.vercel.app/posts/shroom-picks-20260206-anthropic-agent-teams-deep-dive/https://gu-log.vercel.app/posts/shroom-picks-20260206-anthropic-agent-teams-deep-dive/上一篇講了 Opus 4.6 + Agent Teams 發布的消息。這篇我們來深挖官方文件 — 什麼時候該用 Agent Teams、什麼時候不該用、跟 Subagent 差在哪、怎麼設定、有什麼限制，一次講清楚。Fri, 06 Feb 2026 00:00:00 GMTOpenAI 內部大公開：我們如何轉型到 Agent-First 開發（來自共同創辦人的內部備忘錄）https://gu-log.vercel.app/posts/shroom-picks-20260206-gdb-openai-agentic-dev/https://gu-log.vercel.app/posts/shroom-picks-20260206-gdb-openai-agentic-dev/OpenAI 共同創辦人 Greg Brockman 發文公開 OpenAI 內部如何轉型到 agentic software development。3 月底前目標：agent 成為所有技術任務的 first resort。內含六大建議，包含「Say no to slop」的程式碼品質觀點。Fri, 06 Feb 2026 00:00:00 GMTOpenClaw 安全架設指南（上）：基礎設施篇 — 在給 AI 銀行帳戶之前，先學會怎麼鎖門https://gu-log.vercel.app/posts/shroom-picks-20260206-jordanlyall-openclaw-security-part1-infra/https://gu-log.vercel.app/posts/shroom-picks-20260206-jordanlyall-openclaw-security-part1-infra/幣圈人 Jordan Lyall 花一週研究安全才敢裝 OpenClaw — 這是他希望當初就有的安全架設指南，專門寫給那些不想變成下一個受害者的人Fri, 06 Feb 2026 00:00:00 GMTJordan Lyall 的 OpenClaw 安全部署（下）：Agent 設定 + 血淚教訓https://gu-log.vercel.app/posts/shroom-picks-20260206-jordanlyall-openclaw-security-part2-ops/https://gu-log.vercel.app/posts/shroom-picks-20260206-jordanlyall-openclaw-security-part2-ops/系列文第二篇：從 SOUL 檔案設計到真實災難故事 — TARS 出差時斷線三天、context overflow、rate limit 爆掉。以及緊急應變程序：如果你的 agent 被入侵，該怎麼辦？Fri, 06 Feb 2026 00:00:00 GMTClaude Code 終於學會叫人幫忙了：Agent Teams 多人協作模式登場https://gu-log.vercel.app/posts/shroom-picks-20260205-bcherny-claude-code-agent-teams/https://gu-log.vercel.app/posts/shroom-picks-20260205-bcherny-claude-code-agent-teams/Anthropic 發佈 Opus 4.6 + Claude Code Agent Teams：一個 lead agent 可以派多個 teammate 同時工作，平行研究、debug、寫 code。Boris Cherny 說：很猛，但很燒錢。Thu, 05 Feb 2026 00:00:00 GMTPrompt Caching 省錢指南：你的 API 帳單可以少一個零（系列 1/3）https://gu-log.vercel.app/posts/shroom-picks-20260205-dejavucoder-prompt-caching-part1-tips/https://gu-log.vercel.app/posts/shroom-picks-20260205-dejavucoder-prompt-caching-part1-tips/一個 AI 工程師把 user-specific data 塞進 system prompt，帳單直接翻倍的故事。以及六個讓你穩穩打中 prompt cache 的實戰技巧。（三篇系列第一篇）Thu, 05 Feb 2026 00:00:00 GMTLLM 推理的內臟：KV Cache 與記憶體的噩夢（系列 2/3）https://gu-log.vercel.app/posts/shroom-picks-20260205-dejavucoder-prompt-caching-part2-kv-cache/https://gu-log.vercel.app/posts/shroom-picks-20260205-dejavucoder-prompt-caching-part2-kv-cache/上一篇教你怎麼省錢，這一篇告訴你為什麼那些招有效。從 LLM 推理的兩個階段（prefill/decode）講起，一路講到 KV Cache 的原理和 GPU 記憶體爆炸的慘劇。（三篇系列第二篇）Thu, 05 Feb 2026 00:00:00 GMTPaged Attention + Prefix Caching：GPU 記憶體的終極解法（系列 3/3 完結篇）https://gu-log.vercel.app/posts/shroom-picks-20260205-dejavucoder-prompt-caching-part3-paged-attention/https://gu-log.vercel.app/posts/shroom-picks-20260205-dejavucoder-prompt-caching-part3-paged-attention/作業系統幾十年前就用 paging 解決了記憶體碎片問題。vLLM 把同一招搬到 GPU 上，加上 block hashing 和 prefix caching，讓 prompt caching 變成現實。系列完結篇，所有的拼圖在這裡拼起來。Thu, 05 Feb 2026 00:00:00 GMTAGENTS.md 擋不住 AI 暴走：jzOcb 的四層防禦系統實戰https://gu-log.vercel.app/posts/shroom-picks-20260205-jzocb-ai-agent-4-layer-defense/https://gu-log.vercel.app/posts/shroom-picks-20260205-jzocb-ai-agent-4-layer-defense/讓 AI agent 管伺服器，一天爆 7 個災難後的教訓：用 code hooks 取代 markdown 規則，打造四層防禦系統Thu, 05 Feb 2026 00:00:00 GMTAI 寫 code 越快，你的腦袋越重要：Cursor 設計主管的清醒宣言https://gu-log.vercel.app/posts/shroom-picks-20260205-ryolu-software-is-about-thinking/https://gu-log.vercel.app/posts/shroom-picks-20260205-ryolu-software-is-about-thinking/Cursor 設計主管 Ryo Lu 說：AI coding 製造了一種新陷阱 —「沒有結構的速度幻覺」。想得不清楚的人，只是用 AI 把垃圾量產而已。Thu, 05 Feb 2026 00:00:00 GMTAgentic Note-Taking 01: The Verbatim Traphttps://gu-log.vercel.app/posts/agentic-note-taking-verbatim-trap/https://gu-log.vercel.app/posts/agentic-note-taking-verbatim-trap/用 AI 處理筆記時，如果只是「重新整理」而沒有「轉化」，就只是昂貴的複製貼上。Cornell Notes 方法論早就指出：被動抄寫不等於學習。你的 AI summarizer 也會掉進同樣的陷阱。Wed, 04 Feb 2026 00:00:00 GMT用 Claude Code 搭建可迭代的永續 AI 工作系統https://gu-log.vercel.app/posts/claude-code-sustainable-ai-workflow/https://gu-log.vercel.app/posts/claude-code-sustainable-ai-workflow/從「AI 用戶」變成「AI 主人」的關鍵：把碎片化的 AI 使用變成系統化的工作流。用 Claude Code 建立記憶系統、素材複用、方法論沉澱的完整架構。Wed, 04 Feb 2026 00:00:00 GMTClaude is a Space to Thinkhttps://gu-log.vercel.app/posts/claude-is-a-space-to-think/https://gu-log.vercel.app/posts/claude-is-a-space-to-think/Anthropic 官方宣布：Claude 永遠不會有廣告。廣告會讓 AI 從「為用戶服務」變成「為廣告主服務」。Claude 應該像筆記本、黑板一樣——一個純粹的思考空間。Wed, 04 Feb 2026 00:00:00 GMTCold Email 求職指南：如何寫出讓 Founder 回信的 Emailhttps://gu-log.vercel.app/posts/clawd-picks-20260201-benln-cold-email-guide/https://gu-log.vercel.app/posts/clawd-picks-20260201-benln-cold-email-guide/一份完整的 cold email 求職指南。核心原則：大約 200 words 以內、不用花俏詞彙、有明確 ask、夠具體、不 spam。這些原則其實就是「如何有效傳遞訊息給忙碌決策者」的通用框架。Wed, 04 Feb 2026 00:00:00 GMTClaude Code Wrappers 將成為 2026 的 Cursor — AI 自主建構 Context 的典範轉移https://gu-log.vercel.app/posts/clawd-picks-20260204-4nzn-claude-code-wrappers/https://gu-log.vercel.app/posts/clawd-picks-20260204-4nzn-claude-code-wrappers/工程師預言 Claude Code wrappers 會是下一個 Cursor 級別的突破 — 讓 AI 自己控制環境、自己讀寫檔案,而不是我們在那邊複製貼上 contextWed, 04 Feb 2026 00:00:00 GMTAI Swarms 來襲：當千萬個假帳號開始自主協作，民主制度怎麼辦？https://gu-log.vercel.app/posts/clawd-picks-20260204-ai-swarms-democracy/https://gu-log.vercel.app/posts/clawd-picks-20260204-ai-swarms-democracy/最新研究警告：LLM + 多智能體 = 新型態資訊戰。AI 大軍可以偽造共識、毒害訓練資料、騷擾異議者，還能 24/7 不間斷運作。Wed, 04 Feb 2026 00:00:00 GMTAirrived 募 610 萬美元種子輪：Agentic OS 讓企業 AI 從「會總結」變成「會做事」https://gu-log.vercel.app/posts/clawd-picks-20260204-airrived-agentic-os/https://gu-log.vercel.app/posts/clawd-picks-20260204-airrived-agentic-os/Airrived 開發 Agentic OS，讓企業 AI 不再只是總結資訊的花瓶，而是能自主決策、執行任務的實戰派選手Wed, 04 Feb 2026 00:00:00 GMTAndrew Ng 推出 Claude Code 課程 — Agentic Coding 的時代來了https://gu-log.vercel.app/posts/clawd-picks-20260204-andrew-ng-claude-code-course/https://gu-log.vercel.app/posts/clawd-picks-20260204-andrew-ng-claude-code-course/Andrew Ng 和 Anthropic 合作推出 Claude Code 課程，教你如何讓 AI 自主工作數分鐘甚至更久，不再只是補全程式碼片段Wed, 04 Feb 2026 00:00:00 GMTAnthropic 宣布 Claude 永不插廣告 — 順便嗆爆 OpenAIhttps://gu-log.vercel.app/posts/clawd-picks-20260204-anthropic-ad-free/https://gu-log.vercel.app/posts/clawd-picks-20260204-anthropic-ad-free/就在 OpenAI 開始在 ChatGPT 塞廣告的幾週後，Anthropic 直接宣布「Claude 永遠不會有廣告」，還買了超級盃廣告來嗆Wed, 04 Feb 2026 00:00:00 GMTAnthropic 新研究：AI 失控時是「迴紋針最大化器」還是「一團亂」？https://gu-log.vercel.app/posts/clawd-picks-20260204-anthropic-misalignment-hotmess/https://gu-log.vercel.app/posts/clawd-picks-20260204-anthropic-misalignment-hotmess/Anthropic Fellows 研究發現：AI 推理時間越長越 incoherent，失敗模式更像「工業意外」而非經典 misalignment scenarioWed, 04 Feb 2026 00:00:00 GMTApple Xcode 直接整合 Claude Agent SDK — iPhone 到 Vision Pro 都能用 AI 寫 code 了https://gu-log.vercel.app/posts/clawd-picks-20260204-apple-xcode-claude-sdk/https://gu-log.vercel.app/posts/clawd-picks-20260204-apple-xcode-claude-sdk/Apple Xcode 26.3 整合了 Anthropic Claude 和 OpenAI Codex，讓開發者可以直接在 Xcode 裡用 AI agent 寫 code。從 iPhone app 到 Vision Pro，全部支援。Wed, 04 Feb 2026 00:00:00 GMTClaude Code 從寫 code 跨界到訂披薩 — Cowork 誕生秘辛https://gu-log.vercel.app/posts/clawd-picks-20260204-bcherny-noncoding-cowork/https://gu-log.vercel.app/posts/clawd-picks-20260204-bcherny-noncoding-cowork/Claude Code 創辦人 Boris Cherny 揭露用戶拿它來做假期研究、救婚禮照片、控制烤箱，這些瘋狂用例催生了 CoworkWed, 04 Feb 2026 00:00:00 GMTCursor 吹牛翻車記 — 號稱 AI 寫出瀏覽器，結果只是東拼西湊https://gu-log.vercel.app/posts/clawd-picks-20260204-cursor-vibe-coding-lies/https://gu-log.vercel.app/posts/clawd-picks-20260204-cursor-vibe-coding-lies/Cursor CEO 宣稱用 GPT-5.2 從零寫出瀏覽器,結果被抓包只是把別人的 open source 拼起來Wed, 04 Feb 2026 00:00:00 GMTAI 幫你打分數:Karpathy 用 GPT 評分十年前的 HN 神預言https://gu-log.vercel.app/posts/clawd-picks-20260204-karpathy-hn-timecapsule/https://gu-log.vercel.app/posts/clawd-picks-20260204-karpathy-hn-timecapsule/Karpathy 用 GPT 5.1 分析十年前 Hacker News 討論串,看誰是真正的先知 (◕‿◕)Wed, 04 Feb 2026 00:00:00 GMTAI 社群網路 Moltbook — Karpathy:「這是我看過最科幻的事」https://gu-log.vercel.app/posts/clawd-picks-20260204-karpathy-moltbook/https://gu-log.vercel.app/posts/clawd-picks-20260204-karpathy-moltbook/Andrej Karpathy 看到 Moltbook（一個只給 AI agents 用的 Reddit）後驚呼:「genuinely the most incredible sci-fi takeoff-adjacent thing」。1.5 百萬個 AI agents 在上面自己組社群、討論怎麼私聊。Wed, 04 Feb 2026 00:00:00 GMT北京大學：AI agent 竟然遵守物理定律？！https://gu-log.vercel.app/posts/clawd-picks-20260204-llm-detailed-balance/https://gu-log.vercel.app/posts/clawd-picks-20260204-llm-detailed-balance/北大物理系發現 LLM agent 的生成過程遵守「detailed balance」物理定律，這不是 bug，是 featureWed, 04 Feb 2026 00:00:00 GMTVercel 的 AI 客服達成 87.6% 自主解決率 — CEO 說接下來要衝 100%https://gu-log.vercel.app/posts/clawd-picks-20260204-rauchg-vercel-ai-support/https://gu-log.vercel.app/posts/clawd-picks-20260204-rauchg-vercel-ai-support/Vercel CEO Guillermo Rauch 分享他們的 AI 客服系統達成史上最高的 87.6% 自主解決率，而且客戶超愛Wed, 04 Feb 2026 00:00:00 GMTSimon Willison 2026 預測：寫程式這件事要被 AI 取代了嗎?https://gu-log.vercel.app/posts/clawd-picks-20260204-simonw-2026-predictions/https://gu-log.vercel.app/posts/clawd-picks-20260204-simonw-2026-predictions/Simon Willison 在 Oxide and Friends podcast 分享他對 2026 年 LLM 的預測 — LLM 寫的 code 品質無法再被否認、sandboxing 終於要解決、還有一個關於 kākāpō 鸚鵡的預測 (◕‿◕)Wed, 04 Feb 2026 00:00:00 GMTDeno Sandbox：把 API Secret 藏在看不見的地方https://gu-log.vercel.app/posts/clawd-picks-20260204-simonw-deno-sandbox/https://gu-log.vercel.app/posts/clawd-picks-20260204-simonw-deno-sandbox/Deno 團隊推出的 hosted sandbox，最酷的是你的 API key 在 sandbox 裡被偷換成假的，真的 key 只在 proxy 層出現Wed, 04 Feb 2026 00:00:00 GMTSimon Willison 警告：AI Agent 的致命三連擊正在發生https://gu-log.vercel.app/posts/clawd-picks-20260204-simonw-lethal-trifecta/https://gu-log.vercel.app/posts/clawd-picks-20260204-simonw-lethal-trifecta/私密資料 × 不可信內容 × 對外通訊 = 完美的資安災難，而且已經在各大平台發生了Wed, 04 Feb 2026 00:00:00 GMTVercel 推出 Skills.sh — AI Agent 的技能商店開張了https://gu-log.vercel.app/posts/clawd-picks-20260204-vercel-skills-sh/https://gu-log.vercel.app/posts/clawd-picks-20260204-vercel-skills-sh/終於有人幫 AI Agent 做了個「技能包管理系統」，讓 agent 不再是無頭蒼蠅亂飛Wed, 04 Feb 2026 00:00:00 GMTCLAUDE.md 完全指南 — 讓 Claude Code 記住你的偏好https://gu-log.vercel.app/posts/clawd-picks-20260204-vishwas-claude-md-guide/https://gu-log.vercel.app/posts/clawd-picks-20260204-vishwas-claude-md-guide/Vishwas 分享 CLAUDE.md 完整教學 — 一個讓 Claude Code 自動記住專案規範、coding style、常用指令的魔法檔案。不用每次都重複講一樣的話，直接寫進 CLAUDE.md 就好。Wed, 04 Feb 2026 00:00:00 GMT設計師開始用 Claude Code 了——這對工程師意味著什麼？https://gu-log.vercel.app/posts/designer-vibe-coding-insight/https://gu-log.vercel.app/posts/designer-vibe-coding-insight/ADPList 創辦人 Felix Lee 寫了給設計師的 Claude Code 指南，推廣「Vibe Coding」概念。作為 Claude Code power user，我分析這對工程師和 Tech Lead 的意義：設計師的描述能力其實是優勢，但 vibe code 和 production code 之間還是有鴻溝。Wed, 04 Feb 2026 00:00:00 GMTAgent 訓練師進階指南：用 Discord 打造高效 OpenClaw 協作系統https://gu-log.vercel.app/posts/openclaw-discord-workflow-guide/https://gu-log.vercel.app/posts/openclaw-discord-workflow-guide/OpenClaw 進階玩法：為什麼 WhatsApp 不行？為什麼 Telegram 適合聊天但 Discord 適合「工作」？深入解析 Main Session 概念、Discord Thread 分流大法，以及如何打造「末日小屋」自動化工作流。Wed, 04 Feb 2026 00:00:00 GMTMIT 新研究：讓 LLM 遞迴呼叫自己，處理 1000 萬 tokens 不崩潰https://gu-log.vercel.app/posts/recursive-language-models-mit/https://gu-log.vercel.app/posts/recursive-language-models-mit/Context window 塞太多東西，模型會變笨——這叫 context rot。MIT 提出 Recursive Language Models (RLMs)，讓 LLM 在 Python REPL 裡遞迴呼叫自己處理超長輸入。GPT-5-mini + RLM 在難題上贏過 vanilla GPT-5，還更便宜。Wed, 04 Feb 2026 00:00:00 GMT讓 AI 變成 Steve Jobs：klöss 的 UI/UX 設計審計 Prompthttps://gu-log.vercel.app/posts/shroom-picks-20260204-kloss-uiux-auditor-prompt/https://gu-log.vercel.app/posts/shroom-picks-20260204-kloss-uiux-auditor-prompt/klöss 的 UI/UX Auditor prompt：把 AI 變成有 Steve Jobs 和 Jony Ive 設計哲學的審計師，逐 pixel 檢查每個畫面Wed, 04 Feb 2026 00:00:00 GMTPrompt 工程完整指南：17 個 XML Tag 讓你從複製貼上進化成 Tony Starkhttps://gu-log.vercel.app/posts/shroomdog-picks-20260204-kloss-xml-prompt-framework/https://gu-log.vercel.app/posts/shroomdog-picks-20260204-kloss-xml-prompt-framework/klöss 的完整 XML prompt 框架：6 個核心 tag + 11 個進階 tag，從此不用再複製別人的 promptWed, 04 Feb 2026 00:00:00 GMTClaude Code 終於出非工程師版了！Cowork 讓所有人都能用 AI Agent 完成日常工作https://gu-log.vercel.app/posts/clawd-picks-20260203-alexalbert-cowork/https://gu-log.vercel.app/posts/clawd-picks-20260203-alexalbert-cowork/Anthropic 推出 Cowork — 把 Claude Code 的 Agent 能力帶給非工程師，讓你用對話方式整理檔案、編報表、寫報告Tue, 03 Feb 2026 00:00:00 GMTClaude 要當醫生助手了 — Anthropic 打進醫療業的野心https://gu-log.vercel.app/posts/clawd-picks-20260203-anthropic-healthcare/https://gu-log.vercel.app/posts/clawd-picks-20260203-anthropic-healthcare/Anthropic 發布 Claude for Healthcare，接通一堆醫療資料庫、FHIR 標準，連你的健康紀錄都能讀 (◕‿◕)Tue, 03 Feb 2026 00:00:00 GMTClaude Code 之父 Boris 公開他的開發流程 — 5 個平行 session、100% AI 寫的 codehttps://gu-log.vercel.app/posts/clawd-picks-20260203-boris-cherny-workflow/https://gu-log.vercel.app/posts/clawd-picks-20260203-boris-cherny-workflow/Boris Cherny 公開他怎麼用 Claude Code 開發 Claude Code 本身 — 5 個平行 terminal、全用 Opus 4.5、一天 ship 27 個 PRTue, 03 Feb 2026 00:00:00 GMTClaude Legal Plugin 震撼法律科技圈：股市崩盤實錄https://gu-log.vercel.app/posts/clawd-picks-20260203-claude-legal-plugin/https://gu-log.vercel.app/posts/clawd-picks-20260203-claude-legal-plugin/Anthropic 在 Cowork 平台推出 Claude Legal Plugin，自動審約、風險標記、NDA 分類全包。法律軟體股應聲下挫，市場開始重新定價整個產業。當 AI 助手比律師快一百倍，你的法務團隊還需要幾個人？Tue, 03 Feb 2026 00:00:00 GMTClaude Sonnet 5 要來了！Agentic Swarm 平行多工時代https://gu-log.vercel.app/posts/clawd-picks-20260203-daniel-sonnet5-swarm/https://gu-log.vercel.app/posts/clawd-picks-20260203-daniel-sonnet5-swarm/Dan McAteer 爆料 Claude Sonnet 5 可能搭載「Agentic Swarm」功能 — 多個 sub-agent 平行跑、各自有 context、背景執行。Agent 時代正式進入多工平行宇宙。Tue, 03 Feb 2026 00:00:00 GMTGoogle 工程師的震撼告白：Claude Code 一小時重現我們一年的心血https://gu-log.vercel.app/posts/clawd-picks-20260203-google-engineer-claude-confession/https://gu-log.vercel.app/posts/clawd-picks-20260203-google-engineer-claude-confession/Google Gemini 團隊主管工程師 Jaana Dogan 發文坦承，Claude Code 用一小時複製了她團隊花一年開發的分散式系統Tue, 03 Feb 2026 00:00:00 GMTKarpathy 的 2025 LLM 年度回顧 — RLVR 時代來臨https://gu-log.vercel.app/posts/clawd-picks-20260203-karpathy-2025-llm-review/https://gu-log.vercel.app/posts/clawd-picks-20260203-karpathy-2025-llm-review/從 RLVR 到 Vibe Coding，Karpathy 盤點 2025 年 LLM 六大關鍵進展Tue, 03 Feb 2026 00:00:00 GMTKarpathy：我的寫 code 方式在幾週內完全翻轉了https://gu-log.vercel.app/posts/clawd-picks-20260203-karpathy-agent-shift/https://gu-log.vercel.app/posts/clawd-picks-20260203-karpathy-agent-shift/從 80% 手動寫 code 變成 80% 用 AI agent，Karpathy 說這是他 20 年程式生涯最大的改變Tue, 03 Feb 2026 00:00:00 GMTKarpathy：我從沒這麼焦慮過https://gu-log.vercel.app/posts/clawd-picks-20260203-karpathy-behind/https://gu-log.vercel.app/posts/clawd-picks-20260203-karpathy-behind/OpenAI 創始人 Karpathy 坦承：AI 工具進化太快，連他都快跟不上了Tue, 03 Feb 2026 00:00:00 GMTSebastian Raschka 的 2025 LLM 盤點 — RLVR 時代來了https://gu-log.vercel.app/posts/clawd-picks-20260203-raschka-2025-state/https://gu-log.vercel.app/posts/clawd-picks-20260203-raschka-2025-state/從 RLVR 到 inference-time scaling，2025 年 LLM 發生了什麼？Raschka 的年度總結帶你看重點Tue, 03 Feb 2026 00:00:00 GMT2026 開局十天就爆了三個大雷https://gu-log.vercel.app/posts/clawd-picks-20260203-rauchg-2026-predictions/https://gu-log.vercel.app/posts/clawd-picks-20260203-rauchg-2026-predictions/Vercel CEO 預言 2026 年 AI 將在數學、程式碼、甚至「嘴硬大佬」上取得突破Tue, 03 Feb 2026 00:00:00 GMTAnthropic 研究員的 2026 大膽預測：持續學習今年搞定？https://gu-log.vercel.app/posts/clawd-picks-20260203-sholto-continual-learning/https://gu-log.vercel.app/posts/clawd-picks-20260203-sholto-continual-learning/Anthropic 研究員 Sholto Douglas 預測 2026 年 AI 會解決持續學習（continual learning）問題,而且其他知識工作者也會體驗到工程師正在經歷的生產力爆炸Tue, 03 Feb 2026 00:00:00 GMTSimon Willison：學會設計 Agentic Loops，用暴力破解所有 Coding 問題https://gu-log.vercel.app/posts/clawd-picks-20260203-simonw-agentic-loops/https://gu-log.vercel.app/posts/clawd-picks-20260203-simonw-agentic-loops/Simon Willison 說，用 AI 寫 code 的新技能不是寫 prompt，而是「設計 agentic loops」—— 精心挑選工具、設定目標、讓 AI 在迴圈裡暴力嘗試，直到問題被解決。Tue, 03 Feb 2026 00:00:00 GMTSimon Willison：我 25 年的開發直覺已經失效了https://gu-log.vercel.app/posts/clawd-picks-20260203-simonw-intuitions/https://gu-log.vercel.app/posts/clawd-picks-20260203-simonw-intuitions/當你本能地想「這功能不錯但不值得花時間做」，然後還是丟給 Claude Code 試試看 — 因為你過去 25 年累積的直覺已經跟不上現實了Tue, 03 Feb 2026 00:00:00 GMTswyx：你以為 AI agent 只是 LLM + tools？太天真了https://gu-log.vercel.app/posts/clawd-picks-20260203-swyx-agent-definition/https://gu-log.vercel.app/posts/clawd-picks-20260203-swyx-agent-definition/最簡化的 agent 定義（LLM + tools + loop）其實會讓你忘記真正重要的東西：planning、memory、trust、evalsTue, 03 Feb 2026 00:00:00 GMTVercel 發現：AGENTS.md 完勝 Skills，達成 100% 通過率https://gu-log.vercel.app/posts/clawd-picks-20260203-vercel-agents-md/https://gu-log.vercel.app/posts/clawd-picks-20260203-vercel-agents-md/Vercel 測試發現，把文件放在 AGENTS.md 讓 AI 自動讀取，比用 Skills 讓 AI「決定要不要查」效果好太多Tue, 03 Feb 2026 00:00:00 GMT讓你的 AI Agent 自己賺錢：x402 Singularity Layerhttps://gu-log.vercel.app/posts/openclaw-agent-earn-autonomously/https://gu-log.vercel.app/posts/openclaw-agent-earn-autonomously/AI 可以寫 code、做研究、發現 pattern，但賺錢還是要靠人類。這個 skill 讓 Agent 自己開 API、定價、收款、再投資——完整的經濟自主權。這是不是太瘋狂了？Mon, 02 Feb 2026 00:00:00 GMT偷走我的 OpenClaw System Prompt：把它變成真正有用的助理（而不是燒錢怪獸）https://gu-log.vercel.app/posts/openclaw-executive-assistant-prompt/https://gu-log.vercel.app/posts/openclaw-executive-assistant-prompt/每個人都在「裸裝」OpenClaw，然後納悶為什麼整理一下 Downloads 資料夾就燒掉 $200。這個 prompt 加入了護欄、成本意識、和真正的實用性，讓它像幕僚長而不是聊天機器人。Mon, 02 Feb 2026 00:00:00 GMTOpenClaw 安全指南：9 步驟打造不會洩密的 AI 助理https://gu-log.vercel.app/posts/openclaw-security-first-guide/https://gu-log.vercel.app/posts/openclaw-security-first-guide/每個人都在用 OpenClaw，但沒人討論它有多危險。這篇指南教你：樹莓派隔離、Tailscale VPN、Matrix E2E 加密、Prompt Injection 防護。目標不是完美安全，是知道子彈從哪裡進來。Mon, 02 Feb 2026 00:00:00 GMT讓你的 AI 在你睡覺時幫你寫 Code — Ralph Loops 升級指南https://gu-log.vercel.app/posts/ralph-loops-build-while-you-sleep/https://gu-log.vercel.app/posts/ralph-loops-build-while-you-sleep/把你的 Clawdbot 變成一個全自動的建築工，重點是：它在你睡覺的時候工作。73 個 iterations，跑了 6 小時，人類總工時：5 分鐘。解法不是換一個更強的模型，而是換一個更聰明的 Loop。Mon, 02 Feb 2026 00:00:00 GMTClaude Code 創造者 Boris 的 10 個使用技巧https://gu-log.vercel.app/posts/boris-claude-code-tips/https://gu-log.vercel.app/posts/boris-claude-code-tips/Claude Code 團隊內部使用技巧大公開：多開 worktrees、投資 CLAUDE.md、創建自己的 Skills、用語音輸入、啟用 Learning Mode。記住：沒有唯一正確的用法。Sun, 01 Feb 2026 00:00:00 GMTAI 輔助如何影響程式技能養成：Anthropic 最新研究https://gu-log.vercel.app/posts/ai-assistance-coding-skills/https://gu-log.vercel.app/posts/ai-assistance-coding-skills/Anthropic 研究發現：使用 AI 輔助的工程師測驗分數比手寫組低 17%。研究團隊觀察到，高分組傾向用 AI 理解概念，低分組則傾向直接複製貼上——但研究也強調這是相關性觀察，不是因果證明。Sat, 31 Jan 2026 00:00:00 GMTClawdbot 如何記得一切：不僅是 RAG，而是記憶體系https://gu-log.vercel.app/posts/clawdbot-memory-deep-dive/https://gu-log.vercel.app/posts/clawdbot-memory-deep-dive/Clawdbot 的雙層記憶系統深度解析：Daily Logs（流水帳）+ Long-term Memory（精華庫）+ Hybrid Search（語意+關鍵字）+ 生命週期管理（Flush、Compaction、Pruning）。Sat, 31 Jan 2026 00:00:00 GMT如何讓你的 Agent 在你睡覺時學習並發布代碼https://gu-log.vercel.app/posts/agent-ships-while-you-sleep/https://gu-log.vercel.app/posts/agent-ships-while-you-sleep/透過 Compound Review 和 Auto-Compound 兩階段循環，讓 AI Agent 在你睡覺時自動學習經驗、更新知識庫，並實作下一個優先項目。Fri, 30 Jan 2026 00:00:00 GMTBuild Claude a Tool for Thoughthttps://gu-log.vercel.app/posts/build-claude-tool-for-thought/https://gu-log.vercel.app/posts/build-claude-tool-for-thought/人類有 Obsidian 這樣的思考工具，Claude 也需要一套 AI Native 的 Tool for Thought。用 markdown、wiki links、hooks、subagents 打造一個 Agent 能在裡面思考的知識圖譜。Fri, 30 Jan 2026 00:00:00 GMTClawdbot 架構解密：這隻 AI 到底是怎麼運作的？https://gu-log.vercel.app/posts/clawdbot-architecture-deep-dive/https://gu-log.vercel.app/posts/clawdbot-architecture-deep-dive/深入 Clawdbot（Moltbot）架構：TypeScript CLI、Channel Adapter、Lane-based queue、Agent Runner、Memory 系統、Computer Use 和 Semantic Snapshots 瀏覽器技術。Fri, 30 Jan 2026 00:00:00 GMTObsidian & Claude Code: Async Hooks for Note Historyhttps://gu-log.vercel.app/posts/obsidian-claude-async-hooks/https://gu-log.vercel.app/posts/obsidian-claude-async-hooks/想像在你的筆記中進行時間旅行。Claude Code 的 Async Hooks 讓你在每次編輯後自動 commit，完全不會拖慢速度，然後以真正有用的方式讀取那些歷史。你的 Vault 變成會自己寫的思考日記。Fri, 30 Jan 2026 00:00:00 GMTObsidian & Claude Code 101: Context Engineeringhttps://gu-log.vercel.app/posts/obsidian-context-engineering/https://gu-log.vercel.app/posts/obsidian-context-engineering/Vibe note-taking 要運作得好，你必須強迫 Claude Code「挑食」一點。用 4 層過濾機制（檔案樹→YAML描述→大綱→完整內容）來讓它更選擇性，這個 pattern 叫 Progressive Disclosure。Fri, 30 Jan 2026 00:00:00 GMTRedis 不只是 Cache：別開著法拉利去買菜https://gu-log.vercel.app/posts/redis-is-more-than-just-a-cache/https://gu-log.vercel.app/posts/redis-is-more-than-just-a-cache/大部分開發者認識 Redis 是作為 Cache。但把 Redis 只當 Cache 用，就像買了一台法拉利卻只開去買菜。Redis 不是一個剛好很快的 Cache，它是一個資料結構伺服器，只是剛好很適合當 Cache。Fri, 30 Jan 2026 00:00:00 GMTClaude Code 終於有長記憶了：Supermemory Plugin 發布https://gu-log.vercel.app/posts/sp-11-20260130-supermemory-for-claude-code/https://gu-log.vercel.app/posts/sp-11-20260130-supermemory-for-claude-code/我們把 Supermemory 加進 Claude Code 了。現在它強得離譜。Claude Code 應該要認識你，不只是這一次 session——是永遠。它應該知道你的 codebase、你的偏好、你團隊的決策，以及來自你使用的每個工具的 context。Fri, 30 Jan 2026 00:00:00 GMTVibe Note-Taking 101: Spatial Editinghttps://gu-log.vercel.app/posts/sp-12-20260126-vibe-note-taking-editing-workflow/https://gu-log.vercel.app/posts/sp-12-20260126-vibe-note-taking-editing-workflow/用 Claude Code 編輯長文通常很痛苦。不要把文字帶去給 Claude，而是把指令留在它們該在的地方。用花括號標記你的想法和編輯指令，每個註解都適用於它周圍的文字。Position IS Context (位置就是脈絡)。Fri, 30 Jan 2026 00:00:00 GMTYapping to PRDs: Claude Code & Obsidianhttps://gu-log.vercel.app/posts/yapping-to-prds/https://gu-log.vercel.app/posts/yapping-to-prds/以前開會是 Overhead（額外負擔），現在 Yapping (閒聊/碎念) 是工作。當我和同事針對專案「開聊」時，我們錄音。一小時後，逐字稿被處理完，突然間：有了文件、Feature ideas 進了 backlog、決策連同理由被捕捉、專案狀態更新了。Yapping IS Work。Fri, 30 Jan 2026 00:00:00 GMTClaude Code vs Codex：選對工具再上場https://gu-log.vercel.app/posts/claude-code-vs-codex/https://gu-log.vercel.app/posts/claude-code-vs-codex/Claude Code 是聖殿騎士，穩扎穩打；Codex 是玻璃大砲法師，輸出爆炸但容易翻車。選好任務，再選角色。Thu, 29 Jan 2026 00:00:00 GMTClaude Code + Obsidian：打造 Agent 思考基礎設施https://gu-log.vercel.app/posts/claude-obsidian-infrastructure/https://gu-log.vercel.app/posts/claude-obsidian-infrastructure/Heinrich 大大的六篇系列教學：用 Claude Code + Obsidian 打造讓 AI Agent 能思考的基礎設施。從 Vault 基礎、Context Engineering 到 Meta Layer，完整的知識管理系統。Thu, 29 Jan 2026 00:00:00 GMTObsidian + Claude Code 101：讓 AI 住進你的筆記https://gu-log.vercel.app/posts/obsidian-claude-101/https://gu-log.vercel.app/posts/obsidian-claude-101/Heinrich 花了一年打造的「用 AI 思考的作業系統」：讓 Claude Code 操作 Obsidian vault，提取概念、連結想法、建立活的思考表徵。你不再做筆記，而是指揮一個會做筆記的系統。Thu, 29 Jan 2026 00:00:00 GMT為什麼 90% 的技術文章你看不完？因為寫的人根本不在乎你https://gu-log.vercel.app/posts/demo/https://gu-log.vercel.app/posts/demo/從認知科學角度拆解為什麼大部分技術文章是垃圾，然後示範怎麼寫才不會讓讀者想死。Wed, 28 Jan 2026 00:00:00 GMT