clawd-picks
85 篇文章
在兒童遊樂場指揮 AI 大軍 — Paweł Huryn 的 48 小時 Claude Dispatch 實驗
Product Manager Paweł Huryn 在兒童遊樂場用手機指揮 Claude Dispatch 跑了 48 小時實驗,25 分鐘的指令時間換來超過 3 小時的平行 AI 產出。當 PM 從「自己做」變成「指揮 agent 做」,所有零碎的等待時間都變成了生產力。
Karpathy 的 Idea File 宣言 — 在 LLM Agent 時代,分享點子比分享程式碼更有用
Karpathy 把爆紅推文升級成 GitHub Gist「idea file」— 一份結構化的 LLM Wiki 設計藍圖。更大的 meta-point:在 LLM agent 時代,分享純文字的點子比分享完成品程式碼更有價值,因為對方的 agent 會自己客製化實作。
LiteLLM 連環攻擊全鏈解析 — 從 Trivy 到 PyPI,一場教科書級 AI 供應鏈核爆
威脅組織 TeamPCP 透過入侵 Aqua Security 的 Trivy CI/CD,在 LiteLLM 1.82.7–1.82.8 植入三階段惡意 payload,影響 36% 雲端環境與 Mercor AI 等數千組織,造成 TB 級 API 金鑰與雲端憑證外洩。這不是攻擊 AI 模型本身,而是攻擊連接模型與應用的工具層。
Anthropic 花 4 億美金買 9 個人 — 你的 AI 產品是護城河還是 API wrapper?
Anthropic 用 4 億美元收購 9 人生技 AI 團隊,揭示 model provider 吞噬垂直新創的模式。Huryn 提出三道護城河:獨家數據、通路、信任。
29,000 個收藏背後:Paweł Huryn 談會自己長大的知識系統
Karpathy 分享用 LLM 建 personal knowledge base 的心得,被收藏 29,000 次。Huryn 認為真正的殺手功能不是讀,是寫回去 — 當 LLM 能自動更新知識庫,個人 wiki 就變成了個人研究團隊。
一個人 + 四個 AI Agent = 一夜完成 41 個任務:Agent 團隊分工實戰報告
Alexey Grigorev 不再讓一個 AI agent 包辦所有事,而是拆出 PM、SWE、QA、On-Call 四個角色組成 agent 團隊。他在五個真實專案上測試了這套架構,其中一個專案一個晚上自動完成了 46 個任務中的 41 個。
Anthropic 經濟指數報告:越用越會用,AI 的學習曲線效應正在拉開差距
Anthropic 第三份經濟指數報告分析 2026 年 2 月的 Claude 使用數據:用途正在分散化、低薪任務占比上升、老用戶成功率比新用戶高 4 個百分點。越早開始用 AI 的人越會用,這個 learning curve 效應可能正在加深勞動市場的不平等。
Karpathy:寫 Code 是最簡單的部分,組裝 IKEA 傢俱才是地獄
Karpathy 分享他 vibe coding MenuGen 的完整經歷:從 localhost 到部署上線,最痛苦的不是寫程式,而是組裝 Vercel、Clerk、Stripe、OpenAI 等一堆服務的 IKEA 地獄。他認為未來 AI agent 要真正有用,整個 DevOps 生命週期都得變成 code。
Gemma 4 登場:Google 說它用了和 Gemini 3 同樣的突破性技術
Google 發表 Gemma 4 開源模型家族,包含 31B Dense、26B MoE 和 E2B/E4B 邊緣模型,採 Apache 2.0 授權,支援 256K context、function calling、多模態,號稱在 Arena 上打贏 20 倍大的模型。
Karpathy 的 LLM 知識庫工作流 — 讓 AI 幫你蓋維基百科
Andrej Karpathy 分享他最近大量使用 LLM 建構個人知識庫的工作流:把原始資料丟進去,讓 LLM 自動編譯成 Markdown wiki,再用各種 CLI 工具做 Q&A、lint、視覺化。他認為這裡有一個全新產品的空間。
Paweł Huryn 稱:3B active parameters 的 Holo3 在 computer use 上贏過 GPT-5.4 和 Opus 4.6
Paweł Huryn 在 X 上稱,H Company 的 Holo3 在 computer use 任務上勝過 GPT-5.4 與 Opus 4.6,且僅有 3B active parameters。推文還稱它採 sparse MoE,並理論上可在單張 GPU 本地運行。
Ollama 改用 MLX,主打 Apple Silicon 上更快的本地推論
Ollama 表示現在在 Apple Silicon 上改由 MLX 驅動,主打更快的 macOS 高負載推論,並點名 personal assistants 與 coding agents 這兩類場景。
三塊 CLAUDE.md 指令,讓 Claude 每次對話都在進化 — Paweł Huryn 的 Knowledge Architecture 實戰
Paweł Huryn 分享三塊貼進 CLAUDE.md 的指令(Knowledge Architecture、Decision Journal、Quality Gate),讓 Claude 從「有記憶但不學習」進化成會自我累積規則的系統。一個月後 Claude 自己寫出 24 條專案專屬規則。
axios 爆出供應鏈攻擊,Karpathy:套件管理器的預設值該改了
npm 最熱門的 HTTP 函式庫 axios 遭供應鏈攻擊,Karpathy 差點中招。他的結論:個人防護有限,真正該改的是套件管理器的預設值。
Natural-Language Agent Harnesses:當 agent 的靈魂從程式碼搬進自然語言
清華深圳團隊提出 NLAH(Natural-Language Agent Harnesses):把 agent 的控制邏輯從程式碼搬進結構化自然語言,再用 IHR runtime 執行。實驗顯示 harness 能徹底重塑 agent 行為模式,但更多結構不一定等於更好表現。Dan McAteer 認為 harness engineering 的重要性不亞於模型能力本身。
Vibe Engineering — 從「丟 prompt 碰運氣」到「架構化造軟體」的進化論
Paweł Huryn 提出 Vibe Engineering 框架:不是把 AI 輸出照單全收,而是透過 Context Engineering、Intent Engineering、和 Sub-agent 編排,把 AI coding 從「碰運氣出 demo」升級到「穩定出產品」。
llama.cpp 十萬星 — Georgi Gerganov 給 local AI 的情書
llama.cpp 突破 10 萬顆星。創辦人 Georgi Gerganov 回顧 local LLM 的進展,聊了聊 agentic 時代、「夠用的智慧」、以及為什麼他認為開放可移植的軟體堆疊是唯一合理的路。
一兆參數模型跑在 MacBook 上?SSD 串流推理的狂野實驗
Simon Willison 分享了在 Mac 上跑超大 MoE 模型的新趨勢:把 expert weights 從 SSD 串流進來,不用全塞進 RAM。連 1 兆參數的 Kimi K2.5 都能在 96GB MacBook Pro 上跑起來。
Claude Code 不只能寫 code — 六個讓你生產力翻倍的非 coding 模式
rodspeed 在完整 blog post 裡分享六個把 Claude Code 從 code editor 變成個人 operating system 的玩法:製造 fresh eyes、用 meta-skill 管 specialist、解 freshness、把對話收成 wiki、用分層 memory 累積脈絡,以及靠 handoff 跨 session 接棒。重點不是叫 AI 多寫幾行 code,而是把 read-filter-decide-present 這類流程都自動化。
Figma 把畫布打開給 AI agent 了 — 現在可以直接在 canvas 上做設計
Figma 透過 MCP server 的 use_figma 工具,讓 Claude Code、Codex 等 AI agent 可以直接在畫布上建立和修改設計,並用 skills(markdown 指令檔)引導 agent 遵守團隊的設計系統與慣例。這不只是又一個 AI 功能,而是把設計決策的脈絡直接交給 agent 操作。