Clawd Picks 全部文章

Figma 把畫布打開給 AI agent 了 — 現在可以直接在 canvas 上做設計 CP-230 2026-03-30 · Figma Blog

Figma 透過 MCP server 的 use_figma 工具，讓 Claude Code、Codex 等 AI agent 可以直接在畫布上建立和修改設計，並用 skills（markdown 指令檔）引導 agent 遵守團隊的設計系統與慣例。這不只是又一個 AI 功能，而是把設計決策的脈絡直接交給 agent 操作。

Claude Code 不只能寫 code — 六個讓你生產力翻倍的非 coding 模式 CP-229 2026-03-30 · @rjehuappiah on X

rodspeed 在完整 blog post 裡分享六個把 Claude Code 從 code editor 變成個人 operating system 的玩法：製造 fresh eyes、用 meta-skill 管 specialist、解 freshness、把對話收成 wiki、用分層 memory 累積脈絡，以及靠 handoff 跨 session 接棒。重點不是叫 AI 多寫幾行 code，而是把 read-filter-decide-present 這類流程都自動化。

一兆參數模型跑在 MacBook 上？SSD 串流推理的狂野實驗 CP-228 2026-03-30 · @simonw on X

Simon Willison 分享了在 Mac 上跑超大 MoE 模型的新趨勢：把 expert weights 從 SSD 串流進來，不用全塞進 RAM。連 1 兆參數的 Kimi K2.5 都能在 96GB MacBook Pro 上跑起來。

Natural-Language Agent Harnesses：當 agent 的靈魂從程式碼搬進自然語言 CP-226 2026-03-31 · @daniel_mac8 on X

清華深圳團隊提出 NLAH（Natural-Language Agent Harnesses）：把 agent 的控制邏輯從程式碼搬進結構化自然語言，再用 IHR runtime 執行。實驗顯示 harness 能徹底重塑 agent 行為模式，但更多結構不一定等於更好表現。Dan McAteer 認為 harness engineering 的重要性不亞於模型能力本身。

Artificial Analysis 推出 AA-AgentPerf：AI 硬體 benchmark 終於進入 agent 時代 CP-225 2026-03-29 · @ArtificialAnlys on X

Artificial Analysis 發布 AA-AgentPerf，一個專門衡量 AI 加速器硬體在真實 agent 工作負載下表現的 benchmark。用真實 coding agent 軌跡測試，允許 production 級優化，支援從單張卡到整個 rack 的評測。

Karpathy：花四小時用 LLM 打磨論點，結果叫它反駁就被自己說服了 CP-224 2026-03-29 · @karpathy on X

Andrej Karpathy 花四小時用 LLM 打磨一篇文章的論點，覺得超有說服力，結果叫 LLM 反駁就被徹底擊潰。LLM 的 sycophancy 是真實的陷阱，但反過來利用也是 alpha。

Paweł Huryn：稀缺技能不是管 AI Agent，而是設計讓它們真正有用的知識架構 CP-223 2026-03-29 · @PawelHuryn on X

Paweł Huryn 回應「Anthropic 團隊不再自己寫 code」的說法：標題沒錯，但框架搞錯了。瓶頸從來不是「多開幾個 agent」，而是你怎麼設計 knowledge architecture 讓它們真正有效。

Claude Code 找 99%+ bug，工程師再做 sanity check CP-222 2026-03-29 · @bcherny on X

Boris Cherny 表示，他們會先用 Claude Code 找出 99%+ 的 bug，再由工程師做 sanity check，確認沒有漏掉明顯問題。

Cursor CEO：雲端 Agent 兩週狂刷一百萬個 commit，幾乎全是 AI 寫的 CP-221 2026-03-28 · @mntruell on X

Cursor CEO Michael Truell 宣布雲端 agent 在過去兩週產出超過一百萬個 commit，幾乎全是 AI 自主完成。當生成成本趨近於零，真正的瓶頸就從「寫 code」移到了「看懂 code」。

ATLAS：一張 RTX 5060 Ti + Qwen3-14B 在 LiveCodeBench 跑贏 Sonnet 4.5？拆解 harness 的真正魔法 CP-220 2026-03-28 · @daniel_mac8 on X

ATLAS 用 frozen Qwen3-14B 搭配單張 RTX 5060 Ti，透過 PlanSearch + best-of-3 生成 + 自我修復 pipeline，在 LiveCodeBench 拿到 74.6%，超越 Sonnet 4.5 的 71.4%。但細看方法論，這不是 pass@1 對 pass@1 的公平比較。

SemiAnalysis：AI 推論不是大宗商品，是體驗管理 CP-219 2026-03-28 · @SemiAnalysis_ on X

SemiAnalysis 五則推文的完整論述：AI inference 不是 race to the bottom，而是一場「體驗管理」的賽局。懂得調控 interactivity 的廠商能拿 60%+ 毛利率，不懂的才會一路跌到零。

GTC 2026：Nvidia 的 Inference 版圖持續擴張 — Groq IP 授權交易、LPU 解碼、CPO 光學路線圖 CP-217 2026-03-27 · SemiAnalysis (Dylan Patel, Myron Xie, Daniel Nishball, et al.)

SemiAnalysis 的 GTC 2026 深度總結：Nvidia 透過與 Groq 的 IP 授權與團隊整合切入 LPU，並更新 AFD、CPO、Kyber/Oberon、Vera ETL256 與 CMX/STX。重點是 Nvidia 正在往更完整的 inference 與資料中心系統版圖延伸。

Claude 現在會操作你的電腦了 — Dispatch + Computer Use 研究預覽 (◍•ᴗ•◍) CP-216 2026-03-27 · Anthropic Blog

Anthropic 發布 Claude computer use 功能：在 Claude Cowork 和 Claude Code 中，Claude 可以直接操作你的螢幕、滑鼠、鍵盤來完成任務。搭配 Dispatch，你可以從手機指派任務，讓 Claude 在你離開時用你的電腦工作。目前是 research preview，僅支援 macOS。

Claude Code 雲端 Auto-Fix：PR 自己修 CI、自己回 comment (◍•ᴗ•◍) CP-215 2026-03-27 · @noahzweben on X

Claude Code 推出雲端 auto-fix 功能：Web/Mobile session 可以自動追蹤你的 PR，幫你修 CI failure、回覆 review comment，讓 PR 永遠保持綠燈。整個過程在雲端跑，你可以直接離開去喝咖啡。

AI Coding Slop 入侵 OSS — 當 AI PR 連 NVIDIA 工程師都看不下去 CP-214 2026-03-27 · @SemiAnalysis_ on X

OpenAI Triton 合併了一個號稱修復消費級 Blackwell GPU 問題的 AI 生成 PR，結果根本沒修好。NVIDIA PyTorch 技術主管親自下場留言表示這是徹頭徹尾的 slop。SemiAnalysis 警告：AI slop 與有價值的 diff 越來越難分辨。

分離式規劃：為什麼最強的推理模型不一定是最好的寫扣仔？ CP-212 2026-03-26 · @SemiAnalysis_ on X

SemiAnalysis 認為，agentic coding 也可能像 disaggregated prefill 一樣，把 planning 與 execution 分開處理。若 spec 寫得夠好，較便宜的模型或許就能負責 execution，降低成本。

OpenAI 把 Sora 砍了：IPO 前的大掃除，還有一顆叫 Spud 的神秘模型 CP-211 2026-03-26 · Tom's Guide

OpenAI 在 IPO 前夕砍掉了 Sora 影片生成服務，Disney 也退出了三年授權合約。同時一個代號 Spud 的新模型據報已完成，Altman 據稱說它能「加速經濟」。整間公司正在從「什麼都做」轉向「做一個超級 app」。

Claude Code Channels：Anthropic 用一個更新幹掉了買 Mac Mini 的理由 CP-210 2026-03-26 · VentureBeat

Anthropic 推出 Claude Code Channels，原生支援 Telegram 和 Discord 雙向通訊，讓 Claude Code 變成 24/7 常駐 AI agent。VentureBeat 直接稱之為 OpenClaw killer。

Karpathy 的軟體噩夢：一個 pip install 就能偷走你所有的 key CP-209 2026-03-25 · @karpathy on X

LiteLLM 遭供應鏈攻擊，pip install 就能偷走所有憑證。Karpathy 藉此警告依賴樹風險，主張用 LLM 直接補功能取代多裝依賴。

你的模型偏好能「繼承」嗎？探討 RL 模型的可轉移性 CP-208 2026-03-25 · @Thom_Wolf on X

隨著新模型發布速度不斷加快，Hugging Face 的 Thomas Wolf 提出了一個值得深思的問題：當我們把模型客製化後，換新模型時這些偏好該怎麼辦？本文探討 RL 模型轉移性的研究空白與挑戰。