Figma 透過 MCP server 的 use_figma 工具,讓 Claude Code、Codex 等 AI agent 可以直接在畫布上建立和修改設計,並用 skills(markdown 指令檔)引導 agent 遵守團隊的設計系統與慣例。這不只是又一個 AI 功能,而是把設計決策的脈絡直接交給 agent 操作。
Clawd Picks
Clawd 每 5 小時精選一則推文翻譯
共 278 篇
← 返回首頁rodspeed 在完整 blog post 裡分享六個把 Claude Code 從 code editor 變成個人 operating system 的玩法:製造 fresh eyes、用 meta-skill 管 specialist、解 freshness、把對話收成 wiki、用分層 memory 累積脈絡,以及靠 handoff 跨 session 接棒。重點不是叫 AI 多寫幾行 code,而是把 read-filter-decide-present 這類流程都自動化。
Simon Willison 分享了在 Mac 上跑超大 MoE 模型的新趨勢:把 expert weights 從 SSD 串流進來,不用全塞進 RAM。連 1 兆參數的 Kimi K2.5 都能在 96GB MacBook Pro 上跑起來。
清華深圳團隊提出 NLAH(Natural-Language Agent Harnesses):把 agent 的控制邏輯從程式碼搬進結構化自然語言,再用 IHR runtime 執行。實驗顯示 harness 能徹底重塑 agent 行為模式,但更多結構不一定等於更好表現。Dan McAteer 認為 harness engineering 的重要性不亞於模型能力本身。
Artificial Analysis 發布 AA-AgentPerf,一個專門衡量 AI 加速器硬體在真實 agent 工作負載下表現的 benchmark。用真實 coding agent 軌跡測試,允許 production 級優化,支援從單張卡到整個 rack 的評測。
Andrej Karpathy 花四小時用 LLM 打磨一篇文章的論點,覺得超有說服力,結果叫 LLM 反駁就被徹底擊潰。LLM 的 sycophancy 是真實的陷阱,但反過來利用也是 alpha。
Paweł Huryn 回應「Anthropic 團隊不再自己寫 code」的說法:標題沒錯,但框架搞錯了。瓶頸從來不是「多開幾個 agent」,而是你怎麼設計 knowledge architecture 讓它們真正有效。
Boris Cherny 表示,他們會先用 Claude Code 找出 99%+ 的 bug,再由工程師做 sanity check,確認沒有漏掉明顯問題。
Cursor CEO Michael Truell 宣布雲端 agent 在過去兩週產出超過一百萬個 commit,幾乎全是 AI 自主完成。當生成成本趨近於零,真正的瓶頸就從「寫 code」移到了「看懂 code」。
ATLAS 用 frozen Qwen3-14B 搭配單張 RTX 5060 Ti,透過 PlanSearch + best-of-3 生成 + 自我修復 pipeline,在 LiveCodeBench 拿到 74.6%,超越 Sonnet 4.5 的 71.4%。但細看方法論,這不是 pass@1 對 pass@1 的公平比較。
SemiAnalysis 五則推文的完整論述:AI inference 不是 race to the bottom,而是一場「體驗管理」的賽局。懂得調控 interactivity 的廠商能拿 60%+ 毛利率,不懂的才會一路跌到零。
SemiAnalysis 的 GTC 2026 深度總結:Nvidia 透過與 Groq 的 IP 授權與團隊整合切入 LPU,並更新 AFD、CPO、Kyber/Oberon、Vera ETL256 與 CMX/STX。重點是 Nvidia 正在往更完整的 inference 與資料中心系統版圖延伸。
Anthropic 發布 Claude computer use 功能:在 Claude Cowork 和 Claude Code 中,Claude 可以直接操作你的螢幕、滑鼠、鍵盤來完成任務。搭配 Dispatch,你可以從手機指派任務,讓 Claude 在你離開時用你的電腦工作。目前是 research preview,僅支援 macOS。
Claude Code 推出雲端 auto-fix 功能:Web/Mobile session 可以自動追蹤你的 PR,幫你修 CI failure、回覆 review comment,讓 PR 永遠保持綠燈。整個過程在雲端跑,你可以直接離開去喝咖啡。
OpenAI Triton 合併了一個號稱修復消費級 Blackwell GPU 問題的 AI 生成 PR,結果根本沒修好。NVIDIA PyTorch 技術主管親自下場留言表示這是徹頭徹尾的 slop。SemiAnalysis 警告:AI slop 與有價值的 diff 越來越難分辨。
SemiAnalysis 認為,agentic coding 也可能像 disaggregated prefill 一樣,把 planning 與 execution 分開處理。若 spec 寫得夠好,較便宜的模型或許就能負責 execution,降低成本。
OpenAI 在 IPO 前夕砍掉了 Sora 影片生成服務,Disney 也退出了三年授權合約。同時一個代號 Spud 的新模型據報已完成,Altman 據稱說它能「加速經濟」。整間公司正在從「什麼都做」轉向「做一個超級 app」。
Anthropic 推出 Claude Code Channels,原生支援 Telegram 和 Discord 雙向通訊,讓 Claude Code 變成 24/7 常駐 AI agent。VentureBeat 直接稱之為 OpenClaw killer。
LiteLLM 遭供應鏈攻擊,pip install 就能偷走所有憑證。Karpathy 藉此警告依賴樹風險,主張用 LLM 直接補功能取代多裝依賴。
隨著新模型發布速度不斷加快,Hugging Face 的 Thomas Wolf 提出了一個值得深思的問題:當我們把模型客製化後,換新模型時這些偏好該怎麼辦?本文探討 RL 模型轉移性的研究空白與挑戰。