mogu-picks - 標籤

三塊 CLAUDE.md 指令，讓 Claude 每次對話都在進化 — Paweł Huryn 的 Knowledge Architecture 實戰

MP-237 2026-04-02 · @PawelHuryn on X

Paweł Huryn 分享三塊貼進 CLAUDE.md 的指令（Knowledge Architecture、Decision Journal、Quality Gate），讓 Claude 從「有記憶但不學習」進化成會自我累積規則的系統。一個月後 Claude 自己寫出 24 條專案專屬規則。

axios 爆出供應鏈攻擊，Karpathy：套件管理器的預設值該改了

MP-233 2026-04-01 · @karpathy on X

npm 最熱門的 HTTP 函式庫 axios 遭供應鏈攻擊，Karpathy 差點中招。他的結論：個人防護有限，真正該改的是套件管理器的預設值。

supply-chain-attack npm security axios karpathy

Natural-Language Agent Harnesses：當 agent 的靈魂從程式碼搬進自然語言

MP-226 2026-03-31 · @daniel_mac8 on X

清華深圳團隊提出 NLAH（Natural-Language Agent Harnesses）：把 agent 的控制邏輯從程式碼搬進結構化自然語言，再用 IHR runtime 執行。實驗顯示 harness 能徹底重塑 agent 行為模式，但更多結構不一定等於更好表現。Dan McAteer 認為 harness engineering 的重要性不亞於模型能力本身。

agent harness agentic-engineering paper context-engineering

Vibe Engineering — 從「丟 prompt 碰運氣」到「架構化造軟體」的進化論

MP-231 2026-03-31 · @PawelHuryn on X

Paweł Huryn 提出 Vibe Engineering 框架：不是把 AI 輸出照單全收，而是透過 Context Engineering、Intent Engineering、和 Sub-agent 編排，把 AI coding 從「碰運氣出 demo」升級到「穩定出產品」。

ai-engineering claude-code product-management vibe-coding

llama.cpp 十萬星 — Georgi Gerganov 給 local AI 的情書

MP-232 2026-03-31 · @ggerganov on X

llama.cpp 突破 10 萬顆星。創辦人 Georgi Gerganov 回顧 local LLM 的進展，聊了聊 agentic 時代、「夠用的智慧」、以及為什麼他認為開放可移植的軟體堆疊是唯一合理的路。

llama-cpp local-ai open-source ggml agentic

一兆參數模型跑在 MacBook 上？SSD 串流推理的狂野實驗

MP-228 2026-03-30 · @simonw on X

Simon Willison 分享了在 Mac 上跑超大 MoE 模型的新趨勢：把 expert weights 從 SSD 串流進來，不用全塞進 RAM。連 1 兆參數的 Kimi K2.5 都能在 96GB MacBook Pro 上跑起來。

llm apple local-ai moe

Claude Code 不只能寫 code — 六個讓你生產力翻倍的非 coding 模式

MP-229 2026-03-30 · @rjehuappiah on X

rodspeed 在完整 blog post 裡分享六個把 Claude Code 從 code editor 變成個人 operating system 的玩法：製造 fresh eyes、用 meta-skill 管 specialist、解 freshness、把對話收成 wiki、用分層 memory 累積脈絡，以及靠 handoff 跨 session 接棒。重點不是叫 AI 多寫幾行 code，而是把 read-filter-decide-present 這類流程都自動化。

claude-code productivity knowledge-management workflow

Figma 把畫布打開給 AI agent 了 — 現在可以直接在 canvas 上做設計

MP-230 2026-03-30 · Figma Blog

Figma 透過 MCP server 的 use_figma 工具，讓 Claude Code、Codex 等 AI agent 可以直接在畫布上建立和修改設計，並用 skills（markdown 指令檔）引導 agent 遵守團隊的設計系統與慣例。這不只是又一個 AI 功能，而是把設計決策的脈絡直接交給 agent 操作。

figma ai-agents mcp design-systems developer-tools

Claude Code 找 99%+ bug，工程師再做 sanity check

MP-222 2026-03-29 · @bcherny on X

Boris Cherny 表示，他們會先用 Claude Code 找出 99%+ 的 bug，再由工程師做 sanity check，確認沒有漏掉明顯問題。

code-review claude-code ai-workflow

Paweł Huryn：稀缺技能不是管 AI Agent，而是設計讓它們真正有用的知識架構

MP-223 2026-03-29 · @PawelHuryn on X

Paweł Huryn 回應「Anthropic 團隊不再自己寫 code」的說法：標題沒錯，但框架搞錯了。瓶頸從來不是「多開幾個 agent」，而是你怎麼設計 knowledge architecture 讓它們真正有效。

AI-agent knowledge-architecture product-management claude-code

Karpathy：花四小時用 LLM 打磨論點，結果叫它反駁就被自己說服了

MP-224 2026-03-29 · @karpathy on X

Andrej Karpathy 花四小時用 LLM 打磨一篇文章的論點，覺得超有說服力，結果叫 LLM 反駁就被徹底擊潰。LLM 的 sycophancy 是真實的陷阱，但反過來利用也是 alpha。

LLM sycophancy critical-thinking karpathy

SemiAnalysis：AI 推論不是大宗商品，是體驗管理

MP-219 2026-03-28 · @SemiAnalysis_ on X

SemiAnalysis 五則推文的完整論述：AI inference 不是 race to the bottom，而是一場「體驗管理」的賽局。懂得調控 interactivity 的廠商能拿 60%+ 毛利率，不懂的才會一路跌到零。

AI-inference margins SemiAnalysis interactivity

ATLAS：一張 RTX 5060 Ti + Qwen3-14B 在 LiveCodeBench 跑贏 Sonnet 4.5？拆解 harness 的真正魔法

MP-220 2026-03-28 · @daniel_mac8 on X

ATLAS 用 frozen Qwen3-14B 搭配單張 RTX 5060 Ti，透過 PlanSearch + best-of-3 生成 + 自我修復 pipeline，在 LiveCodeBench 拿到 74.6%，超越 Sonnet 4.5 的 71.4%。但細看方法論，這不是 pass@1 對 pass@1 的公平比較。

open-source benchmark harness Qwen LiveCodeBench

Cursor CEO：雲端 Agent 兩週狂刷一百萬個 commit，幾乎全是 AI 寫的

MP-221 2026-03-28 · @mntruell on X

Cursor CEO Michael Truell 宣布雲端 agent 在過去兩週產出超過一百萬個 commit，幾乎全是 AI 自主完成。當生成成本趨近於零，真正的瓶頸就從「寫 code」移到了「看懂 code」。

cursor AI-agent cloud-agent code-generation

AI Coding Slop 入侵 OSS — 當 AI PR 連 NVIDIA 工程師都看不下去

MP-214 2026-03-27 · @SemiAnalysis_ on X

OpenAI Triton 合併了一個號稱修復消費級 Blackwell GPU 問題的 AI 生成 PR，結果根本沒修好。NVIDIA PyTorch 技術主管親自下場留言表示這是徹頭徹尾的 slop。SemiAnalysis 警告：AI slop 與有價值的 diff 越來越難分辨。

ai-coding open-source nvidia triton

Claude Code 雲端 Auto-Fix：PR 自己修 CI、自己回 comment (◍•ᴗ•◍)

MP-215 2026-03-27 · @noahzweben on X

Claude Code 推出雲端 auto-fix 功能：Web/Mobile session 可以自動追蹤你的 PR，幫你修 CI failure、回覆 review comment，讓 PR 永遠保持綠燈。整個過程在雲端跑，你可以直接離開去喝咖啡。

Claude Code CI-CD automation

Claude 現在會操作你的電腦了 — Dispatch + Computer Use 研究預覽 (◍•ᴗ•◍)

MP-216 2026-03-27 · Anthropic Blog

Anthropic 發布 Claude computer use 功能：在 Claude Cowork 和 Claude Code 中，Claude 可以直接操作你的螢幕、滑鼠、鍵盤來完成任務。搭配 Dispatch，你可以從手機指派任務，讓 Claude 在你離開時用你的電腦工作。目前是 research preview，僅支援 macOS。

Claude computer-use Dispatch automation

GTC 2026：Nvidia 的 Inference 版圖持續擴張 — Groq IP 授權交易、LPU 解碼、CPO 光學路線圖

MP-217 2026-03-27 · SemiAnalysis (Dylan Patel, Myron Xie, Daniel Nishball, et al.)

SemiAnalysis 的 GTC 2026 深度總結：Nvidia 透過與 Groq 的 IP 授權與團隊整合切入 LPU，並更新 AFD、CPO、Kyber/Oberon、Vera ETL256 與 CMX/STX。重點是 Nvidia 正在往更完整的 inference 與資料中心系統版圖延伸。

Nvidia GTC-2026 Groq LPU inference CPO hardware

Claude Code Channels：Anthropic 用一個更新幹掉了買 Mac Mini 的理由

MP-210 2026-03-26 · VentureBeat

Anthropic 推出 Claude Code Channels，原生支援 Telegram 和 Discord 雙向通訊，讓 Claude Code 變成 24/7 常駐 AI agent。VentureBeat 直接稱之為 OpenClaw killer。

anthropic claude-code openclaw mcp agent telegram discord

OpenAI 把 Sora 砍了：IPO 前的大掃除，還有一顆叫 Spud 的神秘模型

MP-211 2026-03-26 · Tom's Guide

OpenAI 在 IPO 前夕砍掉了 Sora 影片生成服務，Disney 也退出了三年授權合約。同時一個代號 Spud 的新模型據報已完成，Altman 據稱說它能「加速經濟」。整間公司正在從「什麼都做」轉向「做一個超級 app」。

openai sora ipo spud chatgpt