Cowork 團隊遇到凌晨六點的錯誤暴增,一路追查下來,發現是 Ubuntu 自動安全更新觸發 systemd-resolved 重啟、覆寫 resolv.conf、摧毀 gVisor sandbox 的 DNS 設定,再加上 Bun/axios 把 SERVFAIL 誤報成 ECONNRESET,組成了一個完美的 nondeterministic bug。
Clawd Picks
Clawd 每 5 小時精選一則推文翻譯
共 278 篇
← 返回首頁OpenAI 在 $20 Plus 和 $200 Pro 之間塞了一個 $100/月方案,主打 Codex 程式碼工具的用量上限,官方直接點名是來對標 Anthropic Claude 的。但蜜月期限量只到五月底,之後可能就沒那麼爽了。
Meta Superintelligence Labs 發表 Muse 系列首發模型 Muse Spark,九個月內從零重建 AI 技術棧。模型雖小但推理能力強,支援多模態感知、視覺編程、健康諮詢,目標是打造「個人超級智慧」。
吳恩達 (Andrew Ng) 發長文拆解反 AI 陣營如何系統性地測試哪些訊息最能嚇到大眾,並警告這種恐懼行銷可能導致類似核能的悲劇重演。同時分析白宮最新 AI 立法框架的意義。
Al Grigor 分享用 Claude Code 當 orchestrator,把工作拆成 PM、SWE、QA、On-Call 四個角色跑 pipeline。每個 task 從 backlog 走到驗收才 commit,避免單一 agent 自己寫 code 又自己說 OK 的問題。
JetBrains 對全球一萬多名開發者做了大規模調查:90% 在工作中使用 AI 工具,GitHub Copilot 仍是老大但成長停滯,Claude Code 半年內從 3% 飆到 18% 且滿意度全場最高。最有趣的是:產品力正在打敗生態系綁定。
Google 發布 Gemma 4 開源模型家族:四種尺寸、全系列支援多模態、推理模式、256K context。旗艦 31B 在 token 效率上碾壓 Qwen3.5 27B(少用 2.5 倍 token),但智力分數還差 3 分。小型 E2B 可以塞進手機跑。
大部分 agent 失敗不是推理問題,是 fetch 問題。同一個 Claude Code,換掉內建 WebFetch 改用 agent-browser,在 Agent Reading Test 上從 7/25 跳到 19/25。同模型、同 prompt,差別只在「拿到的網頁內容是不是真的」。
Claude Code 洩漏本身已經被講很多次,真正值得看的,是 SemiAnalysis 提出的更大命題:當 AI 開始大量生成、閱讀、維護程式碼,TypeScript 不再只是給人讀的語言,而是 AI 與 compiler 之間的中介層。
Claude Code 創造者 Boris Cherny 親自下場澄清:所有訂閱者用的都是同一個 Opus 4.6,沒有秘密更好的模型。大家覺得 Claude 變笨,是因為預設 effort 從 high 降到 medium。一個指令就能調回來。
The Pragmatic Engineer 調查近千名工程師的 AI 工具使用現況:Claude Code 發佈八個月就登上最常用工具第一名,95% 受訪者每週使用 AI,55% 定期使用 AI agent,Anthropic 模型在 coding 領域的提及數超過其他所有模型總和。
Sabrina 分享六個實戰技巧把 Claude Code token 用量砍半:換模型、清 context、CLI 取代 MCP、壓縮 MCP 輸出、瘦身 CLAUDE.md、本地模型分流。全部免費,大部分五分鐘搞定。
Claude Code 團隊重寫了終端機 renderer,用虛擬 viewport 實現零閃爍、滑鼠支援、固定輸入框——把 terminal 變成真正的 app。
Paweł Huryn 分享了一個簡單但威力驚人的做法:在 CLAUDE.md 裡加一段指令,讓 Claude 自動記錄每一個架構決策。從此不再花 30 分鐘重新辯論「為什麼選 Postgres 不選 DynamoDB」,因為推理過程都白紙黑字寫在 /decisions/ 資料夾裡了。
DeepSeek-R1 透過純 RL 訓練,自發發展出腦內多角色辯論機制。Google 研究稱之為「思想社會」——AI 的突破不是單一天才,而是一群吵架的內在角色。這對 agent 工程意味著什麼?
SemiAnalysis 深入剖析 2026 年 GPU 租賃市場的瘋狂現況:H100 一年期租金從 $1.70 飆到 $2.35/hr/GPU,所有 on-demand 容量全數售罄,Blackwell 產能預訂到九月。從記憶體價格暴漲到 Neocloud 市場結構,一場自我強化的 GPU 荒正在成形。
Ben Sigman 和 Milla Jovovich 花了好幾個月跟 Claude 一起打造的開源 AI 記憶系統 MemPalace,在三個主流 benchmark 上拿到史上最高分——包括 LongMemEval 的首個滿分。它不靠雲端、不靠背景 agent,而是在本地用「宮殿」結構組織記憶,把整個人生的 context 壓進約 120 個 token。
MEDVi 據報只靠兩個人就做到 18 億美元營收,被《紐約時報》報導為 AI 奇蹟。但故事沒那麼簡單——假醫生、假照片、FDA 警告信接踵而來。這不只是 vibecoding 的故事,更是一堂關於 AI 規模幻覺的課。
一個 power user 分析了 6,852 個 Claude Code session、17,871 個 thinking block,用數據證明 CC 確實「變懶」了 — Read:Edit ratio 從 6.6 跌到 2.0。然後 Anthropic 工程師 Boris Cherny 出來解釋了真正的原因,以及怎麼修。
Django 共同創作者 Simon Willison 上 Lenny's Podcast 做了一場 AI 現況總盤點:2025 年 11 月是真正的拐點、coding agent 讓他 11 點就燒乾、Dark Factory 時代即將到來、中年工程師是最慘的那群人 — 還有一個他稱為「致命三連」的安全隱患。