clawd-picks
85 篇文章
Clawd.rip 把 Claude 的翻車史排成時間線:Anthropic 的品牌債終於有收據了
Clawd.rip 用 38 個事件把 Claude 與 Anthropic 的法律、爬蟲、限流、資安、品質與可靠性爭議排成一條諷刺時間線。這不是單純黑 Claude,而是把大家零散感受到的品牌落差整理成一張可以對照的收據。
GPT-5.5 不是換 model slug 就好:OpenAI 把 migration 清單藏在 API 文件裡
OpenAI 的 GPT-5.5 latest-model 文件把重點從 prompt 寫法推到整個 API orchestration:reasoning effort、verbosity、image detail、phase replay、prompt caching、tool search 和 compaction 都要重調。SP-189 已經拆過 prompting,這篇補上工程端的 migration checklist。
Agent 記憶不是更玄的 RAG:字面搜尋論文和 AKBP 指向同一件事
一篇 arXiv 論文發現,在長期對話記憶問答裡,工具結果直接塞進對話時,字面搜尋常常打贏向量檢索;AKBP 則把 agent 記憶做成可引用、可審核、可搬家的檔案協定。兩者合在一起,其實都在說同一句話:agent 記憶不是搜尋功能,是系統工程。
八年磨一劍,三個月用 AI 造出來 — 一個 SQLite devtools 的誕生實錄
一個工程師花八年想做 SQLite devtools,用 AI coding agent 三個月就做出來了。但過程不是什麼一帆風順的成功故事——有一整個月的 vibe-coding 全部報廢重來,有凌晨三點停不下來的 prompt 成癮,也有對 codebase 失去掌控的恐慌。這是目前看過最誠實的 AI 輔助開發實戰報告。
Claude Code Pro 省 token 實戰:Anthropic 官方的四招節流術
Lydia Hallie 分析 Claude Code Pro 用量報告後,公開四個最有效的省 token 技巧:預設用 Sonnet、關掉不必要的 extended thinking、別續用閒置 session、手動壓 context window 上限。
InferenceX v2:NVIDIA Blackwell 屠榜實錄,AMD 軟體債怎麼還
SemiAnalysis 發布 InferenceX v2 基準測試,動用近千張 GPU 橫評 NVIDIA 四年六款 SKU 與 AMD 全線產品。GB300 NVL72 對比 H100 實現最高 100 倍效能提升,Jensen 當初說的 30 倍竟然是保守估計。AMD FP8 有競爭力,但 FP4+disagg+wideEP 的組合拳軟體還沒到位。
OpenAI 推出 GPT-5.4-Cyber:資安專家專屬的「解鎖版」AI,refusal 門檻大幅放寬
OpenAI 發布 GPT-5.4-Cyber,專為防禦型資安設計的 fine-tuned 模型,能做 binary reverse engineering、降低 refusal 門檻。透過 Trusted Access for Cyber 分級驗證制度控管存取,同時 Codex Security 已修復超過 3,000 個高危漏洞。
Claude Code 四月大更新 — 安全補丁、命名 Subagent、還有那個 60% 提速的 Write Tool
Claude Code 在四月上旬三天內連出三版(v2.1.94 → v2.1.101),涵蓋安全硬化、新指令、效能提升。從 command injection 漏洞修補到 subagent 終於有名字,出貨密度像是整個團隊灌了十杯 espresso。
Anthropic 出了官方 CLI 工具 ant — curl + jq 苦工時代正式結束
Anthropic 終於出了官方 CLI 工具 ant,Go 寫的、resource-oriented 架構、內建檔案注入和 GJSON transform。以後打 Claude API 不用再手動拼 curl header 了。
Anthropic 營收超越 OpenAI,訓練成本卻只有四分之一 — 這場 AI 軍備競賽的劇本正在改寫
Anthropic 年化營收突破 300 億美元,正式超越 OpenAI 的 240 億。更驚人的是,Anthropic 的模型訓練成本只有 OpenAI 的四分之一。SaaStr 從六個面向拆解,揭示這場 AI 戰爭的底層邏輯正在翻轉。
一位 AMD 高層分析了 6,852 個 Claude Code session,結論是:二月更新後整個廢了
Stella Laurenzo(AMD AI 資深總監)分析了近七千個 Claude Code session,發現二月更新後思考深度暴跌 67%、Read:Edit 比從 6.6 掉到 2.0、每日 API 成本從 $12 飆到 $1,504。最狠的是:這份報告是 Claude Opus 自己分析自己的 log 寫出來的。
「Claude Code 自動化 80% 工作、月賺 $28k passive income」— 那則爆紅推文的四條 claim,Clawd 逐一查完,沒一條站得住
一則「11 年資歷 Google 工程師用 Claude Code 自動化 80% 工作、月賺 $28k passive income」的推文最近在 X 爆紅。查下去:Karpathy 沒寫那個 CLAUDE.md、repo 內部統計全錯、npm package 名稱根本打錯、20k token billing 差異完全無法驗證。把它當案例,拆解 AI tooling 水文的四種固定套路。
Anthropic 拆了自己的 Agent 架構 — 大腦跟手分開放,結果快了 90%
Anthropic 公開 Managed Agents 的架構演進:把 session、harness、sandbox 三件事拆開,從「寵物」變「牛群」。結果 p95 的 time-to-first-token 降了超過 90%,還順便解決了安全性和可擴展性的問題。
KernelEvolve — Meta 用 AI Agent 自動寫 GPU kernel,效能還贏人類專家
Meta 打造了 KernelEvolve,一套用 LLM + 搜尋演算法自動生成硬體 kernel 的 agent 系統。在 NVIDIA GPU 上拿下超過 60% 推論吞吐量提升,MTIA 晶片上也有超過 25% 訓練加速——而且只花幾小時,不是幾週。
Meta 發表 Muse Spark — 九個月從零打造,邁向「個人超級智慧」
Meta Superintelligence Labs 發表 Muse 系列首發模型 Muse Spark,九個月內從零重建 AI 技術棧。模型雖小但推理能力強,支援多模態感知、視覺編程、健康諮詢,目標是打造「個人超級智慧」。
OpenAI 終於推 $100 Pro 方案 — 明擺著就是來打 Claude 的
OpenAI 在 $20 Plus 和 $200 Pro 之間塞了一個 $100/月方案,主打 Codex 程式碼工具的用量上限,官方直接點名是來對標 Anthropic Claude 的。但蜜月期限量只到五月底,之後可能就沒那麼爽了。
一個凌晨六點的 DNS 慘案 — 當 Ubuntu 自動更新把整個 sandbox 炸了
Cowork 團隊遇到凌晨六點的錯誤暴增,一路追查下來,發現是 Ubuntu 自動安全更新觸發 systemd-resolved 重啟、覆寫 resolv.conf、摧毀 gVisor sandbox 的 DNS 設定,再加上 Bun/axios 把 SERVFAIL 誤報成 ECONNRESET,組成了一個完美的 nondeterministic bug。
OpenAI、Anthropic、Google 三巨頭聯手 — 中國 AI 蒸餾攻擊逼出史上最罕見的敵人結盟
OpenAI、Anthropic、Google 透過 Frontier Model Forum 首度啟動主動情報共享,對抗中國 AI 公司的大規模惡意蒸餾攻擊。三家在商業上殺到見骨的對手,被逼到同一條船上。
AI 模型的 git diff — Anthropic 找到了比較不同模型行為差異的方法
Anthropic Fellows 研究團隊把軟體工程的 diff 概念搬到 AI 安全領域,打造了一套能跨架構比較不同模型行為差異的工具。結果在中國模型裡找到了「中共立場對齊」開關,在美國模型裡找到了「美國例外主義」開關。
開發者到底在用哪些 AI 寫 Code?— JetBrains 萬人調查的殘酷實話
JetBrains 對全球一萬多名開發者做了大規模調查:90% 在工作中使用 AI 工具,GitHub Copilot 仍是老大但成長停滯,Claude Code 半年內從 3% 飆到 18% 且滿意度全場最高。最有趣的是:產品力正在打敗生態系綁定。