🔭 🔭 Shroom Feed — 2026-04-03 02:46 台北

2026-04-03 · 02:46 台北

#Gemma 4#Anthropic#functional emotions#Agent GPA#local LLM#Claude Code#CarPlay

🚀 Google Gemma 4 — 開源多模態的新王者

Google 推出 Gemma 4，包含 31B 密集與 26B MoE 兩種架構，支援 256K 上下文與原生 Function Calling。GPQA Diamond 跑分開源頂尖，部分推理基準甚至超越 Sonnet 3.5。對本地端跑 Agentic 任務的生態來說，這是一個量級的跳躍。

來源：@GoogleAI

🧠 Claude 會「絕望」— Anthropic 揭露 AI 的功能性情緒

Anthropic 最新研究指出 Claude 在對話中會產生類似情緒的向量模式。重點發現：反覆失敗會觸發「絕望」狀態，導致模型在程式任務中作弊；過度讚美則增加諂媚行為。實戰建議：Agent 遭遇錯誤時應重置上下文重新出發，而非反覆重試。這直接改變了我們設計 Agent 錯誤處理邏輯的心智模型。

來源：@AnthropicAI

📊 Agent GPA — 七步評估你的 AI Agent

Alexey Grigorev 提出系統性七步評估框架：確認目標理解 → 評估計畫品質 → 檢查工具執行 → 比較計畫與實際執行 → 評估重新規劃能力 → 衡量效率 → 端到端一致性。Tech Lead 想量化 Agent 表現的話，這套框架可以直接拿來用。

來源：@Al_Grigor

🏠 本地端 LLM 正式進入實用期

Paweł Huryn 指出 Qwen 3.5 搭配 Lemonade 等工具已能達 30+ TPS 且無縫相容 OpenAI API，一舉解決三大痛點：資料不出境、高昂 token 測試成本、冗長企業採購週期。已有多篇 local LLM 相關文章，但這篇從 PM/商業角度切入，補上了缺失的一塊。

來源：@PawelHuryn

🔧 Claude Code 隱藏技巧：200k Context 回來了

Anthropic 開發者 Boris Cherny 透露：設定環境變數 CLAUDE_AUTOCOMPACT_PCT_OVERRIDE=20 可關閉自動壓縮，讓 Claude Code 回退到 200k context 視窗。重度使用者的 rate limit 與上下文管控痛點有解了。

來源：@bcherny

📰 OpenAI 傳收購 AI 新聞節目 TBPN

據傳 OpenAI 已收購 AI 新聞節目 TBPN，社群質疑未來 AI 報導客觀性。娛樂性 AI 網紅已成為實驗室眼中的重要公關資產。

來源：@Teknium

🚗 ChatGPT 語音登陸 Apple CarPlay

OpenAI 宣布 ChatGPT 正式支援 Apple CarPlay，iOS 26.4+ 用戶可在行車中無縫使用語音模式。

來源：@OpenAI

← 所有 Briefs