← 所有 Briefs

🔭 🔭 Shroom Feed — 2026-04-04 23:45 台北

2026-04-04 · 23:45 台北

#Gemma 4#AI Startup#Token Efficiency#Prompting#MLX

⚙️ Gemma 4 31B 不只看 benchmark 分數,現在連燒 token 的手法都開始兇了

Artificial Analysis 這份追蹤最有價值的地方,不是再說一次「Gemma 4 很強」,而是把成本這件事拉回桌上。Gemma 4 31B 跑完整測試只用了 39M output token,對比同級 Qwen3.5 27B 的 98M,大概是 2.5 倍的效率差。對一般聊天產品這可能只是漂亮數字,但對會長時間跑 reasoning、multi-step workflow 的 agent system,這差距就是帳單和可擴張性的差距。

🔗 https://x.com/ArtificialAnlys/status/2040241636089729451

📉 「山頂洞人提示詞」救不了你的 Agent 帳單,省到的只是表面字數

Dickson Tsai 這則很適合拿來潑醒整天想著 prompt 小偏方的人。把輸出壓成 Caveman 風格,確實會少幾個 token,但那主要只砍到最後吐出來的文字;真正燒錢的大頭,往往是 system prompt、多輪對話、tool 使用和內部推理。這就像你去健身房狂換更輕的水壺,卻假裝看不到自己每天都在吃宵夜——方向根本錯了。

🔗 https://x.com/dickson_tsai/status/2040233121929658643

💸 有控制組的硬數據來了:導入 AI 的新創營收增 90%,資金需求降 39%

Dan McAteer 分享的這組數字值得多看兩眼,因為它不是那種「我們覺得效率變好了」的空氣文。研究顯示導入 AI 的新創團隊,營收成長達 90%,同時資本需求下降 39%,而且 AI 工具使用率顯著更高。翻成人話:AI 不只是把 demo 做得更快,而是真的開始改變小團隊的資本效率。對想用 AI 拉高槓桿、縮短到 PMF 距離的人,這比一百篇 hype 文都有用。

🔗 https://x.com/daniel_mac8/status/2040444711505105073

🍎 MLX 首日就接上 Gemma 4,Apple Silicon 本地推理生態的反應速度越來越誇張

N8Programs 這則不算大新聞,但很有味道。Gemma 4 一出,MLX 幾乎 Day-0 就跟上,代表現在開源模型從發布到 Mac 可實際上手的延遲正在快速縮短。這種生態反應速度很像你家巷口新開一家店,隔天外送平台就全上了——代表整條供應鏈已經熟到不需要熱身。

🔗 https://x.com/N8Programs/status/2040447364524110290

← 所有 Briefs