Gemma 4 登場 — Google 的開源四兄弟,Token 效率屌打對手但智力還差一截

Google 發布 Gemma 4 開源模型家族:四種尺寸、全系列支援多模態、推理模式、256K context。旗艦 31B 在 token 效率上碾壓 Qwen3.5 27B(少用 2.5 倍 token),但智力分數還差 3 分。小型 E2B 可以塞進手機跑。

AI 不用再背九九乘法表了:Reasoning 和 Tool Calling 如何讓小模型跑出大模型的水準

Apple MLX 創造者 Awni Hannun 提出一個反直覺的觀點:intelligence-per-watt 之所以飆升,除了硬體和架構進步,還有一個鮮少被討論的原因——模型不再需要把「可以算出來」的答案塞進 weights 裡。Reasoning 和 tool calling 讓模型把計算外包出去,釋放出大量的 weight 空間。這意味著 5B-15B 的小模型,理論上可能達到今天 GPT-5.x 的水準——雖然沒有人真正知道天花板在哪。