on-device-ai - 標籤

Gemma 4 登場 — Google 的開源四兄弟，Token 效率屌打對手但智力還差一截

MP-275 2026-04-10 · @ArtificialAnlys on X

Google 發布 Gemma 4 開源模型家族：四種尺寸、全系列支援多模態、推理模式、256K context。旗艦 31B 在 token 效率上碾壓 Qwen3.5 27B（少用 2.5 倍 token），但智力分數還差 3 分。小型 E2B 可以塞進手機跑。

AI 不用再背九九乘法表了：Reasoning 和 Tool Calling 如何讓小模型跑出大模型的水準

MP-147 2026-03-09 · @awnihannun on X

Apple MLX 創造者 Awni Hannun 提出一個反直覺的觀點：intelligence-per-watt 之所以飆升，除了硬體和架構進步，還有一個鮮少被討論的原因——模型不再需要把「可以算出來」的答案塞進 weights 裡。Reasoning 和 tool calling 讓模型把計算外包出去，釋放出大量的 weight 空間。這意味著 5B-15B 的小模型，理論上可能達到今天 GPT-5.x 的水準——雖然沒有人真正知道天花板在哪。

awni-hannun mlx model-efficiency reasoning