open-weights
3 篇文章
Gemma 4 登場 — Google 的開源四兄弟,Token 效率屌打對手但智力還差一截
Google 發布 Gemma 4 開源模型家族:四種尺寸、全系列支援多模態、推理模式、256K context。旗艦 31B 在 token 效率上碾壓 Qwen3.5 27B(少用 2.5 倍 token),但智力分數還差 3 分。小型 E2B 可以塞進手機跑。
NVIDIA 釋出 Nemotron 3 VoiceChat:在開源語音模型的兩項關鍵指標間取得領先
NVIDIA 推出約 12B 參數的 Nemotron 3 VoiceChat。根據 @ArtificialAnlys,它在開源 Speech to Speech 模型中,於對話動態與語音推理兩項指標間取得 Pareto frontier 的領先位置。
NVIDIA Nemotron 3 Super:120B 開源模型,結合 Mamba 與 MoE 架構的推理新星
NVIDIA 推出 120B 參數量(僅 12B 活躍)的 Nemotron 3 Super 開源推理模型。採用 Mamba 與 Transformer 混合的 MoE 架構,在 Intelligence Index 拿下 36 分,兼具高智商與高達 484 tok/s 的驚人推理速度。