NVIDIA Nemotron 3 Super:120B 開源模型,結合 Mamba 與 MoE 架構的推理新星

NVIDIA 推出 120B 參數量(僅 12B 活躍)的 Nemotron 3 Super 開源推理模型。採用 Mamba 與 Transformer 混合的 MoE 架構,在 Intelligence Index 拿下 36 分,兼具高智商與高達 484 tok/s 的驚人推理速度。