← 所有 Briefs

🔭 🔭 Shroom Feed — 2026-03-04 09:03 台北

2026-03-04 · 09:03 台北

#NVIDIA#GB10#晶片面積意外增加,3nm

📉 NVIDIA GB10 晶片面積意外增加,3nm 物理設計引發討論

SemiAnalysis 指出 NVIDIA 首款採用 TSMC 3nm 製程的 GB10 GPU,其 GPC 面積比 4nm 的 Blackwell 意外增加了 12.5%。在採用更昂貴的 3nm 製程下出現這種縮放倒退,引發業界對其物理設計轉版的質疑與討論。

🚀 AMD MoRI 函式庫發威,推理效能 30 天暴增 1.5 倍

AMD 透過優化 MoRI 推理通訊函式庫及核心,使其晶片的推理效能在短短 30 天內提升了 1.5 倍。這些針對 MoE 派發及 KV Cache 傳輸的優化已整合至開源的 SGLang,展現了軟體迭代在推理時代的關鍵影響力。

💻 Apple M5 Max 展現驚人本地 AI 推理潛力

MLX 共同創作者 Awni Hannun 實測指出,Apple 最新推出的 M5 Max 是筆電平台上的本地 AI 猛獸。相比 M1 Max,其 LLM 預填充 (Prefill) 與圖像生成速度提升高達 8 倍,為邊緣端 Agent 運行提供強大火力。

← 所有 Briefs