InferenceX v2:NVIDIA Blackwell 屠榜實錄,AMD 軟體債怎麼還

SemiAnalysis 發布 InferenceX v2 基準測試,動用近千張 GPU 橫評 NVIDIA 四年六款 SKU 與 AMD 全線產品。GB300 NVL72 對比 H100 實現最高 100 倍效能提升,Jensen 當初說的 30 倍竟然是保守估計。AMD FP8 有競爭力,但 FP4+disagg+wideEP 的組合拳軟體還沒到位。

GTC 2026:Nvidia 的 Inference 版圖持續擴張 — Groq IP 授權交易、LPU 解碼、CPO 光學路線圖

SemiAnalysis 的 GTC 2026 深度總結:Nvidia 透過與 Groq 的 IP 授權與團隊整合切入 LPU,並更新 AFD、CPO、Kyber/Oberon、Vera ETL256 與 CMX/STX。重點是 Nvidia 正在往更完整的 inference 與資料中心系統版圖延伸。

OpenAI × Cerebras:Codex-Spark 寫 code 快 15 倍 — 但代價是什麼?

OpenAI 今天發布 GPT-5.3-Codex-Spark,第一個跑在 Cerebras 晶圓級晶片上的模型。每秒 1000+ tokens、延遲降 80%、首 token 快 50%。但它是縮小版模型,不跑測試、只限 Pro 用戶。這不只是一個新模型,是 OpenAI 首次在生產環境用非 Nvidia 晶片——AI 算力的版圖正在重劃。