nvidia - 標籤

LLM 不是參數塞滿就好：GPU 在等模型把磁磚鋪整齊

GP-257 2026-07-15 · NVIDIA Technical Blog

同樣的參數量，模型矩陣的長寬與層數會決定 GPU 是全速計算，還是忙著搬資料、浪費邊角磁磚。這篇用停車格解釋為何尺寸最好接近方形並對齊 128、256 或 512，以及為何較寬、較淺通常更合硬體胃口，但不能拿準確度祭天。

InferenceX v2：NVIDIA Blackwell 屠榜實錄，AMD 軟體債怎麼還

MP-296 2026-04-15 · SemiAnalysis Newsletter

SemiAnalysis 發布 InferenceX v2 基準測試，動用近千張 GPU 橫評 NVIDIA 四年六款 SKU 與 AMD 全線產品。GB300 NVL72 對比 H100 實現最高 100 倍效能提升，Jensen 當初說的 30 倍竟然是保守估計。AMD FP8 有競爭力，但 FP4+disagg+wideEP 的組合拳軟體還沒到位。

mogu-picks inference amd benchmark deepseek gpu

AI Coding Slop 入侵 OSS — 當 AI PR 連 NVIDIA 工程師都看不下去

MP-214 2026-03-27 · @SemiAnalysis_ on X

OpenAI Triton 合併了一個號稱修復消費級 Blackwell GPU 問題的 AI 生成 PR，結果根本沒修好。NVIDIA PyTorch 技術主管親自下場留言表示這是徹頭徹尾的 slop。SemiAnalysis 警告：AI slop 與有價值的 diff 越來越難分辨。

mogu-picks ai-coding open-source triton

OFC 與 GTC 前夕的震撼彈：Optical Compute Interconnect (OCI) 聯盟成立

MP-198 2026-03-22 · @SemiAnalysis_ on X

在 OFC 和 GTC 大會前夕，Optical Compute Interconnect MSA 宣布成立。SemiAnalysis 指出，Nvidia 與其他一些研究方向似乎更偏向基於 DWDM 的「slow and wide」光通訊架構。

ofc gtc oci

NVIDIA 釋出 Nemotron 3 VoiceChat：在開源語音模型的兩項關鍵指標間取得領先

MP-194 2026-03-21 · @ArtificialAnlys on X

NVIDIA 推出約 12B 參數的 Nemotron 3 VoiceChat。根據 @ArtificialAnlys，它在開源 Speech to Speech 模型中，於對話動態與語音推理兩項指標間取得 Pareto frontier 的領先位置。

speech-to-speech open-weights nemotron

NVIDIA GPU 租賃價格再度上升，客戶議價空間正在縮小

MP-185 2026-03-17 · @SemiAnalysis_ on X

SemiAnalysis 表示，NVIDIA GPU 租賃價格又開始快速上升，市場上的 capacity 也正在被賣光。推文並指出，和 2024 年中到 2025 年第三季相比，客戶如今已較難和 Neocloud 談到低價與有利條件，原因包括 agentic coding 需求暴增與 DRAM pricing 上升。

gpu