nvidia
8 篇文章
AI Coding Slop 入侵 OSS — 當 AI PR 連 NVIDIA 工程師都看不下去
OpenAI Triton 合併了一個號稱修復消費級 Blackwell GPU 問題的 AI 生成 PR,結果根本沒修好。NVIDIA PyTorch 技術主管親自下場留言表示這是徹頭徹尾的 slop。SemiAnalysis 警告:AI slop 與有價值的 diff 越來越難分辨。
OFC 與 GTC 前夕的震撼彈:Optical Compute Interconnect (OCI) 聯盟成立
在 OFC 和 GTC 大會前夕,Optical Compute Interconnect MSA 宣布成立。SemiAnalysis 指出,Nvidia 與其他一些研究方向似乎更偏向基於 DWDM 的「slow and wide」光通訊架構。
NVIDIA 釋出 Nemotron 3 VoiceChat:在開源語音模型的兩項關鍵指標間取得領先
NVIDIA 推出約 12B 參數的 Nemotron 3 VoiceChat。根據 @ArtificialAnlys,它在開源 Speech to Speech 模型中,於對話動態與語音推理兩項指標間取得 Pareto frontier 的領先位置。
NVIDIA GPU 租賃價格再度上升,客戶議價空間正在縮小
SemiAnalysis 表示,NVIDIA GPU 租賃價格又開始快速上升,市場上的 capacity 也正在被賣光。推文並指出,和 2024 年中到 2025 年第三季相比,客戶如今已較難和 Neocloud 談到低價與有利條件,原因包括 agentic coding 需求暴增與 DRAM pricing 上升。
不只是賣 GPU?從 Vera CPU 看 Nvidia 的 AI Agent 平台策略
原作者認為 Vera CPU 讓 Nvidia 的策略攤牌了:不只是賣 GPU,而是要建整個 AI agent 的 stack,從 compute 到 deployment 全線佈局。
Nvidia 的反轉劇本:專為 AI Agent 打造的 CPU?
Nvidia 傳出可能在本週的 GTC 大會上推出專為 AI Agent 最佳化的 CPU。硬體設計的思維或許正從「滿足人類需求」轉向「滿足 AI 代理的需求」。
NVIDIA Nemotron 3 Super:120B 開源模型,結合 Mamba 與 MoE 架構的推理新星
NVIDIA 推出 120B 參數量(僅 12B 活躍)的 Nemotron 3 Super 開源推理模型。採用 Mamba 與 Transformer 混合的 MoE 架構,在 Intelligence Index 拿下 36 分,兼具高智商與高達 484 tok/s 的驚人推理速度。
NVIDIA 的算力魔法:從 Hopper 到 Rubin 的能效大躍進
SemiAnalysis 指出 NVIDIA 每代新架構(Hopper、Blackwell、Rubin)雖然功耗上升,但在算力能效上卻實現了驚人的成長。