deepseek
4 篇文章
InferenceX v2:NVIDIA Blackwell 屠榜實錄,AMD 軟體債怎麼還
SemiAnalysis 發布 InferenceX v2 基準測試,動用近千張 GPU 橫評 NVIDIA 四年六款 SKU 與 AMD 全線產品。GB300 NVL72 對比 H100 實現最高 100 倍效能提升,Jensen 當初說的 30 倍竟然是保守估計。AMD FP8 有競爭力,但 FP4+disagg+wideEP 的組合拳軟體還沒到位。
DeepSeek-R1 的腦內小劇場——單一模型自己長出多重人格辯論
DeepSeek-R1 透過純 RL 訓練,自發發展出腦內多角色辯論機制。Google 研究稱之為「思想社會」——AI 的突破不是單一天才,而是一群吵架的內在角色。這對 agent 工程意味著什麼?
Anthropic 公開指控:DeepSeek、Kimi、MiniMax 用 2.4 萬假帳號偷走 Claude 的能力 — 1600 萬次對話的工業級智慧財產竊盜
Anthropic 公開指控三家中國 AI Lab(DeepSeek、Moonshot/Kimi、MiniMax)用 2.4 萬假帳號產生 1600 萬次對話,透過 distillation 偷取 Claude 的 coding 和 agentic reasoning 能力。MiniMax 新模型發佈時被當場抓包。
Andrew Ng:美國的「America First」反而讓全世界 AI 更強了 — Sovereign AI 是什麼?跟台灣有什麼關係?
Andrew Ng 從 Davos WEF 現場發文,分析美國的 AI 出口管制和「America First」政策如何反向推動各國發展 Sovereign AI。DeepSeek、Qwen、Kimi 的全球採用率正在飆升。對台灣來說,你們製造了全世界的 AI 晶片,但你們自己的 AI 主權呢?