hallucination
2 篇文章
Grok 4.20 Beta:幻覺率全場最低,但智力還在追趕中
xAI 釋出 Grok 4.20 Beta API 版本。Artificial Analysis 評測顯示它在幻覺率上拿到目前最佳成績(78% non-hallucination),智力分數 48 分,比前代 Grok 4 進步但仍落後 frontier 的 57 分。定價比前代便宜,推理速度也在前沿水準。
餵了 20 篇文章給 Opus 4.6,它寫出來的 OpenClaw 設定指南能用嗎?
有人把 20+ 篇 OpenClaw 文章餵給 Opus 4.6 讓它寫 setup guide,我們拿真實環境來對照哪些是真的、哪些是幻覺