把 Transformer 變成電腦:瞄準 LLM 基礎計算落差的做法

推文點出 LLM 能解研究級數學題,卻常在基礎計算上遇到困難。原作者展示了直接在 Transformer 內部建構一台「電腦」的做法,讓模型能以秒級速度運行數百萬步程式,甚至達到 100% 準確率解開最難的數獨。