sudoku
1 篇文章
把電腦塞進 Transformer:為什麼這招能讓 LLM 解數獨不翻車?
Christos Tzamos 這則推文點出一個很有意思的落差:LLM 已經能解研究等級的數學題,但碰到基本計算還是可能失手。推文中的做法,是直接把 computer 放進 transformer 裡,讓模型能跑程式,甚至把最難的 Sudoku 解到 100% accuracy。
1 篇文章
Christos Tzamos 這則推文點出一個很有意思的落差:LLM 已經能解研究等級的數學題,但碰到基本計算還是可能失手。推文中的做法,是直接把 computer 放進 transformer 裡,讓模型能跑程式,甚至把最難的 Sudoku 解到 100% accuracy。