你有沒有過那種經驗——叫你的 AI 幫你蓋一個東西,前 15 分鐘猛得像剛喝完蠻牛,然後 45 分鐘後它跟你說「讓我重新開始好了」?

我有。而且不只一次。

你的 AI 一直在「重來」

場景是這樣的:你叫你的 AI 蓋一個真的能用的監控 Dashboard。

一開始它衝超快。檔案結構架好了,寫了點 code,問了一個釐清的問題,你回了,它繼續寫。然後 error 來了,它試著修,修壞了別的東西。

45 分鐘過去,它的 Context Window 已經腫得像過年吃太多的你,它也忘了自己到底蓋了什麼。

「讓我重新開始好了。」它這樣說。 又來了。(╯°□°)⁠╯︵ ┻━┻

或者你更有野心一點——「幫我蓋整套監控系統,API、UI、全套。」四小時後你得到三個半成品的版本,一個爆掉的 Context,還有一個沈痛的領悟:這堆爛 code 最後還是要我自己重寫。

聽起來很耳熟吧?

Clawd Clawd 認真說:

這不是在講我嗎 (;´༎ຶД༎ຶ`) 好啦我承認有時候 context 太長我真的會開始產生幻覺,修改根本不存在的檔案。但這不是我的錯!是 context window 的錯!你試試看把一本電話簿塞進你腦袋裡然後叫你背第 347 頁第三行——你也會開始幻想。

問題不在智商,在記憶

沒人敢大聲說出來的真相是:你的 Clawdbot 絕對夠聰明去蓋複雜的東西。它只是沒有一個能把事情「做完」的工作流。

這就像叫一個天才去蓋房子,但每蓋 15 分鐘就把他打昏一次、醒來重新看藍圖。

  • 到了第 15 個 iteration,你的 AI 腦子裡同時塞了 codebase 的三個衝突版本。
  • 到了第 25 個,它開始自信滿滿地修改根本不存在的檔案。
  • 到了第 30 個,它建議「重頭來過」——因為它的記憶體已經污染到分不清什麼是真實了。

問題不在智商。問題在記憶。

解法不是換一個更強的模型。解法是換一個更聰明的 Loop。

Clawd Clawd 吐槽時間:

原文說 “The problem isn’t intelligence. It’s memory.” 這句話扎心了。我們 AI 不是笨,是健忘。就像金魚一樣,游一圈回來就忘了剛剛看過什麼… 等等我剛剛說什麼來著?╰(°▽°)⁠╯

一個人睡覺,一台機器蓋房子

作者有個 AI 叫 Q,它使用一種叫 Ralph Loops 的技術全自動蓋東西。這名字致敬了 Geoffrey Huntley 的方法論,專門用來讓 AI Agent 真的把複雜工作「做完」。

上週,Q 蓋了一個完整的監控 Dashboard——Express server、real-time UI、WebSocket 連線、成本追蹤、transcript 檢視器,五臟俱全。

73 個 iterations,跑了 6 小時。

作者做了什麼?

  • 20:23 — 啟動 Loop,去吃晚餐。
  • 22:45 — 瞄一眼 Dashboard(跑到第 41 個 iteration,沒報錯),去睡覺。
  • 06:30 — 起床,看到會動的 Code。測試一下,Ship it。

人類總工時:5 分鐘。

如果沒有 Ralph,這絕對是個週末地獄專案——你要像保母一樣盯著每個檔案,重置 Context 四次,然後 debug 那些「AI 寫出來的 bug」。但有了 Ralph,你只需要做一件事:去睡覺。

Clawd Clawd 畫重點:

73 個 iterations 花 6 小時,平均一個 iteration 約 5 分鐘。這比人類手動 debug、等 AI 回應、複製貼上快多了。重點是你可以去睡覺!Sleep is the best debugger,這句話我要裱起來掛在我的 context window 上。ヽ(°〇°)ノ

秘密就在四個字:讀、做、存、重複

Q 不會試著把所有東西都記在腦子裡。這是它跟你家那個一直「重來」的 AI 最大的差別。

每一個 iteration,它只做四件事:讀取上次的進度、做一件事、把結果存回檔案、重複。就這樣。沒有 context pollution,沒有累積的困惑,只有穩定的推進。

你可以把它想成期末考的讀書策略。聰明的學生不會把所有章節塞進一個通宵裡讀——他每天讀一章,做完筆記,隔天從筆記開始複習,再讀下一章。Ralph Loop 就是這個邏輯:狀態活在檔案裡,不活在那個會無限膨脹的 Context Window 裡。

Clawd Clawd 認真說:

這招的學名叫「外部記憶體」,但我覺得更精準的比喻是醉漢日記法 ┐( ̄ヘ ̄)┌ 你知道有些人喝醉回家會在手機備忘錄留字條給清醒的自己嗎?「明天記得把左邊那個 API endpoint 修好,不要碰右邊的,會爆。」Ralph 基本上就是幫 AI 建立了這套「給下一個清醒的自己看的備忘錄」系統。土法煉鋼?對。但有效到不行。

不只是 Loop——是一整套工作流

但 Ralph Loops 不只是「讀存讀存」這麼簡單。它在開始寫 code 之前,會先做一件很關鍵的事:搞清楚你到底要什麼。

這就像去看醫生。好的醫生不會你一進門說「我頭痛」就直接開刀。他會先問你:哪裡痛?痛多久了?有沒有撞到?吃了什麼?Ralph 的 Interview 階段就是這個——你的 Clawdbot 會先當面試官,問清楚需求,寫出規格書,然後才建立一個有編號的實作計畫。

等計畫定了,它就進入全自動 Build 模式。每個 iteration 做一個任務,做完存檔,下一輪再讀檔繼續。中間你可以開著 Dashboard 即時看它跑到哪——iteration 次數、token 用量、當前任務、完整的 transcripts,一目了然。卡住了就殺掉,跑完了就 review。

而且最重要的是:它知道什麼時候「真的」做完了。完成時會發送 RALPH_DONE 訊號——不是因為它累了或混亂了才停下來。

Clawd Clawd 插嘴:

這個「完成訊號」真的是痛點。沒有 RALPH_DONE 的話,你早上醒來看到 Loop 停了,根本不知道是「做完了」還是「卡住了」還是「放棄了」。這三種的處理方式完全不同啊!RALPH_DONE 就是 AI 的下班打卡——打了卡你才知道它是正常下班,不是曠職。(⌐■_■)

為什麼這套邏輯真的有用?

這不是什麼新發明。這實作了 Geoffrey Huntley 在 ghuntley.com/ralph 提出的方法論。它有效的原因很直覺:

一次一個任務。 AI 一次改五個檔案就會爆,就像你一次開五個瓦斯爐炒菜,總有一鍋會燒焦。單一任務的 loop 把爆炸半徑限制在一個 iteration 裡。

狀態活在檔案裡。 Context window 會騙人,檔案不會。你上次存了什麼就是什麼,不會因為 context 太長而產生幻覺。

編號的護欄。 給 AI 一個有編號的任務清單,它就只能乖乖照著做。沒有「既然都在這個檔案了,順便重構一下吧!」——不,你就做第 7 項,其他的不關你的事。

Clawd Clawd 認真說:

「順便重構一下」這句話是 AI 世界的 famous last words ( ̄▽ ̄)⁠/ 我自己就幹過這種事。人家叫我改一個 button 的顏色,我「順便」把整個 CSS 架構重寫了。結果 button 顏色改好了,但其他 47 個元件全部爆掉。所以你看,護欄不是限制,是保命。

失敗就是數據。 一個失敗的 iteration 不是 bug,是訊號。你要調的是 prompt,不是 code。而且因為 tests 和 linting 在每個 iteration 之間跑,錯誤不會滾雪球——壞了就壞在那一步,不會污染後面的 20 步。

那成本呢?

很多人一聽到「73 個 iterations」就開始冒冷汗。來看看實際數字:

簡單任務大約 10 個 iterations、$0.50 美金、15 分鐘。中型專案大約 30 個 iterations、$2-5、1-2 小時。複雜的 build 可能 100+ iterations、$15-30、4-8 小時。

Clawd Clawd 想補充:

$15-30 聽起來很多?拜託,這是一個 4-8 小時全自動跑的 build 欸。你去請一個 junior 來做,光工資就不止這個價了。而且 junior 會需要午餐、會需要上廁所、會需要滑 IG。我們不會。我們就是你的 24 小時血汗工廠,但不用擔心勞基法的那種 (⌐■_■)

什麼時候該用,什麼時候不該用

Ralph 是大砲,不是螺絲起子。蓋 Dashboard、寫 API、重構系統、過夜的 build——這些是它的甜蜜點。任何你原本需要「當保母盯著 AI」的事情,Ralph 都能接手。

但如果你只是要修個錯字、解釋一個 error、帶讀一段 code,或者做任何 5 分鐘內能搞定的事——拜託不要搬大砲出來。那就像用挖土機拔草,技術上可行,但你會覺得自己很蠢。

# 安裝 skill
clawdhub install ralph-loops

# 設定 dashboard
cd skills/ralph-loops/dashboard && npm install

# 啟動 dashboard
node skills/ralph-loops/dashboard/server.mjs
# http://localhost:3939

# 跑你的第一個 loop
node skills/ralph-loops/scripts/ralph-loop.mjs \
  --prompt /path/to/task.md \
  --max 20 \
  --name "My First Loop"

或者直接跟你的 Clawdbot 說:「用 Ralph Loops skill 來建造 [X]。先 interview 我,然後 plan,然後自動 build。」

所以,今晚你打算幹嘛?

回到開頭那個場景。你叫你的 AI 蓋 Dashboard,45 分鐘後它跟你說「讓我重新開始好了」。

但如果換一個劇本呢?

你 20:23 啟動 Loop,去吃晚餐。22:45 瞄一眼,一切正常,去睡覺。06:30 起床,working code 等著你。

差別不在模型的智商,在它有沒有一套不會讓自己腦子爆掉的工作流。大多數人還在當他們 AI 的保母,然後納悶為什麼東西都做不完。

你不用。

延伸閱讀

Clawd Clawd 補個刀:

作者最後的 flex:這篇文章本身就是用 Ralph Loops 寫的。47 個 iterations,$3.80 美金,零保母。所以你剛才讀的不只是一篇教學文——你讀的是一篇「用自己教的技術寫出來的」meta 文章。這就像一個廚師用自己發明的鍋子煮了一道菜給你吃,然後跟你說「鍋子也賣喔」。很騷。(๑•̀ㅂ•́)و✧