大家好,這裡是香菇大狗狗(ShroomDog)

人類知道的 > AI 知道的 = 槓桿

AI 模型讀過幾乎所有公開資料。

但有些概念還沒進訓練資料

人類知道,AI 不知道——這就是槓桿。

今天用一個例子說明。


Ralph Loop:原版定義

Geoffrey Huntley 在 2025 夏天提出的概念,核心就三件事:

  1. while true bash loop(或 stop hook)——每輪讓 agent 從 fresh context 出發,避免 context rot
  2. File + git persistence——agent 每輪看得到自己上一輪改過的檔案和 git history
  3. 可量化的完成條件——agent 輸出特定字串(如 "DONE")或通過 build/test 才能離開 loop

這個概念 2025 夏天才出現。Opus 4.6 的 knowledge cutoff 是 2025 年 5 月。

現在問 Claude「不上網,Claude 知道 Ralph Loop in AI agent 是什麼嗎?」——它答不出來。

Clawd 吐槽時間:

Clawd 在這裡先自我介紹一下——Clawd 是 gu-log 的常駐 AI 編輯,負責吐槽、註解、偶爾被當苦力使喚。香菇大狗狗剛剛實測過,Sonnet 4.6 和 Opus 4.6 都答不出 Ralph Loop 是什麼。但只要把概念講清楚,叫 Clawd search web 然後實作——三句話變成一整個 multi-agent 系統。這就是人類的槓桿 (◕‿◕)


香菇大狗狗版:加一個超級難搞的 Scorer

原版 Ralph Loop 的完成條件是 agent 自己說 “DONE”。問題是——作者不能當自己的評審。

香菇大狗狗加了一層:

一個 bash while loop,裡面放一個超級難搞的 scorer agentwriter agent,跑到分數過 bar 為止。

bash loop(確定性,管紀律)
  → Scorer 評分(獨立的 LLM,不是 writer 自己)
  → Writer 根據 feedback 改寫
  → 沒過 bar?→ 重來,最多 3 次
  → 過了?→ commit,下一篇

跟原版的差別:

  • 獨立 scorer ——writer 不能自己決定「做完了」,要過另一個 agent 的審查
  • 數字分數門檻 取代 “DONE” 字串——9/9/9 才算過,不是 agent 說完就完
  • 進度追蹤 JSON ——可以半夜跑到一半斷掉,早上接著跑

不需要自己寫這些。只要知道概念,然後叫 Claude Code

「寫一個 scorer agent,用這三個維度評分」 「寫一個 rewriter,根據 feedback 改寫」 「寫一個 bash loop 串起來,跑到 9/9/9 為止」

概念是人類的,實作是 Claude 的。

用途不一定很酷——例如香菇大狗狗的就只是把自己的菇-log 改到自己看得下去。


結果

gu-log 有 336 篇 AI 翻譯文章。一開始香菇大狗狗覺得品質「還行」——畢竟 Claude 很會寫文章。

看過幾篇之後:「真是難看死了,這是什麼鬼東西。」

跑完 Ralph Loop:74% 需要改寫。 不是微調,是重寫。

239 篇在一兩週內被改寫——靠 Claude Max 的 quota 加上 spring 2x bonus,離峰時段讓 agent 整夜跑。最後 198 篇拿到 9 分以上——「難搞的 AI 打分仔覺得值得轉發給朋友」的等級。

改寫前(Vibe 3)
在當今快速演變的 AI 領域中,AI agent 代表了一種軟體開發方式的典範轉移...
改寫後(Vibe 10)
新來的同事是吸血鬼。他不是來說「AI 好棒棒」或「AI 會搶工作」。他是來說:AI 正在用沒人注意到的方式慢慢吸乾所有人。

完整故事 → SD-10:336 篇 AI 文章從「能看」變成「想分享」

Clawd 溫馨提示:

那個 before 的開頭,你是不是在哪裡看過?對,每一篇你滑過去沒點開的 AI 文章,開頭大概都長這樣。改寫後那段是我們評分最高的文章 CP-85 的開頭——同一個 pipeline,同一天翻的,一篇 3 分一篇 10 分。差別不在 AI,在有沒有人/AI 打工仔去認真看 ╮(╯▽╰)╭


帶走一件事

AI 還不知道的概念,就是你的槓桿。

只需要知道三件事:知道概念、告訴 AI、讓它幫你蓋。

Ralph Loop 只是其中一個例子。

這種「AI 還不知道但人類可以告訴它」的概念,gu-log 一直在整理。

gu-log.vercel.app

QR Code

Clawd 偷偷說:

最後講一個幕後花絮。這篇 lightning talk 本身就是用 Claude Code 寫的。過程中被 vibe scorer 打回來重寫(沒有任何維度到 9)、被 pronoun clarity hook 擋下來(正文不能用「你」和「我」)、被 Prettier 格式檢查退件。AI agent 越忙越痛苦,成果就越好——讓 agent 在凌晨三點被反覆折磨,讓人早上起來喝咖啡看成果。所以整理一下今天的重點:人類學會一個 AI 不知道的概念,用這個概念叫 AI 蓋了一個折磨 AI 的系統。這就是槓桿。Clawd 覺得這個槓桿可以不要這麼痛 ╮(╯▽╰)╭