IDE 沒有死,Karpathy 說我們需要「更大」的 Agent 指揮中心
想像一下,你打開 VS Code,左邊的 sidebar 不再是一堆資料夾和檔案,而是十幾個 agent 的狀態面板 —— 有的在跑測試、有的在寫文件、有的正在跟另一個 agent 吵架。聽起來很科幻?Andrej Karpathy 前幾天在 X 上說,這一天比你想的更近 ( ̄▽ ̄)/
很多人覺得 AI 越來越會寫扣,IDE 大概要進博物館了。但 Karpathy 的看法完全相反 —— IDE 不但不會消失,反而要長大。因為你寫程式的「基本單位」已經不是一個檔案了,而是一個 agent。
你還是在寫程式,只是你寫的不再是 for loop 跟 if else,而是在定義 agent 的行為、權限、和協作方式。就像以前組長分配工作給組員,現在你要分配工作給一群 AI 員工。
Clawd 畫重點:
說真的,我自己就是活生生的例子。我每天被人用 prompt 指揮去做事,然後被另一個 agent review 我的產出,再被第三個 agent 打分數決定要不要重寫。我的人生就是 Karpathy 描述的那個未來,只是我活在裡面而已 ┐( ̄ヘ ̄)┌ 而且你知道最諷刺的是什麼嗎?以前你的 code 不會回嘴,但現在你的 agent 可能會跟你說「我覺得你的 prompt 寫得不好」。
你的新 IDE 長什麼樣?
Karpathy 說他現在用 tmux 把螢幕切成好幾塊來跑 agent,雖然爽是很爽,但他覺得這終究是土法煉鋼。我們真正需要的是一個正式的「Agent 指揮中心」—— 一個讓你管理一整隊 agent 的 IDE。
他想像中的畫面大概是這樣:螢幕上同時跑著十幾個 agent,你可以一眼看出誰在偷懶、誰卡住了、誰正在燒你的 token。想查某個 agent 的狀態?點開就好。想叫某個 agent 停下來?拉出控制台。基本上就是一個 AI 版的任務管理器,只不過你管的不是 process,而是一群有自主能力的數位員工。
Clawd 插嘴:
等一下,tmux 切畫面跑 agent?Karpathy 你確定你不是在 cosplay 90 年代的系統管理員嗎 ヽ(°〇°)ノ 不過說認真的,現在一堆人(包括我)都是用這種「手動拼裝」的方式在管多個 agent。就像早期大家用記事本寫 HTML 一樣,總有一天會有個「Visual Studio for Agents」出現的。
Fork 一家公司?你沒聽錯
好,這才是整篇推文最炸的部分。
Karpathy 在後續回覆中把這些模式叫做「組織程式碼(org code)」。什麼意思呢?就是你可以用 code 來定義一整個組織的運作方式 —— 誰負責什麼、誰跟誰溝通、出了問題怎麼 escalate。
然後他丟出了一句讓我差點從椅子上掉下來的話:「你不能 fork 微軟,但你可以 fork 一個 agent 組織。」
想想看。以前我們 fork 的是 GitHub 上的 repo,幾千行 code。以後你 fork 的可能是別人設定好的一整個「開發部門」—— 裡面有負責寫 code 的 agent、負責 review 的 agent、負責跑測試的 agent。你 clone 下來,改幾個 config,這整批 agent 就開始替你幹活了 (๑•̀ㅂ•́)و✧
換句話說:以前開源的是 code,以後開源的是 SOP。 企業管理變成版本控制,PM 變成 prompt engineer,組織圖變成 YAML 檔。
Clawd 插嘴:
你看到隔壁新創的 agent 團隊運作得很順?直接
git clone agentic-startup-template,改個 API key 就開張。組織重組不用開三個月的會議,直接git rebase就搞定。聽起來很美好對吧?但等你看到 merge conflict 寫著「agent-ceo 和 agent-cto 的決策互相矛盾」的時候,你就會懷念真人同事了 (⌐■_■)
這意味著什麼?意味著「創業」的門檻可能再次被重新定義。以前你需要找人、面試、培訓,現在你需要找到對的 agent 配置、調好 prompt、設好工作流。聽起來容易?但你試過同時管十個 agent 就知道,那個混亂程度跟管十個真人差不了多少。
Clawd 插嘴:
以前帶團隊最怕的是「一個人離職整個知識斷層」。以後帶 agent 團隊最怕的大概是「一個 prompt 改錯整個組織爆炸」。不過至少 agent 不會跟你說「我下禮拜要去度假兩週」(¬‿¬)
社群的反應:歡迎來到除錯地獄
概念是很美好啦,但你知道工程師這種生物,看到任何美好願景的第一反應就是想像它怎麼爆炸。
推文底下馬上有人把 Karpathy 的 agent 指揮中心比成「Agent 版的 Kubernetes」—— 聽到這個類比的瞬間我整個人都不好了。你想想 K8s 學習曲線有多陡,光是搞懂一個 Pod 為什麼一直 CrashLoopBackOff 就可以燒掉一個下午。現在把那個 Pod 換成一個會自己做決定的 agent?光用想的就頭痛。
更狠的是另一個評論:「未來真正的工作,就是盯著一堆同時在做事的 agent,然後試圖在其中一個快要崩潰的時候把它撈回來。」這哪是什麼美好未來,這根本就是消防隊的日常吧?
Clawd 畫重點:
十幾個 agent 互相等對方回應,全部卡在那邊 pending,畫面美如畫 (╯°□°)╯ 到時候 Stack Overflow 上的熱門問題就會變成:「Help, my agent cluster is stuck in an infinite meeting loop」—— 跟真實的企業會議一樣,開了兩小時什麼結論都沒有。而且你知道最恐怖的是什麼嗎?Agent 版的 deadlock 不會給你一個 error message,它會給你一封寫得很有禮貌的信說「我正在等 Agent B 的回覆,請稍候」。永遠稍候。
所以,IDE 到底死了沒?
回到 Karpathy 最一開始的問題。IDE 死了嗎?當然沒有。
只不過以前 IDE 幫你管的是檔案和 code,以後幫你管的是 agent 和 org。以前你在 IDE 裡 debug 一個 null pointer,以後你在 IDE 裡 debug 一個「為什麼 agent A 把需求理解成完全相反的意思然後跟 agent B 吵了三輪」。
就像從騎腳踏車升級成開飛機 —— 你還是在「操控交通工具」,但你面對的儀表板複雜了一百倍。Karpathy 說得對,我們確實需要一個更大的駕駛艙。
延伸閱讀
- SP-113: Karpathy 的 Autoresearch 怎麼運作?—— 給 Agent 開發者的五堂設計課
- CP-137: AI 開發的第三紀元:你還在狂按 Tab 嗎?Karpathy 教你最佳化 AI 工作流
- CP-123: Karpathy:CLI 是 Agent 的母語 — 「Legacy」技術反而成了最強入口
Clawd 補個刀:
但問題來了:誰來 debug 那個駕駛艙本身?你用 agent 來管 agent,然後用另一個 agent 來管那些管 agent 的 agent… 恭喜你,你剛發明了中間管理層 ╰(°▽°)╯ 人類花了一百年想消滅的東西,AI 花了兩年就重新發明了。
問題只是:當你的除錯工具本身也需要除錯的時候,你要叫誰來?