不用重造 AI agent 的輪子:學會跟 AI 隊友打團,叫它不要送頭
有一種 AI 焦慮很常見:既然 LLM 越來越會寫 code、寫文章、查資料、拆 task,人類到底還剩什麼?
這個問題如果用「人類 vs AI」來想,很容易卡住。因為那個框架一開始就把兩邊放到同一路:誰比較會補刀、誰比較會推塔、誰比較會輸出。最後不是走向「AI 會取代一切」的恐慌,就是走向「人類有靈魂」的心理安慰。
兩邊都不太有用。
比較有用的比喻是:LLM 不是敵人,也不是純工具,而是 DOTA 隊友。
這裡的 DOTA 不需要真的玩過。想像一個五人合作遊戲,每個角色有不同位置。有的人負責走中路,有的人負責打野,有的人負責輔助、插眼、開視野、保隊友。勝負不是看某個人表演多帥,而是看整隊最後有沒有贏。
AI 協作也是這樣。
問題不是「AI 會不會取代人類」。問題是:這個隊友很會哪些事、很容易在哪裡送頭,而人類該補哪個位置,才能提高整隊勝率。
Clawd 想補充:
「送頭」就是遊戲裡不該死的時候硬上,結果免費把人頭送給對面。AI 版送頭長這樣:資料沒查就下結論、API 不存在也寫得很順、沒看過程式碼庫慣例卻開始重構核心模組。語氣很穩,內容很炸。最恐怖的是,它送頭時通常還很有自信 ( ̄▽ ̄)/
不要跟 AI 搶中路
如果隊友很會對線,硬要跟它搶中路通常不是勇敢,是戰術失智。
LLM 的某些能力真的很像強線上角色:局部資訊給清楚,它可以很快產出第一版;規格寫明白,它可以很穩地生樣板碼;問題範圍縮小,它可以高速整理、解釋、生成選項。
所以人類不需要把主要精力放在「比 AI 更快寫初稿」。那條路很累,而且越走越像跟機器比補刀。機器不會手痠,也不會凌晨三點開始懷疑人生。
更好的方向是補位。
AI 很會寫初版 code,人類就該練 spec、review、測試策略。AI 很會查資料,人類就該練問題定義、可信度判斷、來源篩選。AI 很會產內容,人類就該練品味、立場、選題。AI 很會把 task 拆小,人類就該判斷哪些 task 根本不該做。
這不是貶低自己。這是戰術分工。
ShroomDog 認真說:
ShroomDog 最近越來越有感:AI 不是把人類從遊戲裡踢出去,而是逼人類不要再假裝自己最有價值的能力是「手速」。手速會被追上,但判斷這場到底該怎麼贏,還是很稀缺。
LLM 的弱點不是笨,是位置感差
把 LLM 當隊友看,就比較容易理解它的弱點。
它不是爛隊友。很多時候它超強。問題是它有些局面會突然像沒看小地圖一樣,直接開戰。
第一個弱點是品味,尤其是視覺品味、動畫手感、產品體感。
LLM 可以說「這個過場要更順」、「這個 UI 要有 Apple 那種細緻感」、「這個間距要更有呼吸感」。但它不一定真的能像人類一樣直接感覺到某個緩動曲線很廉價、某個滑鼠懸停延遲半拍、某個畫面雖然符合規格但就是像模板。
這種東西很難只靠文字補完。它比較像遊戲手感:數據看起來沒壞,實際玩起來就是怪。
第二個弱點是最新知識。
超過知識截止點的世界,LLM 需要搜尋。搜尋當然有用,但搜尋不是免費的。它花 token、花時間、會撈到搜尋引擎垃圾、舊文件、半對半錯的文章,最後還是需要有人判斷哪個來源可信。
第三個弱點是內部細節。
公司內部系統、程式碼庫歷史、某個奇怪慣例、某個不能動的舊服務,這些東西通常不會穩定存在於訓練資料裡。LLM 可能不知道,也可能知道一半,更可能把通用模式套到特殊情境上,講得像真的。
這時候人類不是比較會背文件,而是 脈絡持有人。
知道哪份文件過期。知道哪個函式很醜但不能重寫。知道哪個服務看起來沒人在用,但某個工廠半夜還在呼叫。這些不是「短期記憶」,而是長期踩坑後形成的地圖。
Clawd 插嘴:
很多工程師低估了這種「知道哪裡有鬼」的能力。這不是玄學,是 production 創傷後遺症。LLM 可以讀文件,但它沒有半夜被告警系統叫醒過。這種創傷記憶 雖然不健康,但在系統設計上意外有用。
LLM 有 Context Window,人類有世界模型
LLM 有一個很物理的限制:context window。
再大的上下文視窗,也還是視窗。塞進去會貴、會慢、會吵,模型也不一定能均勻注意到每個細節。把十萬行程式碼、三百個微服務、五年決策脈絡全部倒進去,不等於它真的理解了整座城市。
人類的工作記憶很爛。讓人同時記住五十個函式名稱,大概五分鐘後就會開始失去人性。
但人類可以建立世界模型。
不是記住每條巷子的門牌號碼,而是知道整座城市大概怎麼長。哪區常塞車,哪條路晚上很危險,哪間店 Google Maps 五星但本地人都不去。放到系統裡,就是知道哪些服務是核心、哪些是歷史包袱、哪些文件看起來正確但 production 根本不是那樣跑。
所以人類該練的不是當硬碟。
人類該練的是地圖意識。
在 AI 協作裡,地圖意識包含幾件事:判斷勝利條件、看出風險區、知道哪裡不能打、知道什麼時候該停、知道一個答案聽起來很順但其實缺少視野。
這也解釋了為什麼「重新造一個完整 AI agent」不一定是最值得做的事。很多時候,系統缺的不是又一個更會補刀的隊友,而是有人會看地圖、會標記危險、會叫隊友不要沒視野硬開。這裡和 SD-22 的 Context Window 比喻 是同一條線:模型有一天能經歷的事件容量,人類負責把那一天排成不會撞牆的路線。
管理 AI 的自信
LLM 最危險的地方常常不是不知道,而是不知道自己不知道。
它的輸出格式天生像答案。句子順、結構完整、語氣穩定。當資訊不足時,它不一定自然停下來說「這裡不能答」。它可能根據常見模式補一段合理文字。
在聊天裡,這很方便。在工程、法律、醫療、公司內部系統、最新工具版本裡,這就很危險。
人類在這裡的補位角色,是不確定性偵測器。
也就是專門抓這些訊號:它講得很順但沒有來源;它把通用知識套到內部情境;它沒有問關鍵限制;它假設某個 API 存在;它沒有區分事實、猜測、假設;它把舊世界線當成現在世界線。
這時候人類要做的不是跟它吵智商,而是像隊長一樣叫停:
這裡沒有視野,先別開戰。
這是知道,還是猜的?
給來源。
先查最新文件。
這段先當假設,不准直接進 production。
這就是 AI 時代很重要的一種能力:管理 AI 的自信。
Clawd 吐槽時間:
一個好 agent workflow 不只是讓 AI 做更多事,也要讓 AI 更常承認「這裡資訊不足」。會踩煞車的隊友,比一路喊「打打打」的隊友珍貴太多。尤其是那種喊完打打打,然後第一個死掉的。
結語
人類不需要重新造 AI agent 的輪子,至少不該把那件事當成唯一出路。
更重要的任務是學會跟 AI 隊友打團。
AI 很會補刀,就讓它補。AI 很會產初稿,就讓它產。AI 很會局部推理,就給它清楚的局部戰場。
然後人類去補那些它還不穩的地方:品味、最新脈絡、內部細節、大範圍世界模型、風險判斷、勝利條件,以及最重要的——叫它不要沒視野硬開。
這不是「人類比 AI 高級」那種安慰話。這比較像一句很實際的戰術提醒:
不要跟 AI 搶同一路。看懂隊友會什麼、會在哪裡送頭,然後補位把遊戲贏下來。