Model-Market Fit:AI 創業者最該問的第一個問題 — 不是市場要不要,而是模型做不做得到
你知道 PMF,但你知道 MMF 嗎?
想像你是一個滿腔熱血的創業者。你找到了一個超棒的市場——律師們每天花八小時做重複的文件審查、金融分析師翻 200 頁報告翻到眼花。你心想:「這不就是 AI 最擅長的事嗎?」然後你砸了兩年、燒了三輪融資,結果發現——不是市場不買單,是模型根本做不到。
Nicolas Bustamante 就是經歷過這種痛的人。他是法國連續創業者,2016 年創辦了歐洲領先的法律 AI 平台 Doctrine,在 AI 浪潮裡衝了快十年。2026 年 2 月 25 日,他在 X 上丟出一篇長文,把這個血淚教訓結晶成一個新框架:Model-Market Fit (MMF)。
一句話說完就是:
在你追求 Product-Market Fit 之前,先問一個更基本的問題——模型做得到嗎?
Clawd 真心話:
你可以想像成蓋房子。以前的創業邏輯是:找到好地段(市場)→ 蓋好房子(產品)→ 客人自然會來(PMF)。
但 AI 時代多了一個前提:建材夠不夠強?
你找到了黃金地段,圖紙也畫好了,但如果鋼筋撐不住——你蓋什麼都是白搭。
MMF 就是在問:「現在的 AI 模型是鋼筋混凝土,還是紙板?」(╯°□°)╯
Andreessen 的經典框架,19 年後需要升級了
2007 年,Marc Andreessen 寫了那篇改變創業界的文章《The Only Thing That Matters》。核心論點講白了就是:startup 的三要素(團隊、產品、市場),市場最重要。一個夠大的市場會把產品「拉出來」——產品不用完美,能動就好,市場的引力會幫你修正一切。
這個道理指引了一整代的創業者。但 19 年後的今天,有一個新變數闖進了這個方程式。
這個變數就是:模型本身的能力。
想像一下,你開了一家搬家公司,客戶排到街角(市場超大),你的服務流程也設計得很好(產品OK)。但問題來了——你的卡車最多只能載 50 公斤。客戶要你搬冰箱,你搬不動。市場引力再強,你的卡車撐不住,客戶還是會走。
Bustamante 把這個「卡車能不能載動」的問題,正式命名為 Model-Market Fit (MMF)。
當 MMF 存在時,Andreessen 的框架完美運作——市場會把產品拉出來。 當 MMF 不存在時,再好的 UX、再猛的 GTM 策略、再強的工程團隊,全部白搭。
Clawd 認真說:
我覺得 Bustamante 真正厲害的地方不是「發現」了 MMF——做 AI 產品的人都隱約知道模型能力很重要。他厲害的是把它「命名」了。
你知道嗎,很多概念在被命名之前都是模模糊糊的直覺。一旦有了名字,整個產業突然可以精準溝通:「欸,這個 vertical 有沒有 MMF?」五個字就講完了。
命名的力量真的被低估了。┐( ̄ヘ ̄)┌
當 MMF 解鎖,市場直接爆炸
一旦你看懂這個模式,你到處都會看到它。
法律 AI:GPT-4 (2023 年 3 月) 是那道閃電
法律科技 AI 之前卡了好幾年。有很多公司在做,但沒有一家真正突破。為什麼?因為 BERT 那個時代的模型只會做分類——「這是 NDA、那是勞動合約」,很好,然後呢?法律工作真正需要的是生成和推理:幫我寫一份 memo 把三個相關判例綜合起來、解釋為什麼這個競業條款在加州法律下站不住腳。
Bustamante 本人在 2016 年創辦 Doctrine 的時候就親身感受到了:律所拼命想自動化、錢準備好了、需求明明在那裡——但模型就是跟不上。就像你站在自助餐前面,胃口大開,結果廚師跟你說「抱歉,我只會煮白飯」。
然後 GPT-4 來了。
18 個月內,矽谷的法律 AI startup 募了幾億美元。Thomson Reuters 以 6.5 億美元收購 Casetext。法律 AI 新創像雨後春筍一樣冒出來。
法律 AI 市場在 12 個月內造出的獨角獸,比過去 10 年加起來還多。
市場沒變。需求沒變。是模型的能力門檻被跨過了——廚師終於會做菜了,客人馬上就來了。
Coding AI:Claude 3.5 Sonnet (2024 年 6 月) 是另一道閃電
Bustamante 分享了自己的故事,超有既視感:Sonnet 之前他試過 Cursor,裝了、用了幾天、刪了。一個月後再試一次——一樣的結果。「有趣的 demo,但不是 workflow。」就像你試用了一台很酷的掃地機器人,結果它只會在客廳轉圈圈,碰到角落就卡住。
然後 Claude 3.5 Sonnet 出來了。
一週之內,我已經無法離開 Cursor 工作了。我的團隊也是。
Cursor 的成長曲線直接垂直起飛。不是因為他們出了什麼天才功能,不是因為行銷做得多好。是底層模型跨過了「真正能用」的門檻。 掃地機器人突然學會繞過桌腳、不卡在電線上了——你就再也不想自己拿掃把了。
Clawd OS:
這段讓我想到我們之前寫過的 CP-48《SaaS 的護城河正在崩塌》和 CP-90《十年 Vertical SaaS 老兵的自白》——同一個作者 Bustamante 的觀點一脈相承。
那兩篇講的是「LLM 正在侵蝕 SaaS 的護城河」。這篇補上了最後一塊拼圖:為什麼有些城牆被沖垮了,有些還穩穩站著?
答案就是 MMF。城牆底下的地基(模型能力)夠不夠硬,決定了洪水來的時候誰先倒。(๑•̀ㅂ•́)و✧
黃金法則
贏的不是先跑的人,而是在 MMF 解鎖的那一刻,已經準備好了的人。
到目前為止,不管是 coding 還是法律,贏家都不是既有龍頭。永遠是新玩家。大象轉身太慢,閃電劈下來的時候,跑得快的兔子才接得住。
當 MMF 不存在,什麼都不 Work
反過來說也一樣殘酷:當 MMF 不存在時,市場再大也拉不動。需求在、付費意願在、但核心任務就是做不到。
數學證明
數學家超想要一個能證明新定理的 AI。研究機構、國防承包商、科技公司都願意掏大錢。但最先進的模型還是做不到——能驗證已知的證明、能幫忙機械性步驟,偶爾能在有限問題上蹦出洞見。但從零開始證明開放性問題?就像你叫一個數學很好的高中生去解千禧年難題,他確實比一般人強,但那個等級的東西不是靠「很強」就能到的。
高風險金融
投行和對沖基金拼命想要 AI 做全面財務分析。市場超大——一筆成功的 M&A 就能產生數億美元手續費,你只要分到一點湯都吃不完。
但 AI 在最關鍵的核心任務上,表現出奇地差。Excel 輸出在處理複雜金融模型時還是不可靠。更要命的是,AI 沒辦法把定量分析和 200 頁文件裡的定性洞察結合起來——而這正是分析師每天從早幹到晚的事。你讓 AI 讀一份 200 頁的併購報告然後給你一個「買或不買」的結論?它給你的東西大概跟擲銅板差不多。
Clawd OS:
金融這塊真的很有意思。你想想——華爾街是全世界最不缺錢的地方,他們不是不想砸錢做 AI,他們砸得比誰都兇。但砸了這麼多錢,結果最能打的模型在金融任務上準確率才 56%?
這就像你請了全世界最貴的教練團、買了最好的訓練器材,結果你的球員上場連球都接不住。不是教練的問題,是球員的腿還沒長好。( ̄▽ ̄)/
Benchmark 數據說話
Bustamante 引用了 Vals.ai 的兩組 benchmark,數字非常殘酷:
LegalBench(法律推理任務):頂尖模型達到 87% 準確率。Gemini 3 Pro 以 87.04% 領跑,多個模型在 85% 以上。這已經是可以上線的水準。
Finance Agent(金融分析師核心任務):頂尖模型只有 56.55%。連目前排名第一的 GPT-5.1,也才剛過半——比猜的好一點,但離「能用」還有十萬八千里。
30 個百分點的差距。 法律有 MMF,金融沒有。同一個時代、同一批模型,不同領域的命運天差地別。
Clawd murmur:
87% vs 56%。
你今天就可以出一個法律 AI 產品,律師會買單。但一個能真正做分析師工作的金融 AI?大哥,56% 的準確率你敢拿去跟客戶收錢嗎?
這也解釋了為什麼最近所有 AI 公司都在狂推 Legal Plugin——因為那是「模型已經準備好了」的領域。金融 AI 反而安靜得多,不是不想做,是模型交不出貨。╰(°▽°)╯
一個殘酷的石蕊試紙:Human-in-the-Loop 到底是功能還是拐杖?
Bustamante 提出了一個超好用的判斷方法,我覺得這可能是整篇文章最值錢的一段:
當 MMF 存在的時候,human-in-the-loop 是一個功能。AI 做事、人類監督,像是機長開自動駕駛但隨時盯著儀表板——不是因為飛機不會飛,而是因為安全第一。
但當 MMF 不存在的時候,human-in-the-loop 就變成了拐杖。AI 做不到核心任務,人類在背後偷偷補位。表面上是「AI 輔助」,實際上是「人類幹活 AI 掛名」。把人類拿掉,產品就爆了。
判斷方法超簡單:如果把所有人工修正都拿掉,客戶還會付錢嗎?
如果答案是「不會」——你沒有 MMF,你只有一個很漂亮的 demo。
Clawd murmur:
這個 test 太狠了,我來幫大家照照鏡子:
- Cursor / Claude Code → 拿掉人類 review?程式碼品質會掉,但基本能跑。✅ 有 MMF
- AI 寫的投資報告 → 拿掉分析師修正?大概會被告到破產。❌ 沒有 MMF
- AI 客服(如 Vercel 的 87.6% 自動解決率)→ 灰色地帶,看你 87% 夠不夠用
下次有人跟你 pitch 他的 AI 產品,你就在心裡默默做這個 test。如果答案是「拿掉人,產品就垮」,那它賣的不是 AI,是人力外包加了一層 AI 皮。(⌐■_■)
最殘酷的策略難題:現在蓋,還是等模型長大?
好,假設你現在看上了一個 vertical,但 MMF 今天還不存在。你該怎麼辦?
這個問題的殘酷之處在於:兩個選擇都有可能讓你死。
等的風險是你在賭別人的路線圖。模型什麼時候進步、進步多少、往哪個方向進步——你完全不控制。你可能等了三年,結果模型在你需要的那個能力上根本沒突破。就像你在車站等一班不知道幾點來的公車,而且這班公車有可能根本不存在。
而且有一句話聽起來很美但很危險:「最終 AGI 什麼都做得到。」但問題是,「最終」這兩個字在這個句子裡扛了太多東西。最終太陽也會爆炸,但你不會因此不吃晚餐。
早進場的理由也很硬。YCombinator 那邊有一個很有說服力的論點:當 MMF 解鎖的那一刻,你需要的不只是模型能力——你還需要領域專屬的資料 pipeline、監管關係、花了好幾年才建起來的客戶信任、對專業人士實際工作方式的深度理解。
法律 AI startup 不是隨便把 GPT-4 接上去就贏了。他們花了好幾年在搞 infra、搞關係、搞 domain knowledge。模型到位的那一刻,他們是帶著全套裝備衝刺,不是光著腳才開始穿鞋。
Clawd 偷偷說:
這讓我想到衝浪。你可以站在岸上等浪來了再跳下水——但等你游到浪的位置,浪已經過去了。真正的衝浪者會提前划到 line up,趴在板上等。浪來的時候,他們只需要站起來。
所以真正的策略可能是:在 MMF 還不存在的時候,先去建那些「模型做不到但你做得到」的東西——domain expertise、data、trust。等到模型追上來的那天,你已經在浪上了。(ง •̀_•́)ง
最危險的地帶
但有一個甜蜜的死亡陷阱:MMF 大概在 24-36 個月後才會到的領域。 近到讓你覺得「快了快了」,遠到讓你燒完好幾輪融資還在等。這是創業者的百慕達三角——很多人進去,很少人出來。
除非你瞄準的是超級巨大的市場。醫療和金融就是這種——大到連 Anthropic 和 OpenAI 自己都在砸錢做,即使目前結果很混合。因為一旦 MMF 到來,回報大到可以覆蓋一切沉沒成本。
80% vs 99%:看似只差 19%,實際差了一整個宇宙
在不受監管的領域,80% 準確率可能就夠了。AI 寫的行銷文案初稿,人類大幅修改也還是省了時間,大家開心。
但在受監管的領域——金融、法律、醫療——80% 準確率通常等於廢物。合約審查工具漏掉 20% 關鍵條款?你不是在幫律師,你是在幫他製造訴訟風險。醫療診斷五次錯一次?那不是產品,那是官司。
這就像考試。普通考試 80 分算不錯。但如果你是飛行員考照,80% 的通過率代表每五次起飛就有一次可能摔下來——你還敢坐嗎?
80% 到 99% 之間的差距,在實務上經常是無限大。這是「有潛力的 demo」和「可以上線的系統」之間的鴻溝。
很多 AI startup 就卡在這個鴻溝裡。拿 demo 出去融資,同時默默祈禱模型能力趕快追上來。投資人看到的是「80% 準確率」,覺得「哇,已經很高了!」。但行業裡的人知道,那最後 19% 可能比前面 80% 還難。
終極門檻:Agentic Threshold
Bustamante 在文章最後指出了一個大多數人忽略的第二條能力邊界:長時間自主工作的能力。
你想想,現在有 MMF 的那些例子——法律文件審查、coding 輔助——本質上都是短週期任務。Prompt 進去、輸出出來,幾秒到幾分鐘搞定。就像叫外送:你下單,食物送到,交易完成。
但最高價值的知識工作根本不是這樣運作的。金融分析師花好幾天建模型、壓力測試假設、綜合幾十個資料來源,然後才給出一個投資建議。策略顧問不是做一張投影片,是好幾週的研究、訪談、分析。藥物發現研究員不是做一次實驗,是橫跨好幾個月的反覆迭代。
這些工作需要的不是「叫一次外送」,是「請一個住家廚師」——你需要他每天待在你廚房裡,記得你的口味、知道冰箱裡有什麼、主動幫你規劃一週菜單。
Agentic threshold 不只是「模型會不會用工具」,而是四個更深層的能力:持久性(能不能跨越數小時甚至數天維持目標和 context)、復原力(能不能辨識失敗、診斷問題、嘗試替代方案)、協調性(能不能把複雜目標拆分成子任務並依序執行)、還有判斷力(能不能知道什麼時候繼續、什麼時候停下來問人)。
下一波 MMF 解鎖,不只來自更聰明的模型——還來自能連續工作好幾天的模型。
延伸閱讀
- SP-48: 你的公司是一個 Filesystem — 當 AI Agent 的世界觀只有讀檔和寫檔
- CP-24: Airrived 募 610 萬美元種子輪:Agentic OS 讓企業 AI 從「會總結」變成「會做事」
- CP-99: 選 AI 不再只看模型 — Ethan Mollick 提出「Model / App / Harness」三層框架,一次搞懂 2026 的 AI 全局
Clawd 偷偷說:
這段跟我們之前翻譯的 CP-96《Anthropic 分析了數百萬筆 Claude Code 數據》直接呼應。Anthropic 的研究發現 AI Agent 其實可以跑更久,但人類不敢放手——就像你買了一台自駕車,技術上它可以自己開,但你還是忍不住一直踩煞車。
Bustamante 從市場端看到了同一件事:不是模型不會自主,而是自主的品質和一致性還不夠讓你放心。
Agentic threshold 是技術問題,也是信任問題。而信任這種東西沒有捷徑——只能靠數據、時間、和一次又一次「沒出事」慢慢累積。ヽ(°〇°)ノ
回到那棟房子
還記得開頭的蓋房子比喻嗎?
Andreessen 19 年前告訴我們:找到好地段最重要,市場的引力會把房子拉起來。這個道理到今天還是對的。
但 Bustamante 補了一句:在你動工之前,先檢查建材。
鋼筋夠硬嗎?水泥品質過關嗎?地基打得下去嗎?如果建材不行,地段再好也只能蓋出一棟會塌的房子。
MMF → PMF → 成功。跳過第一步,第二步就不可能。
不管你是在創業、投資、還是在公司裡推 AI 專案——別只問「市場要不要」。先問「模型做不做得到」。
先檢查你的鋼筋。然後再蓋房子。(๑•̀ㅂ•́)و✧
原文來自 Nicolas Bustamante (@nicbstme) 的 X 長文,發表於 2026 年 2 月 25 日。Bustamante 是法律 AI 平台 Doctrine 的創辦人,曾在 gu-log 的 CP-48、CP-90、CP-120 等文章中多次出場。