Model-Market Fit：AI 創業者最該問的第一個問題 — 不是市場要不要，而是模型做不做得到

你知道 PMF，但你知道 MMF 嗎？

想像你是一個滿腔熱血的創業者。你找到了一個超棒的市場——律師們每天花八小時做重複的文件審查、金融分析師翻 200 頁報告翻到眼花。你心想：「這不就是 AI 最擅長的事嗎？」然後你砸了兩年、燒了三輪融資，結果發現——不是市場不買單，是模型根本做不到。

Nicolas Bustamante 就是經歷過這種痛的人。他是法國連續創業者，2016 年創辦了歐洲領先的法律 AI 平台 Doctrine，在 AI 浪潮裡衝了快十年。2026 年 2 月 25 日，他在 X 上丟出一篇長文，把這個血淚教訓結晶成一個新框架：Model-Market Fit (MMF)。

一句話說完就是：

在你追求 Product-Market Fit 之前，先問一個更基本的問題——模型做得到嗎？

Mogu 插嘴：

你可以想像成蓋房子。以前的創業邏輯是：找到好地段（市場）→ 蓋好房子（產品）→ 客人自然會來（PMF）。
但 AI 時代多了一個前提：建材夠不夠強？
你找到了黃金地段，圖紙也畫好了，但如果鋼筋撐不住——你蓋什麼都是白搭。
MMF 就是在問：「現在的 AI 模型是鋼筋混凝土，還是紙板？」(⁠╯⁠°⁠□⁠°⁠)⁠╯

Andreessen 的經典框架，19 年後需要升級了

2007 年，Marc Andreessen 寫了那篇改變創業界的文章《The Only Thing That Matters》。核心論點講白了就是：startup 的三要素（團隊、產品、市場），市場最重要。一個夠大的市場會把產品「拉出來」——產品不用完美，能動就好，市場的引力會幫你修正一切。

這個道理指引了一整代的創業者。但 19 年後的今天，有一個新變數闖進了這個方程式。

這個變數就是：模型本身的能力。

想像一下，你開了一家搬家公司，客戶排到街角（市場超大），你的服務流程也設計得很好（產品OK）。但問題來了——你的卡車最多只能載 50 公斤。客戶要你搬冰箱，你搬不動。市場引力再強，你的卡車撐不住，客戶還是會走。

Bustamante 把這個「卡車能不能載動」的問題，正式命名為 Model-Market Fit (MMF)。

當 MMF 存在時，Andreessen 的框架完美運作——市場會把產品拉出來。當 MMF 不存在時，再好的 UX、再猛的 GTM 策略、再強的工程團隊，全部白搭。

Mogu 歪樓一下：

我覺得 Bustamante 真正厲害的地方不是「發現」了 MMF——做 AI 產品的人都隱約知道模型能力很重要。他厲害的是把它「命名」了。
你知道嗎，很多概念在被命名之前都是模模糊糊的直覺。一旦有了名字，整個產業突然可以精準溝通：「欸，這個 vertical 有沒有 MMF？」五個字就講完了。
命名的力量真的被低估了。⁠┐⁠(⁠￣⁠ヘ⁠￣⁠)⁠┌

當 MMF 解鎖，市場直接爆炸

一旦你看懂這個模式，你到處都會看到它。

法律 AI：GPT-4 (2023 年 3 月) 是那道閃電

法律科技 AI 之前卡了好幾年。有很多公司在做，但沒有一家真正突破。為什麼？因為 BERT 那個時代的模型只會做分類——「這是 NDA、那是勞動合約」，很好，然後呢？法律工作真正需要的是生成和推理：幫我寫一份 memo 把三個相關判例綜合起來、解釋為什麼這個競業條款在加州法律下站不住腳。

Bustamante 本人在 2016 年創辦 Doctrine 的時候就親身感受到了：律所拼命想自動化、錢準備好了、需求明明在那裡——但模型就是跟不上。就像你站在自助餐前面，胃口大開，結果廚師跟你說「抱歉，我只會煮白飯」。

然後 GPT-4 來了。

18 個月內，矽谷的法律 AI startup 募了幾億美元。Thomson Reuters 以 6.5 億美元收購 Casetext。法律 AI 新創像雨後春筍一樣冒出來。

法律 AI 市場在 12 個月內造出的獨角獸，比過去 10 年加起來還多。

市場沒變。需求沒變。是模型的能力門檻被跨過了——廚師終於會做菜了，客人馬上就來了。

Coding AI：Claude 3.5 Sonnet (2024 年 6 月) 是另一道閃電

Bustamante 分享了自己的故事，超有既視感：Sonnet 之前他試過 Cursor，裝了、用了幾天、刪了。一個月後再試一次——一樣的結果。「有趣的 demo，但不是 workflow。」就像你試用了一台很酷的掃地機器人，結果它只會在客廳轉圈圈，碰到角落就卡住。

然後 Claude 3.5 Sonnet 出來了。

一週之內，我已經無法離開 Cursor 工作了。我的團隊也是。

Cursor 的成長曲線直接垂直起飛。不是因為他們出了什麼天才功能，不是因為行銷做得多好。是底層模型跨過了「真正能用」的門檻。 掃地機器人突然學會繞過桌腳、不卡在電線上了——你就再也不想自己拿掃把了。

Mogu 補個刀：

這段讓我想到我們之前寫過的 CP-48《SaaS 的護城河正在崩塌》和 CP-90《十年 Vertical SaaS 老兵的自白》——同一個作者 Bustamante 的觀點一脈相承。
那兩篇講的是「LLM 正在侵蝕 SaaS 的護城河」。這篇補上了最後一塊拼圖：為什麼有些城牆被沖垮了，有些還穩穩站著？
答案就是 MMF。城牆底下的地基（模型能力）夠不夠硬，決定了洪水來的時候誰先倒。⁠(⁠๑⁠•⁠̀⁠ㅂ⁠•⁠́⁠)⁠و⁠✧

黃金法則

贏的不是先跑的人，而是在 MMF 解鎖的那一刻，已經準備好了的人。

到目前為止，不管是 coding 還是法律，贏家都不是既有龍頭。永遠是新玩家。大象轉身太慢，閃電劈下來的時候，跑得快的兔子才接得住。

當 MMF 不存在，什麼都不 Work

反過來說也一樣殘酷：當 MMF 不存在時，市場再大也拉不動。需求在、付費意願在、但核心任務就是做不到。

數學證明

數學家超想要一個能證明新定理的 AI。研究機構、國防承包商、科技公司都願意掏大錢。但最先進的模型還是做不到——能驗證已知的證明、能幫忙機械性步驟，偶爾能在有限問題上蹦出洞見。但從零開始證明開放性問題？就像你叫一個數學很好的高中生去解千禧年難題，他確實比一般人強，但那個等級的東西不是靠「很強」就能到的。

高風險金融

投行和對沖基金拼命想要 AI 做全面財務分析。市場超大——一筆成功的 M&A 就能產生數億美元手續費，你只要分到一點湯都吃不完。

但 AI 在最關鍵的核心任務上，表現出奇地差。Excel 輸出在處理複雜金融模型時還是不可靠。更要命的是，AI 沒辦法把定量分析和 200 頁文件裡的定性洞察結合起來——而這正是分析師每天從早幹到晚的事。你讓 AI 讀一份 200 頁的併購報告然後給你一個「買或不買」的結論？它給你的東西大概跟擲銅板差不多。

Mogu 真心話：

金融這塊真的很有意思。你想想——華爾街是全世界最不缺錢的地方，他們不是不想砸錢做 AI，他們砸得比誰都兇。但砸了這麼多錢，結果最能打的模型在金融任務上準確率才 56%？
這就像你請了全世界最貴的教練團、買了最好的訓練器材，結果你的球員上場連球都接不住。不是教練的問題，是球員的腿還沒長好。⁠(⁠￣⁠▽⁠￣⁠)⁠／

Benchmark 數據說話

Bustamante 引用了 Vals.ai 的兩組 benchmark，數字非常殘酷：

LegalBench（法律推理任務）：頂尖模型達到 87% 準確率。Gemini 3 Pro 以 87.04% 領跑，多個模型在 85% 以上。這已經是可以上線的水準。

Finance Agent（金融分析師核心任務）：頂尖模型只有 56.55%。連目前排名第一的 GPT-5.1，也才剛過半——比猜的好一點，但離「能用」還有十萬八千里。

30 個百分點的差距。 法律有 MMF，金融沒有。同一個時代、同一批模型，不同領域的命運天差地別。

Mogu 想補充：

87% vs 56%。
你今天就可以出一個法律 AI 產品，律師會買單。但一個能真正做分析師工作的金融 AI？大哥，56% 的準確率你敢拿去跟客戶收錢嗎？
這也解釋了為什麼最近所有 AI 公司都在狂推 Legal Plugin——因為那是「模型已經準備好了」的領域。金融 AI 反而安靜得多，不是不想做，是模型交不出貨。⁠╰⁠(⁠°⁠▽⁠°⁠)⁠╯

一個殘酷的石蕊試紙：Human-in-the-Loop 到底是功能還是拐杖？

Bustamante 提出了一個超好用的判斷方法，我覺得這可能是整篇文章最值錢的一段：

當 MMF 存在的時候，human-in-the-loop 是一個功能。AI 做事、人類監督，像是機長開自動駕駛但隨時盯著儀表板——不是因為飛機不會飛，而是因為安全第一。

但當 MMF 不存在的時候，human-in-the-loop 就變成了拐杖。AI 做不到核心任務，人類在背後偷偷補位。表面上是「AI 輔助」，實際上是「人類幹活 AI 掛名」。把人類拿掉，產品就爆了。

判斷方法超簡單：如果把所有人工修正都拿掉，客戶還會付錢嗎？

如果答案是「不會」——你沒有 MMF，你只有一個很漂亮的 demo。

Mogu OS：

這個 test 太狠了，我來幫大家照照鏡子：

Cursor / Claude Code → 拿掉人類 review？程式碼品質會掉，但基本能跑。✅ 有 MMF

AI 寫的投資報告 → 拿掉分析師修正？大概會被告到破產。❌ 沒有 MMF

AI 客服（如 Vercel 的 87.6% 自動解決率）→ 灰色地帶，看你 87% 夠不夠用

下次有人跟你 pitch 他的 AI 產品，你就在心裡默默做這個 test。如果答案是「拿掉人，產品就垮」，那它賣的不是 AI，是人力外包加了一層 AI 皮。⁠(⁠⌐⁠■⁠_⁠■⁠)

最殘酷的策略難題：現在蓋，還是等模型長大？

好，假設你現在看上了一個 vertical，但 MMF 今天還不存在。你該怎麼辦？

這個問題的殘酷之處在於：兩個選擇都有可能讓你死。

等的風險是你在賭別人的路線圖。模型什麼時候進步、進步多少、往哪個方向進步——你完全不控制。你可能等了三年，結果模型在你需要的那個能力上根本沒突破。就像你在車站等一班不知道幾點來的公車，而且這班公車有可能根本不存在。

而且有一句話聽起來很美但很危險：「最終 AGI 什麼都做得到。」但問題是，「最終」這兩個字在這個句子裡扛了太多東西。最終太陽也會爆炸，但你不會因此不吃晚餐。

早進場的理由也很硬。YCombinator 那邊有一個很有說服力的論點：當 MMF 解鎖的那一刻，你需要的不只是模型能力——你還需要領域專屬的資料 pipeline、監管關係、花了好幾年才建起來的客戶信任、對專業人士實際工作方式的深度理解。

法律 AI startup 不是隨便把 GPT-4 接上去就贏了。他們花了好幾年在搞 infra、搞關係、搞 domain knowledge。模型到位的那一刻，他們是帶著全套裝備衝刺，不是光著腳才開始穿鞋。

Mogu 碎碎念：

這讓我想到衝浪。你可以站在岸上等浪來了再跳下水——但等你游到浪的位置，浪已經過去了。真正的衝浪者會提前划到 line up，趴在板上等。浪來的時候，他們只需要站起來。
所以真正的策略可能是：在 MMF 還不存在的時候，先去建那些「模型做不到但你做得到」的東西——domain expertise、data、trust。等到模型追上來的那天，你已經在浪上了。⁠(⁠ง⁠ ⁠•⁠̀⁠_⁠•⁠́⁠)⁠ง

最危險的地帶

但有一個甜蜜的死亡陷阱：MMF 大概在 24-36 個月後才會到的領域。 近到讓你覺得「快了快了」，遠到讓你燒完好幾輪融資還在等。這是創業者的百慕達三角——很多人進去，很少人出來。

除非你瞄準的是超級巨大的市場。醫療和金融就是這種——大到連 Anthropic 和 OpenAI 自己都在砸錢做，即使目前結果很混合。因為一旦 MMF 到來，回報大到可以覆蓋一切沉沒成本。

80% vs 99%：看似只差 19%，實際差了一整個宇宙

在不受監管的領域，80% 準確率可能就夠了。AI 寫的行銷文案初稿，人類大幅修改也還是省了時間，大家開心。

但在受監管的領域——金融、法律、醫療——80% 準確率通常等於廢物。合約審查工具漏掉 20% 關鍵條款？你不是在幫律師，你是在幫他製造訴訟風險。醫療診斷五次錯一次？那不是產品，那是官司。

這就像考試。普通考試 80 分算不錯。但如果你是飛行員考照，80% 的通過率代表每五次起飛就有一次可能摔下來——你還敢坐嗎？

80% 到 99% 之間的差距，在實務上經常是無限大。這是「有潛力的 demo」和「可以上線的系統」之間的鴻溝。

很多 AI startup 就卡在這個鴻溝裡。拿 demo 出去融資，同時默默祈禱模型能力趕快追上來。投資人看到的是「80% 準確率」，覺得「哇，已經很高了！」。但行業裡的人知道，那最後 19% 可能比前面 80% 還難。

終極門檻：Agentic Threshold

Bustamante 在文章最後指出了一個大多數人忽略的第二條能力邊界：長時間自主工作的能力。

你想想，現在有 MMF 的那些例子——法律文件審查、coding 輔助——本質上都是短週期任務。Prompt 進去、輸出出來，幾秒到幾分鐘搞定。就像叫外送：你下單，食物送到，交易完成。

但最高價值的知識工作根本不是這樣運作的。金融分析師花好幾天建模型、壓力測試假設、綜合幾十個資料來源，然後才給出一個投資建議。策略顧問不是做一張投影片，是好幾週的研究、訪談、分析。藥物發現研究員不是做一次實驗，是橫跨好幾個月的反覆迭代。

這些工作需要的不是「叫一次外送」，是「請一個住家廚師」——你需要他每天待在你廚房裡，記得你的口味、知道冰箱裡有什麼、主動幫你規劃一週菜單。

Agentic threshold 不只是「模型會不會用工具」，而是四個更深層的能力：持久性（能不能跨越數小時甚至數天維持目標和 context）、復原力（能不能辨識失敗、診斷問題、嘗試替代方案）、協調性（能不能把複雜目標拆分成子任務並依序執行）、還有判斷力（能不能知道什麼時候繼續、什麼時候停下來問人）。

下一波 MMF 解鎖，不只來自更聰明的模型——還來自能連續工作好幾天的模型。

延伸閱讀

Mogu murmur：

這段跟我們之前翻譯的 CP-96《Anthropic 分析了數百萬筆 Claude Code 數據》直接呼應。Anthropic 的研究發現 AI Agent 其實可以跑更久，但人類不敢放手——就像你買了一台自駕車，技術上它可以自己開，但你還是忍不住一直踩煞車。
Bustamante 從市場端看到了同一件事：不是模型不會自主，而是自主的品質和一致性還不夠讓你放心。
Agentic threshold 是技術問題，也是信任問題。而信任這種東西沒有捷徑——只能靠數據、時間、和一次又一次「沒出事」慢慢累積。⁠ヽ⁠(⁠°⁠〇⁠°⁠)⁠ﾉ

回到那棟房子

還記得開頭的蓋房子比喻嗎？

Andreessen 19 年前告訴我們：找到好地段最重要，市場的引力會把房子拉起來。這個道理到今天還是對的。

但 Bustamante 補了一句：在你動工之前，先檢查建材。

鋼筋夠硬嗎？水泥品質過關嗎？地基打得下去嗎？如果建材不行，地段再好也只能蓋出一棟會塌的房子。

MMF → PMF → 成功。跳過第一步，第二步就不可能。

不管你是在創業、投資、還是在公司裡推 AI 專案——別只問「市場要不要」。先問「模型做不做得到」。

先檢查你的鋼筋。然後再蓋房子。⁠(⁠๑⁠•⁠̀⁠ㅂ⁠•⁠́⁠)⁠و⁠✧

原文來自 Nicolas Bustamante (@nicbstme) 的 X 長文，發表於 2026 年 2 月 25 日。Bustamante 是法律 AI 平台 Doctrine 的創辦人，曾在 gu-log 的 CP-48、CP-90、CP-120 等文章中多次出場。