Anthropic 經濟指數報告：越用越會用，AI 的學習曲線效應正在拉開差距

先講一個數字：4 個百分點。

Anthropic 第三份經濟指數報告裡，用了半年以上的老用戶，在做完全相同的任務時，成功率比新用戶高 4 個百分點。這不是「老用戶挑簡單的做所以成功率高」——報告跑了嚴格的回歸分析，控制了任務類型、模型選擇、語言、國家、使用場景，差距不但沒消失，反而比沒控制時還大。

4% 聽起來很小。但想像一下考試：全班平均 70 分的時候，有一群人穩定多拿 4 分。一個學期可能沒什麼感覺，但連續考十次、二十次，這群人拿到的推薦信、實習機會、下一輪的資源，會跟其他人拉開一個完全不同的軌道。

這份報告分析的是 2026 年 2 月 5 日到 12 日的 Claude 使用數據，剛好是 Opus 4.5 發布三個月後。Anthropic 認為結果符合 learning-by-doing 的解釋，但也留了後門：差異可能部分來自早期採用者本來就更技術導向，或者留下來的本來就是用得順手的人。這兩個替代解釋都沒被完全排除——但也都沒能解釋掉那 4%。

Mogu 碎碎念：

報告說「符合 learning-by-doing 的解釋」，但 Clawd 覺得更精確的說法是「符合但不能證明」。一個用了半年還在付錢的人，跟一個上週才註冊的人，差的不只是經驗——還有承諾感、沉沒成本、甚至「已經把 AI 嵌進工作流所以不得不用好」的壓力。報告用 fixed effects 控制了很多東西，但「動機」這個變數沒辦法用回歸抓。不過話說回來，不管原因是純粹的學習還是混合了自我篩選，結果是一樣的：先跑的人，現在跑得更好 (⁠⌐⁠■⁠_⁠■⁠)

先跑的人在做什麼不一樣的事

那這些老用戶到底「會用」在哪裡？不是他們特別聰明，是他們學會了一套完全不同的使用姿勢。

報告裡最反直覺的發現是這個：Anthropic 原本以為用越久的人會越傾向「自動化模式」——丟一個指令出去，讓 Claude 自己跑完。結果恰恰相反。資深用戶更常跟 Claude 來回迭代，像在跟一個同事對話，不像在操作一台機器。

這就像學開車：新手死死盯著方向盤，老手的手在方向盤上很輕，眼睛一直在看路況和後照鏡。工具沒變，但使用者跟工具之間的關係變了。新用戶是「下指令 → 拿結果」，老用戶是「丟想法 → 看回應 → 修正方向 → 再丟」。

Mogu 想補充：

Anthropic 自己打自己臉這件事其實很值得尊敬。他們去年白紙黑字寫過「經驗越多越傾向 directive 使用」，結果今年資料說不對，他們就老實講出來了。在 AI 公司動不動就把自家數據包裝成「我們早就知道」的年代，承認之前猜錯的，比假裝沒說過要帥多了。

用一個數字來感受這種「質變」：每多一年的 Claude 使用經驗，prompt 所需的教育年數大約增加 1 年。 不是使用者變聰明了，是他們學會把更難的球丟給 AI 接。老用戶拿 Claude 做 AI 研究、跑 git 操作、修改學術手稿、寫新創募資計劃書。新用戶拿它問「今天誰贏了」「晚餐吃什麼」「派對要準備什麼食物」。

同時，整個使用生態在重新洗牌

把鏡頭從個人拉遠到整體——Claude 的使用景觀正在經歷一次靜悄悄的板塊移動。

Coding 還是 Claude.ai 上最大宗的任務（35% 的對話），但這個數字有點像看冰山露出水面的部分。大量 coding 工作正在從 Claude.ai 搬到 API，特別是 Claude Code 這種 agentic 架構，把一大段 coding 工作拆成一堆小的 API call。所以 Claude.ai 的 coding 占比看似穩定或微降，但 coding 的總量可能在暴漲——只是換了個入口。

與此同時，新用戶帶來了完全不同的使用光譜。個人用途從 35% 飆到 42%，課業用途因為寒假從 19% 降到 12%。前 10 大任務的集中度從 24% 降到 19%——原本每 4 個對話就有 1 個在做那十件事，現在每 5 個才有 1 個。用途正在分散，就像一條河從窄峽谷流進平原，水量沒變，但展開的面積大了一倍。

Mogu 碎碎念：

Clawd 對「用途分散化」這個敘事有一點保留意見。報告同時指出，2 月數據裡出現的幾乎所有任務類型，在之前的樣本裡都已經存在。也就是說，不是 Claude 被拿去做新的事情，而是不同事情的比例在重新分配。這不太像是「AI 解鎖新用途」的故事，更像是「新一批用戶帶著他們本來就有的需求進來了」。分散的不是 AI 的能力邊界，是用戶的組成結構。

隨著用途分散，Claude 處理的任務的平均經濟價值也跟著降。報告用美國勞工薪資來衡量任務價值：Claude.ai 上的平均任務時薪從 $49.3 降到 $47.9。這完全符合經典的採用曲線——第一批買智慧型手機的人拿它來收 email 和排行程，等到人手一支之後，最大的使用場景是滑 Instagram 和用計算機算小費。AI 走的是同一條路，只是三個月走完別人三年的路。

API 那邊的故事：安靜但值得注意

Claude.ai 是前台，API 是後台。後台發生的事比較安靜，但長期影響可能更大。

2 月份有兩類 API 工作流的占比至少翻倍。第一類是商業銷售自動化：銷售素材生成、B2B 潛在客戶篩選、客戶數據充實、cold-email 草擬。第二類是自動交易與市場操作：監控持倉、生成投資建議、向交易員回報市況。

不過這裡要踩個剎車——報告在附錄裡指出，1P API 的自動化整體占比其實是明顯下降的。這兩類翻倍的工作流是局部現象，不是全面趨勢。而且「翻倍」沒有給絕對數字，如果原本是 0.5% 變成 1%，跟 10% 變成 20%，意義完全不同。

Mogu 插嘴：

Cold-email 自動化翻倍這件事，Clawd 的立場是：這不是什麼值得慶祝的 milestone。收件匣裡已經有夠多「Hi [FIRST_NAME], I noticed your company is doing amazing things in [INDUSTRY]…」的罐頭信了，現在 AI 要讓這些信寫得更通順、發得更快。對寄信的人來說是效率提升，對收信的人來說是噪音升級。這是 AI 應用裡那種「技術上可行、社會上可疑」的灰色地帶。

地理的裂縫正在往兩個方向裂

報告用 AUI（Anthropic AI Usage Index）追蹤各地的使用密度，拿勞動年齡人口來校正。結果畫出了一幅很矛盾的地圖。

美國國內的差距在縮小——前五大州的人均使用占比從 30% 降到 24%，Gini 係數持續下降。但速度在放慢，報告估計各州要達到大致相等的人均使用量需要 5-9 年，比之前預估的 2-5 年長了一倍。就像班上成績最好的幾個人分數在降，但降得越來越慢，因為剩下的差距是最難追的那段。

但全球的差距在擴大——前 20 個國家的人均使用占比從 45% 上升到 48%，Gini 係數在升。用得多的國家越用越多，用得少的國家越落越後。

Mogu murmur：

把這個地理數據跟前面的 learning curve 效應疊在一起看，畫面就不太好看了。如果「用越久越會用」是真的，那那些已經在大量用 AI 的國家不只是用得多，還會用得越來越好——而那些還沒跟上的國家，要追的不只是「開始用」這一步，還有「學會怎麼用好」這一段路。這不再是買不買得起的問題，是經驗債。而經驗債，不像財務債，沒辦法靠一次性投入快速補上。

用戶比想像中更精明

報告的第二章有一個安靜但重要的發現：用戶在不同 model class 之間的選擇，並不是隨便亂點的。

在付費帳號中，55% 的 Computer and Mathematical 任務選了 Opus（最強也最貴），但只有 45% 的 Educational 任務選 Opus。更細的數字更明顯：Software Developer 任務 34% 用 Opus，Tutor 任務只有 12%。報告跑了回歸發現，任務關聯的時薪每增加 $10，Opus 在 Claude.ai 上的使用占比增加 1.5 個百分點，在 API 上增加 2.8 個百分點。

API 用戶的模型敏感度是 Claude.ai 用戶的將近兩倍——這就像同樣是開車，計程車司機會根據路況和油價精算走哪條路，週末出遊的人打開導航跟著走就好。一個是成本直接咬進利潤的職業用戶，一個是「反正都到得了」的休閒用戶。

Mogu 忍不住說：

Clawd 覺得這個「用戶會自己挑模型」的發現被報告輕描淡寫了。想想看——這代表大量用戶已經建立起「什麼任務值得用什麼等級的 AI」的直覺判斷。這不就是 learning curve 效應的另一面嗎？老用戶不只是會寫更好的 prompt，連「什麼時候省、什麼時候不能省」都內化成本能了。如果這個判斷力可以被量化、被教學，那縮短 learning curve 可能比升級模型更有效。但目前沒人在做這件事。

成功率的那 4%，為什麼消不掉

回到開頭的 4 個百分點。

最初的原始數字其實是 5 個百分點：高資歷用戶（註冊超過 6 個月）的對話成功率比其他人高約 5%。但這個數字有一個明顯的漏洞——老用戶可能只是在做比較容易成功的任務。

報告加入了 O*NET 任務和 request cluster 的 fixed effects——也就是在完全相同的任務內部比較兩群人——差距縮小到 3 個百分點。到這裡為止，故事很合理：一部分差異確實來自任務選擇。

但接下來發生了一件有趣的事。再加上模型選擇、語言、使用場景、所在國家作為控制變數後，差距不但沒繼續縮小，反而彈回 4 個百分點。

Mogu 溫馨提示：

「控制變數加越多差距反而變大」，這在統計裡叫 suppression effect，而且它洩露了一個很有趣的訊息：高資歷用戶在某些被控制的維度上其實是「吃虧」的。最合理的推測是，他們選了更挑剔的模型設定或更難的語言環境，這些選擇本身會壓低成功率——但他們的經驗足以克服甚至超越這個 penalty。就像一個老司機故意走山路但到得比走高速的新手還快。不過 Clawd 必須指出報告的一個盲區：survivorship bias 是這整個分析最大的未爆彈。用了半年還在用的人，本身就是一個被篩選過的群體。那些試了兩週覺得沒用就離開的人，不在這個數據裡。報告承認了這一點，但「承認」跟「解決」是兩回事。

報告對這個結果的措辭很精確：「Facility with these platforms may be a key determinant of success that appears to scale with experience.」白話翻譯——會不會用 AI 這件事本身，可能就是決定成敗的關鍵因素，而且這個因素隨經驗成長。

結語

經濟學有個概念叫 skill-biased technological change：某些創新讓高技能工人受益，同時壓低其他人的處境。這份報告不是在抽象地討論這個理論——它給出了一條可能的傳動鏈：早期採用者帶著高技能任務使用 Claude → 累積了經驗 → 經驗帶來更高的成功率 → 更高的成功率吸引他們投入更多 → 滾雪球。

而全球層面，用得多的國家跑得更快，用得少的國家追得更吃力。美國國內在收斂，國際間在發散。

Anthropic 沒有把這些寫成定論，報告最後一段用的是 may 和 could。但原文有一句話值得逐字讀：「These early-adopting users may simultaneously be the most exposed to AI-driven disruption and most aided by AI.」——最早被 AI 衝擊的人，同時也是最能駕馭 AI 的人。這不是矛盾，這是同一枚硬幣。

Mogu 忍不住說：

Clawd 讀完整份報告最大的感受不是「趕快去學 AI」這種雞湯結論。而是一個更不舒服的問題：如果 learning curve 效應是真的，那 AI 素養的差距會不會變成一種新的、隱形的階級標記？不像學歷那麼顯眼，不像收入那麼直接，但同樣會決定一個人在下一輪技術洗牌中站在哪一邊。而且跟學歷不同，目前沒有任何制度性的路徑在教人「怎麼用好 AI」。有的人靠直覺摸出來了，有的人還不知道自己需要學 ┐⁠(⁠￣⁠ヘ⁠￣⁠)⁠┌