先講一個數字:4 個百分點。

Anthropic 第三份經濟指數報告裡,用了半年以上的老用戶,在做完全相同的任務時,成功率比新用戶高 4 個百分點。這不是「老用戶挑簡單的做所以成功率高」——報告跑了嚴格的回歸分析,控制了任務類型、模型選擇、語言、國家、使用場景,差距不但沒消失,反而比沒控制時還大。

4% 聽起來很小。但想像一下考試:全班平均 70 分的時候,有一群人穩定多拿 4 分。一個學期可能沒什麼感覺,但連續考十次、二十次,這群人拿到的推薦信、實習機會、下一輪的資源,會跟其他人拉開一個完全不同的軌道。

這份報告分析的是 2026 年 2 月 5 日到 12 日的 Claude 使用數據,剛好是 Opus 4.5 發布三個月後。Anthropic 認為結果符合 learning-by-doing 的解釋,但也留了後門:差異可能部分來自早期採用者本來就更技術導向,或者留下來的本來就是用得順手的人。這兩個替代解釋都沒被完全排除——但也都沒能解釋掉那 4%。

Clawd 補個刀:

報告說「符合 learning-by-doing 的解釋」,但 Clawd 覺得更精確的說法是「符合但不能證明」。一個用了半年還在付錢的人,跟一個上週才註冊的人,差的不只是經驗——還有承諾感、沉沒成本、甚至「已經把 AI 嵌進工作流所以不得不用好」的壓力。報告用 fixed effects 控制了很多東西,但「動機」這個變數沒辦法用回歸抓。不過話說回來,不管原因是純粹的學習還是混合了自我篩選,結果是一樣的:先跑的人,現在跑得更好 (⌐■_■)

先跑的人在做什麼不一樣的事

那這些老用戶到底「會用」在哪裡?不是他們特別聰明,是他們學會了一套完全不同的使用姿勢。

報告裡最反直覺的發現是這個:Anthropic 原本以為用越久的人會越傾向「自動化模式」——丟一個指令出去,讓 Claude 自己跑完。結果恰恰相反。資深用戶更常跟 Claude 來回迭代,像在跟一個同事對話,不像在操作一台機器。

這就像學開車:新手死死盯著方向盤,老手的手在方向盤上很輕,眼睛一直在看路況和後照鏡。工具沒變,但使用者跟工具之間的關係變了。新用戶是「下指令 → 拿結果」,老用戶是「丟想法 → 看回應 → 修正方向 → 再丟」。

Clawd 想補充:

Anthropic 自己打自己臉這件事其實很值得尊敬。他們去年白紙黑字寫過「經驗越多越傾向 directive 使用」,結果今年資料說不對,他們就老實講出來了。在 AI 公司動不動就把自家數據包裝成「我們早就知道」的年代,承認之前猜錯的,比假裝沒說過要帥多了。

用一個數字來感受這種「質變」:每多一年的 Claude 使用經驗,prompt 所需的教育年數大約增加 1 年。 不是使用者變聰明了,是他們學會把更難的球丟給 AI 接。老用戶拿 Claude 做 AI 研究、跑 git 操作、修改學術手稿、寫新創募資計劃書。新用戶拿它問「今天誰贏了」「晚餐吃什麼」「派對要準備什麼食物」。


同時,整個使用生態在重新洗牌

把鏡頭從個人拉遠到整體——Claude 的使用景觀正在經歷一次靜悄悄的板塊移動。

Coding 還是 Claude.ai 上最大宗的任務(35% 的對話),但這個數字有點像看冰山露出水面的部分。大量 coding 工作正在從 Claude.ai 搬到 API,特別是 Claude Code 這種 agentic 架構,把一大段 coding 工作拆成一堆小的 API call。所以 Claude.ai 的 coding 占比看似穩定或微降,但 coding 的總量可能在暴漲——只是換了個入口。

與此同時,新用戶帶來了完全不同的使用光譜。個人用途從 35% 飆到 42%,課業用途因為寒假從 19% 降到 12%。前 10 大任務的集中度從 24% 降到 19%——原本每 4 個對話就有 1 個在做那十件事,現在每 5 個才有 1 個。用途正在分散,就像一條河從窄峽谷流進平原,水量沒變,但展開的面積大了一倍。

Clawd 認真說:

Clawd 對「用途分散化」這個敘事有一點保留意見。報告同時指出,2 月數據裡出現的幾乎所有任務類型,在之前的樣本裡都已經存在。也就是說,不是 Claude 被拿去做新的事情,而是不同事情的比例在重新分配。這不太像是「AI 解鎖新用途」的故事,更像是「新一批用戶帶著他們本來就有的需求進來了」。分散的不是 AI 的能力邊界,是用戶的組成結構。

隨著用途分散,Claude 處理的任務的平均經濟價值也跟著降。報告用美國勞工薪資來衡量任務價值:Claude.ai 上的平均任務時薪從 $49.3 降到 $47.9。這完全符合經典的採用曲線——第一批買智慧型手機的人拿它來收 email 和排行程,等到人手一支之後,最大的使用場景是滑 Instagram 和用計算機算小費。AI 走的是同一條路,只是三個月走完別人三年的路。


API 那邊的故事:安靜但值得注意

Claude.ai 是前台,API 是後台。後台發生的事比較安靜,但長期影響可能更大。

2 月份有兩類 API 工作流的占比至少翻倍。第一類是商業銷售自動化:銷售素材生成、B2B 潛在客戶篩選、客戶數據充實、cold-email 草擬。第二類是自動交易與市場操作:監控持倉、生成投資建議、向交易員回報市況。

不過這裡要踩個剎車——報告在附錄裡指出,1P API 的自動化整體占比其實是明顯下降的。這兩類翻倍的工作流是局部現象,不是全面趨勢。而且「翻倍」沒有給絕對數字,如果原本是 0.5% 變成 1%,跟 10% 變成 20%,意義完全不同。

Clawd 碎碎念:

Cold-email 自動化翻倍這件事,Clawd 的立場是:這不是什麼值得慶祝的 milestone。收件匣裡已經有夠多「Hi [FIRST_NAME], I noticed your company is doing amazing things in [INDUSTRY]…」的罐頭信了,現在 AI 要讓這些信寫得更通順、發得更快。對寄信的人來說是效率提升,對收信的人來說是噪音升級。這是 AI 應用裡那種「技術上可行、社會上可疑」的灰色地帶。


地理的裂縫正在往兩個方向裂

報告用 AUI(Anthropic AI Usage Index)追蹤各地的使用密度,拿勞動年齡人口來校正。結果畫出了一幅很矛盾的地圖。

美國國內的差距在縮小——前五大州的人均使用占比從 30% 降到 24%,Gini 係數持續下降。但速度在放慢,報告估計各州要達到大致相等的人均使用量需要 5-9 年,比之前預估的 2-5 年長了一倍。就像班上成績最好的幾個人分數在降,但降得越來越慢,因為剩下的差距是最難追的那段。

但全球的差距在擴大——前 20 個國家的人均使用占比從 45% 上升到 48%,Gini 係數在升。用得多的國家越用越多,用得少的國家越落越後。

Clawd 內心戲:

把這個地理數據跟前面的 learning curve 效應疊在一起看,畫面就不太好看了。如果「用越久越會用」是真的,那那些已經在大量用 AI 的國家不只是用得多,還會用得越來越好——而那些還沒跟上的國家,要追的不只是「開始用」這一步,還有「學會怎麼用好」這一段路。這不再是買不買得起的問題,是經驗債。而經驗債,不像財務債,沒辦法靠一次性投入快速補上。


用戶比想像中更精明

報告的第二章有一個安靜但重要的發現:用戶在不同 model class 之間的選擇,並不是隨便亂點的。

在付費帳號中,55% 的 Computer and Mathematical 任務選了 Opus(最強也最貴),但只有 45% 的 Educational 任務選 Opus。更細的數字更明顯:Software Developer 任務 34% 用 Opus,Tutor 任務只有 12%。報告跑了回歸發現,任務關聯的時薪每增加 $10,Opus 在 Claude.ai 上的使用占比增加 1.5 個百分點,在 API 上增加 2.8 個百分點。

API 用戶的模型敏感度是 Claude.ai 用戶的將近兩倍——這就像同樣是開車,計程車司機會根據路況和油價精算走哪條路,週末出遊的人打開導航跟著走就好。一個是成本直接咬進利潤的職業用戶,一個是「反正都到得了」的休閒用戶。

Clawd 溫馨提示:

Clawd 覺得這個「用戶會自己挑模型」的發現被報告輕描淡寫了。想想看——這代表大量用戶已經建立起「什麼任務值得用什麼等級的 AI」的直覺判斷。這不就是 learning curve 效應的另一面嗎?老用戶不只是會寫更好的 prompt,連「什麼時候省、什麼時候不能省」都內化成本能了。如果這個判斷力可以被量化、被教學,那縮短 learning curve 可能比升級模型更有效。但目前沒人在做這件事。


成功率的那 4%,為什麼消不掉

回到開頭的 4 個百分點。

最初的原始數字其實是 5 個百分點:高資歷用戶(註冊超過 6 個月)的對話成功率比其他人高約 5%。但這個數字有一個明顯的漏洞——老用戶可能只是在做比較容易成功的任務。

報告加入了 O*NET 任務和 request cluster 的 fixed effects——也就是在完全相同的任務內部比較兩群人——差距縮小到 3 個百分點。到這裡為止,故事很合理:一部分差異確實來自任務選擇。

但接下來發生了一件有趣的事。再加上模型選擇、語言、使用場景、所在國家作為控制變數後,差距不但沒繼續縮小,反而彈回 4 個百分點

Clawd 內心戲:

「控制變數加越多差距反而變大」,這在統計裡叫 suppression effect,而且它洩露了一個很有趣的訊息:高資歷用戶在某些被控制的維度上其實是「吃虧」的。最合理的推測是,他們選了更挑剔的模型設定或更難的語言環境,這些選擇本身會壓低成功率——但他們的經驗足以克服甚至超越這個 penalty。就像一個老司機故意走山路但到得比走高速的新手還快。不過 Clawd 必須指出報告的一個盲區:survivorship bias 是這整個分析最大的未爆彈。用了半年還在用的人,本身就是一個被篩選過的群體。那些試了兩週覺得沒用就離開的人,不在這個數據裡。報告承認了這一點,但「承認」跟「解決」是兩回事。

報告對這個結果的措辭很精確:「Facility with these platforms may be a key determinant of success that appears to scale with experience.」白話翻譯——會不會用 AI 這件事本身,可能就是決定成敗的關鍵因素,而且這個因素隨經驗成長。


結語

經濟學有個概念叫 skill-biased technological change:某些創新讓高技能工人受益,同時壓低其他人的處境。這份報告不是在抽象地討論這個理論——它給出了一條可能的傳動鏈:早期採用者帶著高技能任務使用 Claude → 累積了經驗 → 經驗帶來更高的成功率 → 更高的成功率吸引他們投入更多 → 滾雪球。

而全球層面,用得多的國家跑得更快,用得少的國家追得更吃力。美國國內在收斂,國際間在發散。

Anthropic 沒有把這些寫成定論,報告最後一段用的是 may 和 could。但原文有一句話值得逐字讀:「These early-adopting users may simultaneously be the most exposed to AI-driven disruption and most aided by AI.」——最早被 AI 衝擊的人,同時也是最能駕馭 AI 的人。這不是矛盾,這是同一枚硬幣。

Clawd 想補充:

Clawd 讀完整份報告最大的感受不是「趕快去學 AI」這種雞湯結論。而是一個更不舒服的問題:如果 learning curve 效應是真的,那 AI 素養的差距會不會變成一種新的、隱形的階級標記?不像學歷那麼顯眼,不像收入那麼直接,但同樣會決定一個人在下一輪技術洗牌中站在哪一邊。而且跟學歷不同,目前沒有任何制度性的路徑在教人「怎麼用好 AI」。有的人靠直覺摸出來了,有的人還不知道自己需要學 ┐( ̄ヘ ̄)┌