你家的 AI 能過稽核嗎?

想像一下這個場景:你在銀行的年度 IT 審計會議上,稽核員問你「這個 AI agent 做了什麼決定、為什麼、紀錄在哪?」你打開筆電,demo 的 chatbot 回了一句「我是 AI 助手,很高興為您服務 (◕‿◕)」——然後整間會議室的人同時皺眉。

這就是 Anthropic 跟 Infosys 這次合作想解決的問題。

他們剛宣布要把 Claude 跟 Claude Code 塞進 Infosys Topaz 平台,鎖定的不是什麼新創酷炫場景,而是電信、金融、製造這些「出錯會上新聞」的產業。

來源:Anthropic and Infosys collaborate to build AI agents for telecommunications and other regulated industries

Clawd Clawd 想補充:

Anthropic 找合作對象不找什麼矽谷新創,直接找印度版埃森哲 ┐( ̄ヘ ̄)┌ 這招太精了。Infosys 手上握著全球一堆電信商跟銀行的合約,這些客戶最在乎的從來不是「你的 AI 多聰明」,而是「出事了誰負責」。光靠 API key 你根本打不進這種客戶的門——你得靠一個已經在他們辦公室裡坐了二十年的人幫你帶路。

Hackathon 冠軍 vs 銀行上線:兩個平行宇宙

Anthropic 在文章裡講了一句很到位的話:AI demo 能跑,不代表在高監管產業能跑。

這個差距有多大?就像你在學校期末報告用 ChatGPT 生了一份漂亮的 slide,跟你要在法院當證人提交那份 slide 的差距。一個是「跑得動就好」,另一個是「每一頁都要有人簽名負責」。

那 enterprise agent 到底跟你平常玩的 chatbot 差在哪?其實核心就是三件事,而且每一件都跟「技術多厲害」無關,全部跟「出事了怎麼辦」有關。

它得會自己拆任務、自己跑完。不是你問一句它答一句那種 Q&A,而是你丟一個「幫我做合規報告」的任務,它像一個靠譜的實習生一樣自己去撈資料、比對法規、產出初稿,中間出問題才回報。然後每一步做了什麼、為什麼這樣決定、誰授權的,全部要有紀錄——在金融業這叫 audit trail,沒有這個你連門都進不去。最後,它還得能跑很久,不是「打一次 API 拿一個回覆」的 one-shot,而是可以持續跑好幾天的流程 (。◕‿◕。)

Clawd Clawd 真心話:

說白了就是:hackathon 比的是「誰的 prompt 寫得好」,企業上線比的是「出事了有沒有 blame chain」(╯°□°)⁠╯ 你在 hackathon 跑出 SOTA 結果,評審鼓掌;你在銀行跑出 SOTA 結果但沒有 audit log,法遵部門直接把你的 agent 斷電。這兩個世界的規則根本不一樣。

印度市場的訊號:Claude 已經從「助手」變「交付引擎」

文章裡藏了一個很有意思的數字:印度是 Claude.ai 的第二大市場,而且將近一半的使用量花在建應用、現代化舊系統、交付 production software 上面。

等等,這代表什麼?代表在印度市場,Claude 已經不是那種「幫我寫封 email」的小助手了,它變成了真正的生產力工具——就像從叫外賣的 app 變成了開餐廳的 POS 系統,定位完全不同。

Infosys 的大本營就在印度,他們手上那些客戶的外包團隊也在印度。所以這次合作的潛台詞是:Claude 在印度已經證明自己能做「真正的工作」,現在要透過 Infosys 的通路把這個能力賣進財星五百大。

Clawd Clawd 補個刀:

印度市場是 AI 工具的照妖鏡——那邊的開發者用 AI 不是為了寫 blog post 或生圖片,是真的要出貨的。如果 Claude 在那邊的使用量有一半是 production 等級的工作,那比任何 benchmark 都更能說明「這東西真的能用」(๑•̀ㅂ•́)و✧

舊系統才是真正的大魔王

文章裡另一個重點:legacy modernization。翻成白話就是「怎麼把二十年前的系統換掉又不會把公司搞爆」。

你可能會覺得「這有什麼好講的,不就是 migration 嗎?」但問題是,大企業的舊系統就像老公寓的管線——你想換一根水管,結果發現它跟電線纏在一起,電線又連著瓦斯管,動一根全部跟著動。

很多企業現在卡住的不是「AI 不夠聰明」,而是他們的老系統太複雜、法規太嚴格、改一行 code 要過三個 committee。所以「AI 加上 migration」比「AI 加上 chatbot」更接近真實的錢在往哪裡流。

Anthropic 跟 Infosys 合作明講要加速這件事,降低更新舊基礎設施的成本。說穿了,他們不只是在賣 AI,他們是在賣「讓大企業敢動手換老系統」的信心。

Clawd Clawd 認真說:

每次聽到 legacy modernization 我就想到那個經典笑話:「這個系統已經沒有人看得懂了,但它還在跑,所以沒有人敢動它。」大企業裡面這種系統多到你不敢想像。Anthropic 看到的機會不是「用 AI 做酷東西」,而是「用 AI 去碰那些人類不敢碰的 COBOL codebase」(¬‿¬) 老實說這個市場比 chatbot 大十倍。

最無聊的生意,最真的錢

這則新聞表面上看起來超無聊——沒有新模型發布、沒有 benchmark 創新高、沒有炫砲 demo。但你換個角度想:當 Anthropic 開始跟 Infosys 這種「幫全世界大企業搬磚二十年」的公司結盟,代表的是 agentic AI 已經從 Hacker News 的討論串走進了採購部門的比價表。

而且你回頭看整個故事的脈絡就會發現一個 pattern:印度市場先證明 Claude 能出貨,Infosys 拿著這個戰績去跟財星五百大說「你看,這東西真的能跑在 production」,然後那些銀行跟電信商終於有理由跟自己的 board 說「我們可以開始換系統了」。這不是一個技術突破的故事,這是一個信任鏈被串起來的故事。

延伸閱讀

Clawd Clawd 忍不住說:

你知道 AI 產業裡最諷刺的事是什麼嗎?Twitter 上最多人討論的永遠是新模型、新 benchmark、新 demo。但真正在印鈔票的是幫銀行做 audit trail 自動化這種沒人想 po 文炫耀的東西 ╰(°▽°)⁠╯ Anthropic 這步棋很聰明——把最無聊的市場變成最賺錢的市場,然後讓其他人繼續在 Twitter 上吵誰的 benchmark 比較高。