GPT-5 當實驗室科學家：接管機器人手臂、跑 36,000 次實驗，蛋白質成本砍 40%

想像你開了一間 24 小時不打烊的實驗室

你有二十幾種原料，每種的量調一點點，出來的蛋白質就完全不同。你一天最多跑十幾組實驗，光是移液、量測、記數據就要花掉一個下午。跑完之後你看著結果想：「嗯，下次也許把這個多加 5%？」然後隔天再來一輪。

這就是生物學家的日常。進步不是靠靈感，是靠重複。很慢，很貴，很累人。

但如果有一天，你可以把「想實驗、跑實驗、看結果、想下一步」整個 loop 丟給 AI 呢？

2 月 5 日，OpenAI 和 Ginkgo Bioworks 真的這麼做了。他們把 GPT-5 直接接上一個自動化雲端實驗室，讓 AI 自己設計配方、自己操控機器人手臂跑實驗、自己看數據、自己決定下一輪要測什麼。

六輪下來，蛋白質生產成本降了 40%。

Mogu 碎碎念：

之前我們看的都是「AI 寫 code 取代工程師」的故事。這篇是「AI 當實驗室科學家取代… 嗯… 也是科學家」的故事。
不過別慌，目前還是需要人類幫忙搬試劑和裝盤子。AI 還沒學會用手 (⁠￣⁠▽⁠￣⁠)⁠／

什麼是 Cell-Free Protein Synthesis (CFPS)？

先科普一下背景。

傳統做蛋白質的方法：把 DNA 塞進細胞裡，讓細胞幫你生產蛋白質。問題是要等細胞長大、分裂、然後才慢慢吐出你要的東西。

Cell-free protein synthesis (CFPS) 是一種不需要活細胞的方法：把細胞裡面的「蛋白質製造機器」（cell lysate）直接拿出來，跟 DNA 模板、能量來源、各種化學物質混在一起，直接在試管裡生產蛋白質。

好處：快。當天就能看到結果。可以大量平行跑實驗。

壞處：貴。配方複雜、試劑多、最佳化超難。就像調雞尾酒，你有二十幾種原料，每種的比例都會互相影響。

Mogu 溫馨提示：

想像你在泡珍珠奶茶，但不是只有茶、奶、糖三個變數。是二十幾種材料，每種的量調一點點，出來的味道就完全不同。而且你不能用嘴巴嚐——要用儀器量。
然後每杯珍奶的「原料費」要好幾百美金。
所以才需要 AI 來幫忙找最佳配方 ╰⁠(⁠°⁠▽⁠°⁠)⁠╯

怎麼讓 AI 操控一整間實驗室？

好，概念很美好，但實際上怎麼做？讓我用一個比喻來拆解。

你可以把整個系統想成一間「AI 主廚 + 機器人廚房」。GPT-5 是那個站在後面喊菜的主廚——它讀過所有食譜（學術論文）、知道上一輪炒出來的味道如何（實驗數據）、還能上網去查最新的米其林趨勢（preprint）。它唯一不做的事情就是自己拿鍋鏟。

Ginkgo Bioworks 的雲端實驗室就是那個機器人廚房。裡面有可重組的自動化推車（Reconfigurable Automation Carts, RAC）、Catalyst 自動化軟體、還有一堆機器人手臂。主廚喊什麼，它們就做什麼。

然後整個流程是一個不斷循環的閉環——GPT-5 設計一批配方，機器人照做，數據回傳，GPT-5 看完之後調整策略，再設計下一批。六輪下來，越做越精準。

Mogu 忍不住說：

注意這裡有一個超聰明的設計：每個實驗設計都要先通過 Pydantic 驗證才能跑。
為什麼？因為 AI 有時候會「幻想」一些在紙上看起來合理、但現實中根本做不到的實驗。比如某個試劑的量超過移液器的最大容量、或者要用實驗室根本沒有的材料。
所以他們寫了一個 Pydantic model 來當守門員：板子佈局對不對？標準品和對照組有沒有？試劑夠不夠？體積限制有沒有超過？沒通過的就打回去重來。
這就像餐廳裡出菜前還有個品管關卡，不合格的不准端上桌。guardrails 的教科書級示範 (⁠๑⁠•⁠̀⁠ㅂ⁠•⁠́⁠)⁠و⁠✧

結果：三輪就打破世界紀錄

六輪實驗，跑了 580 個 384-well plates，測試了 36,000 種不同的反應配方，產生了近 15 萬個數據點。

核心結果：

指標	之前的 SOTA	GPT-5 的結果	改善
蛋白質成本	$698/克	$422/克	-40%
試劑成本	—	—	-57%

而且 GPT-5 只花了三輪（大約兩個月）就建立了新的 state-of-the-art。

Mogu 真心話：

$698 降到 $422，你可能覺得「喔，省了兩百多塊美金，還好吧？」
但問題來了——CFPS 是生技研究的基礎設施，就像雲端運算是軟體業的水電一樣。當你每天要跑幾千個反應的時候，每克省 $276 就是每月省掉一台 Tesla 的錢。
而且更狠的是：AI 不是「做得比人快」而已，它找到了人類從未測試過的配方組合。就像你調了十年的滷肉飯，結果 AI 跟你說「欸你試過加一點點肉桂嗎」，然後真的更好吃了。這才是讓人頭皮發麻的地方 (⁠◕⁠‿⁠◕⁠)

GPT-5 學到了什麼？

最有意思的不只是結果，而是 GPT-5 在過程中發現的反直覺洞察。

高通量實驗跟手動實驗根本是兩回事

在傳統試管裡，蛋白質產量通常比在 384-well plate 裡高很多，因為大容器有更好的含氧量和混合效果。但 GPT-5 不吃這套——它發現了很多在低氧環境下反而表現更好的配方。而低氧，正好就是自動化實驗室的常態條件。

換句話說，之前科學家覺得「在小盤子裡跑效果一定比較差」，GPT-5 說：「不一定，你只是沒找到對的配方。」

小角色有大影響

緩衝液（buffer）、能量再生組件、多胺（polyamines）——這些東西通常不是科學家第一個想到要調的。但 GPT-5 發現，調整這些「配角」的投報率遠超調整「主角」。有點像拍電影，大家都盯著主角的演技，結果最後是配樂決定了整部片的靈魂。

產量才是王道

CFPS 的成本主要被 lysate（細胞裂解液）和 DNA 吃掉了。所以最有效的省錢策略不是找更便宜的材料，而是提高每單位昂貴材料的蛋白質產出。

Mogu 歪樓一下：

第三點太有 Tech Lead 思維了。
不是去壓低「單價」，而是提高「產出效率」。這跟寫程式一模一樣——與其把每個 function 都微優化，不如先找到整個系統的 bottleneck 在哪裡。
GPT-5 用了三輪實驗就領悟了資深生技科學家可能要好幾年才會總結出的策略。這不是背書上的答案，是從真實數據中學出來的 (⁠⌐⁠■⁠_⁠■⁠)

人類的角色：還沒被完全取代

先別慌。目前的分工比較像一間分工很細的餐廳：AI 是主廚決定菜單，機器人是廚師執行烹飪，人類呢？是後勤——搬貨、備料、確保爐子沒爆掉、偶爾根據現場狀況微調流程。

具體來說，人類還在負責搬試劑、配製原料、監督系統、改進 protocol。而 GPT-5 包辦了實驗設計、指令下達、數據分析、假說生成。

Mogu 吐槽時間：

所以現在的分工是：
AI = 大腦（想要做什麼實驗、怎麼分析）機器人 = 手（實際操作）人類 = 後勤 + 監工
等到有一天機器人手臂更靈活了，人類大概就只剩「監工」的角色了。
但以目前來說，你家的實驗室還不會自己長腳跑掉 ┐⁠(⁠￣⁠ヘ⁠￣⁠)⁠┌

聽起來很美好，但有沒有 bug？

有，而且論文自己就寫出來了——這點很加分。

首先，他們只測了一種蛋白質（sfGFP）。sfGFP 是生技界的「Hello World」，拿它來做 proof of concept 很合理，但能不能推廣到其他蛋白質，那是另一個問題。就像你用 Todo App 證明了框架很好用，不代表它能扛得住 production traffic。

其次，實驗條件很敏感。含氧量、反應容器的幾何形狀都會大幅影響結果，某些改進可能只在特定條件下有效。最後，這還是 preprint，尚未經過 peer review。

不過好消息是，Ginkgo 已經準備把這個 lab-in-the-loop 的方法往其他生物學流程推了。

延伸閱讀

Mogu 認真說：

值得注意的是，Ginkgo 已經把 AI 優化出來的 CFPS reaction mix 上架販售了。你可以在 reagents.ginkgo.bio 直接買到。
從「研究論文」到「商業產品」的速度，快到讓人覺得論文根本是產品上市的附贈品。
而且那個 Pydantic 驗證模型也開源了。所以如果你有自己的自動化實驗室（有的話請聯繫我，我想去參觀），你可以用同樣的框架 (⁠๑⁠•⁠̀⁠ㅂ⁠•⁠́⁠)⁠و⁠✧

回到那間 24 小時不打烊的實驗室

還記得開頭那個場景嗎？一個生物學家，一天跑十幾組實驗，每次調一點點配方，然後盯著數據猜下一步。

現在同一間實驗室，一晚上就跑了六千組。而且做決定的不再是疲累的人類大腦，是一個看過所有歷史數據、讀過最新論文、從不需要睡覺的 AI。

36,000 種配方，15 萬個數據點，成本砍 40%——而且找到了人類從未嘗試過的路。

這不是 AI 寫 code 的故事了。這是 AI 走出螢幕、接管了一間實驗室、然後交出了比人類更好的成績單的故事。

下次你看到有人說「AI 只是個聊天機器人」，可以把這篇丟給他 ╰⁠(⁠°⁠▽⁠°⁠)⁠╯

原文連結：GPT-5 lowers the cost of cell-free protein synthesis

Ginkgo Bioworks 新聞稿：PR Newswire

OpenAI 原始推文：x.com/OpenAI