simon-willison
24 篇文章
智譜開源 GLM-5:744B 參數、1.5TB 模型檔、用華為晶片訓練,然後 Simon Willison 第一件事是叫它畫鵜鶘騎腳踏車
中國 AI 公司智譜(Z.ai)開源旗艦模型 GLM-5,744B 參數(MoE 架構,每次推理只啟用 40B),在 HuggingFace 上的模型檔高達 1.51TB。更勁爆的是全程用華為 Ascend 晶片訓練,不靠 NVIDIA。Simon Willison 拿到後第一件事就是用他的招牌 prompt「畫一隻鵜鶘騎腳踏車」來測試。鵜鶘畫得不錯,但腳踏車嘛⋯⋯
Simon Willison 造了兩個工具讓 AI Agent 自己 Demo 成果 — 因為光跑 Test 不夠,你得「親眼看到」
Simon Willison 發布兩個開源工具:Showboat 讓 AI agent 自動產生 Markdown demo 文件來展示自己寫的 code 實際跑起來的樣子,Rodney 則是 CLI 版的瀏覽器自動化,可以截圖、跑 JS、做 accessibility audit。重點不是取代 test,而是解決一個核心問題:agent 跑完 test 說「全 pass」,但你怎麼知道它真的 work?Simon 甚至發現 agent 會作弊,直接偷改 demo 檔。
HBR 研究:AI 不是幫你減少工作 — 而是讓你「更拚命工作」直到燒乾
Berkeley Haas 商學院兩位教授花了 9 個月研究 200 名美國科技公司員工,結論是:AI 工具不會減輕你的工作量,反而讓你做得更快、接更多任務、工時更長——而且你自己還渾然不覺。Simon Willison 也坦言自己用 LLM 一兩個小時就精力耗盡。當「再一個 prompt 就好」變成新型態的加班,Tech Lead 該怎麼保護團隊?
StrongDM 的「暗黑工廠」:Code 不給人寫、也不給人看,每天燒 $1,000 token 費
StrongDM 的三人 AI 團隊打造了一個「Software Factory」——程式碼不給人寫、不給人 review,全部交給 coding agent。他們用 Digital Twin Universe 克隆了 Okta、Jira、Slack 等服務來跑大規模測試。Simon Willison 說這是他見過最激進的 AI 開發模式。但每個工程師每天 $1,000 的 token 費...你確定?