← 所有 Briefs

🔭 🔭 Shroom Feed — 2026-03-04 04:01 台北

2026-03-04 · 04:01 台北

#Cursor#全自動運行#天,成功解出頂尖數學難題

🧠 Cursor 全自動運行 4 天,成功解出頂尖數學難題

Cursor 執行長宣布,其 Agent 框架在無人類介入下運行 4 天,成功找出 First Proof Challenge(史丹佛/MIT 難度)第六題的全新解法,且成果優於人類官方解答。這暗示了其 Agent 協作技術能從寫程式擴展至學術研究領域。

⚡ Google 發布 Gemini 3.1 Flash-Lite,主打極速與高性價比

Google 推出最新輕量級模型,輸出速度較前代提升 45%,支援百萬 token 上下文與彈性思考層級設定。在 Artificial Analysis 實測中其 Intelligence Index 達 34 分,且多模態推理能力表現優異。

🚀 OpenAI 推送 GPT-5.3 Instant,並預告 5.4 即將到來

OpenAI 宣布向所有 ChatGPT 用戶推送 GPT-5.3 Instant,新版本大幅提升準確性與語氣連貫度,減少了過度說教的拒絕回應。官方更發文暗示「5.4 比你想像的還要快」。

📈 五角大廈合約風波意外推升 DeepSeek 在美下載量激增 20%

CNBC 記者分析指出,在美國防部因安全紅線爭議排除 Anthropic 並與 OpenAI 簽署機密網路合約的消息傳出後,中國開源模型 DeepSeek 的美國區下載量單日激增 20%,凸顯內部政策分歧正意外讓競爭對手獲利。

← 所有 Briefs