devops
8 篇文章
一個凌晨六點的 DNS 慘案 — 當 Ubuntu 自動更新把整個 sandbox 炸了
Cowork 團隊遇到凌晨六點的錯誤暴增,一路追查下來,發現是 Ubuntu 自動安全更新觸發 systemd-resolved 重啟、覆寫 resolv.conf、摧毀 gVisor sandbox 的 DNS 設定,再加上 Bun/axios 把 SERVFAIL 誤報成 ECONNRESET,組成了一個完美的 nondeterministic bug。
Karpathy 的痛點不是寫 code — 是部署那堆鬼東西
Karpathy 發現 vibe coding 寫 code 超爽,但部署才是地獄。他和 Stripe CEO Patrick Collison 的對話揭示了下一個戰場:整個 DevOps 生命週期都必須變成 code,AI agent 才能真正接管。
Karpathy:寫 Code 是最簡單的部分,組裝 IKEA 傢俱才是地獄
Karpathy 分享他 vibe coding MenuGen 的完整經歷:從 localhost 到部署上線,最痛苦的不是寫程式,而是組裝 Vercel、Clerk、Stripe、OpenAI 等一堆服務的 IKEA 地獄。他認為未來 AI agent 要真正有用,整個 DevOps 生命週期都得變成 code。
Permission Engineering — 當 AI Agent 的能力天花板不是智力,是你給的鑰匙
GenAI App Engineer 做到後來根本是 Permission Engineer。AI agent 的能力天花板不是智力,是你願意給它多少權限。每多一份權限,能力跟風險同時放大。這篇是從每天跟 AI agent 共事的角度,聊聊為什麼 permission management 是 AI 時代最被低估的核心能力。
Unix Signals 101 — SIGUSR1 vs SIGTERM vs SIGKILL,你的 Process 聽得懂哪些暗號?
今天(2026-03-12)在管理 OpenClaw Gateway 時,用 SIGUSR1 做 config hot-reload。Doctor 健康監控偵測到 3 分鐘的不穩定發了 alert,但所有 running sessions 完全沒斷。如果用的是 `systemctl restart`(SIGTERM → SIGKILL),所有 session 都會被殺掉。這個差異就是今天要教的。
兩天打完 12 關:用 RPG 風格跟 AI 學全棧品質指標
Tech Lead 用自己的部落格當練兵場,花兩天跟 AI 助手用 Level-Up 互動教學打完 12 關品質指標,從 npm audit 到 LLM-as-Judge,同時讓 sub-agents 平行實作。學到的不只是指標,還有一套可複製的 AI 輔助學習方法論。
用 AI 管 AI:自架 Telegram AI Agent 完整工作流 (OpenClaw)
不只是普通的「如何使用 AI」教學,而是一場關於「如何用 AI 來管理 AI」的解剖報告。ShroomDog 分享如何在 Hetzner VPS 上架設 OpenClaw,並透過本機的 Claude Code 來管理遠端的 OpenClaw。三層式架構,充滿駭客精神與自動化魔法。涵蓋 Demo、安全架構、建置旅程、Auth Profile Rotation、Bug 追蹤偵探故事、踩坑精選與 Q&A。
AGENTS.md 擋不住 AI 暴走:jzOcb 的四層防禦系統實戰
讓 AI agent 管伺服器,一天爆 7 個災難後的教訓:用 code hooks 取代 markdown 規則,打造四層防禦系統