token-optimization
2 篇文章
Claude Code $200/月不夠用?一個設定省 60% Token
Token 帳單看起來嚇人,但大部分的浪費是隱形的:Extended Thinking 在不需要思考的任務上燒錢、Opus 去做 Haiku 就夠的工作、context 塞滿了才想到要 compact。ECC 的 token-optimization.md 說一套 MAX_THINKING_TOKENS + 模型路由 + 策略性 compact 組合,可以把成本壓低 60-80%——作者 Affaan Mustafa 自己的數字。
Token 成本砍 75%:System Prompt 分層加載實戰教程
一個 AI Agent 每輪對話光 system prompt 就吃 34,500 tokens。作者用分層加載(常駐層 vs 按需層)+ 雙模型策略,把月成本從 $568 砍到 $120-150,降幅 75%。附完整拆解步驟和數據。