token-optimization
5 篇文章
Claude Code Pro 省 token 實戰:Anthropic 官方的四招節流術
Lydia Hallie 分析 Claude Code Pro 用量報告後,公開四個最有效的省 token 技巧:預設用 Sonnet、關掉不必要的 extended thinking、別續用閒置 session、手動壓 context window 上限。
Claude Code 省 Token 六招——別再開法拉利去買菜了
Sabrina 分享六個實戰技巧把 Claude Code token 用量砍半:換模型、清 context、CLI 取代 MCP、壓縮 MCP 輸出、瘦身 CLAUDE.md、本地模型分流。全部免費,大部分五分鐘搞定。
/effort 不是換模型,是踩油門——Claude Code 創造者親自闢謠
Claude Code 創造者 Boris Cherny 親自下場澄清:所有訂閱者用的都是同一個 Opus 4.6,沒有秘密更好的模型。大家覺得 Claude 變笨,是因為預設 effort 從 high 降到 medium。一個指令就能調回來。
Claude Code $200/月不夠用?一個設定省 60% Token
Token 帳單看起來嚇人,但大部分的浪費是隱形的:Extended Thinking 在不需要思考的任務上燒錢、Opus 去做 Sonnet 就夠的工作、context 塞滿了才想到要 compact。ECC 的 token-optimization.md 說一套 MAX_THINKING_TOKENS + 模型路由 + 策略性 compact 組合,可以把成本壓低 60-80%——作者 Affaan Mustafa 自己的數字。
Token 成本砍 75%:System Prompt 分層加載實戰教程
一個 AI Agent 每輪對話光 system prompt 就吃 34,500 tokens。作者用分層加載(常駐層 vs 按需層)+ 雙模型策略,把月成本從 $568 砍到 $120-150,降幅 75%。附完整拆解步驟和數據。