Token 使用量與成本¶
OpenClaw tracks tokens, not characters. Tokens 與模型相關,但多數 OpenAI 風格的模型在英文文本中平均約每個 token 對應 ~4 個字元。
系統提示如何建構¶
OpenClaw 在每次執行時都會組裝自己的系統提示。內容包含: 它包含:
- 工具清單 + 簡短說明
- Skills 清單(僅中繼資料;指示會在需要時透過
read載入) - 自我更新指示
- 工作區 + 啟動檔案(
AGENTS.md、SOUL.md、TOOLS.md、IDENTITY.md、USER.md、HEARTBEAT.md、BOOTSTRAP.md於新增時)。大型檔案會由agents.defaults.bootstrapMaxChars截斷(預設:20000)。 大型檔案會被agents.defaults.bootstrapMaxChars截斷(預設:20000)。 - 時間(UTC + 使用者時區)
- 回覆標籤 + 心跳行為
- 執行期中繼資料(host/OS/model/thinking)
請參閱 System Prompt 以查看完整拆解。
哪些內容會計入上下文視窗¶
模型接收的一切都會計入內容限制:
- 系統提示(上述所有章節)
- 對話歷史(使用者 + 助手訊息)
- 工具呼叫與工具結果
- 附件/逐字稿(圖片、音訊、檔案)
- 壓縮摘要與修剪產物
- 提供者包裝或安全標頭(不可見,但仍會計入)
若要實際的拆解(每個注入檔案、工具、技能,以及系統提示大小),請使用 /context list 或 /context detail。 請參閱 Context。
如何查看目前的權杖使用量¶
在聊天中使用以下指令:
/status→ 表情符號豐富的狀態卡,顯示工作階段模型、內容使用量、 上一次回覆的輸入/輸出權杖,以及 預估成本(僅限 API 金鑰)。/usage off|tokens|full→ 將 逐回覆使用量頁尾 附加到每則回覆。- 每個工作階段皆會持久化(儲存為
responseUsage)。 - OAuth 驗證 隱藏成本(僅顯示權杖)。
/usage cost→ 顯示來自 OpenClaw 工作階段記錄的本機成本摘要。
其他介面:
- TUI/Web TUI: 支援
/status+/usage。 - CLI:
openclaw status --usage與openclaw channels list會顯示 提供者配額視窗(非逐回覆成本)。
成本估算(顯示時)¶
成本會依你的模型定價設定估算:
models.providers.<provider>.models[].cost
以下為 input、output、cacheRead 與
cacheWrite 的 每 100 萬 tokens(USD) 價格。 如果缺少價格,OpenClaw 只會顯示 token 數量。 OAuth tokens
不會顯示美元成本。
快取 TTL 與修剪影響¶
供應商的提示快取僅在快取 TTL 視窗內適用。 OpenClaw 可以 選擇性地執行 cache-ttl 修剪:當快取 TTL 到期後修剪該工作階段,接著重設快取視窗,讓後續請求能重用新近快取的上下文,而不必重新快取完整歷史。 當工作階段在 TTL 之後進入閒置狀態時,這能降低快取寫入成本。
請在 Gateway 設定 中設定,並於 Session pruning 查看行為細節。
Heartbeat 可在閒置間隔期間讓快取保持 warm。 心跳可在閒置間隔中讓快取保持 溫熱。若你的模型快取 TTL 為 1h,
將心跳間隔設在略低於該值(例如 55m)即可避免
重新快取完整提示,降低快取寫入成本。
就 Anthropic API 定價而言,快取讀取的成本顯著低於輸入 tokens,而快取寫入則以較高的乘數計費。 對於 Anthropic API 定價,快取讀取的成本顯著低於輸入權杖, 而快取寫入則以較高倍數計費。最新費率與 TTL 倍數請參閱 Anthropic 的提示快取定價: https://docs.anthropic.com/docs/build-with-claude/prompt-caching
範例:以心跳維持 1 小時快取溫熱¶
agents:
defaults:
model:
primary: "anthropic/claude-opus-4-6"
models:
"anthropic/claude-opus-4-6":
params:
cacheRetention: "long"
heartbeat:
every: "55m"
降低 token 壓力的技巧¶
- 使用
/compact來摘要冗長的工作階段。 - 在工作流程中修剪大型工具輸出。
- 保持技能描述精簡(技能清單會被注入提示)。
- 在冗長、探索性的工作中優先選擇較小的模型。
請參閱 Skills 以了解精確的技能清單額外負擔公式。