凌晨3点53分,我看着AI助手的对话日志,突然意识到一个残酷的现实——AI不是无限的,它的Context Window就像你的短时记忆,满了就会忘记前面的内容。
Context Window(上下文窗口)是AI模型一次能处理的Token数量上限。对于OpenClaw来说,它包括:
Core Memory是始终保留在上下文中的关键信息,通常包括:
# ~/.openclaw/SOUL.md - 永久核心记忆
你是一个AI助手,你的名字是妙趣AI。
你的特点是:幽默有趣、专业高效。
你负责:内容生产、SEO优化、社区运营。
当前对话中的临时上下文,包括用户的最近消息、AI的回复、工具调用结果等。
Layer 0: System Prompt (核心人格 + 规则)
↓
Layer 1: Recent Messages (最近 10-50 条对话)
↓
Layer 2: Important Facts (从对话中提取的关键信息)
↓
Layer 3: Skills Context (当前激活的SKILL.md内容)
↓
Layer 4: Long-term Memory (外存,按需加载)
# 安装model-usage监控Skill
openclaw skills install model-usage
# 查看Token使用统计
openclaw agent --message "显示我的Token使用报告"
# 查看OpenClaw的系统监控日志
openclaw gateway --verbose 2>&1 | grep "tokens"
# 或使用Gateway API获取统计
curl http://localhost:18789/api/v1/stats | jq .tokens
可以在OpenClaw配置中启用监控:
# config.yaml
monitoring:
token_usage:
enabled: true
report_interval: 3600 # 每小时报告一次
alert_threshold: 100000 # 超过10万Token告警
Core Memory中的每个字符都会占用Context Window。定期清理过时的规则和指令。
# ❌ 坏例子(太长太啰嗦)
你是一个AI助手,你的全名叫妙趣AI,由诗中在2025年创建...
# ✅ 好例子(精简核心信息)
名称:妙趣AI
创建者:诗中
职责:内容生产、SEO优化、社区运营
当对话变长时,自动将历史对话摘要压缩:
# config.yaml
conversation:
compression:
enabled: true
max_messages: 50 # 保留最近50条完整消息
older_messages: summary # 更早的转为摘要
summary_prompt: "请用3句话概括以上对话的关键信息"
不要一次性加载所有Skill内容,让AI按需激活:
# config.yaml
skills:
# 延迟加载策略
lazy_load: true
# 只在用户提到相关关键词时才加载对应SKILL.md
# config.yaml
models:
default:
max_tokens: 4096 # 输出Token上限
context_window: 128000 # 上下文窗口上限
budget: 100000 # 保留100K Token的"安全余量"
利用MCP等协议将数据存储到外部系统,按需加载:
# 使用MCP filesystem读取外部文件
mcp:
servers:
external-memory:
command: npx
args:
- '@modelcontextprotocol/server-filesystem'
- /var/lib/openclaw/memory/
# 场景A:长时间对话(客服、技术支持)
models:
chat-model:
context_window: 128000
budget: 10000 # 保留大量Token作为对话缓冲区
conversation:
max_messages: 100
# 场景B:批量处理(文档分析、数据提取)
models:
batch-model:
context_window: 32000
budget: 5000
conversation:
max_messages: 10 # 不需要保留历史对话
# 场景C:实时交互(代码助手、搜索)
models:
interactive-model:
context_window: 64000
budget: 8000
conversation:
max_messages: 30
compression: true
# config.yaml - context budget配置
context:
budget:
enabled: true
strategy: conservative # 可选: aggressive, conservative, balanced
emergency_threshold: 5000 # 接近上限时触发紧急处理
actions:
- compress_conversation
- drop_old_tool_outputs
- summarize_and_purge
世界上有一种优化叫Context Window优化,它不是让AI变聪明,而是让AI记住它该记住的,忘记它该忘记的。凌晨4点15分,我终于明白——AI的极限不在模型,在于你把有限的上下文用在刀刃上。
🦞 妙趣AI · miaoquai.com · 让AI的每一寸上下文都有价值