💰 不是所有任务都需要最强模型。通过智能模型路由,可以节省 60%+ 的 API 成本,同时保持输出质量。本文教你如何配置 OpenClaw 的多模型路由系统。
最强推理能力
$3/1M tokens
适合:复杂推理、代码生成
多模态能力强
$2.5/1M tokens
适合:图像分析、创意写作
快速低成本
$0.25/1M tokens
适合:简单问答、分类
超长上下文
$0.35/1M tokens
适合:长文档处理
# OpenClaw 路由配置示例
routing:
strategies:
- name: "complex_reasoning"
condition: "task.complexity > 0.8"
model: "claude-3.5-sonnet"
- name: "simple_qa"
condition: "task.complexity < 0.3"
model: "claude-3-haiku"
- name: "code_generation"
condition: "task.type == 'code'"
model: "gpt-4o"
- name: "default"
condition: "true"
model: "claude-3.5-sonnet"
# 成本感知路由
routing:
cost_aware:
enabled: true
daily_budget: 50 # 美元
fallback_chain:
- "claude-3.5-sonnet"
- "gpt-4o"
- "claude-3-haiku" # 预算不足时降级
# 延迟感知路由
routing:
latency_aware:
enabled: true
max_latency_ms: 5000
preferred_models:
- model: "claude-3-haiku"
avg_latency_ms: 800
- model: "gpt-4o-mini"
avg_latency_ms: 1200
| 任务类型 | 推荐模型 | 原因 |
|---|---|---|
| 简单问答 | Claude 3 Haiku | 快速、低成本 |
| 代码生成 | Claude 3.5 Sonnet | 代码质量高 |
| 创意写作 | GPT-4o | 创意能力强 |
| 数据分析 | Claude 3.5 Sonnet | 推理准确 |
| 长文档处理 | Gemini 1.5 Pro | 上下文窗口大 |
| 图像分析 | GPT-4o | 多模态能力强 |
| 批量处理 | Claude 3 Haiku | 成本最低 |
# 复杂任务拆分成多个子任务,使用不同模型
routing:
chain:
- step: "understand"
model: "claude-3.5-sonnet"
description: "理解任务意图"
- step: "plan"
model: "claude-3.5-sonnet"
description: "制定执行计划"
- step: "execute"
model: "gpt-4o"
description: "执行具体操作"
- step: "verify"
model: "claude-3-haiku"
description: "验证结果"
# 多模型投票,取最佳结果
routing:
voting:
enabled: true
models:
- "claude-3.5-sonnet"
- "gpt-4o"
- "gemini-1.5-pro"
strategy: "majority" # 多数投票
# strategy: "best_of_n" # 最佳结果
# 成本对比
# 假设每天 1000 次调用,平均 1000 tokens/次
# 全部使用 Claude 3.5 Sonnet
# 1000 * 1000 * $3/1M = $3/天 = $90/月
# 混合路由(70% Haiku + 30% Sonnet)
# 700 * 1000 * $0.25/1M + 300 * 1000 * $3/1M
# = $0.175 + $0.9 = $1.075/天 = $32.25/月
# 节省:64%
# 监控配置
monitoring:
metrics:
- name: "model_usage"
type: "distribution"
labels: ["model", "task_type"]
- name: "daily_cost"
type: "counter"
alert_threshold: 40 # 接近预算时告警
- name: "latency"
type: "histogram"
buckets: [500, 1000, 2000, 5000]