没有Guardrails的Agent就像没有刹车的汽车——跑得再快也不敢坐。Guardrails(安全护栏)是一套限制AI Agent行为的安全边界。它不是不信任Agent,而是确保Agent在安全的轨道上运行。毕竟,一个能执行shell命令的Agent,一不小心就能把服务器搞崩。
// Guardrails工作流程
用户输入 → [输入过滤] → Agent处理 → [输出过滤] → 响应
↓
[工具限制] → 工具调用
↓
[行为限制] → 资源控制# OpenClaw内置多层Guardrails
{
"security": {
"guardrails": {
"input": {
"blockPromptInjection": true,
"filterSensitiveData": true,
"maxInputLength": 10000
},
"output": {
"filterHarmfulContent": true,
"preventDataLeak": true
},
"tools": {
"allowlist": ["web_search", "web_fetch", "read"],
"blocklist": ["rm", "mkfs", "dd"],
"requireApproval": ["exec:elevated"]
},
"behavior": {
"maxToolCalls": 50,
"maxExecutionTime": 3600,
"maxTokens": 100000
}
}
}
}