Hermes Agent vs OpenClaw:控制还是进化?
最近 AI Agent 领域涌现出两个备受关注的框架:Hermes Agent 和 OpenClaw。我在研究过程中发现,它们定位相似——都是「个人 AI 助手」,但底层设计哲学截然不同。这篇文章从技术角度拆解两者的差异,帮助刚接触 AI Agent 的开发者做出选择。
基本定位
Hermes Agent 来自 Nous Research,GitHub 目前积累 57,169 Stars。它以 Python 构建,核心定位是「The agent that grows with you」——一个会随使用而成长的代理。官网:hermes-agent.nousresearch.com,GitHub:github.com/NousResearch/hermes-agent。
OpenClaw 以 TypeScript 编写,GitHub Stars 达到 354,714,是目前热度最高的 Agent 框架之一。定位是「Personal AI assistant. Any OS. Any Platform.」——强调跨平台能力和控制平面的完整性。
数据上看,OpenClaw 的社区热度更高,但这不意味着它更适合所有场景。
设计哲学:学习循环 vs 控制平面
这是两者最根本的差异。
Hermes 采用「学习循环优先」设计。它内置闭环系统:Agent 从复杂任务中自动提取经验、生成技能,并在后续使用中持续改进。比如你说「帮我安排会议」,它不仅执行任务,还会记住你偏好上午 10 点、倾向 Zoom 而非 Teams、习惯提前 15 分钟提醒。这些偏好被自动提炼存储,下次无需重复说明。
OpenClaw 采用「控制平面优先」设计。它的 Gateway 是 WebSocket 控制中枢,管理 sessions、channels、tools、events——人在决策链中心。你需要显式配置技能、路由规则、安全策略,Agent 不会自动「进化」,但你对其一切行为有完整掌控。比如明确规定「所有文件操作必须人工确认」、「敏感数据访问需二次验证」。这种设计牺牲便利性,换来了可预测性和可审计性。
简而言之:Hermes 追求「越用越懂你」,OpenClaw 追求「你定义它做什么」。
记忆系统对比
记忆系统是 Agent 的核心能力,两者实现差异明显。
Hermes 多层架构:
- SQLite FTS5 底层存储,支持全文检索
- LLM summarization 自动压缩历史对话
- Honcho dialectic user modeling 建立用户画像
- 字符限制强制优先级排序,避免记忆膨胀
代价是复杂性——多层系统意味着多层调试。好处是跨会话检索强,Agent 能「回忆」几周前的对话细节。
OpenClaw Markdown 文件:
- 记忆以纯 Markdown 文件存储(
MEMORY.md、USER.md) - 无硬性容量限制
- 可人工编辑审计,完全透明
方案简单直观,适合需要手动干预记忆内容的场景。审计人员可直接查阅记忆文件,确认 Agent 行为依据。
技能生成方式
Hermes 自动生成技能。完成复杂任务后,Agent 自动创建 skill 文件,后续类似任务可直接调用。比如你连续三次要求「将 PDF 转为 Markdown 并存入 Obsidian vault」,Hermes 分析操作模式,生成可复用技能脚本,下次只需说「转换这个 PDF」。这套机制符合 agentskills.io 开放标准,技能可跨 Agent 共享。
OpenClaw 人工编写技能。提供 52+ 内置技能,覆盖文档处理、数据分析、API 集成等常见场景,但新技能需要用户显式创建。技能平台有安装门控和 UI 管理,适合需要精细控制技能集的场景。
多维度对比
| 维度 | Hermes | OpenClaw |
|---|---|---|
| 模型支持 | 200+ 模型(OpenRouter),一条命令切换 | BYOK 模式,用户自行配置 API Key |
| 平台支持 | Telegram、Discord、Slack、WhatsApp、Signal、CLI | 22 渠道(含 WeChat、iMessage、Matrix 等) |
| 安全机制 | 默认沙盒隔离,容器执行,零遥测 | DM pairing 验证,显式 allowlist |
| 运行环境 | 6 种 backend:local、Docker、SSH、Daytona、Singularity、Modal | Node 24,npm/pnpm/bun 安装 |
| Serverless | Modal/Daytona 支持,闲置近乎零成本 | 无原生 serverless,需自行部署 |
| Cron 调度 | 内置 cron,支持多平台投递 | 内置 cron + webhooks |
| 部署成本 | 5 美元 VPS 可运行 | 推荐本地运行或托管选项 |
适用场景分析
适合 Hermes 的场景:
- 长期陪伴型助手,需要跨会话记忆积累
- Serverless 部署,预算敏感(5 美元 VPS 即可运行)
- 多模型切换需求,不想被单一 provider 锁定
- 希望 Agent 自主学习、减少手动配置
适合 OpenClaw 的场景:
- 企业级部署,需要完整审计能力
- 复杂渠道路由,需精细控制消息流向
- iOS/Android 原生集成需求(Voice Wake、Canvas)
- 安全合规优先,需显式审批每条 DM
核心观点:两个框架各有优劣,场景决定选择。 Hermes 更适合「轻量、自进化」的个人助手场景;OpenClaw 更适合「可控、可审计」的正式部署场景。
Hermes 快速上手
如果决定尝试 Hermes,安装极其简单:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash安装后执行:
source ~/.bashrchermes setup # 配置向导hermes # 启动对话hermes model # 选择模型hermes gateway # 启动消息网关首次运行会引导选择模型 provider(推荐 OpenRouter 以获得最大模型选择范围)、配置安全策略、设置 Telegram/Discord 等平台连接。完整文档见 hermes-agent.nousresearch.com/docs。
如果从 OpenClaw 迁移,Hermes 提供一键迁移命令:
hermes claw migrate --dry-run # 先预览hermes claw migrate # 执行迁移会导入 SOUL.md、记忆文件、技能、API Keys 等历史配置。
结语
选择框架本质是选择一种 Agent 与人交互的范式:让 Agent 自主进化,还是让人类完全掌控?Hermes 和 OpenClaw 代表了两种截然不同的答案。建议先用 Hermes 起步——它的学习循环能让你快速体验「Agent 会成长」的感觉,之后再根据实际需求决定是否切换到 OpenClaw 的控制平面模式。
选择哪一个,取决于你的核心诉求是效率还是控制。
支持与分享
如果这篇文章对你有帮助,欢迎分享给更多人或赞助支持!