1432 字
7 分钟

Hermes Agent vs OpenClaw:控制还是进化?

最近 AI Agent 领域涌现出两个备受关注的框架:Hermes Agent 和 OpenClaw。我在研究过程中发现,它们定位相似——都是「个人 AI 助手」,但底层设计哲学截然不同。这篇文章从技术角度拆解两者的差异,帮助刚接触 AI Agent 的开发者做出选择。

基本定位#

Hermes Agent 来自 Nous Research,GitHub 目前积累 57,169 Stars。它以 Python 构建,核心定位是「The agent that grows with you」——一个会随使用而成长的代理。官网:hermes-agent.nousresearch.com,GitHub:github.com/NousResearch/hermes-agent

OpenClaw 以 TypeScript 编写,GitHub Stars 达到 354,714,是目前热度最高的 Agent 框架之一。定位是「Personal AI assistant. Any OS. Any Platform.」——强调跨平台能力和控制平面的完整性。

数据上看,OpenClaw 的社区热度更高,但这不意味着它更适合所有场景。

设计哲学:学习循环 vs 控制平面#

这是两者最根本的差异。

Hermes 采用「学习循环优先」设计。它内置闭环系统:Agent 从复杂任务中自动提取经验、生成技能,并在后续使用中持续改进。比如你说「帮我安排会议」,它不仅执行任务,还会记住你偏好上午 10 点、倾向 Zoom 而非 Teams、习惯提前 15 分钟提醒。这些偏好被自动提炼存储,下次无需重复说明。

OpenClaw 采用「控制平面优先」设计。它的 Gateway 是 WebSocket 控制中枢,管理 sessions、channels、tools、events——人在决策链中心。你需要显式配置技能、路由规则、安全策略,Agent 不会自动「进化」,但你对其一切行为有完整掌控。比如明确规定「所有文件操作必须人工确认」、「敏感数据访问需二次验证」。这种设计牺牲便利性,换来了可预测性和可审计性。

简而言之:Hermes 追求「越用越懂你」,OpenClaw 追求「你定义它做什么」

记忆系统对比#

记忆系统是 Agent 的核心能力,两者实现差异明显。

Hermes 多层架构

  • SQLite FTS5 底层存储,支持全文检索
  • LLM summarization 自动压缩历史对话
  • Honcho dialectic user modeling 建立用户画像
  • 字符限制强制优先级排序,避免记忆膨胀

代价是复杂性——多层系统意味着多层调试。好处是跨会话检索强,Agent 能「回忆」几周前的对话细节。

OpenClaw Markdown 文件

  • 记忆以纯 Markdown 文件存储(MEMORY.mdUSER.md
  • 无硬性容量限制
  • 可人工编辑审计,完全透明

方案简单直观,适合需要手动干预记忆内容的场景。审计人员可直接查阅记忆文件,确认 Agent 行为依据。

技能生成方式#

Hermes 自动生成技能。完成复杂任务后,Agent 自动创建 skill 文件,后续类似任务可直接调用。比如你连续三次要求「将 PDF 转为 Markdown 并存入 Obsidian vault」,Hermes 分析操作模式,生成可复用技能脚本,下次只需说「转换这个 PDF」。这套机制符合 agentskills.io 开放标准,技能可跨 Agent 共享。

OpenClaw 人工编写技能。提供 52+ 内置技能,覆盖文档处理、数据分析、API 集成等常见场景,但新技能需要用户显式创建。技能平台有安装门控和 UI 管理,适合需要精细控制技能集的场景。

多维度对比#

维度HermesOpenClaw
模型支持200+ 模型(OpenRouter),一条命令切换BYOK 模式,用户自行配置 API Key
平台支持Telegram、Discord、Slack、WhatsApp、Signal、CLI22 渠道(含 WeChat、iMessage、Matrix 等)
安全机制默认沙盒隔离,容器执行,零遥测DM pairing 验证,显式 allowlist
运行环境6 种 backend:local、Docker、SSH、Daytona、Singularity、ModalNode 24,npm/pnpm/bun 安装
ServerlessModal/Daytona 支持,闲置近乎零成本无原生 serverless,需自行部署
Cron 调度内置 cron,支持多平台投递内置 cron + webhooks
部署成本5 美元 VPS 可运行推荐本地运行或托管选项

适用场景分析#

适合 Hermes 的场景

  • 长期陪伴型助手,需要跨会话记忆积累
  • Serverless 部署,预算敏感(5 美元 VPS 即可运行)
  • 多模型切换需求,不想被单一 provider 锁定
  • 希望 Agent 自主学习、减少手动配置

适合 OpenClaw 的场景

  • 企业级部署,需要完整审计能力
  • 复杂渠道路由,需精细控制消息流向
  • iOS/Android 原生集成需求(Voice Wake、Canvas)
  • 安全合规优先,需显式审批每条 DM

核心观点:两个框架各有优劣,场景决定选择。 Hermes 更适合「轻量、自进化」的个人助手场景;OpenClaw 更适合「可控、可审计」的正式部署场景。

Hermes 快速上手#

如果决定尝试 Hermes,安装极其简单:

Terminal window
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

安装后执行:

Terminal window
source ~/.bashrc
hermes setup # 配置向导
hermes # 启动对话
hermes model # 选择模型
hermes gateway # 启动消息网关

首次运行会引导选择模型 provider(推荐 OpenRouter 以获得最大模型选择范围)、配置安全策略、设置 Telegram/Discord 等平台连接。完整文档见 hermes-agent.nousresearch.com/docs

如果从 OpenClaw 迁移,Hermes 提供一键迁移命令:

Terminal window
hermes claw migrate --dry-run # 先预览
hermes claw migrate # 执行迁移

会导入 SOUL.md、记忆文件、技能、API Keys 等历史配置。

结语#

选择框架本质是选择一种 Agent 与人交互的范式:让 Agent 自主进化,还是让人类完全掌控?Hermes 和 OpenClaw 代表了两种截然不同的答案。建议先用 Hermes 起步——它的学习循环能让你快速体验「Agent 会成长」的感觉,之后再根据实际需求决定是否切换到 OpenClaw 的控制平面模式。

选择哪一个,取决于你的核心诉求是效率还是控制。

支持与分享

如果这篇文章对你有帮助,欢迎分享给更多人或赞助支持!

赞助
Hermes Agent vs OpenClaw:控制还是进化?
https://blog.moewah.com/posts/hermes-agent-vs-openclaw-comparison/
作者
MoeWah
发布于
2026-04-10
许可协议
CC BY-NC-SA 4.0
Profile Image of the Author
MoeWah
Hello, I'm MoeWah.
分类
标签
站点统计
文章
174
分类
9
标签
377
总字数
304,552
运行时长
0
最后活动
0 天前

目录