1432 字

7 分钟

Hermes Agent vs OpenClaw：控制还是进化？

2026-04-10

AI工具

AI Agent

最近 AI Agent 领域涌现出两个备受关注的框架：Hermes Agent 和 OpenClaw。我在研究过程中发现，它们定位相似——都是「个人 AI 助手」，但底层设计哲学截然不同。这篇文章从技术角度拆解两者的差异，帮助刚接触 AI Agent 的开发者做出选择。

基本定位#

Hermes Agent 来自 Nous Research，GitHub 目前积累 57,169 Stars。它以 Python 构建，核心定位是「The agent that grows with you」——一个会随使用而成长的代理。官网：hermes-agent.nousresearch.com，GitHub：github.com/NousResearch/hermes-agent。

OpenClaw 以 TypeScript 编写，GitHub Stars 达到 354,714，是目前热度最高的 Agent 框架之一。定位是「Personal AI assistant. Any OS. Any Platform.」——强调跨平台能力和控制平面的完整性。

数据上看，OpenClaw 的社区热度更高，但这不意味着它更适合所有场景。

设计哲学：学习循环 vs 控制平面#

这是两者最根本的差异。

Hermes 采用「学习循环优先」设计。它内置闭环系统：Agent 从复杂任务中自动提取经验、生成技能，并在后续使用中持续改进。比如你说「帮我安排会议」，它不仅执行任务，还会记住你偏好上午 10 点、倾向 Zoom 而非 Teams、习惯提前 15 分钟提醒。这些偏好被自动提炼存储，下次无需重复说明。

OpenClaw 采用「控制平面优先」设计。它的 Gateway 是 WebSocket 控制中枢，管理 sessions、channels、tools、events——人在决策链中心。你需要显式配置技能、路由规则、安全策略，Agent 不会自动「进化」，但你对其一切行为有完整掌控。比如明确规定「所有文件操作必须人工确认」、「敏感数据访问需二次验证」。这种设计牺牲便利性，换来了可预测性和可审计性。

简而言之：Hermes 追求「越用越懂你」，OpenClaw 追求「你定义它做什么」。

记忆系统对比#

记忆系统是 Agent 的核心能力，两者实现差异明显。

Hermes 多层架构：

SQLite FTS5 底层存储，支持全文检索
LLM summarization 自动压缩历史对话
Honcho dialectic user modeling 建立用户画像
字符限制强制优先级排序，避免记忆膨胀

代价是复杂性——多层系统意味着多层调试。好处是跨会话检索强，Agent 能「回忆」几周前的对话细节。

OpenClaw Markdown 文件：

记忆以纯 Markdown 文件存储（MEMORY.md、USER.md）
无硬性容量限制
可人工编辑审计，完全透明

方案简单直观，适合需要手动干预记忆内容的场景。审计人员可直接查阅记忆文件，确认 Agent 行为依据。

技能生成方式#

Hermes 自动生成技能。完成复杂任务后，Agent 自动创建 skill 文件，后续类似任务可直接调用。比如你连续三次要求「将 PDF 转为 Markdown 并存入 Obsidian vault」，Hermes 分析操作模式，生成可复用技能脚本，下次只需说「转换这个 PDF」。这套机制符合 agentskills.io 开放标准，技能可跨 Agent 共享。

OpenClaw 人工编写技能。提供 52+ 内置技能，覆盖文档处理、数据分析、API 集成等常见场景，但新技能需要用户显式创建。技能平台有安装门控和 UI 管理，适合需要精细控制技能集的场景。

多维度对比#

维度	Hermes	OpenClaw
模型支持	200+ 模型（OpenRouter），一条命令切换	BYOK 模式，用户自行配置 API Key
平台支持	Telegram、Discord、Slack、WhatsApp、Signal、CLI	22 渠道（含 WeChat、iMessage、Matrix 等）
安全机制	默认沙盒隔离，容器执行，零遥测	DM pairing 验证，显式 allowlist
运行环境	6 种 backend：local、Docker、SSH、Daytona、Singularity、Modal	Node 24，npm/pnpm/bun 安装
Serverless	Modal/Daytona 支持，闲置近乎零成本	无原生 serverless，需自行部署
Cron 调度	内置 cron，支持多平台投递	内置 cron + webhooks
部署成本	5 美元 VPS 可运行	推荐本地运行或托管选项

适用场景分析#

适合 Hermes 的场景：

长期陪伴型助手，需要跨会话记忆积累
Serverless 部署，预算敏感（5 美元 VPS 即可运行）
多模型切换需求，不想被单一 provider 锁定
希望 Agent 自主学习、减少手动配置

适合 OpenClaw 的场景：

企业级部署，需要完整审计能力
复杂渠道路由，需精细控制消息流向
iOS/Android 原生集成需求（Voice Wake、Canvas）
安全合规优先，需显式审批每条 DM

核心观点：两个框架各有优劣，场景决定选择。 Hermes 更适合「轻量、自进化」的个人助手场景；OpenClaw 更适合「可控、可审计」的正式部署场景。

Hermes 快速上手#

如果决定尝试 Hermes，安装极其简单：

1
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

安装后执行：

1
source ~/.bashrc
2
hermes setup    # 配置向导
3
hermes          # 启动对话
4
hermes model    # 选择模型
5
hermes gateway  # 启动消息网关

首次运行会引导选择模型 provider（推荐 OpenRouter 以获得最大模型选择范围）、配置安全策略、设置 Telegram/Discord 等平台连接。完整文档见 hermes-agent.nousresearch.com/docs。

如果从 OpenClaw 迁移，Hermes 提供一键迁移命令：

1
hermes claw migrate --dry-run    # 先预览
2
hermes claw migrate              # 执行迁移

会导入 SOUL.md、记忆文件、技能、API Keys 等历史配置。

结语#

选择框架本质是选择一种 Agent 与人交互的范式：让 Agent 自主进化，还是让人类完全掌控？Hermes 和 OpenClaw 代表了两种截然不同的答案。建议先用 Hermes 起步——它的学习循环能让你快速体验「Agent 会成长」的感觉，之后再根据实际需求决定是否切换到 OpenClaw 的控制平面模式。