Hermes vs OpenClaw：当 Agent 基础设施走向分叉，谁在定义下一代数字主权

如果你今天还在用一张“支持多少平台、接了多少模型、会不会写代码”的功能表，去给 Agent 基础设施打分，那你其实已经错过了真正的战场。

2024 年和 2025 年，行业里最流行的误解，是把一切带 tool call 的产品都叫作 Agent；2026 年，这种误解正在变得更加昂贵。因为真正决定 Agent 上限的，早就不再是它能不能调一个 Shell、会不会写一段 CRUD，也不是它能否把 Telegram 和 Discord 接起来。真正决定上限的，是四件更深的事情：入口由谁掌控、记忆如何沉淀、执行环境能否迁移、经验能否转化为长期能力。

截至今日，当我重新核对 OpenClaw 官方文档与 Hermes Agent 官方文档之后，我越来越确信：OpenClaw 和 Hermes 之所以值得被放在一起写，不是因为它们“长得像”，而是因为它们代表了两条已经清晰分叉的基础设施路线。

OpenClaw 更像一套以 消息入口、网关控制、本地主权、多平台代理接入与工作空间编排 为中心的 Agent 操作底座。它首先回答的是：消息从哪里进来，命令如何路由，哪些设备能力可以开放，哪些物理边界必须锁死。

而 Hermes 则把更大的赌注押在 学习闭环、持久记忆、技能生成、运行时迁移与长期能力演化 上。它首先回答的是：这个 Agent 如何越用越懂你，如何把一次次会话沉淀成可复用技能，如何在不同环境中继续工作，而不是每次都从零开始。

所以，这篇文章不是测评，不是安装指南，也不是“谁更强”的饭圈式站队。它真正要辨析的，是一个更根本的问题：

在 Agent 时代，你究竟需要一个可控的网关，还是一个会成长的系统？你争取的到底是入口主权，还是学习主权？

一、Agent 时代真正开始分叉了

今天很多人一提到 Agent，脑子里浮现的依然是一个聊天框，再外加几个工具按钮。这个认知并不完全错，但它只覆盖了最浅的一层。那一层的重点是“会不会执行”；而基础设施真正关心的，是“执行发生在什么边界内、由什么历史驱动、能否被持续治理”。

为什么我说 2026 年以后，Agent 工具链的竞争已经不再是“会不会调工具”，而是“谁来掌控入口、记忆、执行环境与长期演化”？原因很简单。工具调用这件事，已经越来越像云时代的 HTTP 请求能力，迟早会变成标配。真正稀缺的，不是一个 Agent 能不能把命令发出去，而是：

它从哪里接收到任务；
它能记住多久；
它的经验能否在下一次调用时继续生效；
它能不能离开你的这台笔记本，在更稳定、更隔离、更适合长期运行的环境里持续工作；
它的“人格”“规则”“技能”“上下文资产”是否可迁移、可审计、可治理。

事情已经变了。我们讨论的重点，已经从“让模型动起来”，转向“让系统长出来”。

这也是为什么我越来越反感一种极其偷懒的比较方式：把不同层级的产品全部塞进同一个表格里，左边写“支持 Telegram/Discord”，右边写“支持记忆/自动化/子代理”，最后得出一个“功能更多所以更强”的结论。这样的比较，和拿 NAS、Kubernetes、消息中间件与协同办公软件做横向评分没有本质区别，表面上都沾边，实际上根本不在同一个战略层面。

OpenClaw 和 Hermes 的真正价值，不在于它们都能接平台、调模型、写文件，而在于它们分别选择了不同的“中心”。一个把中心建在 Gateway 上，一个把中心建在 Learning Loop 上。一个更关心系统如何接住现实世界的消息流与设备边界，一个更关心系统如何在时间中形成自我连续性。

这不是小差异。这是系统人格的分水岭。

如果一个产品从诞生之初就把“消息入口与平台治理”放在第一位，那么它后续的一切设计，包括工作空间隔离、节点能力声明、配对机制、权限裁剪、命令队列，都会围绕“控制平面”展开。

如果一个产品从诞生之初就把“记忆、技能、长期成长”放在第一位，那么它后续的一切设计，包括 bounded memory、session search、skill improvement、subagent delegation、remote backends、scheduled automation，都会围绕“持续性”展开。

你看，分叉其实不是从“支持什么功能”开始的，而是从“系统首先害怕失去什么”开始的。

OpenClaw 害怕失去的是入口、边界与主权。

Hermes 害怕失去的是连续性、经验与成长。

这就是我们后面所有分析的底盘。

二、为什么 Hermes 和 OpenClaw 值得被放在一起比较

有些比较从一开始就不成立。比如把一个 IDE 内补全插件，和一个自托管消息网关放在一起打分，通常只会得出空洞结论。但 Hermes 与 OpenClaw 不一样，它们之间不仅有可比性，甚至还带着一丝明确的“谱系关系”。

先看 OpenClaw。截至 4 月 22 日，我核对的 OpenClaw Gateway Architecture 文档非常明确：它的核心是一个单一、长期运行的 Gateway。所有消息 surface 都归 Gateway 所有，Gateway 通过 WebSocket 与 clients、nodes 建立连接，默认控制平面监听在 127.0.0.1:18789。文档甚至强调，每台主机只应有一个 Gateway，它不仅是控制平面的枢纽，也是某些平台会话唯一的持有者。

这说明什么？说明 OpenClaw 从来就不是一个“会聊天的壳子”。它是把 Agent 放进可治理的消息与执行基础设施里来理解的。平台入口、身份绑定、工作区路由、节点能力声明、配对审批、队列调度，这些不是旁枝末节，而是主干。

再看 Hermes。截至同一天，我核对的 Hermes Agent 文档首页与 Features Overview 的表述相当明确：Hermes 把自己定义成一个“会自我改进的 agent”，重点落在闭环学习、技能生成、长期记忆、子代理协作、远程终端后端、自动化调度与多平台接入。它不是一个只靠“当下上下文”过日子的聊天机器人，而是试图让每次成功与失败都在后续行为中留下痕迹。

如果只是这样，二者还可以被理解为“同赛道里的不同风格”。但真正让我确认这篇文章值得写下去的，是 Hermes 官方提供的 Migrate from OpenClaw 指南。

这件事的意义非常大。

一个项目愿意专门提供另一个项目的迁移路径，通常说明三件事：

它认为对方用户与自己目标用户高度重叠；
它认为对方沉淀下来的资产值得继承，而不是必须抛弃；
它不只是想做“新工具”，而是想接管一段既有工作流和心智模型。

而 Hermes 的迁移指南，恰恰就暴露了这种野心。它不仅尝试接住 SOUL.md、AGENTS.md、MEMORY.md、skills、providers、approval mode、gateway tokens、MCP servers，甚至连 session reset 策略、消息平台配置、环境变量映射都要一起带走。它并不是只想把你“拉新”，而是想把你在 OpenClaw 里已经形成的行为资产一起吞进来。

所以，Hermes 与 OpenClaw 不是两个毫无关系的并列名词，它们更像是同一问题上的两种答案：

如果你首先把 Agent 当作一个需要严控入口和边界的控制系统，你会更容易走向 OpenClaw；
如果你首先把 Agent 当作一个需要持续积累与进化的长期系统，你会更容易走向 Hermes。

它们之所以值得比较，不是因为功能重叠，而是因为它们都在争夺“Agent 基础设施”的定义权。

三、先拆 OpenClaw：它本质上是一台 Agent 网关，而不是单纯聊天壳子

我在之前的两篇 OpenClaw 文章里，已经用过比较重的措辞去形容它：数字领地、代理操作系统、物理隔离、多平台代理枢纽。今天重新回头看，我依然认为这种判断大体成立，但我更愿意把它说得再精准一点：

OpenClaw 首先是一台 Gateway-first 的 Agent 控制平面。

很多人一看到它能接 Telegram、Discord、Slack、Signal、WhatsApp，以及 Matrix、Feishu、Microsoft Teams 这类扩展渠道，就会本能地把它归类成“高级聊天桥接器”。这其实低估了它。平台接入只是你肉眼最容易看到的一层，真正有分量的，是它围绕 Gateway 建立起来的那整套治理逻辑。

根据 Gateway Architecture 与 Agent Runtime 的设计，OpenClaw 把系统拆成了几个非常鲜明的角色：

Gateway：长期运行的中心进程，持有消息 surface、会话状态、路由能力与部分平台专属连接；
Clients：通过 WebSocket 连入 Gateway 的界面或交互端；
Nodes：也通过 WebSocket 接入 Gateway，但它们不是 UI，而是带着显式能力声明的执行节点；
Workspace / Session / Agent 配置：决定消息如何落到不同上下文、不同规则与不同运行边界。

这意味着，在 OpenClaw 的世界观里，“Agent”从来不是一个抽象人格，而是一套被放进消息入口、工作空间、权限声明、节点能力与路由规则中的可执行实体。

更具体一点说，OpenClaw 的运行时并不是一团漂浮的“多代理幻觉”。文档里写得很明白：它有一个嵌入式 agent runtime，而 channels、sessions、routing、nodes、bootstrap files 与 tools 决定了这个 runtime 在什么边界内工作。也正因为如此，它给人的感觉才更像控制平面，而不是一串随手堆起来的 prompt。

这很重要。因为一旦你把问题定义成“控制平面”，很多原本会被聊天产品忽视的东西，就会一下子变成头等大事。

1. 入口统一不是锦上添花，而是系统的第一性原则

OpenClaw 的官方设计把“统一消息入口”放在极高的位置。你可以把 Telegram、Discord、Slack、WhatsApp、Signal 这类外部平台理解成不同国家的港口，而 Gateway 就像一个中央海关。所有船都可以来，但不是直接闯进仓库，而是先经过主权边界、身份验证、路由判断、会话归属、节点能力裁剪，最后再进入具体工作空间。

这就是为什么 OpenClaw 的很多“繁琐配置”其实不是负担，而是这种世界观的自然结果。比如：

某些平台需要配对审批，而不是 token 一贴就自动放行；
某些账号需要群组白名单或明确 mention 才能触发；
某些设备能力必须在节点层做 deny commands；
某些工作区必须物理隔离，避免上下文污染；
某些自动回复需要进队列，不能并发乱闯。

如果你只是把 Agent 当作一个“更聪明的聊天机器人”，这些设计会显得很重；但如果你把它当作一个真实连接多平台、多设备、多工作空间、多模型提供商的执行中枢，这些设计才像它该有的样子。

2. `127.0.0.1:18789` 背后的，不只是一个端口

我一直很喜欢 OpenClaw 文档对默认控制平面的处理方式。它把核心监听收敛到 127.0.0.1:18789，强调 loopback、本地优先、必要时通过 Tailscale 或 SSH tunnel 暴露。这并不花哨，却极其说明问题。

因为这意味着它默认把 Agent 视作需要先守住本机边界的系统，而不是天然开放在公网的服务。

这背后的思想其实很朴素：如果一个系统可以执行命令、读写文件、连接设备、代你回应外部消息，那它首先应该被看作“高权限基础设施”，而不是“会话产品”。一旦这样理解，端口绑定、令牌认证、节点 capability 声明、命令黑名单、会话范围隔离，就都不是次要细节，而是主权设计的一部分。

3. 节点能力声明，让“执行”从黑箱变成了协商

很多所谓 Agent 工具，表面上也能执行 Shell、读写文件、操作浏览器，但这些能力往往是隐式的，甚至有点“工具一开，听天由命”的味道。OpenClaw 对 nodes 的处理更接近工程世界里的资源协商：节点通过 WebSocket 连入 Gateway，并带着自己的能力、命令支持范围、执行环境特征参与系统。

这件事有两个意义。

第一，它让执行权从“模型想干什么”退回到“节点允许什么”。这看似保守，实则成熟。

第二，它把多机、多环境、多能力层级的调度问题，从“提示词技巧”变成了显式架构问题。你的某个节点可以只负责安全地执行 Shell，另一个节点可以负责受限的浏览器访问，再一个节点可以挂在更高算力机器上提供重推理。这样一来，Agent 不再只是一个人格，它背后是一张可编排的能力网络。

4. SOUL、Workspace 与会话边界，构成了 OpenClaw 的性格骨架

我之前写 OpenClaw 的时候，尤其强调过 SOUL.md 的价值。今天回头看，我依然觉得这是 OpenClaw 最容易被忽视、却非常关键的一点。

在很多工具里，“人格设定”只是 system prompt 的另一种包装；而在 OpenClaw 体系里，SOUL.md、AGENTS.md、USER.md、工作区规则、会话边界、memory 文件与 skills 之间，形成了一个更接近操作约束 + 性格约束 + 项目约束的组合体。官方 system prompt 文档甚至把这些文件明确列成 bootstrap context 的一部分，这就意味着它们不是边角配置，而是行为面的骨架。

这套设计的妙处在于，它默认承认了一件事实：Agent 的“个性”不是一句 prompt 能讲完的，它需要和工作空间、权限边界、长期记忆共同构成一个稳定的行为面。

这也是为什么我会把 OpenClaw 视作“数字领地底座”而不是玩具 bot。它的重点从来不是一句话生成得多漂亮，而是你能否在一个统一入口上，把多个平台、多个工作区、多个角色、多个能力节点收编进同一治理框架。

5. OpenClaw 的内核焦虑，是失去控制

理解一个系统最好的方式，不是看它宣传什么，而是看它最怕什么。

OpenClaw 最怕什么？

它最怕的是：

入口失控；
平台混乱；
会话串线；
节点越权；
设备能力被提示词注入滥用；
多代理互相污染；
外部消息直接顶到执行层。

所以它做出来的一切都带着一种鲜明的“控制平面气质”。哪怕是在 memory、skills、agent teams 这些更像“聪明层”的地方，你也能感觉到它始终不愿意失去对边界与归属的把控。

这就是 OpenClaw 的底色。

它不是先问“Agent 能不能更像人”，它先问“Agent 能不能先像一套可靠的系统”。

6. OpenClaw 的系统图像

CodeBlock Loading...

你会发现，这张图里最粗的那根骨头不是模型，而是 Gateway。模型当然重要，但在 OpenClaw 的叙事里，它更像可替换算力，而不是文明中心。

这就是 OpenClaw 的强项，也是它的宿命。

四、再拆 Hermes：它真正想解决的是 Agent 如何越用越像一个人

如果说 OpenClaw 的世界观，是先造一座边界清晰、路由明确、可接万渠的港口城市，那么 Hermes 的野心更像另一种东西：它想造的不是港口，而是神经系统。

这句话听上去像夸张修辞，但当你把 Hermes 的官方文档从头到尾读一遍，会发现它几乎所有主轴都在围绕同一个问题打转：

一个 Agent，怎样才能不是每次都像第一次见你？

Hermes 文档把自己的身份定义得非常鲜明：它不是一个绑在 IDE 里的代码补全器，也不是一个只能靠单轮上下文撑场面的聊天机器人。它试图成为一个会积累、会迁移、会委派、会自我修正的长期系统。

1. 闭环学习，不是一个营销词，而是产品中心

在 Hermes 的叙事里，最关键的不是“有记忆”，而是记忆能否形成闭环。这和很多产品嘴上说“我们也有 memory”完全不是一回事。

Hermes 不是把记忆当作一个辅助模块，而是把它当作系统的方向盘之一。它关心的不只是“保存过什么”，更关心：

哪些经验值得进入始终加载的短记忆；
哪些历史应该进入可搜索的长记忆；
哪些成功模式可以被提炼成 skills；
哪些失败应当被总结为行为修正；
用户的偏好、习惯、语气和禁忌，能否在后续任务里自然生效。

这就是官方文档不断强调 closed learning loop 的原因。真正稀缺的，不是“保存聊天记录”，而是让聊天记录、项目经验、执行反馈和技能资产互相转化。

2. bounded persistent memory，说明 Hermes 不是在幻想“无限记忆”

我很欣赏 Hermes 对 memory 的一个处理：它没有天真地承诺“无限上下文”或者“什么都记住”，而是做了一套分层结构。

根据 Hermes Persistent Memory 与 Sessions 文档，Hermes 的核心长期记忆至少分成了几层：

一个始终在上下文中的 MEMORY.md，默认预算约为 2200 字符；
一个面向用户建模的 USER.md，默认预算约为 1375 字符；
基于 SQLite FTS5 的 session_search，可以在 state.db 与 JSONL transcript 所构成的会话历史里检索再总结；
外部 memory provider 插件，可以接入更专业的长期记忆存储。

这意味着 Hermes 不是在搞“无限装载”的幻觉，而是在做一种更像认知系统的分层：

有些东西必须时刻记得；
有些东西不必常驻，但要能在需要时想起来；
有些东西不该只是记住，而该被提炼成技能；
有些东西则应该被沉淀为稳定的用户模型。

这比“把所有历史都硬塞进上下文”成熟得多。因为真实的成长，从来不是信息越多越好，而是筛选、压缩、召回与抽象的质量越高越好。

3. Skills 在 Hermes 里，不是插件边角，而是程序性记忆

Hermes 的 skills 体系之所以重要，并不是因为“它也支持技能”，而是因为它把技能放在一个近乎核心资产的位置上。

在 Hermes 的设计里，skills 不是单纯的 prompt 模板，也不是给用户显摆花样的小工具包。它更接近一种程序性记忆：把一次次完成任务的稳定方法，提炼成可以复用、共享、迁移、组合的行为单元。

更有意思的是，Hermes 还把 skills 视作开放标准的一部分，和 agentskills.io 这样的生态产生关系。这说明它不只是想让你“本地多几个技能包”，而是试图把技能当成跨项目、跨环境、跨人群都可以流动的资产。

这和 OpenClaw 的 skills 叙事很不一样。OpenClaw 当然也有 skills、plugins、工作区技能与管理技能，但在它的产品神话里，skills 更多像是可编排能力的一部分；而在 Hermes 的叙事里，skills 更像成长之后留下来的能力结晶。

4. 六种 terminal backends，暴露了 Hermes 的另一个核心欲望：脱离单机束缚

Hermes 的另一个非常关键的信号，是它对运行时后端的抽象。

按我核对的文档，Hermes 当前列出的终端后端包括 local、docker、ssh、Daytona、Singularity、Modal。这个列表本身，比一百句宣传语都更能说明问题。

因为它告诉你：Hermes 想解决的不是“在你的笔记本上跑一个 agent”，而是“让 agent 可以在不同安全等级、不同持续时长、不同隔离强度、不同成本模型的环境里继续活着”。

这和 OpenClaw 的思路差别很大。

OpenClaw 当然也能通过 nodes 把执行能力拉到不同机器上，但它的重心依然是Gateway 如何统御这些节点；Hermes 则更像是在说：Agent 本身不该被困在你当前这台机器上，它应该能够迁移到更适合它工作的环境里。

这会直接带来几个现实优势：

长时间任务不再必须占着你的本机；
更高风险的执行可以放入容器或远端隔离环境；
更高算力需求的任务可以迁到 SSH/Modal/Daytona 等后端；
你的聊天入口与实际执行环境可以物理分离。

这就是为什么我说 Hermes 的野心已经不仅是“让 agent 接入 Telegram/Discord”，而是“让 agent 在时间和空间上都具备持续性”。

5. Delegation 让 Hermes 更像一个会分工的系统，而不是一张万能嘴

Hermes 的 subagent delegation 同样不是一个边缘彩蛋，而是核心能力的一部分。官方文档对 child agent、并发上限、上下文隔离、深度限制、delegation patterns 都给了明确说明。以当前文档为准，默认最多并发 3 个子代理；默认 max_spawn_depth=1，也就是平面委派，子代理不能继续递归派生。只有显式启用 role="orchestrator" 并把 max_spawn_depth 提高到 2 或 3，才会出现孙代理层级。父代理收到的也不是原样上下文回灌，而是子代理的结构化总结。这意味着 Hermes 不是简单支持“多开几个任务”，而是在认真把任务分工做成一等公民。

这件事的意义，远不只是性能或方便。

它意味着 Hermes 默认承认：一个足够复杂的 Agent，不应该永远靠单一上下文、单一人格、单一执行路径去硬扛所有任务。复杂工作要拆、要分工、要隔离上下文、要限制深度、要控制并发、要让 orchestrator 和 worker 的责任分开。

这个思路非常像现代工程体系里的微服务和任务编排，但 Hermes 试图把它下沉进“个体 agent”的日常运行里。一个 agent 不再只是一个输出接口，而更像一个会调度自己分身的工作系统。

6. Messaging gateway 在 Hermes 里也重要，但不再是唯一神

有人可能会说：Hermes 也有 messaging gateway，也能接十几个平台，为什么还要强调它和 OpenClaw 不一样？

答案是：重要性排序不同。

Hermes 的 gateway 的确很强。按 sessions 文档列出的来源，它覆盖了 CLI、本地 TUI、Telegram、Discord、Slack、WhatsApp、Signal、Matrix、email、cron、webhook 等会话入口。但 Hermes 的整个产品叙事，并没有像 OpenClaw 一样把 Gateway 塑造成宇宙中心。

在 Hermes 的世界里，messaging gateway 更像一条非常重要的输入输出神经，而不是整个神经系统本身。真正的中心，仍然是 memory、skills、delegation、backends 与 automations 共同构成的持续工作能力。

7. Hermes 的系统图像

CodeBlock Loading...

这张图和 OpenClaw 那张图最大的区别，不在于有没有 gateway，而在于哪根线最粗。在 Hermes 里，最粗的线不再是入口，而是持续性。

它要的不是一座把船接进来的港口，而是一个会长出经验、技能和分工机制的工作大脑。

五、第一轮正面对决：两者在设计哲学上到底差了什么

如果前面两章还只是拆解，那么从这里开始，我们就该把刀口直接对准核心差异了。

很多文章喜欢在这个时候开始列表，说谁支持 Telegram，谁支持 SSH，谁支持自动化，谁支持 memory。那种比较当然也能做，但它很容易把真正重要的问题稀释掉。

我更愿意先给出一句可能会得罪一部分人的判断：

OpenClaw 和 Hermes 的差异，本质上不是功能差异，而是“系统人格差异”。

一个系统的功能可以补，一个系统的插件可以装，一个系统的模型提供商可以换；但一个系统最初把什么当成文明中心，这个东西通常非常难改。它会决定默认配置、文档叙事、治理逻辑、扩展方向、用户群体，甚至决定它遇到矛盾时优先保护什么。

1. OpenClaw：通道优先、控制平面优先、主权先行

OpenClaw 的哲学可以浓缩成一句话：

先把入口和边界守住，再谈智能如何生长。

所以你会看到它天然偏好：

单一长期运行的 Gateway；
统一消息 surface；
明确的节点能力声明；
会话与工作区隔离；
平台配对与审批；
物理级权限裁剪；
通过 routing 和 policy 来控制“谁能被什么触发”。

这是一种很工程化、很像“控制系统”的思维。它先把交通秩序、安保系统、港口调度和仓库归属建好，再来讨论仓库里放什么货。

这也解释了为什么 OpenClaw 的魅力，往往会最先打动那类特别在意边界的人：极客、自托管爱好者、多平台代理重度使用者、本地优先主义者、对设备权限和网络暴露有明确警惕的人。

2. Hermes：学习优先、能力积累优先、运行环境抽象优先

Hermes 的哲学则是另一句话：

先让 Agent 拥有时间维度，再谈它如何接住更多入口。

所以你会看到它天然偏好：

bounded persistent memory；
session search 与长期召回；
user modeling；
skills 的沉淀与开放标准化；
subagent delegation；
remote terminal backends；
scheduled automations；
把经验转化为下一次能力的闭环。

这是一种更像“认知系统”的思维。它关心的不是先建一个巨大的港口，而是先让大脑学会记住、学会检索、学会归纳、学会把成功模式固化成技能，然后再让这些能力进入更多输入输出通道。

这也解释了为什么 Hermes 会更吸引另一类人：长期与 agent 协作的人、希望 agent 越用越懂自己的人、需要 remote execution 的人、需要分工与自动化的人、把 agent 当作长期生产系统而不是消息机器人来使用的人。

3. 它们真正分叉的地方，是“先保护什么”

如果要我用一句极端凝练的话来总结两者差异，我会说：

OpenClaw 首先保护的是系统的边界；Hermes 首先保护的是系统的连续性。

这句话很重要。

因为边界与连续性，恰恰是 Agent 基础设施最容易互相拉扯的两端。

你越强调边界，系统往往越保守、越审慎、越依赖显式规则；
你越强调连续性，系统往往越想积累、越想召回、越想迁移、越想从历史中长出新的能力。

一个产品的默认姿态，本质上就是它对这组张力的取舍。

4. 一张总对照表

维度	OpenClaw	Hermes
核心叙事	统一消息入口、网关主权、可控执行边界	学习闭环、长期记忆、能力演化
控制中心	Gateway / Routing / Nodes	Memory / Skills / Delegation / Backends
系统气质	控制平面、港口、调度中枢	认知系统、神经网络、工作大脑
优先保护	入口、权限、会话边界、设备能力	连续性、召回质量、技能资产、长期人格
适合的第一批用户	多平台入口重度用户、自托管极客、主权优先者	长期协作者、重记忆和自动化者、远程运行重度用户
最大诱惑	一切入口收编到自己控制之下	一个 Agent 越用越像“你的系统”
最大代价	配置重、边界治理复杂、平台兼容性持续维护	记忆治理难、技能膨胀、远程后端安全与成本管理复杂

看明白这张表之后，你其实已经能理解后面大半篇文章的结论了。

OpenClaw 更像“通道优先、控制平面优先、主权先行”的系统。

Hermes 更像“学习优先、能力积累优先、运行环境抽象优先”的系统。

这一章不讨论输赢，只讨论气质。因为很多时候，用户选错工具，不是功能不够，而是气质不合。

六、第二轮正面对决：入口、记忆、技能、执行环境、协作模型逐项拆开

现在我们进入更硬的一层。既然系统人格已经定性，那就必须把关键模块逐项拆开，看看这种人格到底是怎么落到技术结构里的。

1. 入口层：OpenClaw 把入口当疆域，Hermes 把入口当神经末梢

OpenClaw 的入口观非常强硬。Gateway 持有所有消息 surface，这不仅是实现问题，更是政治问题。它相当于在说：所有来自外部世界的触发，都必须先经过我这个中央关口。

这就是为什么 OpenClaw 的平台适配、工作区匹配、配对审批、群组 allowlist、mention policy、account 绑定、channel scope 都那么显眼。它不允许入口绕过控制面，直接撞到执行层。

从工程角度看，这种设计有三个明显好处：

入口统一，利于治理；
平台差异被 Gateway 吃掉，利于抽象；
安全策略、路由策略、工作区归属都可集中管理。

但代价也存在：入口一旦成为一切的中心，你的复杂度也会在这里堆积。平台兼容性、会话奇怪行为、token 轮换、bot 权限、平台 API 漂移，都更容易在 Gateway 层持续吞噬维护精力。

Hermes 当然也不缺入口。官方文档里的会话来源覆盖得很广，从 CLI 到消息平台，再到 email、cron 与 webhook 都算入口。但 Hermes 对入口的态度更像是：它必须强，但它不是文明中心。

这就像一个人拥有嘴巴、耳朵、眼睛，但文明中心不是感官，而是大脑与神经系统。Hermes 的消息入口很强，却更像服务于长期系统的 I/O 层，而不是唯一主轴。

如果你最看重的是“把各种现实世界入口统一收编”，OpenClaw 会天然更打你；如果你更看重“入口只是任务进入系统的一种方式”，Hermes 的视角会更顺。

2. 记忆层：OpenClaw 更像可审计笔记本，Hermes 更像分层认知架构

这可能是二者最容易被说成“都差不多”的地方，但其实恰恰相反：它们在记忆上的差异，非常能暴露路线分叉。

根据 OpenClaw Memory Overview，OpenClaw 的 memory 体系围绕文件化与工作区可见性展开。官方直接强调：模型只会记住写进磁盘的东西，没有隐藏状态。MEMORY.md 是常规长期记忆入口，memory/YYYY-MM-DD.md 承担 daily notes 的角色，而且今天与昨天的日记会被自动加载；DREAMS.md 则承担更像“后台整理”或灵感沉淀的角色。除此之外，它还有 memory_get、memory_search 之类工具，并通过 SQLite / 向量 / 混合搜索来完成召回。

这套体系的优点非常鲜明：

可审计；
可编辑；
与工作区绑定清晰；
记忆是一种你能摸得着、改得了、提交得出的资产；
对于本地优先和项目导向的使用方式非常友好。

你甚至可以把它理解成一种“工程师式记忆”：它不追求像人脑那样暧昧而流动，而是尽量把长期经验落成结构清晰、归属明确、文件可见的存档。

而 Hermes 的记忆观则明显更“认知化”。

它一方面给出严格的 bounded memory：MEMORY.md 与 USER.md 都有明确的上下文预算，不鼓励失控膨胀；另一方面又通过 session_search 和 FTS5 把历史检索能力做成一等公民，还允许接入外部 memory provider。也就是说，Hermes 把“记住”拆成了至少三层：

常驻短记忆；
可搜索的长记忆；
可结构化沉淀的技能与用户模型。

这套思路更接近人的认知系统：不是所有东西都要一直背着，但该想起来的时候要能想起来；不是所有历史都值得常驻，但有些模式应该被抽象成能力，而不是变成堆积的聊天记录。

所以，如果要一句话总结二者记忆差异，我会说：

OpenClaw 的记忆像一本可审计、可归档、可控边界的工程日志。

Hermes 的记忆像一个会筛选、召回、压缩并继续长出技能的认知分层系统。

3. 技能层：OpenClaw 的技能更像扩展能力，Hermes 的技能更像经验结晶

OpenClaw 的 skills、plugins、bundled channels、workflow pipelines 当然不弱。它有足够强的扩展性，也允许工作区技能和管理技能共存。这一套更接近“把 Agent 的手脚装齐”：让它可以处理更多动作、更多平台、更多外部连接。

但 Hermes 的 skills 叙事更像是在说：技能不是外挂，而是经验的硬化形态。

这带来两个很大的差异。

第一，Hermes 的 skill 更强调 portable、standardized、shareable。它希望技能不仅能在你当前任务里用，还能成为你未来所有任务的资产。

第二，Hermes 的 skill 更紧密地连接 memory 与 learning loop。也就是说，skills 并不只是“提前写好的技巧包”，它们还承担了一部分“把长期经验固化成可复用方法”的功能。

这就是为什么我会说，OpenClaw 的 skills 更像扩展能力，Hermes 的 skills 更像程序性记忆。

4. 执行层：OpenClaw 强在控制，Hermes 强在迁移

执行层的差异同样非常深。

OpenClaw 的执行世界，是 Gateway 统御下的 nodes 世界。你可以把它理解成：所有执行都必须纳入一个中心控制面里，被工作区归属、节点能力、命令权限与平台路由共同约束。它非常适合处理“这台机器能干什么、那台机器能干什么、哪些命令必须拉黑、哪些设备能力绝不开放”这类问题。

这种设计对于强调物理边界的人极具吸引力。因为你清楚知道：

哪个节点提供了什么能力；
哪些命令会被拦截；
哪些工作区能访问哪些文件；
哪个平台来的消息最终会进入哪个执行环境。

而 Hermes 的执行层，则明显更偏向“运行时抽象”。它把 local、docker、ssh、Daytona、Singularity、Modal 这些后端放到同一个终端抽象之下，本质上是在回答一个更大的问题：

Agent 该不该永远绑定在用户眼前这台机器上？

Hermes 的答案显然是否定的。

这种思路的优点，在今天越来越明显：

远程任务不再依赖本地机器持续在线；
隔离环境变成常态，而非额外补丁；
迁移工作负载到更合适的环境更自然；
你可以把聊天入口留在日常平台，把高风险执行丢给更强、更远、更隔离的后端。

所以，OpenClaw 强在可控执行，Hermes 强在可迁移执行。这两个词看起来只差一个字，背后其实是两套完全不同的工程取向。

5. 协作层：OpenClaw 像调度中枢，Hermes 像任务分形

多代理协作这件事，也是二者差异非常有戏的一层。

OpenClaw 的多代理思路，很容易让人想到调度中心与特种工种。你可以通过 workspace 隔离、SOUL 角色定义、routing、agent teams、handoff 机制，把不同代理塑造成不同功能角色。它强调的是：让不同角色在同一控制平面下，按边界和规则被调度起来。

我之前写“北斗七星”式流水线，其实就是把这种思路写得更戏剧化了一点：天枢感知、玉衡设计、天玑执行，本质上依然是 Gateway-first 的编排世界。

Hermes 的 delegation 则更像另一种东西：任务分形。

它允许你在当前 Agent 中继续派生子代理，让每个子代理拥有隔离上下文、独立终端会话、受限工具集，并根据 delegation patterns 处理不同子问题。这里的重点不再是“有几个角色被 central router 叫醒”，而是“当前系统能否自发地把复杂任务分裂成可并行的局部工作单元”。

从协作哲学看：

OpenClaw 更像一个总调度台，强调角色清晰、入口统一、边界明确；
Hermes 更像一个可自我裂变的工作系统，强调任务拆分、并发推进、局部隔离。

6. 自动化层：OpenClaw 重通道连续性，Hermes 重工作连续性

自动化能力是很多人喜欢一笔带过的部分，但我认为它恰恰能揭示二者对“持续性”的不同理解。

OpenClaw 的自动化，天然容易和消息通道、会话入口、平台推送绑在一起。它非常适合做“某个平台来的事件应该触发什么工作流”“某个 Bot 在特定频道如何响应”“某个 gateway 内的周期任务如何回到某个消息 surface”。

Hermes 的 scheduled automations 则更强调“这个 Agent 自己有哪些应该持续做的工作”。定时任务在它那里不是仅仅服务于消息平台，而是整个长期工作系统的一部分。你可以把它理解成：OpenClaw 更像在维持通道的连续性，Hermes 更像在维持工作的连续性。

7. 这一轮对决的结论

如果把这一整章压缩成一句话，那就是：

OpenClaw 把 Agent 放进一个可治理的基础设施框架里；Hermes 则试图让基础设施本身长出时间维度。

这两者都很高级，也都很难。真正可怕的不是它们谁做不到，而是用户自己根本没分清自己在买哪一套逻辑。

七、为什么说 OpenClaw 更像“入口主权”，而 Hermes 更像“学习主权”

这是我整篇文章最想讲清楚的一章。因为如果不把这个概念讲透，后面所有对比都会滑回“功能表比较”。

1. 什么叫入口主权

所谓入口主权，不是一个空洞的政治大词。落到 Agent 基础设施上，它至少意味着：

你知道消息从哪里进来；
你知道什么消息可以触发系统；
你知道不同平台、不同账号、不同群组、不同私聊该落到哪个工作区；
你知道执行权是通过哪些节点、哪些命令、哪些权限边界被授予的；
你知道哪些设备能力被永远封死；
你知道控制平面是否暴露公网，还是被 loopback、tunnel、allowlist 保护。

本质上，入口主权首先是一种控制消息流、命令流与权限流的能力。

OpenClaw 在这方面非常强，甚至可以说，这是它存在的根本理由。它让你把平台入口、工作区归属、节点能力、命令权限、会话范围都纳入可见、可配、可审计的体系里。它提醒你：不要把高权限 Agent 当成一个单纯的聊天玩具，它首先是一套要守住边界的执行基础设施。

这就是我为什么一直认为，OpenClaw 对“数字主权”的理解带有非常强的基础设施味道。它不是在卖你一个更聪明的助手，而是在帮你收回入口控制权。

2. 什么叫学习主权

而学习主权，则是另一个层级的东西。

它意味着：

你知道 Agent 记住了什么；
你知道它如何把短记忆、长历史、用户偏好与技能资产区分开；
你知道它的技能不是云厂商黑箱里的一串不可见 embedding，而是你可审视、可导出、可迁移的资产；
你知道它能把成功与失败沉淀成稳定改进，而不是每次都靠临场发挥；
你知道这个系统即便换了后端、换了机器、换了项目，也能保留核心人格与经验结构。

本质上，学习主权首先是一种控制 Agent 如何成长、成长成什么样、成长资产归谁所有的能力。

Hermes 在这方面明显走得更远。bounded memory、user model、session search、skills、delegation、backends、migration，这一整套组合起来，构成的就是一种学习主权框架。真正昂贵的，不只是入口 token 和平台绑定，而是 Agent 长时间与你合作之后形成的那套“会做事的方法”。

如果这些东西只存在于某个 SaaS 黑箱中，你就始终在租用它的记忆和成长；如果这些东西能够落地为 MEMORY.md、USER.md、state DB、skills、context files、可迁移配置，那你才真正开始拥有 Agent 的“持续人格”。

3. 从数据主权到认知主权

过去几年，很多人一谈“主权”，主要还是在谈数据不出境、本地部署、私有 API key、loopback 端口、不依赖云厂商。这些都重要，而且一点都不过时。

但到了今天，如果我们还把主权理解停留在“数据在哪台机器上”，那就太浅了。

因为对于 Agent 来说，更深一层的主权其实是：

这个系统怎么理解你、怎么记住你、怎么学会一套工作方法、怎么把经验传到下一个任务里。

这就是我为什么说，Hermes 把“数字主权”从本地部署推进到了另一层：从数据主权，进一步逼近认知主权。

而 OpenClaw 则恰恰守住了更早但同样不可或缺的一层：入口主权。

4. 两种主权不是互斥，但顺序会改变一切

这里我要特别提醒一点：入口主权和学习主权不是互斥的。任何足够成熟的 Agent 基础设施，最终都应该兼顾这两者。

问题在于，系统最先构建哪一层，会深刻影响后续一切。

如果你先构建入口主权，你的世界会长得更像 OpenClaw：先统一消息入口，先立边界，先管执行，再去谈记忆与成长。

如果你先构建学习主权，你的世界会长得更像 Hermes：先让 Agent 形成连续性，先把经验沉淀成技能，先把运行环境抽象出来，再去扩张更多入口。

顺序为什么重要？因为基础设施不是搭乐高。先打什么地基，会决定你未来哪里补得动、哪里永远别扭。

5. 我的判断：2026 年之后，真正昂贵的是“成长权”

如果一定要让我给出一个带锋芒的判断，我会说：

在 2026 年之后，入口依然重要，但真正越来越昂贵的，将是 Agent 的成长权。

为什么？因为平台入口这件事，随着协议成熟、插件生态扩张、桥接能力增强，会越来越像“可以通过工程投入补齐的能力”；但一个 Agent 的持续人格、技能资产、用户模型、远程运行能力、跨项目经验复用，这些东西一旦沉淀下来，就会变成更难替代的壁垒。

说得再直白一点：

入口是可以被重新接入的；
记忆与成长却往往更难被重新培养。

这不是说 OpenClaw 过时，恰恰相反。没有入口主权，学习主权很容易变成空中楼阁。但这意味着我们不能再只满足于“Agent 在我本地跑起来了”，而必须继续追问：它留下了什么，未来还能带走什么。

八、迁移指南背后的真实信号：Hermes 为什么要主动吃掉 OpenClaw 的历史资产

如果说前面七章还主要是架构与哲学分析，那么从这里开始，我们终于要进入最有现实味道的一层：迁移。

一个项目提供另一个项目的迁移指南，这件事本身就很有信息量；而 Hermes 的 OpenClaw 迁移指南之所以格外值得研究，是因为它迁移的不是表面配置，而是一整套“行为资产”。

根据我核对的迁移文档，Hermes 在真正执行写入前会先给出 preview，且支持 --dry-run。它试图映射和吸收的，至少包括这些对象：

SOUL.md
AGENTS.md
MEMORY.md
USER.md
daily memories
workspace / managed skills
providers
approval mode
messaging tokens
MESSAGING_CWD
session reset policies
MCP servers
部分环境变量与密钥映射

你仔细看这份清单，就会明白一个非常重要的事实：

Hermes 不是只想把你“导过去”，而是想把你在 OpenClaw 里已经形成的世界一起接过去。

1. 迁移的对象，不只是文件，而是人格与习惯

先看 SOUL.md 与 AGENTS.md。

这两个文件代表的不是简单配置，而是 Agent 的角色、操作习惯、项目边界、人格口吻与执行规则。Hermes 迁移它们，说明它非常清楚：一个长期使用者最宝贵的资产，不只是 token 和模型提供商，而是他已经把系统调教成什么样了。

再看 MEMORY.md、USER.md 与 daily memories。

这部分更直接。它们是长期协作关系的沉淀物，是“这个 Agent 对我知道什么、记住什么、怎么叫我、什么偏好别碰、哪些习惯该保留”的核心材料。Hermes 不只是复制它们，而是尝试把这些东西归并到自己的 memory 结构中去。这说明它并不是只想接一个“静态配置集”，而是想吸收一段协作历史。

2. 迁移映射本身，就是架构意图的证据

下面这张映射表，比很多宣传文案都更能解释 Hermes 的野心：

OpenClaw 资产	Hermes 侧的落点	这说明了什么
`SOUL.md`	`~/.hermes/SOUL.md` 或上下文文件体系	Hermes 希望继承人格与规则资产
`AGENTS.md`	`--workspace-target` 下的工作区上下文文件	项目级行为规范需要被延续
`MEMORY.md`	`~/.hermes/memories/MEMORY.md`	长期协作记忆需要保留
`USER.md`	`~/.hermes/memories/USER.md`	用户模型是高价值资产
daily memories	归并进 Hermes memories	零散历史也被视作可继承经验
skills	`~/.hermes/skills/openclaw-imports`	方法论资产比你想象得更值钱
providers	`custom_providers` / provider 配置	算力入口要尽可能无缝迁移
approval mode	Hermes approval 配置	安全与执行习惯同样属于资产
messaging tokens	`.env` 等环境变量方案	平台入口也要随迁移保留
MCP servers	Hermes MCP 配置	外部工具生态同样需要延续

注意，这不是“复制粘贴”。它更像一种翻译。

而且这种翻译不是无损搬箱子。迁移文档里写得很细：MEMORY.md 和 USER.md 会被解析成条目，与现有内容合并、去重，并使用 § 分隔；导入到 ~/.hermes/skills/openclaw-imports/ 的 skills 也不是立刻在当前会话生效，而是要从新 session 开始接管行为。迁移工具要做的，不只是把文件放到新目录，而是要判断：旧体系里的资产，在新体系里应该变成什么角色。这背后的本质，是 Hermes 在说：

OpenClaw 用户真正拥有的，不是一个配置文件，而是一套已经被打磨出来的工作文明。

3. 哪些东西不能自动迁移，恰恰更有信息量

一个成熟的迁移系统，最值得信任的地方，往往不是“它能迁多少”，而是“它清楚说出哪些不能迁”。

Hermes 的迁移文档里，至少有几个地方值得注意：

某些 SecretRef 来源如果是 source:file 或 exec，无法完全自动解析；
WhatsApp 等平台可能需要重新配对，而不是单纯迁 token；
skills 如有冲突，需要人工决定 skip、overwrite 或 rename；
AGENTS.md 的迁移需要你显式提供 --workspace-target；
部分 OpenClaw 特有概念会被归档，而非直接变成 Hermes 的一等结构；
session reset 策略需要核对，不是所有行为都能 1:1 语义等价。

这其实更能证明 Hermes 不是在做表面文章。因为它非常清楚：迁移不是导入 JSON，而是把一套工作方式搬进另一套文明里。

4. 为什么这件事会让我高看 Hermes 一眼

我不是因为“能迁移”就高看一个产品。我高看它，是因为它知道用户真正舍不得丢的东西是什么。

普通产品经理以为用户最怕重输 token。

稍微懂一点工程的人知道，用户更怕重配 providers。

真正理解长期协作价值的人才知道，用户最怕丢的其实是：

已经磨出来的行为规则；
已经沉淀下来的记忆；
已经复用起来的技能；
已经适应的审批与安全习惯；
已经绑定好的上下文文件与工作流。

Hermes 愿意花力气去接这些东西，说明它想竞争的不是“新鲜感”，而是长期系统的接班权。

5. 这也暴露了 Hermes 对 OpenClaw 的真正判断

一个项目是否提供另一个项目的迁移，背后其实也藏着它对对方的评估。

Hermes 愿意接 OpenClaw，等于默认承认了三件事：

OpenClaw 用户是高价值用户；
OpenClaw 沉淀下来的资产具有高度可继承性；
OpenClaw 并不是“低端旧工具”，而是一套值得被升级吸纳的基础设施前史。

从这个角度看，Hermes 并没有把 OpenClaw 当成需要否定的过去，而是把它视作一个值得承接的文明阶段。

这件事本身，就非常说明问题。

九、工程现实：两套系统分别会给谁带来红利，给谁制造负担

到这里为止，如果你还只想问“那到底选哪个”，说明你还是没有摆脱消费电子测评思维。真正负责任的回答，从来不是一个单选按钮，而是要看你到底在解决什么问题、你愿意承担什么成本、你未来六到十二个月最看重的是什么。

1. 什么人更适合 OpenClaw

如果你属于下面这类人，OpenClaw 往往会更对味：

你是重度多平台消息用户，希望把 Telegram、Discord、Slack、WhatsApp、Signal、Feishu、Matrix 等入口统一收编；
你对本地优先、loopback、配对审批、物理权限边界这类事情极度敏感；
你把 Agent 首先视作一个“可控执行中枢”，而不是陪聊系统；
你需要一套能够把不同工作区、不同角色、不同节点能力明确分隔开的控制平面；
你愿意为入口治理付出配置代价；
你对“系统能否被严格定义边界”看得比“它会不会自我成长”更重。

这种用户通常有一个共同特点：他们很讨厌黑箱，尤其讨厌一个高权限系统在自己不知道的前提下越界行动。他们宁愿多写点配置、多调点路由、多做点权限裁剪，也不愿接受“它大概会自己处理好吧”的含糊感。

对这类人来说，OpenClaw 的价值，不是让系统更像人，而是让系统先像一套受管控的基础设施。

2. 什么人更适合 Hermes

如果你属于下面这类人，Hermes 往往会更有未来感：

你和 Agent 的协作不是偶发的，而是长期关系；
你希望它记住你的偏好、项目脉络、做事方法，最好还能越来越会做；
你不满足于单次执行，而是需要 skills、memory、automations、delegation 形成闭环；
你需要 Agent 离开本机，在 Docker、SSH、Modal、Daytona 等环境里持续工作；
你关心跨项目、跨环境、跨时间的能力延续；
你相信最贵的不是入口，而是成长出来的行为资产。

这类用户通常也有共同特征：他们不是把 Agent 当“机器”，而更像把它当“长期合作对象”。他们接受系统有更多层次，也愿意投入时间治理 memory、skills、delegation 和 remote runtime，因为他们想得到的是复利，而不是一次性的执行便利。

3. 什么人其实两者都不太适合

还有第三类人，值得被直接点出来。

如果你只是：

想在 IDE 里补补代码；
偶尔问几句技术问题；
不打算自托管；
不想维护配置；
不需要多平台接入；
不需要长期记忆；
不想管远程后端；
不会持续使用 agent。

那无论是 OpenClaw 还是 Hermes，都很可能是火力过剩。

这不是看不起需求，而是很多人真正需要的，可能只是一个轻量 copilot、一个云端对话工具、或者一个更稳定的编码助手，而不是一整套需要你自己治理的智能基础设施。

工具选型里最常见的浪费，就是拿一艘巡洋舰去送外卖。

4. 三种典型人物画像

为了说得更直白一点，我给三个典型画像。

画像一：多平台数字指挥官

你有 Telegram、Discord、Slack、Feishu、Matrix 甚至 WhatsApp 的重度使用需求，希望所有消息入口统一归口，Agent 可以在不同平台之间承担协同、监听、转发、执行与汇报角色。你还非常在意本机权限、节点命令、设备隔离。

这类人，大概率先从 OpenClaw 获得最大收益。

画像二：长期协作型独立开发者

你希望 Agent 帮你写代码、查资料、跑任务、记偏好、沉淀技能，而且这些事情最好别总占着你的本机。你需要远程执行、记忆复利、子代理并发和定时任务。

这类人，更容易在 Hermes 身上看到未来。

画像三：小团队里的流程编排者

你既在意入口，也在意成长，既想统一平台，又不想让经验白白流失。你不是想买一个“能聊”的产品，而是在试图搭一层长期工作底座。

这类人很可能既不会彻底放弃 OpenClaw，也不会忽视 Hermes。他们真正要做的，是判断自己的第一性约束在哪：是入口治理，还是成长治理。

5. 一个非常现实的判断：大多数人会先被 OpenClaw 打动，再被 Hermes 说服

如果让我凭直觉做一个行业判断，我会说很多工程用户的路线大概率会是这样：

先因为 OpenClaw 的入口统一、多平台联动、本地主权、物理边界而被打动；
在实际长期使用中，开始意识到“入口收回来了，但成长资产还没有真正沉淀下来”；
然后被 Hermes 这种 learning-first 体系吸引，开始重新思考什么才是最值钱的部分。

这条路径很正常。因为入口主权通常比学习主权更容易被感知。你一旦把 Telegram、Discord、Feishu 这些入口全都打进一个 gateway，那种“控制权终于回到自己手里”的感受非常强烈；而成长主权则是慢变量，它需要时间累积，直到有一天你忽然意识到：一个会持续记住、持续提炼、持续迁移的 Agent，比多接几个入口更值钱。

这也是为什么我认为两者不是简单替代关系，而更像两个阶段的重心转移。

十、风险与代价：别把“开源主权”误读成“零成本自由”

这里我必须泼一盆冷水。

无论是 OpenClaw 还是 Hermes，只要你开始认真使用它们，你就会很快发现一件事：

开源主权不是免费午餐，它只是把成本从订阅费，转移成了配置费、治理费、维护费和认知负担。

很多人对“主权工具”的浪漫想象，停留在“我终于不受 SaaS 绑架了”；但真实工程世界更接近另一句话：

你不再向平台交租，但你开始给自己的复杂度交租。

1. OpenClaw 的代价：你拥有了港口，也就拥有了海关、码头和巡逻队

OpenClaw 最迷人的地方，恰恰也是它最累人的地方。你一旦真的把它当成统一入口，就意味着你也要开始承担统一入口的责任。

它的典型隐性成本包括：

各平台 API、权限模型、token 生命周期与 webhook / 长连接细节持续变化；
配对、allowlist、mention policy、群组范围、账号映射这些东西需要持续打磨；
Gateway 作为中心控制面，会自然变成复杂度集散地；
节点能力与命令黑名单要长期维护，不是一劳永逸；
多代理、多工作区、多平台并发下的会话污染与路由异常，需要你有足够清晰的治理策略；
一旦你让它真的接触文件系统、设备、Shell，它的任何失误都不再是“聊天胡说八道”，而可能是真实物理层面的副作用。

很多人喜欢把这种成本说成“配置比较多”。这话太轻了。更准确的说法应该是：

你接管的不只是入口，你还接管了入口背后的全部秩序维护。

2. Hermes 的代价：成长从来不是白给的，尤其是可治理的成长

Hermes 则有另一类成本，而且在我看来，它并不比 OpenClaw 轻松。

它的典型隐性成本包括：

memory 如何压缩、何时更新、是否污染、是否过时，本身就是一门治理学；
skills 会不会越长越乱、越积越碎、命名失控、质量参差，需要系统性整理；
delegation 一旦滥用，子代理会带来额外 token、调度、追踪和责任归因成本；
remote backends 虽然解放了本机，但也引入了容器安全、SSH 密钥、云费用、持久化、审计等问题；
自动化任务一旦持续运行，就意味着你要真正考虑“它在无人值守时出错怎么办”；
认知资产一旦变多，如何迁移、如何去重、如何防止幻觉写入“伪记忆”，会成为长期问题。

很多人对 learning-first 系统的误解，在于他们以为“系统越会学越好”。不是的。

一个会学习的系统，如果没有良好的记忆治理、技能治理、审批治理、环境治理，它很容易从“越来越懂你”滑向“越来越难控制”。所以 Hermes 的难点不是功能不够，而是它逼着你面对一个更成熟、也更沉重的问题：

你真的准备好治理一个会成长的系统了吗？

3. 最容易被忽略的成本：认知负担

我认为无论 OpenClaw 还是 Hermes，用户最容易低估的成本都不是钱，而是认知负担。

因为当你从普通工具升级到基础设施时，你不再只是“会用某个软件”，你是在管理一套系统的：

边界；
习惯；
规则；
记忆；
技能；
环境；
自动化；
审批策略；
故障模式。

这不是小白鼠玩具，而是一种新的工作方式。你越认真使用，就越需要从“消费者心态”切到“运维者心态”甚至“架构师心态”。

4. 一个残酷但必要的结论

如果一定要说得更难听一点，我会说：

很多人不是不需要 OpenClaw 或 Hermes，而是不具备长期治理它们的纪律。

他们喜欢的是那种“我掌控了一切”的感觉，却不愿意承担“掌控一切之后的维护义务”。这种心态下，任何基础设施都会在三个月后长成垃圾场。

所以，别再把“开源主权”理解成“零成本自由”。真正的自由，不是你能不能跑起来，而是你有没有能力长期维护自己夺回来的那部分世界。

十一、未来趋势：Agent 工具的下一轮竞争不再是“更会写代码”，而是“谁拥有持续性”

未来几年，如果还有人拿“写代码更快”“支持模型更多”“平台接得更全”当作 Agent 工具链的主要比较维度，我会越来越觉得那是旧时代的回声。

因为下一轮竞争，正在从“即时能力”迁移到“持续能力”。

我认为至少有四个维度，会决定下一代 Agent 基础设施谁更有生命力。

1. 记忆质量，而不是记忆数量

不是谁存得多谁赢，而是谁更能：

过滤噪音；
保留关键；
让召回发生在正确时机；
把重复经验转化成长期优势；
避免系统被自己过往的垃圾拖死。

OpenClaw 在记忆可审计与工作区归属上有优势，Hermes 在分层记忆与长期召回闭环上更激进。未来谁能把“可控”与“高质量召回”同时做深，谁就更接近下一阶段的答案。

2. 技能资产，而不是提示词技巧

提示词再花哨，也很难形成真正的长期资产。真正值钱的，是你能否把一套稳定方法沉淀为可迁移、可共享、可演进的 skill。

在这一点上，Hermes 明显已经把技能资产当成文明中心之一；OpenClaw 则更像把技能放在可扩展能力框架里。未来如果行业继续成熟，我几乎可以确定：skills 将会像源码仓库、基础镜像、IaC 模板一样，成为真正可复利的基础资产。

3. 环境迁移能力，而不是单机炫技

一个 Agent 是否只能活在你眼前这台机器上，这个问题会越来越重要。

因为长期工作、夜间自动化、高风险执行、高并发任务、跨地域协作，都要求 Agent 有更强的运行时迁移能力。Hermes 已经在这条线上押注明显；OpenClaw 则通过 nodes 和 gateway 管理路径给出另一种答案。未来行业不可能一直停留在“我本地开个 terminal 让它跑”的阶段。

4. 治理与安全边界，而不是功能炫技

越强的 Agent，越需要成熟的治理。审批模式、权限模型、节点能力、技能来源、记忆污染、远端后端隔离、会话归属、自动化审计，这些问题最终会把所有“玩具级 Agent”筛出去。

在这件事上，我反而觉得 OpenClaw 和 Hermes 其实代表了两种很互补的未来方向：

OpenClaw 提醒行业：别忘了边界、入口、平台治理、物理世界风险；
Hermes 提醒行业：别忘了连续性、成长、技能资产、运行时迁移。

未来真正成熟的系统，很可能必须把这两套意识都装进去。

5. 它们会继续靠拢，还是会彻底分家？

这是一个很有意思的问题。

我认为未来有两种可能。

第一种可能：继续靠拢。

OpenClaw 进一步强化长期记忆、技能资产、更多自动化治理，慢慢向 learning-first 靠近；Hermes 则继续补强 gateway、平台治理、权限控制与设备边界，慢慢向 control-plane-first 靠近。最终二者会在中间地带相遇，形成一类“既懂入口主权，也懂学习主权”的复合型 Agent OS。

第二种可能：彻底分家。

OpenClaw 继续成为消息入口与执行控制的主权中枢，做成最强的 gateway / agent routing plane；Hermes 则继续朝长期认知系统、生长型 agent runtime、远程执行编排平台的方向狂奔。

如果是我个人判断，我认为短期内二者会局部靠拢，长期却未必会收敛成同一种东西。因为它们的第一性焦虑不同，而第一性焦虑，往往会在关键决策上反复暴露出来。

6. 我最确定的一点

无论未来哪条路径胜出，我最确定的一点都是：

下一轮 Agent 基础设施的竞争，不再是“谁更会写代码”，而是“谁更能让智能持续存在”。

这里的持续，不只是 uptime，而是：

经验持续；
规则持续；
技能持续；
运行持续；
人格持续；
可迁移性持续。

谁抓住了这件事，谁就抓住了真正的未来。

十二、结语：我们真正争夺的不是一个 Agent，而是一套可继承的智能基础设施

写到这里，其实已经可以把整篇文章压缩成最后一句话了。

如果说 OpenClaw 的历史使命，是帮助开发者从平台与 SaaS 手里夺回消息入口与本地控制权，那么 Hermes 正在尝试推进下一步：从“我能控制它做什么”，走向“我能控制它如何成长、如何记住、如何延续”。

前者争夺的是港口。

后者争夺的是文明。

这话听上去很重，但我一点都不觉得夸张。因为我们今天面对的，已经不是一个会不会聊天的机器人，而是一类越来越接近“长期工作系统”的东西。你给它入口，它就会形成流量；你给它记忆，它就会形成历史；你给它技能，它就会形成方法；你给它后端与自动化，它就会形成生产关系。

到了这个层面，讨论“哪个更好”已经太浅了。真正的问题是：你到底想先掌控哪一层世界。

如果你首先害怕的是外部平台、执行边界、设备能力、权限失控，那 OpenClaw 这条路会非常有说服力。它告诉你，别把高权限系统当玩具，先把边界建起来，先把入口收回来，先把控制平面立住。

如果你首先害怕的是经验蒸发、记忆丢失、方法无法复用、系统每次都像第一次见你，那 Hermes 这条路会更有未来感。它告诉你，真正值钱的不是一次次短暂输出，而是那个会随着时间越来越像“你的系统”的长期 Agent。

所以，这场对比真正给我的结论，不是 Hermes 取代 OpenClaw，也不是 OpenClaw 注定被 Hermes 吞掉，而是：

Agent 基础设施正在从“入口主权时代”，迈向“学习主权时代”。

前一个时代的英雄，是把消息入口、平台触角和执行边界收回到自己手里的系统；后一个时代的英雄，则是能把成长权、记忆权、技能权和迁移权一起收回来的系统。

而我们真正争夺的，终究不只是一个会说话、会执行、会写代码的 Agent。

我们争夺的是：

谁定义它的边界；
谁保管它的记忆；
谁拥有它的技能；
谁决定它在哪个环境继续活下去；
谁继承它在时间中长出来的那部分“人格”。

如果这些东西仍然掌握在别人手里，那么你拥有的只是一个租来的幻觉。

如果这些东西开始回到你自己的文件、你自己的 gateway、你自己的 memory、你自己的 skills、你自己的 backends、你自己的自动化与审批规则里，那么你才真正开始拥有一套可继承的智能基础设施。

这，就是我理解的下一代数字主权。

延伸阅读

如果你今天还在用一张“支持多少平台、接了多少模型、会不会写代码”的功能表，去给 Agent 基础设施打分，那你其实已经错过了真正的战场。

所以，这篇文章不是测评，不是安装指南，也不是“谁更强”的饭圈式站队。它真正要辨析的，是一个更根本的问题：

在 Agent 时代，你究竟需要一个可控的网关，还是一个会成长的系统？你争取的到底是入口主权，还是学习主权？

一、Agent 时代真正开始分叉了

它从哪里接收到任务；
它能记住多久；
它的经验能否在下一次调用时继续生效；
它能不能离开你的这台笔记本，在更稳定、更隔离、更适合长期运行的环境里持续工作；
它的“人格”“规则”“技能”“上下文资产”是否可迁移、可审计、可治理。

事情已经变了。我们讨论的重点，已经从“让模型动起来”，转向“让系统长出来”。

这不是小差异。这是系统人格的分水岭。

你看，分叉其实不是从“支持什么功能”开始的，而是从“系统首先害怕失去什么”开始的。

OpenClaw 害怕失去的是入口、边界与主权。

Hermes 害怕失去的是连续性、经验与成长。

这就是我们后面所有分析的底盘。

二、为什么 Hermes 和 OpenClaw 值得被放在一起比较

如果只是这样，二者还可以被理解为“同赛道里的不同风格”。但真正让我确认这篇文章值得写下去的，是 Hermes 官方提供的 Migrate from OpenClaw 指南。

这件事的意义非常大。

一个项目愿意专门提供另一个项目的迁移路径，通常说明三件事：

它认为对方用户与自己目标用户高度重叠；
它认为对方沉淀下来的资产值得继承，而不是必须抛弃；
它不只是想做“新工具”，而是想接管一段既有工作流和心智模型。

所以，Hermes 与 OpenClaw 不是两个毫无关系的并列名词，它们更像是同一问题上的两种答案：

如果你首先把 Agent 当作一个需要严控入口和边界的控制系统，你会更容易走向 OpenClaw；
如果你首先把 Agent 当作一个需要持续积累与进化的长期系统，你会更容易走向 Hermes。

它们之所以值得比较，不是因为功能重叠，而是因为它们都在争夺“Agent 基础设施”的定义权。

三、先拆 OpenClaw：它本质上是一台 Agent 网关，而不是单纯聊天壳子

OpenClaw 首先是一台 Gateway-first 的 Agent 控制平面。

根据 Gateway Architecture 与 Agent Runtime 的设计，OpenClaw 把系统拆成了几个非常鲜明的角色：

Gateway：长期运行的中心进程，持有消息 surface、会话状态、路由能力与部分平台专属连接；
Clients：通过 WebSocket 连入 Gateway 的界面或交互端；
Nodes：也通过 WebSocket 接入 Gateway，但它们不是 UI，而是带着显式能力声明的执行节点；
Workspace / Session / Agent 配置：决定消息如何落到不同上下文、不同规则与不同运行边界。

这很重要。因为一旦你把问题定义成“控制平面”，很多原本会被聊天产品忽视的东西，就会一下子变成头等大事。

1. 入口统一不是锦上添花，而是系统的第一性原则

这就是为什么 OpenClaw 的很多“繁琐配置”其实不是负担，而是这种世界观的自然结果。比如：

某些平台需要配对审批，而不是 token 一贴就自动放行；
某些账号需要群组白名单或明确 mention 才能触发；
某些设备能力必须在节点层做 deny commands；
某些工作区必须物理隔离，避免上下文污染；
某些自动回复需要进队列，不能并发乱闯。

2. `127.0.0.1:18789` 背后的，不只是一个端口

因为这意味着它默认把 Agent 视作需要先守住本机边界的系统，而不是天然开放在公网的服务。

3. 节点能力声明，让“执行”从黑箱变成了协商

这件事有两个意义。

第一，它让执行权从“模型想干什么”退回到“节点允许什么”。这看似保守，实则成熟。

4. SOUL、Workspace 与会话边界，构成了 OpenClaw 的性格骨架

我之前写 OpenClaw 的时候，尤其强调过 SOUL.md 的价值。今天回头看，我依然觉得这是 OpenClaw 最容易被忽视、却非常关键的一点。

5. OpenClaw 的内核焦虑，是失去控制

理解一个系统最好的方式，不是看它宣传什么，而是看它最怕什么。

OpenClaw 最怕什么？

它最怕的是：

入口失控；
平台混乱；
会话串线；
节点越权；
设备能力被提示词注入滥用；
多代理互相污染；
外部消息直接顶到执行层。

这就是 OpenClaw 的底色。

它不是先问“Agent 能不能更像人”，它先问“Agent 能不能先像一套可靠的系统”。

6. OpenClaw 的系统图像

graph TD
    A["Telegram / Discord / Slack / WhatsApp / Signal"] --> B["OpenClaw Gateway"]
    C["Clients / UI / Canvas"] --> B
    D["Auth / Pairing / Routing / Queue"] --> B
    K["Loopback bind on 127.0.0.1 port 18789"] --> B
    B --> E["Workspace A"]
    B --> F["Workspace B"]
    E --> E1["SOUL.md / MEMORY.md / Skills"]
    F --> F1["SOUL.md / MEMORY.md / Skills"]
    B --> G["Node 1"]
    B --> H["Node 2"]
    G --> G1["Shell / File / Browser Caps"]
    H --> H1["Restricted Commands"]
    E --> I["Agent Session A"]
    F --> J["Agent Session B"]

CodeBlock Loading...

你会发现，这张图里最粗的那根骨头不是模型，而是 Gateway。模型当然重要，但在 OpenClaw 的叙事里，它更像可替换算力，而不是文明中心。

这就是 OpenClaw 的强项，也是它的宿命。

四、再拆 Hermes：它真正想解决的是 Agent 如何越用越像一个人

这句话听上去像夸张修辞，但当你把 Hermes 的官方文档从头到尾读一遍，会发现它几乎所有主轴都在围绕同一个问题打转：

一个 Agent，怎样才能不是每次都像第一次见你？

1. 闭环学习，不是一个营销词，而是产品中心

在 Hermes 的叙事里，最关键的不是“有记忆”，而是记忆能否形成闭环。这和很多产品嘴上说“我们也有 memory”完全不是一回事。

Hermes 不是把记忆当作一个辅助模块，而是把它当作系统的方向盘之一。它关心的不只是“保存过什么”，更关心：

哪些经验值得进入始终加载的短记忆；
哪些历史应该进入可搜索的长记忆；
哪些成功模式可以被提炼成 skills；
哪些失败应当被总结为行为修正；
用户的偏好、习惯、语气和禁忌，能否在后续任务里自然生效。

2. bounded persistent memory，说明 Hermes 不是在幻想“无限记忆”

我很欣赏 Hermes 对 memory 的一个处理：它没有天真地承诺“无限上下文”或者“什么都记住”，而是做了一套分层结构。

根据 Hermes Persistent Memory 与 Sessions 文档，Hermes 的核心长期记忆至少分成了几层：

一个始终在上下文中的 MEMORY.md，默认预算约为 2200 字符；
一个面向用户建模的 USER.md，默认预算约为 1375 字符；
基于 SQLite FTS5 的 session_search，可以在 state.db 与 JSONL transcript 所构成的会话历史里检索再总结；
外部 memory provider 插件，可以接入更专业的长期记忆存储。

这意味着 Hermes 不是在搞“无限装载”的幻觉，而是在做一种更像认知系统的分层：

有些东西必须时刻记得；
有些东西不必常驻，但要能在需要时想起来；
有些东西不该只是记住，而该被提炼成技能；
有些东西则应该被沉淀为稳定的用户模型。

这比“把所有历史都硬塞进上下文”成熟得多。因为真实的成长，从来不是信息越多越好，而是筛选、压缩、召回与抽象的质量越高越好。

3. Skills 在 Hermes 里，不是插件边角，而是程序性记忆

Hermes 的 skills 体系之所以重要，并不是因为“它也支持技能”，而是因为它把技能放在一个近乎核心资产的位置上。

4. 六种 terminal backends，暴露了 Hermes 的另一个核心欲望：脱离单机束缚

Hermes 的另一个非常关键的信号，是它对运行时后端的抽象。

按我核对的文档，Hermes 当前列出的终端后端包括 local、docker、ssh、Daytona、Singularity、Modal。这个列表本身，比一百句宣传语都更能说明问题。

这和 OpenClaw 的思路差别很大。

这会直接带来几个现实优势：

长时间任务不再必须占着你的本机；
更高风险的执行可以放入容器或远端隔离环境；
更高算力需求的任务可以迁到 SSH/Modal/Daytona 等后端；
你的聊天入口与实际执行环境可以物理分离。

这就是为什么我说 Hermes 的野心已经不仅是“让 agent 接入 Telegram/Discord”，而是“让 agent 在时间和空间上都具备持续性”。

5. Delegation 让 Hermes 更像一个会分工的系统，而不是一张万能嘴

这件事的意义，远不只是性能或方便。

6. Messaging gateway 在 Hermes 里也重要，但不再是唯一神

有人可能会说：Hermes 也有 messaging gateway，也能接十几个平台，为什么还要强调它和 OpenClaw 不一样？

答案是：重要性排序不同。

7. Hermes 的系统图像

graph TD
    A["Telegram / Discord / Slack / WhatsApp / Signal / Email"] --> B["Hermes Gateway"]
    B --> C["Hermes Core Agent"]
    C --> D["MEMORY.md / USER.md"]
    C --> E["Session Search / FTS5 State DB"]
    C --> F["Skills / Open Skill Standard"]
    C --> G["Subagent Delegation"]
    C --> H["Scheduled Automations"]
    G --> I["Worker Agent 1"]
    G --> J["Worker Agent 2"]
    C --> K["Terminal Backends"]
    K --> L["Local"]
    K --> M["Docker"]
    K --> N["SSH / Daytona / Singularity / Modal"]

CodeBlock Loading...

这张图和 OpenClaw 那张图最大的区别，不在于有没有 gateway，而在于哪根线最粗。在 Hermes 里，最粗的线不再是入口，而是持续性。

它要的不是一座把船接进来的港口，而是一个会长出经验、技能和分工机制的工作大脑。

五、第一轮正面对决：两者在设计哲学上到底差了什么

如果前面两章还只是拆解，那么从这里开始，我们就该把刀口直接对准核心差异了。

我更愿意先给出一句可能会得罪一部分人的判断：

OpenClaw 和 Hermes 的差异，本质上不是功能差异，而是“系统人格差异”。

1. OpenClaw：通道优先、控制平面优先、主权先行

OpenClaw 的哲学可以浓缩成一句话：

先把入口和边界守住，再谈智能如何生长。

所以你会看到它天然偏好：

单一长期运行的 Gateway；
统一消息 surface；
明确的节点能力声明；
会话与工作区隔离；
平台配对与审批；
物理级权限裁剪；
通过 routing 和 policy 来控制“谁能被什么触发”。

这是一种很工程化、很像“控制系统”的思维。它先把交通秩序、安保系统、港口调度和仓库归属建好，再来讨论仓库里放什么货。

2. Hermes：学习优先、能力积累优先、运行环境抽象优先

Hermes 的哲学则是另一句话：

先让 Agent 拥有时间维度，再谈它如何接住更多入口。

所以你会看到它天然偏好：

bounded persistent memory；
session search 与长期召回；
user modeling；
skills 的沉淀与开放标准化；
subagent delegation；
remote terminal backends；
scheduled automations；
把经验转化为下一次能力的闭环。

3. 它们真正分叉的地方，是“先保护什么”

如果要我用一句极端凝练的话来总结两者差异，我会说：

OpenClaw 首先保护的是系统的边界；Hermes 首先保护的是系统的连续性。

这句话很重要。

因为边界与连续性，恰恰是 Agent 基础设施最容易互相拉扯的两端。

你越强调边界，系统往往越保守、越审慎、越依赖显式规则；
你越强调连续性，系统往往越想积累、越想召回、越想迁移、越想从历史中长出新的能力。

一个产品的默认姿态，本质上就是它对这组张力的取舍。

4. 一张总对照表

维度	OpenClaw	Hermes
核心叙事	统一消息入口、网关主权、可控执行边界	学习闭环、长期记忆、能力演化
控制中心	Gateway / Routing / Nodes	Memory / Skills / Delegation / Backends
系统气质	控制平面、港口、调度中枢	认知系统、神经网络、工作大脑
优先保护	入口、权限、会话边界、设备能力	连续性、召回质量、技能资产、长期人格
适合的第一批用户	多平台入口重度用户、自托管极客、主权优先者	长期协作者、重记忆和自动化者、远程运行重度用户
最大诱惑	一切入口收编到自己控制之下	一个 Agent 越用越像“你的系统”
最大代价	配置重、边界治理复杂、平台兼容性持续维护	记忆治理难、技能膨胀、远程后端安全与成本管理复杂

看明白这张表之后，你其实已经能理解后面大半篇文章的结论了。

OpenClaw 更像“通道优先、控制平面优先、主权先行”的系统。

Hermes 更像“学习优先、能力积累优先、运行环境抽象优先”的系统。

这一章不讨论输赢，只讨论气质。因为很多时候，用户选错工具，不是功能不够，而是气质不合。

六、第二轮正面对决：入口、记忆、技能、执行环境、协作模型逐项拆开

现在我们进入更硬的一层。既然系统人格已经定性，那就必须把关键模块逐项拆开，看看这种人格到底是怎么落到技术结构里的。

1. 入口层：OpenClaw 把入口当疆域，Hermes 把入口当神经末梢

从工程角度看，这种设计有三个明显好处：

入口统一，利于治理；
平台差异被 Gateway 吃掉，利于抽象；
安全策略、路由策略、工作区归属都可集中管理。

2. 记忆层：OpenClaw 更像可审计笔记本，Hermes 更像分层认知架构

这可能是二者最容易被说成“都差不多”的地方，但其实恰恰相反：它们在记忆上的差异，非常能暴露路线分叉。

这套体系的优点非常鲜明：

可审计；
可编辑；
与工作区绑定清晰；
记忆是一种你能摸得着、改得了、提交得出的资产；
对于本地优先和项目导向的使用方式非常友好。

你甚至可以把它理解成一种“工程师式记忆”：它不追求像人脑那样暧昧而流动，而是尽量把长期经验落成结构清晰、归属明确、文件可见的存档。

而 Hermes 的记忆观则明显更“认知化”。

常驻短记忆；
可搜索的长记忆；
可结构化沉淀的技能与用户模型。

所以，如果要一句话总结二者记忆差异，我会说：

OpenClaw 的记忆像一本可审计、可归档、可控边界的工程日志。

Hermes 的记忆像一个会筛选、召回、压缩并继续长出技能的认知分层系统。

3. 技能层：OpenClaw 的技能更像扩展能力，Hermes 的技能更像经验结晶

但 Hermes 的 skills 叙事更像是在说：技能不是外挂，而是经验的硬化形态。

这带来两个很大的差异。

第一，Hermes 的 skill 更强调 portable、standardized、shareable。它希望技能不仅能在你当前任务里用，还能成为你未来所有任务的资产。

这就是为什么我会说，OpenClaw 的 skills 更像扩展能力，Hermes 的 skills 更像程序性记忆。

4. 执行层：OpenClaw 强在控制，Hermes 强在迁移

执行层的差异同样非常深。

这种设计对于强调物理边界的人极具吸引力。因为你清楚知道：

哪个节点提供了什么能力；
哪些命令会被拦截；
哪些工作区能访问哪些文件；
哪个平台来的消息最终会进入哪个执行环境。

Agent 该不该永远绑定在用户眼前这台机器上？

Hermes 的答案显然是否定的。

这种思路的优点，在今天越来越明显：

远程任务不再依赖本地机器持续在线；
隔离环境变成常态，而非额外补丁；
迁移工作负载到更合适的环境更自然；
你可以把聊天入口留在日常平台，把高风险执行丢给更强、更远、更隔离的后端。

所以，OpenClaw 强在可控执行，Hermes 强在可迁移执行。这两个词看起来只差一个字，背后其实是两套完全不同的工程取向。

5. 协作层：OpenClaw 像调度中枢，Hermes 像任务分形

多代理协作这件事，也是二者差异非常有戏的一层。

我之前写“北斗七星”式流水线，其实就是把这种思路写得更戏剧化了一点：天枢感知、玉衡设计、天玑执行，本质上依然是 Gateway-first 的编排世界。

Hermes 的 delegation 则更像另一种东西：任务分形。

从协作哲学看：

OpenClaw 更像一个总调度台，强调角色清晰、入口统一、边界明确；
Hermes 更像一个可自我裂变的工作系统，强调任务拆分、并发推进、局部隔离。

6. 自动化层：OpenClaw 重通道连续性，Hermes 重工作连续性

自动化能力是很多人喜欢一笔带过的部分，但我认为它恰恰能揭示二者对“持续性”的不同理解。

7. 这一轮对决的结论

如果把这一整章压缩成一句话，那就是：

OpenClaw 把 Agent 放进一个可治理的基础设施框架里；Hermes 则试图让基础设施本身长出时间维度。

这两者都很高级，也都很难。真正可怕的不是它们谁做不到，而是用户自己根本没分清自己在买哪一套逻辑。

七、为什么说 OpenClaw 更像“入口主权”，而 Hermes 更像“学习主权”

这是我整篇文章最想讲清楚的一章。因为如果不把这个概念讲透，后面所有对比都会滑回“功能表比较”。

1. 什么叫入口主权

所谓入口主权，不是一个空洞的政治大词。落到 Agent 基础设施上，它至少意味着：

你知道消息从哪里进来；
你知道什么消息可以触发系统；
你知道不同平台、不同账号、不同群组、不同私聊该落到哪个工作区；
你知道执行权是通过哪些节点、哪些命令、哪些权限边界被授予的；
你知道哪些设备能力被永远封死；
你知道控制平面是否暴露公网，还是被 loopback、tunnel、allowlist 保护。

本质上，入口主权首先是一种控制消息流、命令流与权限流的能力。

2. 什么叫学习主权

而学习主权，则是另一个层级的东西。

它意味着：

你知道 Agent 记住了什么；
你知道它如何把短记忆、长历史、用户偏好与技能资产区分开；
你知道它的技能不是云厂商黑箱里的一串不可见 embedding，而是你可审视、可导出、可迁移的资产；
你知道它能把成功与失败沉淀成稳定改进，而不是每次都靠临场发挥；
你知道这个系统即便换了后端、换了机器、换了项目，也能保留核心人格与经验结构。

本质上，学习主权首先是一种控制 Agent 如何成长、成长成什么样、成长资产归谁所有的能力。

3. 从数据主权到认知主权

过去几年，很多人一谈“主权”，主要还是在谈数据不出境、本地部署、私有 API key、loopback 端口、不依赖云厂商。这些都重要，而且一点都不过时。

但到了今天，如果我们还把主权理解停留在“数据在哪台机器上”，那就太浅了。

因为对于 Agent 来说，更深一层的主权其实是：

这个系统怎么理解你、怎么记住你、怎么学会一套工作方法、怎么把经验传到下一个任务里。

这就是我为什么说，Hermes 把“数字主权”从本地部署推进到了另一层：从数据主权，进一步逼近认知主权。

而 OpenClaw 则恰恰守住了更早但同样不可或缺的一层：入口主权。

4. 两种主权不是互斥，但顺序会改变一切

这里我要特别提醒一点：入口主权和学习主权不是互斥的。任何足够成熟的 Agent 基础设施，最终都应该兼顾这两者。

问题在于，系统最先构建哪一层，会深刻影响后续一切。

如果你先构建入口主权，你的世界会长得更像 OpenClaw：先统一消息入口，先立边界，先管执行，再去谈记忆与成长。

如果你先构建学习主权，你的世界会长得更像 Hermes：先让 Agent 形成连续性，先把经验沉淀成技能，先把运行环境抽象出来，再去扩张更多入口。

顺序为什么重要？因为基础设施不是搭乐高。先打什么地基，会决定你未来哪里补得动、哪里永远别扭。

5. 我的判断：2026 年之后，真正昂贵的是“成长权”

如果一定要让我给出一个带锋芒的判断，我会说：

在 2026 年之后，入口依然重要，但真正越来越昂贵的，将是 Agent 的成长权。

说得再直白一点：

入口是可以被重新接入的；
记忆与成长却往往更难被重新培养。

八、迁移指南背后的真实信号：Hermes 为什么要主动吃掉 OpenClaw 的历史资产

如果说前面七章还主要是架构与哲学分析，那么从这里开始，我们终于要进入最有现实味道的一层：迁移。

根据我核对的迁移文档，Hermes 在真正执行写入前会先给出 preview，且支持 --dry-run。它试图映射和吸收的，至少包括这些对象：

SOUL.md
AGENTS.md
MEMORY.md
USER.md
daily memories
workspace / managed skills
providers
approval mode
messaging tokens
MESSAGING_CWD
session reset policies
MCP servers
部分环境变量与密钥映射

你仔细看这份清单，就会明白一个非常重要的事实：

Hermes 不是只想把你“导过去”，而是想把你在 OpenClaw 里已经形成的世界一起接过去。

1. 迁移的对象，不只是文件，而是人格与习惯

先看 SOUL.md 与 AGENTS.md。

再看 MEMORY.md、USER.md 与 daily memories。

2. 迁移映射本身，就是架构意图的证据

下面这张映射表，比很多宣传文案都更能解释 Hermes 的野心：

OpenClaw 资产	Hermes 侧的落点	这说明了什么
`SOUL.md`	`~/.hermes/SOUL.md` 或上下文文件体系	Hermes 希望继承人格与规则资产
`AGENTS.md`	`--workspace-target` 下的工作区上下文文件	项目级行为规范需要被延续
`MEMORY.md`	`~/.hermes/memories/MEMORY.md`	长期协作记忆需要保留
`USER.md`	`~/.hermes/memories/USER.md`	用户模型是高价值资产
daily memories	归并进 Hermes memories	零散历史也被视作可继承经验
skills	`~/.hermes/skills/openclaw-imports`	方法论资产比你想象得更值钱
providers	`custom_providers` / provider 配置	算力入口要尽可能无缝迁移
approval mode	Hermes approval 配置	安全与执行习惯同样属于资产
messaging tokens	`.env` 等环境变量方案	平台入口也要随迁移保留
MCP servers	Hermes MCP 配置	外部工具生态同样需要延续

注意，这不是“复制粘贴”。它更像一种翻译。

OpenClaw 用户真正拥有的，不是一个配置文件，而是一套已经被打磨出来的工作文明。

3. 哪些东西不能自动迁移，恰恰更有信息量

一个成熟的迁移系统，最值得信任的地方，往往不是“它能迁多少”，而是“它清楚说出哪些不能迁”。

Hermes 的迁移文档里，至少有几个地方值得注意：

某些 SecretRef 来源如果是 source:file 或 exec，无法完全自动解析；
WhatsApp 等平台可能需要重新配对，而不是单纯迁 token；
skills 如有冲突，需要人工决定 skip、overwrite 或 rename；
AGENTS.md 的迁移需要你显式提供 --workspace-target；
部分 OpenClaw 特有概念会被归档，而非直接变成 Hermes 的一等结构；
session reset 策略需要核对，不是所有行为都能 1:1 语义等价。

这其实更能证明 Hermes 不是在做表面文章。因为它非常清楚：迁移不是导入 JSON，而是把一套工作方式搬进另一套文明里。

4. 为什么这件事会让我高看 Hermes 一眼

我不是因为“能迁移”就高看一个产品。我高看它，是因为它知道用户真正舍不得丢的东西是什么。

普通产品经理以为用户最怕重输 token。

稍微懂一点工程的人知道，用户更怕重配 providers。

真正理解长期协作价值的人才知道，用户最怕丢的其实是：

已经磨出来的行为规则；
已经沉淀下来的记忆；
已经复用起来的技能；
已经适应的审批与安全习惯；
已经绑定好的上下文文件与工作流。

Hermes 愿意花力气去接这些东西，说明它想竞争的不是“新鲜感”，而是长期系统的接班权。

5. 这也暴露了 Hermes 对 OpenClaw 的真正判断

一个项目是否提供另一个项目的迁移，背后其实也藏着它对对方的评估。

Hermes 愿意接 OpenClaw，等于默认承认了三件事：

OpenClaw 用户是高价值用户；
OpenClaw 沉淀下来的资产具有高度可继承性；
OpenClaw 并不是“低端旧工具”，而是一套值得被升级吸纳的基础设施前史。

从这个角度看，Hermes 并没有把 OpenClaw 当成需要否定的过去，而是把它视作一个值得承接的文明阶段。

这件事本身，就非常说明问题。

九、工程现实：两套系统分别会给谁带来红利，给谁制造负担

1. 什么人更适合 OpenClaw

如果你属于下面这类人，OpenClaw 往往会更对味：

你是重度多平台消息用户，希望把 Telegram、Discord、Slack、WhatsApp、Signal、Feishu、Matrix 等入口统一收编；
你对本地优先、loopback、配对审批、物理权限边界这类事情极度敏感；
你把 Agent 首先视作一个“可控执行中枢”，而不是陪聊系统；
你需要一套能够把不同工作区、不同角色、不同节点能力明确分隔开的控制平面；
你愿意为入口治理付出配置代价；
你对“系统能否被严格定义边界”看得比“它会不会自我成长”更重。

对这类人来说，OpenClaw 的价值，不是让系统更像人，而是让系统先像一套受管控的基础设施。

2. 什么人更适合 Hermes

如果你属于下面这类人，Hermes 往往会更有未来感：

你和 Agent 的协作不是偶发的，而是长期关系；
你希望它记住你的偏好、项目脉络、做事方法，最好还能越来越会做；
你不满足于单次执行，而是需要 skills、memory、automations、delegation 形成闭环；
你需要 Agent 离开本机，在 Docker、SSH、Modal、Daytona 等环境里持续工作；
你关心跨项目、跨环境、跨时间的能力延续；
你相信最贵的不是入口，而是成长出来的行为资产。

3. 什么人其实两者都不太适合

还有第三类人，值得被直接点出来。

如果你只是：

想在 IDE 里补补代码；
偶尔问几句技术问题；
不打算自托管；
不想维护配置；
不需要多平台接入；
不需要长期记忆；
不想管远程后端；
不会持续使用 agent。

那无论是 OpenClaw 还是 Hermes，都很可能是火力过剩。

工具选型里最常见的浪费，就是拿一艘巡洋舰去送外卖。

4. 三种典型人物画像

为了说得更直白一点，我给三个典型画像。

画像一：多平台数字指挥官

这类人，大概率先从 OpenClaw 获得最大收益。

画像二：长期协作型独立开发者

这类人，更容易在 Hermes 身上看到未来。

画像三：小团队里的流程编排者

你既在意入口，也在意成长，既想统一平台，又不想让经验白白流失。你不是想买一个“能聊”的产品，而是在试图搭一层长期工作底座。

这类人很可能既不会彻底放弃 OpenClaw，也不会忽视 Hermes。他们真正要做的，是判断自己的第一性约束在哪：是入口治理，还是成长治理。

5. 一个非常现实的判断：大多数人会先被 OpenClaw 打动，再被 Hermes 说服

如果让我凭直觉做一个行业判断，我会说很多工程用户的路线大概率会是这样：

先因为 OpenClaw 的入口统一、多平台联动、本地主权、物理边界而被打动；
在实际长期使用中，开始意识到“入口收回来了，但成长资产还没有真正沉淀下来”；
然后被 Hermes 这种 learning-first 体系吸引，开始重新思考什么才是最值钱的部分。

这也是为什么我认为两者不是简单替代关系，而更像两个阶段的重心转移。

十、风险与代价：别把“开源主权”误读成“零成本自由”

这里我必须泼一盆冷水。

无论是 OpenClaw 还是 Hermes，只要你开始认真使用它们，你就会很快发现一件事：

开源主权不是免费午餐，它只是把成本从订阅费，转移成了配置费、治理费、维护费和认知负担。

很多人对“主权工具”的浪漫想象，停留在“我终于不受 SaaS 绑架了”；但真实工程世界更接近另一句话：

你不再向平台交租，但你开始给自己的复杂度交租。

1. OpenClaw 的代价：你拥有了港口，也就拥有了海关、码头和巡逻队

OpenClaw 最迷人的地方，恰恰也是它最累人的地方。你一旦真的把它当成统一入口，就意味着你也要开始承担统一入口的责任。

它的典型隐性成本包括：

各平台 API、权限模型、token 生命周期与 webhook / 长连接细节持续变化；
配对、allowlist、mention policy、群组范围、账号映射这些东西需要持续打磨；
Gateway 作为中心控制面，会自然变成复杂度集散地；
节点能力与命令黑名单要长期维护，不是一劳永逸；
多代理、多工作区、多平台并发下的会话污染与路由异常，需要你有足够清晰的治理策略；
一旦你让它真的接触文件系统、设备、Shell，它的任何失误都不再是“聊天胡说八道”，而可能是真实物理层面的副作用。

很多人喜欢把这种成本说成“配置比较多”。这话太轻了。更准确的说法应该是：

你接管的不只是入口，你还接管了入口背后的全部秩序维护。

2. Hermes 的代价：成长从来不是白给的，尤其是可治理的成长

Hermes 则有另一类成本，而且在我看来，它并不比 OpenClaw 轻松。

它的典型隐性成本包括：

memory 如何压缩、何时更新、是否污染、是否过时，本身就是一门治理学；
skills 会不会越长越乱、越积越碎、命名失控、质量参差，需要系统性整理；
delegation 一旦滥用，子代理会带来额外 token、调度、追踪和责任归因成本；
remote backends 虽然解放了本机，但也引入了容器安全、SSH 密钥、云费用、持久化、审计等问题；
自动化任务一旦持续运行，就意味着你要真正考虑“它在无人值守时出错怎么办”；
认知资产一旦变多，如何迁移、如何去重、如何防止幻觉写入“伪记忆”，会成为长期问题。

很多人对 learning-first 系统的误解，在于他们以为“系统越会学越好”。不是的。

你真的准备好治理一个会成长的系统了吗？

3. 最容易被忽略的成本：认知负担

我认为无论 OpenClaw 还是 Hermes，用户最容易低估的成本都不是钱，而是认知负担。

因为当你从普通工具升级到基础设施时，你不再只是“会用某个软件”，你是在管理一套系统的：

边界；
习惯；
规则；
记忆；
技能；
环境；
自动化；
审批策略；
故障模式。

这不是小白鼠玩具，而是一种新的工作方式。你越认真使用，就越需要从“消费者心态”切到“运维者心态”甚至“架构师心态”。

4. 一个残酷但必要的结论

如果一定要说得更难听一点，我会说：

很多人不是不需要 OpenClaw 或 Hermes，而是不具备长期治理它们的纪律。

他们喜欢的是那种“我掌控了一切”的感觉，却不愿意承担“掌控一切之后的维护义务”。这种心态下，任何基础设施都会在三个月后长成垃圾场。

所以，别再把“开源主权”理解成“零成本自由”。真正的自由，不是你能不能跑起来，而是你有没有能力长期维护自己夺回来的那部分世界。

十一、未来趋势：Agent 工具的下一轮竞争不再是“更会写代码”，而是“谁拥有持续性”

未来几年，如果还有人拿“写代码更快”“支持模型更多”“平台接得更全”当作 Agent 工具链的主要比较维度，我会越来越觉得那是旧时代的回声。

因为下一轮竞争，正在从“即时能力”迁移到“持续能力”。

我认为至少有四个维度，会决定下一代 Agent 基础设施谁更有生命力。

1. 记忆质量，而不是记忆数量

不是谁存得多谁赢，而是谁更能：

过滤噪音；
保留关键；
让召回发生在正确时机；
把重复经验转化成长期优势；
避免系统被自己过往的垃圾拖死。

2. 技能资产，而不是提示词技巧

提示词再花哨，也很难形成真正的长期资产。真正值钱的，是你能否把一套稳定方法沉淀为可迁移、可共享、可演进的 skill。

3. 环境迁移能力，而不是单机炫技

一个 Agent 是否只能活在你眼前这台机器上，这个问题会越来越重要。

4. 治理与安全边界，而不是功能炫技

在这件事上，我反而觉得 OpenClaw 和 Hermes 其实代表了两种很互补的未来方向：

OpenClaw 提醒行业：别忘了边界、入口、平台治理、物理世界风险；
Hermes 提醒行业：别忘了连续性、成长、技能资产、运行时迁移。

未来真正成熟的系统，很可能必须把这两套意识都装进去。

5. 它们会继续靠拢，还是会彻底分家？

这是一个很有意思的问题。

我认为未来有两种可能。

第一种可能：继续靠拢。

第二种可能：彻底分家。

6. 我最确定的一点

无论未来哪条路径胜出，我最确定的一点都是：

下一轮 Agent 基础设施的竞争，不再是“谁更会写代码”，而是“谁更能让智能持续存在”。

这里的持续，不只是 uptime，而是：

经验持续；
规则持续；
技能持续；
运行持续；
人格持续；
可迁移性持续。

谁抓住了这件事，谁就抓住了真正的未来。

十二、结语：我们真正争夺的不是一个 Agent，而是一套可继承的智能基础设施

写到这里，其实已经可以把整篇文章压缩成最后一句话了。

前者争夺的是港口。

后者争夺的是文明。

到了这个层面，讨论“哪个更好”已经太浅了。真正的问题是：你到底想先掌控哪一层世界。

所以，这场对比真正给我的结论，不是 Hermes 取代 OpenClaw，也不是 OpenClaw 注定被 Hermes 吞掉，而是：

Agent 基础设施正在从“入口主权时代”，迈向“学习主权时代”。

而我们真正争夺的，终究不只是一个会说话、会执行、会写代码的 Agent。

我们争夺的是：

谁定义它的边界；
谁保管它的记忆；
谁拥有它的技能；
谁决定它在哪个环境继续活下去；
谁继承它在时间中长出来的那部分“人格”。

如果这些东西仍然掌握在别人手里，那么你拥有的只是一个租来的幻觉。

这，就是我理解的下一代数字主权。

Hermes vs OpenClaw：当 Agent 基础设施走向分叉，谁在定义下一代数字主权

Hermes vs OpenClaw：当 Agent 基础设施走向分叉，谁在定义下一代数字主权

一、Agent 时代真正开始分叉了

二、为什么 Hermes 和 OpenClaw 值得被放在一起比较

三、先拆 OpenClaw：它本质上是一台 Agent 网关，而不是单纯聊天壳子

1. 入口统一不是锦上添花，而是系统的第一性原则

2. 127.0.0.1:18789 背后的，不只是一个端口

3. 节点能力声明，让“执行”从黑箱变成了协商

4. SOUL、Workspace 与会话边界，构成了 OpenClaw 的性格骨架

5. OpenClaw 的内核焦虑，是失去控制

6. OpenClaw 的系统图像

四、再拆 Hermes：它真正想解决的是 Agent 如何越用越像一个人

1. 闭环学习，不是一个营销词，而是产品中心

2. bounded persistent memory，说明 Hermes 不是在幻想“无限记忆”

3. Skills 在 Hermes 里，不是插件边角，而是程序性记忆

4. 六种 terminal backends，暴露了 Hermes 的另一个核心欲望：脱离单机束缚

5. Delegation 让 Hermes 更像一个会分工的系统，而不是一张万能嘴

6. Messaging gateway 在 Hermes 里也重要，但不再是唯一神

7. Hermes 的系统图像

五、第一轮正面对决：两者在设计哲学上到底差了什么

1. OpenClaw：通道优先、控制平面优先、主权先行

2. Hermes：学习优先、能力积累优先、运行环境抽象优先

3. 它们真正分叉的地方，是“先保护什么”

4. 一张总对照表

六、第二轮正面对决：入口、记忆、技能、执行环境、协作模型逐项拆开

1. 入口层：OpenClaw 把入口当疆域，Hermes 把入口当神经末梢

2. 记忆层：OpenClaw 更像可审计笔记本，Hermes 更像分层认知架构

3. 技能层：OpenClaw 的技能更像扩展能力，Hermes 的技能更像经验结晶

4. 执行层：OpenClaw 强在控制，Hermes 强在迁移

5. 协作层：OpenClaw 像调度中枢，Hermes 像任务分形

6. 自动化层：OpenClaw 重通道连续性，Hermes 重工作连续性

7. 这一轮对决的结论

七、为什么说 OpenClaw 更像“入口主权”，而 Hermes 更像“学习主权”

1. 什么叫入口主权

2. 什么叫学习主权

3. 从数据主权到认知主权

4. 两种主权不是互斥，但顺序会改变一切

5. 我的判断：2026 年之后，真正昂贵的是“成长权”

八、迁移指南背后的真实信号：Hermes 为什么要主动吃掉 OpenClaw 的历史资产

1. 迁移的对象，不只是文件，而是人格与习惯

2. 迁移映射本身，就是架构意图的证据

3. 哪些东西不能自动迁移，恰恰更有信息量

4. 为什么这件事会让我高看 Hermes 一眼

5. 这也暴露了 Hermes 对 OpenClaw 的真正判断

九、工程现实：两套系统分别会给谁带来红利，给谁制造负担

1. 什么人更适合 OpenClaw

2. 什么人更适合 Hermes

3. 什么人其实两者都不太适合

4. 三种典型人物画像

5. 一个非常现实的判断：大多数人会先被 OpenClaw 打动，再被 Hermes 说服

十、风险与代价：别把“开源主权”误读成“零成本自由”

1. OpenClaw 的代价：你拥有了港口，也就拥有了海关、码头和巡逻队

2. Hermes 的代价：成长从来不是白给的，尤其是可治理的成长

3. 最容易被忽略的成本：认知负担

4. 一个残酷但必要的结论

十一、未来趋势：Agent 工具的下一轮竞争不再是“更会写代码”，而是“谁拥有持续性”

1. 记忆质量，而不是记忆数量

2. 技能资产，而不是提示词技巧

3. 环境迁移能力，而不是单机炫技

4. 治理与安全边界，而不是功能炫技

5. 它们会继续靠拢，还是会彻底分家？

6. 我最确定的一点

十二、结语：我们真正争夺的不是一个 Agent，而是一套可继承的智能基础设施

延伸阅读

一、Agent 时代真正开始分叉了

二、为什么 Hermes 和 OpenClaw 值得被放在一起比较

三、先拆 OpenClaw：它本质上是一台 Agent 网关，而不是单纯聊天壳子

1. 入口统一不是锦上添花，而是系统的第一性原则

2. 127.0.0.1:18789 背后的，不只是一个端口

3. 节点能力声明，让“执行”从黑箱变成了协商

4. SOUL、Workspace 与会话边界，构成了 OpenClaw 的性格骨架

5. OpenClaw 的内核焦虑，是失去控制

6. OpenClaw 的系统图像

四、再拆 Hermes：它真正想解决的是 Agent 如何越用越像一个人

1. 闭环学习，不是一个营销词，而是产品中心

2. bounded persistent memory，说明 Hermes 不是在幻想“无限记忆”

3. Skills 在 Hermes 里，不是插件边角，而是程序性记忆

4. 六种 terminal backends，暴露了 Hermes 的另一个核心欲望：脱离单机束缚

5. Delegation 让 Hermes 更像一个会分工的系统，而不是一张万能嘴

6. Messaging gateway 在 Hermes 里也重要，但不再是唯一神

2. `127.0.0.1:18789` 背后的，不只是一个端口

2. `127.0.0.1:18789` 背后的，不只是一个端口