为什么Hermes这么火：因为我们想要的不是更强 AI，而是长期同事

我原本以为，Hermes 又是一个新瓶装旧酒的 Agent 项目。

这两年 AI 圈子里几乎天天都有新概念。
一会儿是新模型，一会儿是新 Agent，一会儿是新入口，一会儿又是新平台。

OpenClaw 火的时候，大家在讨论开放生态。
Claude Code 火的时候，大家在讨论程序员工作流。
我自己这段时间也一直在折腾 Codex、Claude Code、MCP、skills、CC Switch，把一套自己的 AI 工作台慢慢搭起来。

说实话，折腾到这个阶段，我对“又来了一个新 Agent”这种事，第一反应已经不是兴奋，而是警惕。

不是吧，又来一个？

我这边刚把一堆工作流和配置梳理顺，你现在又告诉我，我还需要一个“个人 AI 中枢”？

所以一开始，我对 Hermes 并没有特别上头。

但我有个习惯：
越是这种看起来像新名词包装的东西，我越想把它拆开看。

因为我不太相信宣传语，我更相信结构。

一个东西到底有没有价值，不看它喊了什么口号，而看它到底解决了哪一层问题。

看完几篇关于 Hermes、OpenClaw、Harness Engineering 的文章之后，我开始意识到，Hermes 真正让我停下来的地方，不是它又多了一个聊天入口，也不是它能接飞书、微信、Telegram，更不是它可以部署到 VPS 上。

真正让我觉得值得认真看的，是另一件事：

它想做的，不只是“让 AI 能调用工具”，而是让 Agent 在长期使用里，慢慢积累经验。

这件事，和“再来一个聊天机器人”，不是一个量级。

云端 AI 同事的核心想象：不是聊天入口，而是长期协作搭档

真正的问题，从来不只是模型够不够强

这段时间我自己用 Codex 改项目，体感特别强。

一个 Agent 好不好用，真的不只是模型强不强。

不是只看 GPT-5.4 强不强，也不是只看 Claude Sonnet 聪不聪明。

更重要的是，它进入我的环境之后，知不知道我怎么做事。

它知道项目规则在哪里吗？
它知道哪些配置不能乱动吗？
它知道改完代码要验证吗？
它知道哪些是长期偏好，哪些只是当前项目的临时事实吗？

这些东西，模型自己猜不出来。

它得依赖一整套模型之外的工程环境。

这也是我看完那篇 Harness Engineering 之后，最认同的一点。

Agent 不是只有模型。

模型只是那匹马。
真正让这匹马能跑起来的，是缰绳、路线、护栏、地图、记录仪。

也就是 harness。

你可以把它理解成：
除了模型之外，让 Agent 真正能干活的那一整套东西。

比如工具调用、权限控制、日志、验证、记忆、skill、多 Agent 分工、失败恢复。

过去我们可能把这些零零散散叫做工作流、脚本、插件、规范、配置。
但当这些东西被放到一张桌子上，你就会发现，Agent 的可用性，越来越取决于模型外面的那一层。

这也是为什么我现在看很多 Agent 项目，已经不会第一时间去问：

它模型多强？

我更想问的是：

它到底怎么让一个 AI 真正长期、稳定、可控地替你做事。

Agent 真正可用，不只看模型，还要看 harness 这一整层工程环境

对我来说，Codex 和 Hermes 不是同一类东西

如果非要用一句话说我现在的感受，那就是：

Codex、Claude Code 更像开发现场的高强度工作台；Hermes 想做的，则更像一个长期同事。

这两类东西都重要，但不是一个层级。

像 Codex、Claude Code 这种，我现在已经很熟了。

我今天进一个项目目录，它围绕这个项目帮我查文件、改代码、跑测试、修 bug。
你把文档给够，把上下文给够，它就能打。

这种体验非常强。

它们像项目现场里的临时战友。
任务明确，火力很足，特别适合在一个清晰目标下迅速推进。

但它们大多数时候还是“项目内”的。

你进入这个项目，它围绕这个项目工作。
你离开这个项目，再换一个目录，它就进入另一个上下文。

Hermes 想解决的不是这个问题。

它更像在问：

有没有一种 Agent，不是每次都从零开始认识你，而是在长期使用里，慢慢知道你是谁、你怎么工作、你常做什么、你反复踩什么坑。

这就不是“项目工作台”的逻辑了。

这更像“长期同事”的逻辑。

我觉得这也是 Hermes 和 OpenClaw 很不一样的地方。

项目工作台和长期同事不是一回事，差别在连续协作而不只是单次执行

OpenClaw 像平台，Hermes 像同事

OpenClaw 在我眼里，更像一个开放平台。

它强调 Gateway，强调多渠道，强调多 Agent，强调插件生态，也强调你可以自己去搭一整套入口系统。

这种东西很强，也很有想象力。

但它天然更偏向构建者。

你得懂部署。
你得懂配置。
你得懂安全。
你得懂生态治理。
你还得知道哪些 skill 能信，哪些 skill 不能信。

开放生态的魅力在这里，复杂度也在这里。

只要足够开放，就一定会遇到治理问题。
开放带来自由，自由带来复杂，复杂又会带来治理成本。

所以 OpenClaw 像什么？

它更像一个很大的工具箱，或者一个可高度折腾的平台。

Hermes 则更像另一种哲学。

它不是在说：
来，搭一个更大的平台。

它更像在说：
你先养一个属于自己的 Agent。

让它跟着你做事。
让它记住过程。
让它沉淀经验。
让它慢慢长出自己的 skill。

所以如果一定要做类比，我会说：

OpenClaw 更适合构建者
Hermes 更适合操作者

一个像平台。
一个像同事。

一个重点在“你能搭出什么”。
一个重点在“它能不能越来越懂你”。

OpenClaw 更像开放平台，Hermes 更像围绕单一用户持续工作的个人 Agent

为什么这个方向会打动我

因为说到底，很多人现在已经不缺一个“会回答问题的 AI”了。

大家真正开始缺的，是另一个东西：

一个能记得昨天、接得住今天、还能推进明天的 AI。

这两者差别很大。

会回答问题的 AI，本质上是一个很强的响应器。
你问，它答。
你给任务，它执行。

但一个长期同事型的 AI，解决的是另一种痛苦：

不是回答不够好。
而是每次都要重新交代。

这一点，我自己体感非常重。

我一天里会在很多事情之间来回切换。

一会儿整理 Codex 配置。
一会儿修 skill。
一会儿看 OpenClaw。
一会儿研究 Hermes。
一会儿又要写公众号文章。
中间还夹着 VPS、飞书、API、文档、项目目录这些杂事。

如果每件事都从零开始解释，哪怕模型本身再强，体验也会很累。

烦的不是“它答得不够聪明”。

烦的是“它不记得我前天刚说过什么”。

所以我会对 Hermes 这种路线感兴趣，不是因为我觉得它一定会成功，而是因为它碰到的是一个真实需求：

我们缺的，也许已经不是更强的模型，而是更连续的协作。

如果有一个常驻的云端 Agent，知道我最近在迁移什么，知道我的工作流怎么分工，知道我关注 Hermes 不是为了替代开发工作台，而是为了试一个个人 AI 中枢。

那我下次在飞书里只丢一句：

“继续整理 Hermes 试装方案。”

它如果真能接上之前的脉络，那体验会完全不一样。

那就不是聊天机器人了。

那更像一个项目助理。
或者更准确一点，一个长期协作的 AI 同事。

但我现在最关心的，不是它多酷，而是它能不能管住自己

当然，说到这里，问题就来了。

Hermes 这个方向的想象力很强，但风险也不小。

我现在真正关心的，不是它接飞书顺不顺，不是它安装脚本漂不漂亮，也不是它能不能自己生成 skill。

我更关心三件事：

第一，记忆能不能干净。
长期记忆听起来很美，但如果一个 Agent 记住的东西越来越杂、越来越旧、越来越脏，那所谓长期记忆，最后就会变成长期污染。

第二，skill 能不能有效。
会生成 skill 当然很酷，但生成一堆垃圾 skill 也不难。真正难的是，哪些该保留，哪些该淘汰，哪些只是临时经验，哪些才是真正稳定的规则。

第三，边界能不能可控。
一个个人 AI 中枢，如果接的是你的消息、知识、任务、偏好、账号、文件、API key，那这已经不是“好不好玩”的问题了，而是边界问题。

如果这三件事解决不好，那它再会说话、再会连工具，也依然只是一个很酷的新玩具。

它还不配叫个人 AI 中枢。

如果真要试，我不会一上来就把它接进主工作流

我现在已经想得很清楚了。

Hermes 如果要试，我不会直接梭哈。

我不会一上来就把它接进主环境。
不会一上来就让它碰主项目。
不会一上来就把所有 channel、所有目录、所有 API key 全塞进去。

这太危险了。

尤其是这种带长期记忆、长期协作预期的系统，最忌讳的就是还没摸清楚边界，就直接进入主干道。

我看了下我自己那台 VPS 小鸡。

配置是最小的那种。

看到这个配置的时候，我第一反应其实是想笑。

这台机器跑点轻量脚本问题不大，但真要拿它去长期扛一个个人 AI 中枢，多少有点为难它。

不是说一定跑不起来。

而是这种东西最怕的，不是启动失败，而是半死不活。

今天在线。
明天消息不回。
后天记忆库写坏。
大后天 gateway 端口抽风。

然后你开始怀疑人生：
到底是 Hermes 不行，还是 VPS 太小，还是 Node 版本不对，还是网络有问题，还是 API 节点抽了？

这种排查体验，太差了。

所以如果我要试，我只会给它一个单独环境。

至少 2C4G。
想长期跑，4C8G 会更舒服。
系统用 Ubuntu 22.04 或 24.04。
先不碰现有 Codex 和 Claude Code 的主配置。
也不接管我现在的主 skills 库。

先让它自己单独活着。

这一步，我觉得特别重要。

我更愿意先拿一个非常小的场景验证它

如果让我现在给 Hermes 设计一个试用方案，我不会让它一上来就做太多。

我只会先给它一个很小的场景。

比如只让它跟踪我的 AI 工具研究。

只做三件事：

帮我记录最近研究了哪些 Agent
帮我总结每个工具的定位和风险
帮我提醒哪些东西还没验证

先让它在一个小范围里证明自己。

如果这个场景能稳定跑一周，我再考虑接飞书。
如果接了飞书之后，它真的能像一个长期助理一样跟我对话，而不是每次都像新来的实习生，我再考虑扩大范围。

如果做不到，那就停。

这没什么丢人的。

工具就是工具。
好用就留下，不好用就放回博物馆。

我现在对很多 AI 项目的态度，其实都差不多：

少一点信仰，多一点测试。
少一点激动，多一点边界。

我会先用一个最小验证闭环试 Hermes，而不是一上来就接进主工作流

我为什么还会继续看下去

虽然我现在很谨慎，但我还是承认，Hermes 这条路线让我有点兴奋。

不是因为它一定会赢。

而是因为它提出了一个我觉得非常重要的问题：

一个 AI，能不能不只是会回答，而是会成长？
它能不能不只是调用工具，而是能积累经验？
它能不能不只是完成任务，而是慢慢理解一个人的工作方式？

如果这几个问题真的能往前推进一步，那个人 AI 中枢这件事，才算真正开始有意思。

到那时候，AI 也许就不只是一个你随时调出来问问题的工具了。

它会更像一个长期共处的数字同事。

你不是每次都在重新开工。
而是在接着昨天继续推进。

这才是我觉得最迷人的地方。

不是多一个入口。
也不是多一个机器人。

而是你终于开始拥有一个，可能会慢慢懂你的系统。

当然，现在说这些还早。

我的那台配置是最小的 VPS 还在那里亮着绿灯，像一个努力想证明自己的小土豆。

以前我们买 VPS，是为了挂网站、跑脚本、搭代理。
现在很多人买 VPS，已经开始是为了养一个可能会记住自己的 Agent。

这件事本身就很荒诞。

但也正因为它有点荒诞，我才觉得值得继续看下去。

我的暂时结论

我不会现在就把 Hermes 推到主舞台。

但我愿意先给它一个小房间。

让它先住进去。
先做一点小事。
先证明它不是一个包装很好的新玩具，而是真的有可能，慢慢长成一个靠谱的云端同事。

如果它最后能把三件事做顺：

记忆干净
skill 有效
边界可控

那它就值得被认真对待。

如果做不到，它就还是一个概念大于落地的新项目。

至少对我来说，现在 Hermes 的价值，不在于替代 Codex，也不在于再给我多一个 AI 入口。

它真正让我在意的，是它有没有可能补上我现有工作流里一直缺的那一层：

不是更强的执行力，而是更连续的协作。

如果有一天，我在飞书里叫一句，它不是像新来的实习生一样重新问一遍背景，而是像一个老搭档一样直接接着往下干。

那这件事，就真有点意思了。