Hermes Agent 完全指南:让 AI 编程助手接管你的全部消息平台
Hermes Agent 是 2026 年增长最快的开源 AI Agent 框架(191K+ Stars),支持 22 个消息平台、300+ 模型、自我进化技能系统。架构原理、核心能力、与 OpenClaw 的生态位对比、生产部署实战,以及 14 篇子教程导航。
Hermes Agent 是 2026 年增长最快的开源 AI Agent 框架(191K+ Stars),支持 22 个消息平台、300+ 模型、自我进化技能系统。架构原理、核心能力、与 OpenClaw 的生态位对比、生产部署实战,以及 14 篇子教程导航。
Hermes Agent 是什么?一句话:它是一个驻扎在你服务器上的自主 AI Agent,能同时接管 22 个消息平台,运行时间越长能力越强。
不是绑定 IDE 的编程副驾驶,不是包裹单个 API 的聊天机器人。Nous Research 在 2026 年 2 月发布了这个开源框架,截至 2026 年 6 月已经拿到 191,000+ 个 GitHub Stars、1,397 位贡献者和 11,265 次提交。它的官方标语是"The agent that grows with you"——与你一同成长的 Agent。
我用 Hermes 跑了两个月生产环境,同时接管微信和 Discord 双平台,日均处理 50+ 条消息。这篇文章把我摸透的所有东西整理成一份完全指南:架构原理、核心能力、与 OpenClaw 的生态位对比、成本深算、生产部署经验,以及 14 篇子教程的导航入口。


Hermes 的架构由三个解耦层组成,每层独立可扩展,互不干扰。
通道层(Channels)负责收发消息。一个 Gateway 进程同时服务所有平台,跨平台对话保持连续性。
支持的消息平台:
| 平台 | 支持能力 |
|---|---|
| Telegram | 文字/图片/文件/语音/群组 |
| Discord | 文字/图片/文件/群组 |
| Slack | 文字/图片/文件/群组 |
| 文字/图片/文件/语音 | |
| Signal | 文字/图片/文件/语音 |
| 完整邮件收发 | |
| CLI/TUI | 终端界面,多行编辑,流式输出 |
上面 7 个是最常用的一线通道。加上 v0.16.0 新增的官方原生桌面应用(macOS / Windows / Linux)、Web Dashboard(浏览器管理面板)、Home Assistant(智能家居)、API Server(兼容 Open WebUI 等 6 款前端)以及社区贡献的其他集成,Hermes 目前累计支持 22 个消息平台。
v0.16.0(代号 The Surface Release)的最大更新就是官方桌面端。它不是独立产品或轻量替代——底层跑的是同一个 Hermes Agent 核心,共享配置、密钥、会话、技能和记忆。CLI 里设置过的东西桌面端直接可用,反过来也一样。内置文件浏览器、语音模式、技能管理、定时任务面板,还支持连接远程服务器上的 Hermes 实例。

关键特性:语音备忘录自动转录。你在 Telegram 上发一段语音,Hermes 用本地 faster-whisper 转成文字后处理,不经过第三方转录服务。
核心层是 Hermes 的大脑,包含:
支持 300+ 模型,覆盖全球主流 Provider(提供商):
Nous Portal、OpenRouter、OpenAI、Anthropic、Google Gemini、DeepSeek、GLM(智谱)、Kimi、MiniMax、Hugging Face、NVIDIA NIM 等。
切换模型只需一条命令:hermes model,无需改代码。这意味着你可以根据任务类型灵活切换——日常对话用低成本模型,复杂推理任务临时切换高端模型,花费精确到每条消息。
三层解耦的好处是:换消息平台不影响 Agent 逻辑,换模型不影响消息通道,升级任何一层不需要动另外两层。

传统方案是每个平台写一套接入代码。Hermes 的 Gateway 进程统一处理所有通道的消息收发,你在 Telegram 说的话和在 Discord 说的话共享同一个上下文。
实际体验:我在微信问了一个问题,切到 Discord 继续追问,Hermes 记得之前的对话内容,不需要重复说明背景。这种跨平台连续性在竞品中很少见——大多数方案要么每个平台独立部署一个实例,要么需要额外的中间层来同步上下文。
Gateway 的另一个设计亮点是消息格式自动适配。同一条回复在 Telegram 用 Markdown 渲染,在 Discord 用代码块,在 Email 用 HTML——Agent 只管输出内容,格式适配交给通道层处理。
技能系统(Skills)是 Hermes 的过程记忆。格式是 Markdown + YAML frontmatter,人可读、机器可用。
进化机制:
社区还有技能市场 agentskills.io,一键安装别人沉淀的技能:/skill install <name>。
Nous Research 另有独立的自我进化框架 hermes-agent-self-evolution(4K Stars),用 DSPy + GEPA 驱动技能和提示词的自动优化。
💡 通俗讲:技能系统就像一个自动生长的操作手册。你教过 Hermes 做一件事,它就永远记住怎么做,而且越做越熟练。
详细教程 → Hermes Skill 自我进化系统
传统 Cron 表达式 0 9 * * 1-5 难记难写。Hermes 的调度器支持自然语言:
每天早上 9 点给我推送今日待办
每周一下午 3 点检查 GitHub 仓库的 issue
每月 1 号汇总上月 API 花费
定时任务通过 scheduler 工具注册,重启后自动恢复,支持跨平台推送结果。

详细教程 → Hermes Agent Cron 定时自动化
Hermes 内置 faster-whisper 本地语音转录和 TTS 文字转语音。在 Telegram、WhatsApp、Signal 上直接发语音消息,Hermes 转录后理解并执行,结果可以用语音回复。
应用场景:通勤路上语音指挥 Agent 跑数据分析任务,到公司后文字看结果。做饭时语音问今天的日程安排,不用腾出手来打字。
语音模式的关键优势是隐私:转录在本地完成,音频不上传第三方服务。对于涉及商业机密的对话场景,这一点很重要。
详细教程 → Hermes 语音模式完全攻略
Hermes v0.16.0 支持 MCP 反向服务(hermes mcp serve),暴露 10 个工具接口。Claude Code 和 Codex 通过 SSH stdio 连接 Hermes,在完成长任务后自动推送通知到 Discord 或 Telegram。
暴露的工具包括:conversations_list、messages_send、events_poll、permissions_respond 等——覆盖消息收发、事件轮询和权限审批的完整流程。
使用场景:Claude Code 在后台跑两小时的代码重构,完成后通过 Hermes 推送结果到你的手机。你不在电脑前也能收到通知。
详细教程 → Claude Code + Hermes MCP 消息桥接实战
| 分类 | 工具 |
|---|---|
| 文件操作 | read / write / edit / ls |
| 终端 | bash 命令执行 |
| 网络 | web_fetch / web_search / browser |
| 记忆 | memory 检索与写入 |
| 调度 | scheduler 定时任务 |
| 多媒体 | vision 图片理解 / TTS 语音合成 / 图像生成 |
| 协议 | MCP 集成 |
决定命令执行的隔离方式:

Hermes Atlas(社区官方生态图谱)截至 2026 年 6 月已收录 168 个开源仓库,覆盖 12 个分类,累计 700K+ 总 Stars。
| 维度 | 数值 |
|---|---|
| 社区 GUI 客户端 | 18 个 |
| 记忆提供者 | 23 个(含 8 个官方支持) |
| 技能注册表 | 31 个仓库 |
| 多 Agent 编排框架 | 13 个 |
| 部署方案 | 11 个 |

Hermes 的记忆不是简单的聊天历史堆叠,而是三层递进式架构:
| 层级 | 容量 | 速度 | 用途 |
|---|---|---|---|
| 内置层(MEMORY.md + USER.md) | ~1300 token | 即时注入 | 关键事实,每次对话都在 |
| 会话搜索层(SQLite FTS5) | 无限 | 搜索 + 摘要 | 回溯特定历史对话 |
| 外部提供者(8 种插件) | 取决于后端 | 按需调用 | 语义搜索、知识图谱 |
外部记忆提供者包括 Honcho(辩证式用户建模)、Hindsight(知识图谱,结构化实体检索 + reflect 合成)、mem0(58K Stars 通用记忆层)、SuperMemory(26K Stars,亚 300ms 召回)等。
理解记忆系统需要知道系统提示词是怎么组装的:
1. SOUL.md ← 身份定义(全局,跟 Agent 走)
2. 工具行为指引 ← 内置规则
3. MEMORY.md ← Agent 笔记(环境事实、教训、经验)
4. USER.md ← 用户画像(习惯、偏好)
5. Skills 指引 ← 技能索引(名字 + 描述,按需展开全文)
6. AGENTS.md ← 项目上下文(按工作目录加载)
7. 时间戳 + 平台格式 ← 内置
SOUL.md 决定 Agent 的人格和行为边界,MEMORY.md 存储运行中积累的事实和教训,USER.md 记录用户偏好。三份文件协同工作,让 Hermes 既有稳定的身份基线,又能持续适应用户的使用习惯。
详细教程 → Hermes SOUL.md 人设工程 + 三层记忆
Hermes 和 OpenClaw 是 2026 年开源 Agent 领域最受关注的两个项目,同属「自主 Agent」赛道,但设计取向截然不同。
| 维度 | Hermes Agent | OpenClaw |
|---|---|---|
| 开发商 | Nous Research | 社区驱动 |
| GitHub Stars | 191K+ | 378K+ |
| 贡献者 | 1,397 | 2,500+ |
| 主要语言 | Python 82.7%,TypeScript 13.4% | TypeScript |
| 许可证 | Apache-2.0 | 自定义许可 |
| 核心定位 | 消息平台自主 Agent(22 个平台原生集成) | 通用个人 AI 助手(Any OS, Any Platform) |
| 桌面端 | v0.16.0 官方原生应用 | 官方桌面端 |
| 自我进化 | Markdown 技能系统 + 技能市场 agentskills.io | 内置工具 + 社区扩展 |
| 记忆体系 | 三层递进(内置 + FTS5 + 8 种外部提供者) | 持久化对话 + 项目上下文 |
| MCP 支持 | 原生 + 反向服务(hermes mcp serve) |
原生支持 |
Hermes 的差异化在于消息平台的深度集成。它不是把消息收发作为一个可选插件,而是从架构层面就按「消息网关 + Agent 核心 + 模型层」三层设计。22 个平台的跨平台上下文连续性、语音转录、品牌频道分区——这些是 Hermes 投入最多工程量的方向。
OpenClaw 的规模更大(378K Stars,GitHub 上最受关注的 Agent 项目之一),走的是「通用个人 AI 助手」路线,强调「Any OS, Any Platform」。两者的关系更像是专用工具和通用工具的关系:Hermes 在消息自动化场景更深入,OpenClaw 在通用辅助场景覆盖更广。
如果你的核心需求是一个能 7×24 驻守消息平台、自动处理和回复消息的 Agent,Hermes 是更匹配的选择。如果你需要一个全能型个人 AI 助手,OpenClaw 的生态更大、社区更活跃。
如果你完全不想碰代码,Coze(扣子)的低代码界面可以零基础搭 Agent;如果你需要编排复杂的多步工作流,Dify 的可视化编排更合适。但这两者和 Hermes/OpenClaw 不在同一个品类——前者是平台型产品,后者是开源 Agent 框架,选型时不应混在一起比。
详细横评 → Hermes Agent vs OpenClaw vs Claude Code:8 大 AI Agent 横评
详细成本拆解 → Hermes Agent 成本控制实战

| 项 | 配置 |
|---|---|
| 部署方式 | pipx install hermes-agent[messaging](隔离虚拟环境) |
| 后台服务 | launchd 注册,7×24 常驻 |
| 消息平台 | 微信 iLink Bot(私聊)+ Discord(品牌分区 12 频道) |
| 主力模型 | GLM-5.1(智谱 Coding Plan);额度耗尽切 DeepSeek V4 Pro |
| 视觉辅助 | Gemini 2.5 Flash(独立配置,不受主模型限流影响) |
| MCP 反向服务 | Claude Code / Codex 通过 SSH stdio 调用 |
这是我在实践中总结出的架构模式——知识库是唯一真值源,Hermes 配置只存路径指针和导航指令,不复制内容。
静态层(系统提示词,每次都在)
├── SOUL.md → 身份 + 语言规则 + "知识库路径在这"
├── MEMORY.md → 根路径 + 导航方法
└── USER.md → 极简画像 + "详情读知识库"
动态层(对话中按需读取文件)
├── 知识库 CLAUDE.md → 总路由表
├── 知识库 品牌/*/身份/*.md → 品牌详情
├── 知识库 规范/*/ → 写作规范
└── ... 知识库里的一切
好处:
💡 通俗讲:传统方案是把整本字典塞进 Agent 的口袋。指针架构是给 Agent 一张图书馆地图,需要哪个词条就去查哪个词条。字典更新了不需要重新印刷——走到书架前翻最新版就行。
Discord 服务器按品牌拆分 12 个频道:翔宇运营区 5 个 + SYL 运营区 2 个 + 共用区 5 个。进频道即确定品牌身份,无需每次手动指定。
每个频道的 channel_prompts 只放导航指令,不放具体内容。Hermes 收到消息后按频道职责域提取触发词,到知识库匹配对应工作流,再逐步执行。新增或修改工作流后,Hermes 下次对话自动感知。
72 个工具的 Schema 定义占约 19,210 token。开启 tool_search 后,只加载常用工具的完整 Schema,其余按需查找。Token 降到约 2,200——减少 89%。
auxiliary:
vision:
provider: google # Gemini Flash 处理图片
model: gemini-2.5-flash
compression:
provider: deepseek # 独立 Provider
model: deepseek-v4-pro
主模型限流时(比如 GLM 月度额度耗尽返回 429),如果压缩模型没有独立配置,它也跟着挂,Agent 会丢失整个对话上下文。独立配置 Provider 后,主力挂了压缩不受影响。
采用腾讯官方 iLink Bot API(非破解协议),通过长轮询通信,无需公网服务器或 Webhook。
支持能力:
限制:iLink Bot 身份无法加入普通微信群,仅私聊场景可用。
详细方案 → 用 Hermes Agent 搭建跨平台 AI 消息助手

# Linux / macOS / WSL2 / Termux
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash
# Windows (PowerShell)
iex (irm https://hermes-agent.nousresearch.com/install.ps1)
# pipx(推荐高级用户)
pipx install "hermes-agent[messaging]"
# 交互式配置模型
hermes
# 或使用 Nous Portal 一键配置
hermes setup --portal
model:
default: deepseek-v4-pro
provider: deepseek
auxiliary:
vision:
provider: google
model: gemini-2.5-flash
compression:
provider: deepseek
model: deepseek-v4-pro
terminal:
backend: local
cwd: ~/projects
timeout: 300
memory:
provider: honcho
pip install 'hermes-agent[web,pty]'
hermes dashboard
# 浏览器访问 http://127.0.0.1:9119
# ~/.hermes/.env
API_SERVER_ENABLED=true
API_SERVER_KEY=your-secret-key
API_SERVER_PORT=8642
已验证兼容的前端:Open WebUI(126K Stars)、LobeChat(73K)、NextChat(87K)、AnythingLLM(56K)、ChatBox(39K)、LibreChat(34K)。
API Server 支持三种模式:
/v1/chat/completions)——标准 OpenAI 格式,无状态,兼容所有 OpenAI 客户端/v1/responses)——服务端会话状态,支持 previous_response_id 实现多轮对话/v1/runs)——长时任务的 SSE 事件流 + 人工审批,适合需要确认的高风险操作# 启用内置插件
hermes plugins enable disk-cleanup
hermes plugins enable observability/langfuse
# 安装社区技能
hermes skills install official/autonomous-ai-agents/honcho
# 配置记忆提供者
hermes memory setup
# 选择 honcho / hindsight / mem0
Langfuse 插件可以把 Agent 的所有活动追踪到可视化仪表盘——每次工具调用、Token 消耗、花费明细一目了然。对比 Coze 和 Dify 的黑盒监控,这种完全透明的可观测性(Observability)是自部署方案的天然优势。
Docker 部署详细教程 → Hermes Agent Docker 部署实战
本地模型接入 → Hermes Agent 本地模型指南
| # | 问题 | 解法 |
|---|---|---|
| 1 | 首条消息慢 ~20s(冷启动探测端点) | .env 显式设 GLM_BASE_URL |
| 2 | 未授权用户消息被丢弃 | hermes pairing approve 批准 |
| 3 | GLM-5.1 返回空(reasoning 消耗 max_tokens) | max_tokens ≥ 200 |
| 4 | gateway install 覆盖 plist 配置 |
每次 install 后重新修补工作目录 |
| 5 | 月度额度耗尽(5 台机器共享) | 切 DeepSeek 按量计费无上限 |
| 6 | Discord 表格不渲染 Markdown | 手写 PNG 图片渲染器 |
| 7 | 双 Bot 冲突重复回复 | 停掉另一个 Agent 的连接 |
这些坑每个都花了我至少一小时排查。生产级部署和演示环境的差距就在这些细节里。市面上的 Hermes 教程大多停留在安装配置阶段,不会告诉你长期运行后会遇到什么问题——因为写教程的人通常只跑了一个下午的演示环境。
两个月的生产运行让我确认:Hermes 的稳定性已经达到生产级要求。上面列的 7 个坑都有明确的解法,解决后不会复发。
arXiv 论文"Agent System Operations: Categorization, Challenges, and Opportunities"将 Hermes Agent 与 Claude Code、OpenClaw 等并列为代表性 Agent 框架。从 GitHub Stars 看,Hermes(191K)和 OpenClaw(378K)分别占据自主 Agent 赛道的第一梯队——前者专攻消息平台自动化,后者走通用助手路线。
从 2026 年 2 月首发到 6 月突破 191K Stars,Hermes 的增速在同类项目中排名前列。这背后的推力主要有三个:MCP 协议成为 Agent 工具集成的事实标准(Hermes 原生支持),自我进化的技能系统把「用过就忘的聊天机器人」和「越用越聪明的 Agent」拉开了差距,以及 Modal/Daytona 等无服务器平台让部署成本趋近于零。
变现路径 → Hermes Agent 变现指南:7 种商业模式
一人公司实战 → Hermes Agent 一人公司实战
这是本系列的完整导航。根据你的需求选择入口:
| 教程 | 适合谁 | 链接 |
|---|---|---|
| Claude Code + Hermes MCP 消息桥接 | 已有 Claude Code,想最快体验 | 阅读 |
| 跨平台 AI 消息助手搭建 | 想接入多个消息平台 | 阅读 |
| Docker 部署实战 | 想 10 分钟跑通 | 阅读 |
| 本地模型指南 | 不想用云端 API | 阅读 |
| 教程 | 核心主题 | 链接 |
|---|---|---|
| Skill 自我进化系统 | 技能创建与优化 | 阅读 |
| Cron 定时自动化 | 自然语言调度 | 阅读 |
| 语音模式完全攻略 | 语音交互 | 阅读 |
| SOUL.md 人设工程 + 三层记忆 | 记忆与人格 | 阅读 |
| 教程 | 核心主题 | 链接 |
|---|---|---|
| 8 大 AI Agent 横评 | 选型决策 | 阅读 |
| 成本控制实战 | 花最少的钱 | 阅读 |
| Kanban 多 Agent 编排 | 多 Agent 协作 | 阅读 |
| Home Assistant 集成 | 智能家居 | 阅读 |
| 教程 | 核心主题 | 链接 |
|---|---|---|
| 变现指南:7 种商业模式 | 赚钱 | 阅读 |
| 一人公司实战 | 全流程落地 | 阅读 |
| 指标 | 当前值 |
|---|---|
| 最新版本 | v0.16.0(2026-06-05,代号 The Surface Release) |
| GitHub Stars | 191,000+(截至 2026-06-11) |
| 贡献者 | 1,397 人 |
| 总 Commits | 11,265 |
| 许可证 | Apache-2.0 |
| 主要语言 | Python 82.7%,TypeScript 13.4% |
| 生态收录仓库 | 168 个(Hermes Atlas) |
| 生态总 Stars | 700K+ |
| 官方桌面端 | v0.16.0 起内置(macOS / Windows / Linux) |
| 消息平台 | 22 个(含一线通道 + 桌面端 + Web + 社区集成) |
| 官网 | hermes-agent.nousresearch.com |
| GitHub | github.com/NousResearch/hermes-agent |
注意区分:Hermes Agent(本文主题,Agent 框架)和 Hermes 模型(如 Hermes 3,基于 Llama 微调的大语言模型)是 Nous Research 的两条独立产品线。两者可以配合使用,但不是同一个东西。
Hermes Agent 是 Nous Research 开发的开源自主 AI Agent 框架,采用 Apache-2.0 许可证。它驻扎在你的服务器上,支持 22 个消息平台,能自动学习新技能,运行时间越长能力越强。
两者都是开源自主 Agent 框架,但定位不同。Hermes 专攻消息平台自动化(22 个平台原生集成),OpenClaw(378K Stars)走通用个人助手路线。如果核心需求是 7×24 消息处理,选 Hermes;如果需要全能型 AI 助手,选 OpenClaw。Coze/Dify 是低代码平台,和 Hermes/OpenClaw 不在同一品类。
累计 22 个。一线通道包括 Telegram、Discord、Slack、WhatsApp、Signal、Email、CLI/TUI。v0.16.0 新增官方原生桌面应用(macOS/Windows/Linux)。还有 Web Dashboard、Home Assistant、API Server(兼容 Open WebUI 等 6 款前端),以及社区贡献的微信(iLink Bot)等集成。
能在终端执行 curl 安装、编辑配置文件、理解环境变量。不要求编程能力,但会 Python 可以开发自定义插件。
基于技能系统:完成复杂任务后自动生成 Markdown 格式的技能文件,下次遇到类似任务直接复用。技能在使用中持续改进。
300+ 模型,覆盖 OpenAI、Anthropic、Gemini、DeepSeek、GLM、Kimi、MiniMax 等。切换模型一条命令搞定。
可以。Hermes v0.16.0 的 MCP 反向服务让 Claude Code 在完成任务后自动推送通知到你的消息平台。
不是。Hermes Agent 是 Agent 框架,Hermes 模型是基于 Llama 微调的大语言模型。两者独立但可配合使用。
推荐从 Claude Code + Hermes MCP 消息桥接实战 开始,这是最轻量的入门路径。想完整部署看 Docker 部署实战。
每周精选 AI 编程与自动化实战内容,直达你的邮箱