✨ 功能介绍
Hermes Agent 不仅仅是一个聊天机器人——它是一个持续学习、自我改进的自主 AI 代理。以下是它的核心功能。
🧠 自主学习闭环
这是 Hermes 与其他 AI 代理最大的区别。Hermes 拥有完整的「学习闭环」:
- 自主记忆管理:Hermes 会主动决定哪些信息值得记住,并定期自我提醒以持久化知识
- 技能创建:完成复杂任务后,Hermes 会主动将解决方法封装为可复用的「技能」
- 技能自我改进:使用技能时,Hermes 会发现不足并自动优化
- 跨会话召回:基于 FTS5 的全文搜索,让 Hermes 能回忆起过去任意会话中的内容
- 用户建模:通过 Honcho 辩证建模,Hermes 跨会话建立对你的深层理解
💾 记忆系统
Hermes 的记忆系统分为三层:
| 类型 | 用途 | 持久性 |
|---|---|---|
| 用户记忆 (User Memory) | 你的偏好、习惯、个人信息 | 跨会话永久保存 |
| 代理笔记 (Agent Notes) | Hermes 自己的观察和总结 | 跨会话永久保存 |
| 会话记忆 (Session) | 当前对话的上下文 | 会话内有效 |
📚 技能系统
技能是 Hermes 的「过程记忆」——它知道如何做某件事的完整步骤。
- 技能使用 YAML frontmatter + Markdown 格式
- 兼容 agentskills.io 技能中心
- 支持社区贡献和分享
- Hermes 会在执行任务时自动学习并创建新技能
💬 消息网关 (15+ 平台)
Hermes 通过统一的消息网关连接 15+ 个平台:
- 即时通讯:Telegram、Discord、Slack、WhatsApp、Signal
- 中国平台:飞书 (Feishu)、钉钉 (DingTalk)、企业微信 (WeCom)
- 开放协议:Matrix、Mattermost
- 其他:Email、SMS、BlueBubbles、Home Assistant
一次配置,全平台可用。详见 消息平台配置。
🎙️ 语音模式
Hermes 支持实时语音交互:
- CLI 语音输入/输出
- Telegram 语音消息
- Discord 语音频道
- 支持多种 TTS 和 STT 引擎
🎭 个性与 SOUL.md
通过全局 SOUL.md 文件定义 Hermes 的默认性格和说话风格。你可以让它正式、幽默、简洁,或任何你想要的风格。
📄 上下文文件
在项目中放置 HERMES.md 文件,可以为 Hermes 提供项目特定的上下文信息,让它在每个项目中都有针对性的工作方式。
🔌 MCP 集成
连接任何 MCP (Model Context Protocol) 服务器来扩展 Hermes 的能力:
- 工具过滤和安全配置
- 支持 stdio 和 SSE 传输方式
- 自动发现和注册 MCP 工具
🔧 47 个内置工具
Hermes 内置了 47 个工具,涵盖:
- 终端操作和代码执行
- 文件读写和搜索
- 网页搜索、抓取和浏览器控制
- 图像生成和视觉分析
- TTS 语音合成
- 定时任务和后台进程管理
- 子代理委派和并行执行
🔒 安全
Hermes 提供多层安全保障:
- 命令审批:危险操作需要确认
- 授权系统:细粒度权限控制
- 容器隔离:支持 Docker 沙箱运行