Agent Wiki/Hermes Agent
Wiki 首页分类搜索

知识树

Agent Wiki

      • Claude Agent SDK(Anthropic)
      • Google ADK(Agent Development Kit)
      • OpenAI Agents SDK
      • Docker(容器化平台)
      • Kubernetes(容器编排平台)
      • Agent Harness(Agent 脚手架 / 运行时控制层)
      • Agent Retry(重试机制)
      • Function Calling(函数调用)
      • Hooks(钩子机制)
      • Human-in-the-Loop(人机协同)
      • MCP(Model Context Protocol)
      • Memory(Agent 记忆机制)
      • RAG(检索增强生成)
      • State Management(Agent 状态管理)
      • Tool Use(工具使用)
      • 上下文工程(Context Engineering)
      • Chroma(向量数据库)
      • Milvus(向量数据库)
      • MongoDB(文档数据库)
      • MySQL(关系型数据库)
      • Pinecone(云原生向量数据库)
      • Qdrant(向量搜索引擎)
      • Weaviate(AI 原生向量数据库)
      • AgentScope(多Agent平台)
      • AutoGPT(自主Agent平台)
      • AutoGen(微软多Agent框架)
      • CAMEL-AI(多Agent通信框架)
      • DSPy(声明式 LLM 编程框架)
      • Haystack(AI 应用框架)
      • Hermes Agent
      • LangChain(LLM 应用开发框架)
      • LangGraph
      • Letta(有状态Agent框架)
      • LlamaIndex(数据框架)
      • Phidata / Agno(Agent 构建框架)
      • Apache Kafka(分布式流处理平台)
      • Celery(分布式任务队列)
      • RabbitMQ(消息代理)
      • Redis(内存数据库/缓存)
      • FastAPI(高性能Web框架)
      • Uvicorn(ASGI 服务器)
      • 位置编码(Positional Encoding)
      • 注意力优化(Attention Optimization)
      • 长上下文处理(Long Context Handling)
      • 高效推理(Efficient Inference)
      • AI 硬件概述(Hardware Overview)
      • FlagOS(模型服务平台)
      • SGLang(高效LLM推理引擎)
      • vLLM(高性能LLM推理引擎)
      • 云端模型服务概述
      • 推理引擎(Inference Engines)
      • 本地模型概述(Local Model Deployment)
      • 部署架构(Deployment Architecture)
      • 部署系统(Deployment System)
      • 按场景选型(模型选择指南)
      • 按规模选型(Model Selection by Parameter Size)
      • 模型评估方法(Model Evaluation Methods)
      • Agent 与工具使用(Tool-Augmented LLM)
      • 技术趋势(Technology Trends)
      • 推理增强(Reasoning Enhancement)
      • 混合专家模型(Mixture of Experts, MoE)
      • 长上下文技术(Long Context Technology)
      • 模型架构演进(Model Architecture Evolution)
      • 预训练语言模型(Pre-trained Language Model)
      • BERT 系列模型
      • GPT 系列模型(OpenAI)
      • 开源大模型生态(Open-source LLM Ecosystem)
      • 统一多模态模型(Unified Multimodal Models)
      • 视觉定位与检测(Visual Grounding & Detection)
      • 视觉语言模型(Vision-Language Models, VLM)
      • 对齐技术(Alignment)
      • 持续学习(Continual Learning)
      • 指令微调(Instruction Tuning)
      • 预训练技术(Pretraining Techniques)
      • Plan-and-Solve(计划与执行)
      • ReAct(推理与行动协同)
      • Reflection(反思/自我纠错模式)
      • 数据流编排模式(Data Flow Orchestration)
      • 知识密集型架构(Knowledge-Intensive Architecture)
      • 自主 Agent 架构(Autonomous Agent Architecture)
      • Handoff 模式(任务移交)
      • Kimi Agent Swarm(Kimi 智能体集群)
      • Master-Worker 模式(主从分发)
      • 分层模式(Hierarchical)
      • 流水线模式(Pipeline)
      • 群聊模式(Group Chat)
      • 辩论/竞争模式(Debate & Competition)
      • 按场景选型(Pattern Selection by Scenario)
      • 按复杂度选型(Pattern Selection by Complexity)
      • Code Agent(代码型 Agent)
      • RAG Agent(检索增强型 Agent)
      • 对话型 Agent(Conversational Agent)
      • 工具型 Agent(Tool Agent)
      • 自主型 Agent(Autonomous Agent)
      • AI 代码审查(AI Code Review)
      • AI 编码助手(AI Coding Assistants)
      • AI 辅助文档生成(AI Documentation Generation)
      • AI 驱动开发流程(AI-Driven Development Workflow)
      • Agent CD 部署(持续部署)
      • Agent CI 流水线(Agent CI Pipeline)
      • 模型版本管理(Model Version Management)
      • 自动化工具链(Automation Toolchain)
      • 可靠性优化(Reliability Optimization)
      • 延迟优化(Latency Optimization)
      • 成本优化(Cost Optimization)
      • Agent 项目结构(Agent Project Structure)
      • Harness Engineering(Agent 生产化工程)
      • 团队协作(Team Collaboration)
      • 开发规范(Development Standards)
      • Agent 安全实践(Agent Security Practices)
      • Prompt 注入防御(Prompt Injection Defense)
      • 合规审计(Compliance Audit)
      • 数据安全(Data Security)
      • 访问控制(Access Control)
      • Agent 测试金字塔(Testing Pyramid for AI Agents)
      • LLM 输出测试(LLM Output Testing)
      • 回归测试(Regression Testing)
      • 对话质量测试(Conversation Quality Testing)
      • 工具调用测试(Tool Calling Testing)
      • 性能与压力测试(Performance & Stress Testing)
      • Embedding 模型(嵌入模型)
      • 数据清洗与预处理(Data Cleaning & Preprocessing)
      • 文本分割工具(Text Splitting Tools)
      • 文档解析工具(Document Parsing Tools)
      • API 网关与代理(API Gateway & Proxy)
      • 向量索引工具(Vector Indexing Tools)
      • 提示词管理工具(Prompt Management Tools)
      • 知识库工具(Knowledge Base Tools)
      • Agent 行为评估(Agent Behavior Evaluation)
      • Agent 评估工具(Evaluation Tools)
      • RAG 评估
      • 评估框架(Evaluation Framework)
      • Arize AI(AI 可观测性平台)
      • Braintrust(AI 产品评估平台)
      • LangSmith(LLM 开发平台)
      • Langfuse(开源 LLM 可观测性平台)
      • Weave(W&B AI 可观测性工具)
      • 可观测性工具对比
      • MinerU(文档智能解析工具)
      • 传统 OCR(光学字符识别)
      • 多模态 OCR(Vision Language Model OCR)
      • Whisper(OpenAI 语音识别模型)
      • 文本转语音(Text-to-Speech, TTS)
      • 语音对话 Agent(Voice Conversation Agent)
      • ReAct 提示技巧(Reasoning + Acting)
      • 思维图(Graph-of-Thought, GoT)
      • 思维树(Tree-of-Thought, ToT)
      • 思维链(Chain-of-Thought, CoT)
      • 结构化输出(Structured Output)
      • 自一致性(Self-Consistency)
      • 上下文与 Agent(Context & Agent)
      • 上下文压缩(Context Compression)
      • 上下文构建策略(Context Building Strategy)
      • 上下文窗口管理(Context Window Management)
      • 多轮对话上下文管理(Multi-turn Context Management)
      • 提示词优化(Prompt Optimization)
      • 提示词版本管理(Prompt Versioning)
      • 提示词评估(Prompt Evaluation)
      • 少样本提示(Few-Shot Prompting)
      • 指令工程(Instruction Engineering)
      • 提示词的基本结构(Prompt Structure)
      • 系统提示词设计(System Prompt Design)
      • 零样本提示(Zero-Shot Prompting)
      • 元提示(Meta Prompting)
      • 分解提示(Decomposition Prompting)
      • 多模态提示(Multimodal Prompting)
      • 检索增强提示(RAG Prompting)
      • 角色扮演提示(Role Prompting)
      • Agent 场景提示模板(Agent Prompt Templates)
      • 代码生成场景提示(Code Generation Prompts)
      • 数据分析场景提示词模板(Data Analysis Prompt Templates)
      • 文本生成场景(Writing/Translation/Summarization)
      • 知识问答场景(QA Prompt Templates)
工程篇

Hermes Agent

Nous Research 开源的自我进化型 Agent 框架,内置学习闭环与四层记忆系统

难度 3⏱ 8 分钟tool更新于 2026-05-17

内容摘要

Hermes Agent 是 Nous Research 于 2026 年 2 月开源的自主 AI Agent 框架,核心卖点是**自我进化**——它不只是执行任务,还能从经验中自动提炼技能、在使用中持续改进、跨会话记住你的偏好和项目背景。

Hermes Agent

基础概念

Hermes Agent 是 Nous Research 于 2026 年 2 月开源的自主 AI Agent 框架,核心卖点是自我进化——它不只是执行任务,还能从经验中自动提炼技能、在使用中持续改进、跨会话记住你的偏好和项目背景。

与 LangChain 这类需要开发者手动组装的编排框架不同,Hermes Agent 是一个开箱即用的 Agent 运行时:安装后直接对话,技能和记忆会随着使用自动积累。它的定位更接近"数字员工"而非"开发工具包"。

核心要素

要素作用
学习闭环(Learning Loop)从完成的任务中自动提炼可复用技能,下次遇到类似问题直接调用
四层记忆系统短期工作记忆 + 长期情景记忆 + 程序化技能记忆 + 冻结系统提示记忆
多平台消息网关统一接入 Telegram、Discord、Slack、WhatsApp、飞书等 20+ 平台
多模型支持支持 OpenAI、Anthropic、OpenRouter(200+ 模型)、MiniMax、GLM 等
多执行后端支持本地、Docker、SSH 远程主机、Daytona、Singularity、Modal 等 6 种运行环境

学习闭环

学习闭环是 Hermes Agent 最核心的差异化能力。工作流程如下:

  1. 任务执行:Agent 完成用户交给的任务
  2. 经验提炼:任务完成后,自动将操作序列抽象为可复用的技能(Skill)
  3. 技能存储:技能保存到技能库,下次遇到类似问题直接调用
  4. 持续改进:通过 GEPA(Genetic Evolution of Prompts and Agents)引擎自动评估、迭代、优化策略

四层记忆系统

正在渲染 Mermaid 图表…

各层记忆的职责:

层级存储方式生命周期内容
短期工作记忆模型上下文窗口当前会话即时对话上下文
长期情景记忆SQLite + FTS5永久保存跨会话的事实、偏好、项目背景
程序化技能记忆技能文件永久保存自动提炼的可复用工作流
冻结系统提示记忆MEMORY.md / USER.md永久保存环境事实(2200 字符)+ 用户画像(1375 字符)

多平台消息网关

Hermes Agent 通过统一的 Gateway 服务接入多个消息平台,用户可以在任何习惯的工具中与 Agent 交互:

  • 即时通讯:Telegram、Discord、Slack、WhatsApp、Signal
  • 国内平台:飞书(Feishu/Lark)、企业微信(WeCom)
  • 终端界面:CLI 命令行、TUI 终端 UI
  • Web 界面:内置 Web 面板

基础用法

安装依赖:

# 一行命令安装(支持 Linux、macOS、WSL2、Android Termux)
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

# 安装完成后加载环境变量
source ~/.bashrc  # 或 source ~/.zshrc

配置 LLM 提供商:

# 交互式配置向导(推荐新手)
hermes setup

# 或手动切换模型
hermes model

最小可运行示例:

# 启动交互式对话
hermes chat

# 或一次性提问
hermes chat "帮我写一个 Python 快速排序函数"

预期输出:

✓ 已检索记忆:无相关历史
✓ 已调用技能:无匹配技能(首次使用)
✓ 生成响应...

这是一个 Python 快速排序实现:

def quicksort(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr[len(arr) // 2]
    left = [x for x in arr if x < pivot]
    middle = [x for x in arr if x == pivot]
    right = [x for x in arr if x > pivot]
    return quicksort(left) + middle + quicksort(right)

✓ 已记录经验:Python 排序算法偏好

常用管理命令:

# 检查环境依赖
hermes doctor

# 查看当前配置
hermes config

# 启动消息网关
hermes gateway start

# 管理记忆文件
hermes memory

# 查看已创建的技能
hermes skills list

同类工具对比

维度Hermes AgentLangChainAutoGPTClaude Code
核心定位自我进化型 Agent 运行时Agent 编排框架自主任务执行 AgentIDE 集成编程 Agent
学习能力内置学习闭环,自动提炼技能无内置学习,需手动实现有限的记忆能力会话内上下文学习
记忆系统四层记忆架构需自行集成 Memory 模块简单的长期记忆会话级上下文
部署方式一行命令安装,开箱即用需要开发集成需要配置环境IDE 插件
适合场景长期使用的个人 AI 助手构建定制化 Agent 应用自动化任务执行编程辅助

核心区别:

  • Hermes Agent:强调"越用越聪明",适合长期陪伴型使用,不需要编程能力
  • LangChain:开发框架,适合构建定制化 Agent 应用,需要编程能力
  • AutoGPT:早期自主 Agent,缺乏系统性的学习闭环
  • Claude Code:IDE 集成,专注编程场景,不是独立运行时

常见误区

误区准确理解
Hermes Agent 是一个多 Agent 协作框架它是单 Agent 运行时,专注于单个 Agent 的自我进化,不涉及多 Agent 编排
需要编程能力才能使用安装后直接对话即可,技能和记忆自动积累,无需写代码
学习闭环意味着它会自动变好学习闭环依赖足够的使用频次和任务多样性,初期需要用户耐心使用
它可以替代 LangChain它们定位不同:Hermes 是运行时,LangChain 是开发框架

优劣势分析

优势劣势
开箱即用,一行命令安装资源消耗较大,建议 4GB+ 内存
内置学习闭环,越用越聪明学习效果依赖使用频次
四层记忆系统,跨会话持久化记忆容量有限(MEMORY.md 仅 2200 字符)
支持 20+ 消息平台中文文档和教程相对较少
支持 200+ LLM 模型生态仍在发展中,插件数量有限
MIT 开源,社区活跃(150k+ Stars)架构复杂,调试需要一定技术背景

思考题

初级:Hermes Agent 的"学习闭环"具体指什么?

参考答案:

学习闭环是指 Agent 完成任务后,自动将操作序列抽象为可复用的技能(Skill),保存到技能库中。下次遇到类似问题时,直接调用已有技能,而不是从零开始。同时通过 GEPA 引擎持续评估和优化已有技能。

中级:Hermes Agent 的四层记忆系统各层分别解决什么问题?

参考答案:

  • 短期工作记忆:维持单次对话的连贯性,生命周期为当前会话
  • 长期情景记忆:跨会话记住用户的项目背景、偏好、习惯,使用 SQLite + FTS5 支持全文检索
  • 程序化技能记忆:将反复执行的复杂操作固化为自动化技能
  • 冻结系统提示记忆:存储环境事实(MEMORY.md)和用户画像(USER.md),注入到每次对话的系统提示中
中级:Hermes Agent 和 LangChain 的本质区别是什么?分别适合什么场景?

参考答案:

本质区别在于定位:Hermes Agent 是一个运行时,安装后直接使用,技能和记忆自动积累;LangChain 是一个开发框架,需要开发者用代码组装 Chain、Agent、Tool 等组件。

适合场景:

  • Hermes Agent:长期陪伴型使用,个人 AI 助手,不需要编程能力
  • LangChain:构建定制化 Agent 应用,需要精细控制 Agent 行为,需要编程能力

参考资料

  1. GitHub 仓库:https://github.com/NousResearch/hermes-agent
  2. 官方文档:https://hermes-agent.nousresearch.com/
  3. 技术架构解析:https://cloud.tencent.com/developer/article/2652528
  4. 记忆系统源码解析:https://blog.csdn.net/qq_23625847/article/details/160147456

目录

快速定位正文内容

  • 基础概念
  • 基础用法
  • 同类工具对比
  • 常见误区
  • 优劣势分析
  • 思考题
  • 参考资料

这页有错、不清楚、或想看更深?

继续浏览

相关主题

  • Agent Harness(Agent 脚手架 / 运行时控制层)

    让模型能稳定作为 Agent 运行的一层工程化控制系统,负责调度、约束、反馈与恢复。

  • AutoGen(微软多Agent框架)

    微软开源的多智能体协作框架,通过异步消息驱动多个 Agent 角色分工完成复杂任务。

  • AutoGPT(自主Agent平台)

    开源自主 Agent 平台,支持可视化搭建和部署持续运行的 AI Agent 工作流。

延伸阅读

优先展示同分类且标签更接近的内容,方便继续串联学习。

工程篇难度 3⏱ 11 分钟概念
01

Agent Harness(Agent 脚手架 / 运行时控制层)

让模型能稳定作为 Agent 运行的一层工程化控制系统,负责调度、约束、反馈与恢复。

Agent HarnessHarness Engineering运行时控制层Agent RuntimeGuardrails
更新于 2026-04-11agent-harness
工程篇难度 3⏱ 9 分钟工具
02

AutoGen(微软多Agent框架)

微软开源的多智能体协作框架,通过异步消息驱动多个 Agent 角色分工完成复杂任务。

AutoGen微软多Agent对话式GroupChat
更新于 2026-03-26autogen
工程篇难度 3⏱ 9 分钟工具
03

AutoGPT(自主Agent平台)

开源自主 Agent 平台,支持可视化搭建和部署持续运行的 AI Agent 工作流。

AutoGPT自主Agent开源GPT-4目标驱动
更新于 2026-03-26autogpt