Hermes Workspace:你的 AI Agent 全功能指挥中心

项目简介

Hermes Workspace 是一个为 AI Agent 打造的全功能 Web 工作台——集聊天、终端、文件管理、记忆浏览、技能市场、MCP 管理、任务调度和 Swarm 多智能体协调于一体。它不是一个简单的聊天界面封装,而是一个完整的 AI Agent 指挥中心,让你从单一界面编排智能体、浏览记忆、管理技能并控制一切。

项目地址:https://github.com/outsourc-e/hermes-workspace

当前版本 v2.3.0,Star 数 4.9k+,采用 MIT 开源协议。

核心特性

💬 实时聊天

基于 SSE 流式传输的实时对话界面,支持工具调用渲染、多会话管理、Markdown 语法高亮显示。聊天不再是简单的文本交互,而是一个完整的 Agent 交互窗口。

🧠 记忆浏览器

直接在 Web 界面中浏览、搜索和编辑 Agent 的持久化记忆。内置 Markdown 实时编辑器,可以随时修改 Agent 记住的内容,让它更了解你的偏好和上下文。

🧩 技能市场

浏览 2000+ 技能,支持来源标识、筛选、源路径查看和技能市场。技能是 Agent 的程序化记忆——可复用的方法和工作流,一键加载即可使用。

🔌 MCP 集成

完整的 MCP(Model Context Protocol)页面,包含目录、市场和源管理。也支持本地配置的增删改查作为后备方案。MCP 是连接外部工具和数据源的标准协议。

📁 文件管理 + 终端

内置完整的文件浏览器(支持 Monaco 编辑器)和跨平台 PTY 终端。不需要离开浏览器就能浏览文件、编辑代码、执行命令。

🎮 运维操作中心

多 Agent 管理仪表盘,支持配置预设角色(Sage/Trader/Builder/Scribe/Ops),自动检测"需要配置"的 Agent 状态。让你像运维一个微服务集群一样管理你的 AI Agent 们。

📡 Conductor 任务调度

任务分发与分解引擎。当 Dashboard 任务 API 可用时,直接使用;不可用时,自动回退到 Workspace 原生的 Swarm 调度模式(mode: native-swarm),保证零分叉兼容性。

👥 Agent 视图

聊天界面中的实时 Agent 面板,显示头像、任务队列、历史记录和使用量仪表。让你对 Agent 的状态一目了然。

🐝 Swarm 模式

这是 Hermes Workspace 的杀手级特性。基于持久化 tmux 后端的 Hermes Agent 工作池,支持基于角色的任务分派:

  • 编排器聊天——向控制平面请求一个任务、分解后的任务组或全量广播
  • 多智能体控制平面——在一个界面中查看所有持久化的 Hermes Agent、角色、状态、运行时和路由
  • 看板任务板——无需离开工作台即可管理 Backlog、Ready、Running、Review、Blocked、Done 列
  • 报告 + 收件箱——审查检查点、阻塞项、交接事项和需要人工决策的事项
  • TUI 视图——连接到 tmux 后端工作进程或回退到实时 Shell/日志流

🗄️ 仪表盘

聚合总览界面:会话列表、模型使用分布、费用账本、注意力卡片和运维状态条。帮你掌握全局。

🎨 主题系统

内置 5 套主题:Hermes、Nous、Bronze、Slate、Mono,每套都有亮色和暗色模式。

🔒 安全设计

每条 API 路由都有认证中间件、CSP 头、路径穿越防护、速率限制、失败即关闭的远程绑定守卫。在非本地回环地址绑定时,强制要求设置密码。

架构设计

Hermes Workspace 采用前后端分离架构,核心由三个服务组成:

┌───────────────┐         :8642 gateway          ┌────────────────┐
│   Workspace    │ ─────────────────────▶ │  Hermes Agent  │
│   :3000 (UI)   │ ◀───────────────────── │  CLI / brain   │
└───────────────┘         :9119 dashboard        └────────────────┘

三个服务,三条命令即可启动:

hermes gateway run     # 终端 1 · :8642 · 聊天、模型、流式传输、任务
hermes dashboard       # 终端 2 · :9119 · 会话、技能、配置、MCP
cd ~/hermes-workspace && pnpm dev   # 终端 3 · :3000 · Web UI

关键设计理念:v2 版本实现了"零分叉"架构。Workspace 不需要修改 Hermes Agent 的任何代码,直接运行原版的 NousResearch/hermes-agent,通过标准 HTTP API 与 Agent 通信。Conductor 在 Dashboard 任务 API 可用时使用它,不可用时回退到 Workspace 原生的 Swarm 调度,始终保持零分叉兼容。

快速部署

方式一:Docker Compose(推荐)

最简单的部署方式,2 分钟即可跑起来:

git clone https://github.com/outsourc-e/hermes-workspace.git
cd hermes-workspace
cp .env.example .env
# 编辑 .env,添加至少一个 LLM 提供商的 API Key
docker compose up

Docker 会拉取两个预构建镜像:

  • hermes-agentnousresearch/hermes-agent:latest,端口 8642
  • hermes-workspaceghcr.io/outsourc-e/hermes-workspace:latest,端口 3000

打开 http://localhost:3000,完成引导流程即可使用。

方式二:一行命令安装

适合本地开发(macOS/Linux):

curl -fsSL https://raw.githubusercontent.com/outsourc-e/hermes-workspace/main/install.sh | bash

安装完成后:

hermes gateway run                  # 终端 1
cd ~/hermes-workspace && pnpm dev   # 终端 2

方式三:附加到已有的 Hermes Agent

如果你已经在运行 Hermes Agent:

git clone https://github.com/outsourc-e/hermes-workspace.git
cd hermes-workspace
pnpm install
cp .env.example .env
echo 'HERMES_API_URL=http://127.0.0.1:8642' >> .env
echo 'HERMES_DASHBOARD_URL=http://127.0.0.1:9119' >> .env
pnpm dev

本地模型支持

Hermes Workspace 原生支持 Ollama、Atomic Chat、LM Studio、vLLM 等本地模型服务,无需 API Key 即可使用。

便携模式(最简单)

直接指向本地模型服务,不需要 Hermes Agent 网关:

# Ollama
OLLAMA_ORIGINS=* ollama serve
HERMES_API_URL=http://127.0.0.1:11434 pnpm dev

# Atomic Chat
HERMES_API_URL=http://127.0.0.1:1337/v1 pnpm dev

便携模式下聊天立即可用,但会话、记忆、技能等高级功能不可用。

增强模式(全功能)

通过 Hermes Agent 网关路由,解锁全部功能。在 ~/.hermes/config.yaml 中配置:

# Ollama 示例
provider: ollama
model: qwen3:32b
custom_providers:
  - name: ollama
    base_url: http://127.0.0.1:11434/v1
    api_key: ollama
    api_mode: chat_completions

然后在 ~/.hermes/.env 中启用 API 服务:

API_SERVER_ENABLED=true

启动网关和仪表盘后,所有工作台功能自动解锁。

PWA + 移动端支持

Hermes Workspace 是一个渐进式 Web 应用(PWA),可以像原生应用一样安装:

  • 桌面端:在 Chrome/Edge 中点击地址栏的安装图标,即可安装为独立桌面应用
  • iPhone/iPad:在 Safari 中点击分享按钮 → "添加到主屏幕"
  • Android:在 Chrome 菜单中选择"添加到主屏幕"

配合 Tailscale,你可以在任何设备上从任何网络访问你的 Hermes Workspace——无需端口转发,无需复杂的 VPN 配置,流量端到端加密。

多提供商支持

Hermes Workspace 支持所有主流 AI 模型提供商:

  • OpenAI(GPT / o 系列)
  • OpenRouter(包含免费模型)
  • Google Gemini
  • Ollama
  • LM Studio
  • vLLM
  • Atomic Chat
  • llama.cpp / LocalAI
  • 任何 OpenAI 兼容的 API 服务

安全机制

Hermes Workspace 内置了多层安全防护:

  • 每条 API 路由的认证中间件
  • CSP 安全头
  • 路径穿越防护(基于真实路径边界检查,而非字符串前缀匹配)
  • 接口速率限制
  • 失败即关闭:在非回环地址绑定时强制要求密码
  • Session Cookie:HttpOnly + SameSite=Strict + Secure
  • 可选的 Web UI 密码保护

技术栈

  • 前端:Next.js + React + TypeScript
  • 后端:Hermes Agent(Python,FastAPI 网关)
  • 终端:跨平台 PTY(node-pty)
  • 编辑器:Monaco Editor
  • 容器化:Docker Compose,支持 linux/amd64 和 linux/arm64
  • 部署:支持 Coolify / Easypanel / Dokploy / Unraid 等 PaaS 平台

适用场景

  • 🤖 AI Agent 爱好者:一个界面管理多个 AI Agent,查看记忆、管理技能、调度任务
  • 🏠 Home Lab 玩家:Docker 一键部署,配合 Tailscale 随时随地访问
  • 👨‍💻 开发者:内置终端和文件浏览器,在浏览器里完成开发工作
  • 🏢 团队协作:共享任务看板、Agent 状态、费用追踪(云版本开发中)
  • 🔬 AI 研究:Swarm 多智能体协调,角色化任务分派,自动化 PR/Issue 处理

总结

Hermes Workspace 是目前开源社区中最完整的 AI Agent 工作台之一。它不仅仅是一个聊天界面,而是一个真正意义上的"指挥中心"——从单个 Agent 的日常交互,到多个 Agent 的 Swarm 协调,再到任务看板和费用追踪,所有功能都在一个界面中完成。

零分叉架构是它最巧妙的设计:Workspace 是纯 UI 层,所有智能都在原版 Hermes Agent 中。这意味着你可以随时升级 Agent,不用担心兼容性问题。

如果你在寻找一个功能全面、架构优雅、部署简单的 AI Agent 管理平台,Hermes Workspace 绝对值得一试。

发表回复

后才能评论