OpenHuman AI Agent 完整教程:从零搭建私人 AI 助手

🤖 OpenHuman is your Personal AI super intelligence. Private, Simple and extremely powerful.


💡 本文要点(Key Takeaways)

  1. OpenHuman 是一个开源的桌面级 AI 智能助手框架,使用 Rust 编写核心逻辑
  2. 内置 118+ 第三方集成(Gmail、Notion、GitHub、Slack 等),一键 OAuth 连接
  3. 记忆树技术让 AI 在几分钟内了解你的工作上下文
  4. TokenJuice 智能压缩可降低高达 80% 的 token 成本和延迟
  5. 支持通过 OllamaLM Studio 启用本地 AI
  6. 单订阅多模型架构,内置智能模型路由
  7. 采用 GPL-3.0 开源许可证,代码完全可审计

📖 项目简介

OpenHuman 是什么?

关键定义OpenHuman 是一个开源的个人 AI 智能助手框架(Personal AI super intelligence),使用 Rust 编写核心逻辑,通过 Tauri 构建跨平台桌面应用[^1]。它由 TinyHumans AI 团队开发,旨在将 AI 能力无缝融入用户的日常生活,让智能体在几分钟内了解你的工作上下文,而非像其他智能体框架那样需要数天或数周的训练期[^1]。

OpenHuman 的核心定位是替代传统多账户、多 API Key 的 AI 使用模式。它采用单订阅多模型架构,通过内置智能模型路由自动将任务分发到最适合的 LLM(推理型、快速型或视觉型),无需管理多个 API Key[^1]。

关键数据[^2]:

  • 🌟 21,096+ GitHub Stars(截至 2026 年 5 月 19 日)
  • 🍴 1,857+ Forks
  • 📅 项目创建:2026 年 2 月 18 日
  • ⚖️ 许可证:GPL-3.0
  • 🏷️ 当前状态:Early Beta(早期测试版)— 正在积极开发中

核心特点:

  • 🔒 私密性 — 本地运行,工作流数据保留在设备上并本地加密[^1]
  • 🚀 高性能 — Rust 编写核心,TokenJuice 智能压缩可降低高达 80% 的 token 成本和延迟[^1]
  • 📦 简单易用 — UI 优先设计,从安装到可用仅需几次点击,无需终端[^1]
  • 🎯 功能强大 — 支持多模态任务、语音交互、Google Meet 会议集成[^1]

关键洞察:OpenHuman 是首个能在几分钟内了解你的智能体框架。大多数智能体从零开始——Hermes 通过观察你的工作来学习;OpenClaw 等待插件输送上下文。无论哪种方式,你都需要花费数天甚至数周时间[^1]。

[^1]: 来源:OpenHuman GitHub README
[^2]: 来源:GitHub API


📊 主要功能

1. 简洁的 UI 优先设计

OpenHuman 采用UI 优先的设计思路,让你从安装到可用的 Agent 只需几次点击——无需配置优先,无需终端[^1]。

Agent 拥有桌面吉祥物:会说话、会反应、会加入你的 Google Meet 会议,记住你,并在你停止输入后继续在后台思考[^1]。

2. 118+ 第三方集成

接入 Gmail、Notion、GitHub、Slack、Stripe、日历、Drive、Linear、Jira 等工具,一键 OAuth[^1]。每个连接都暴露为 Agent 的 typed tool,每 20 分钟核心会主动抓取最新数据到记忆树中。无需提示,无需轮询循环[^1]。

集成覆盖的主要领域:

类别 集成示例
邮件 Gmail
笔记/知识库 Notion
代码托管 GitHub
团队沟通 Slack
支付 Stripe
项目管理 Linear, Jira
云存储 Google Drive
日历 Google Calendar

3. 记忆树 + Obsidian Wiki

一个本地优先的知识库,由你的数据和活动构建[^1]。所有连接的内容被规范化为 ≤3k token 的 Markdown 块,评分并折叠成存储在本地 SQLite中的层次化摘要树[^1]。相同的块作为 .md 文件存放在兼容 Obsidian 的仓库中,可以打开、浏览和编辑[^1]。

灵感来源:该设计灵感来自 Karpathy 的 obsidian-wiki 工作流

4. 内置工具集

开箱即用[^1]:

  • 🔍 网络搜索
  • 🌐 网页抓取器
  • 💻 完整编码工具集(文件系统、git、lint、test、grep)
  • 🎤 原生语音(STT 输入 → ElevenLabs TTS 输出,吉祥物唇同步,Google Meet Agent)

模型路由会将每个任务发送到正确的 LLM(推理型、快速型或视觉型),只需一个订阅[^1]。还有本地 AI 通过 Ollama用于本地工作负载的选择[^1]。

关键洞察:OpenHuman 是首个能在几分钟内了解你的智能体框架。大多数智能体从零开始——Hermes 通过观察你的工作来学习;OpenClaw 等待插件输送上下文。无论哪种方式,你都需要花费数天甚至数周时间[^1]。

5. TokenJuice 智能压缩

每个工具调用、抓取结果、邮件正文、搜索负载都通过token 压缩层运行后再接触任何 LLM[^1]。HTML 转换为 Markdown,长 URL 缩短,冗长的工具输出通过可配置规则覆盖去重和总结等… CJK、emoji 和其他多字节文本按图元逐个保留——永远不剥离[^1]。用更少的 token 获得相同的信息,降低成本和延迟高达 80%[^1]。

6. 消息通道

通过你已经在使用的通道进行入站/出站交互,工作流数据保留在设备上,本地加密,视为你的财产[^1]。

7. 可选 agentmemory 后端

如果你已经在其他编码智能体中自托管了 agentmemory,OpenHuman 提供了可选的 Memory 后端来代理它——在 config.toml 中设置 memory.backend = "agentmemory",同一个持久化存储将同时服务于 OpenHuman 和 Claude Code、Cursor、Codex、OpenCode[^1]。


📦 系统要求

项目 要求
操作系统 Linux / macOS / Windows
编程语言 Rust 1.93.0+
依赖 Git、Node.js 24+、pnpm 10.10.0、CMake、Ninja、ripgrep

🚀 快速开始

方法一:终端安装(推荐)

macOS 或 Linux x64:

1
curl -fsSL https://raw.githubusercontent.com/tinyhumansai/openhuman/main/scripts/install.sh | bash

Windows:

1
irm https://raw.githubusercontent.com/tinyhumansai/openhuman/main/scripts/install.ps1 | iex

方法二:官网下载

访问 tinyhumans.ai/openhuman 下载 DMG 或 EXE 安装包。


💻 开发构建

从源码构建

1
2
3
4
5
6
7
8
9
10
11
12
# 克隆仓库
git clone <repo-url>
cd openhuman

# 初始化子模块
git submodule update --init --recursive

# 安装依赖
pnpm install

# 开发模式运行
pnpm dev

构建命令

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
# Web-only 开发模式(Vite 开发服务器)
pnpm dev

# 桌面应用开发(Tauri + CEF)
pnpm --filter openhuman-app dev:app

# 通用构建
pnpm build

# 类型检查
pnpm typecheck

# 格式化检查
pnpm format:check

# Cargo 检查
cargo check --manifest-path Cargo.toml
cargo check --manifest-path app/src-tauri/Cargo.toml

🔧 进阶配置

模型路由配置

OpenHuman 采用单订阅多模型架构,内置路由器自动将任务分发到合适的 LLM。通过 config.toml 配置 hint 路由表(注意:官方 README 使用 hint_reasoning 格式,而非 hint:reasoning 前缀)[^1]:

1
2
3
4
5
[model_routing]
hint_reasoning = "anthropic/claude-sonnet-4"
hint_fast = "openrouter/google/gemini-2.0-flash"
hint_code = "anthropic/claude-sonnet-4"
hint_vision = "openrouter/google/gemini-2.0-flash"

路由表说明:

Hint 键名 典型目标模型 适用场景
hint_reasoning 强推理模型(如 Claude Sonnet 4) 多步规划、数学计算、重代码任务
hint_fast 快速廉价模型(如 Gemini 2.0 Flash) UI 辅助、自动补全、轻量分类
hint_code 代码调优模型 原生编码任务
hint_vision 视觉模型 截图、图片附件、OCR
hint_summarize 擅长压缩的模型 记忆树摘要构建

📖 官方文档:Automatic Model Routing

工作原理:当你在聊天消息中使用 hint:reasoning 前缀时,路由器会查找配置表并解析到对应的模型。所有路由通过 OpenHuman 单一定制订阅后端代理,无需管理多个 API Key。也可在单次调用中直接指定模型名(不带 hint: 前缀)进行精确控制。

本地 AI 配置(可选)

OpenHuman 支持通过 OllamaLM Studio 启用本地 AI,用于隐私敏感型任务:

1
2
3
# 安装 Ollama 后,运行默认本地模型
ollama pull all-minilm:latest # 用于记忆树嵌入向量搜索
ollama pull gemma3:1b-it-qat # 用于记忆树摘要生成

本地 AI 处理的负载(默认不启用,需手动开启):

负载类型 默认模型 用途
记忆嵌入 all-minilm:latest 记忆树向量搜索
摘要生成 gemma3:1b-it-qat 记忆树来源/主题/全局摘要
心跳循环 可配置 后台推理循环

注意:聊天、推理、视觉任务仍走云端前端模型。这是有意为之的设计——本地 AI 专注于低延迟、隐私敏感的重复性工作。


❓ 常见问题

OpenHuman 和 Cursor、Windsurf、Claude Code 有什么区别?

OpenHuman 是一个完整的桌面级 AI Agent 框架,而 Cursor、Windsurf 和 Claude Code 本质上是代码编辑器或编码辅助工具。OpenHuman 的核心优势在于:① 118+ 第三方集成(Gmail、Notion、Slack 等),② 记忆树技术让 AI 在几分钟内了解你的工作上下文,③ 桌面吉祥物提供拟人化交互体验,④ 支持 Google Meet 会议集成。它更像是一个通用 AI 助手,而非仅限于编码场景。

如何在本地运行 OpenHuman?

下载后解压即可运行,无需安装任何额外软件。macOS 和 Linux 用户可通过终端一键安装脚本快速部署,Windows 用户也可通过 PowerShell 安装。OpenHuman 的 UI 优先设计确保从安装到可用仅需几次点击,完全不需要终端操作。所有工作流数据保留在设备上并本地加密,确保数据隐私。

OpenHuman 可以连接我的数据吗?如何连接?

是的,OpenHuman 支持 118+ 第三方应用集成,包括 Gmail、Notion、GitHub、Slack、Stripe、Google 日历、Google Drive、Linear、Jira 等[^1]。每个连接都通过一键 OAuth 认证完成,连接后会自动暴露为 Agent 的 typed tool。核心会每 20 分钟主动抓取最新数据到记忆树中,无需手动提示或轮询循环。

OpenHuman 需要联网吗?可以完全离线使用吗?

OpenHuman 需要网络连接以访问 API 和搜索功能,但其核心数据(记忆树、工作流数据)完全存储在本地设备上。如果你通过 Ollama 或 LM Studio 配置了本地 AI 模型,部分推理任务可以在离线状态下运行。不过,模型路由和第三方集成功能仍需网络连接。

OpenHuman 支持哪些 AI 模型?可以自定义模型吗?

OpenHuman 内置模型路由系统,支持通过单一定制订阅后端代理多种 LLM,包括 Anthropic Claude、Google Gemini 等[^1]。你可以通过 config.toml 自定义每个 hint 路由的目标模型,也可以直接指定模型名进行精确控制。此外,还支持通过 Ollama 或 LM Studio 接入本地 AI 模型用于隐私敏感型任务。

什么是记忆树?它如何工作?

记忆树是 OpenHuman 的本地优先知识库,由你的数据和活动自动构建[^1]。所有连接的内容被规范化为不超过 3,000 token 的 Markdown 块,经过评分并折叠成存储在本地 SQLite 中的层次化摘要树。相同的块作为 .md 文件存放在兼容 Obsidian 的仓库中,你可以直接打开、浏览和编辑。该设计灵感来自 Karpathy 的 obsidian-wiki 工作流

OpenHuman 的安全性如何?数据是否安全?

OpenHuman 采用多层安全设计:① 所有工作流数据保留在设备上并本地加密[^1],② 记忆树存储在本地 SQLite 中,不依赖云端,③ 第三方集成通过 OAuth 认证,数据不会直接暴露给 AI 模型,④ 采用 GPL-3.0 开源许可证,代码完全可审计。

OpenHuman 目前处于什么开发阶段?

OpenHuman 目前处于Early Beta(早期测试版)阶段,正在积极开发中[^1]。这意味着核心功能已经可用,但部分功能可能还在完善中。建议在生产环境中使用时做好备份。

OpenHuman 的 TokenJuice 智能压缩如何工作?

TokenJuice 是 OpenHuman 的token 压缩层,每个工具调用、抓取结果、邮件正文、搜索负载都通过该层运行后再接触任何 LLM[^1]。它将 HTML 转换为 Markdown,缩短长 URL,通过可配置规则对冗长的工具输出进行去重和总结。CJK、emoji 和其他多字节文本按图元逐个保留——永远不剥离。实测可降低高达 80% 的 token 成本和延迟[^1]。

[^1]: 来源:OpenHuman GitHub README


📊 OpenHuman vs 其他 AI Agent 对比

选择指南:如果你需要一个通用 AI 助手(不仅限于编码),OpenHuman 是目前最全面的开源选择。如果你专注于编码,Cursor 或 Windsurf 可能更适合。

特性 OpenHuman Cursor Windsurf Claude Code
核心定位 桌面级 AI 助手 代码编辑器 IDE 增强 编码 CLI 工具
第三方集成 118+(Gmail, Notion, Slack…) 有限(GitHub 为主) 有限 有限
记忆系统 记忆树(本地 SQLite + Obsidian) 有(会话级)
桌面吉祥物 ✅ 拟人化交互
语音交互 ✅ STT + ElevenLabs TTS
会议集成 ✅ Google Meet
本地 AI ✅ Ollama / LM Studio
跨平台 ✅ Linux / macOS / Windows
开源 ✅ GPL-3.0 ❌ 闭源 ❌ 闭源 ❌ 闭源
模型路由 ✅ 单订阅多模型
最佳适用 通用 AI 助手 专业编码 专业编码 专业编码

💡 总结:如果你需要一个通用 AI 助手(不仅限于编码),OpenHuman 是目前最全面的开源选择。如果你专注于编码,Cursor 或 Windsurf 可能更适合。

📚 资源链接

类型 链接
📖 官方文档 https://tinyhumans.gitbook.io/openhuman/
🐦 Twitter/X https://x.com/intent/follow?screen_name=tinyhumansai
💬 Discord https://discord.tinyhumans.ai/
📦 GitHub https://github.com/tinyhumansai/openhuman
📄 License GPL-3.0

👤 本文适合谁阅读?

本教程适合以下读者:

  • 🔧 开发者:想构建自己的 AI 助手或集成 OpenHuman 到工作流中
  • 🧪 AI 研究者:对 AI Agent 架构和记忆系统感兴趣
  • 🏢 团队负责人:评估 OpenHuman 是否适合团队使用
  • 🙋 普通用户:想拥有一个能理解你工作上下文的私人 AI 助手

⚠️ 前置知识:本教程假设你具备基本的命令行使用能力和 Git 操作经验。如果你是编程新手,建议先学习基础的前端开发知识。


🏁 总结

OpenHuman 是一个强大的开源 AI Agent 框架,适合:

  • 开发者构建自己的 AI 助手
  • 研究人员进行 AI 实验
  • 普通用户自动化日常任务

开始你的 AI Agent 之旅吧! 🚀

💬 互动:如果你尝试了 OpenHuman,欢迎在 GitHub IssuesDiscord 分享你的体验!