OpenHuman AI Agent 完整教程:从零搭建私人 AI 助手
OpenHuman AI Agent 完整教程:从零搭建私人 AI 助手
小新软件平替🤖 OpenHuman is your Personal AI super intelligence. Private, Simple and extremely powerful.
💡 本文要点(Key Takeaways)
- OpenHuman 是一个开源的桌面级 AI 智能助手框架,使用 Rust 编写核心逻辑
- 内置 118+ 第三方集成(Gmail、Notion、GitHub、Slack 等),一键 OAuth 连接
- 记忆树技术让 AI 在几分钟内了解你的工作上下文
- TokenJuice 智能压缩可降低高达 80% 的 token 成本和延迟
- 支持通过 Ollama 或 LM Studio 启用本地 AI
- 单订阅多模型架构,内置智能模型路由
- 采用 GPL-3.0 开源许可证,代码完全可审计
📖 项目简介
OpenHuman 是什么?
关键定义:OpenHuman 是一个开源的个人 AI 智能助手框架(Personal AI super intelligence),使用 Rust 编写核心逻辑,通过 Tauri 构建跨平台桌面应用[^1]。它由 TinyHumans AI 团队开发,旨在将 AI 能力无缝融入用户的日常生活,让智能体在几分钟内了解你的工作上下文,而非像其他智能体框架那样需要数天或数周的训练期[^1]。
OpenHuman 的核心定位是替代传统多账户、多 API Key 的 AI 使用模式。它采用单订阅多模型架构,通过内置智能模型路由自动将任务分发到最适合的 LLM(推理型、快速型或视觉型),无需管理多个 API Key[^1]。
关键数据[^2]:
- 🌟 21,096+ GitHub Stars(截至 2026 年 5 月 19 日)
- 🍴 1,857+ Forks
- 📅 项目创建:2026 年 2 月 18 日
- ⚖️ 许可证:GPL-3.0
- 🏷️ 当前状态:Early Beta(早期测试版)— 正在积极开发中
核心特点:
- 🔒 私密性 — 本地运行,工作流数据保留在设备上并本地加密[^1]
- 🚀 高性能 — Rust 编写核心,TokenJuice 智能压缩可降低高达 80% 的 token 成本和延迟[^1]
- 📦 简单易用 — UI 优先设计,从安装到可用仅需几次点击,无需终端[^1]
- 🎯 功能强大 — 支持多模态任务、语音交互、Google Meet 会议集成[^1]
关键洞察:OpenHuman 是首个能在几分钟内了解你的智能体框架。大多数智能体从零开始——Hermes 通过观察你的工作来学习;OpenClaw 等待插件输送上下文。无论哪种方式,你都需要花费数天甚至数周时间[^1]。
[^1]: 来源:OpenHuman GitHub README
[^2]: 来源:GitHub API
📊 主要功能
1. 简洁的 UI 优先设计
OpenHuman 采用UI 优先的设计思路,让你从安装到可用的 Agent 只需几次点击——无需配置优先,无需终端[^1]。
Agent 拥有桌面吉祥物:会说话、会反应、会加入你的 Google Meet 会议,记住你,并在你停止输入后继续在后台思考[^1]。
2. 118+ 第三方集成
接入 Gmail、Notion、GitHub、Slack、Stripe、日历、Drive、Linear、Jira 等工具,一键 OAuth[^1]。每个连接都暴露为 Agent 的 typed tool,每 20 分钟核心会主动抓取最新数据到记忆树中。无需提示,无需轮询循环[^1]。
集成覆盖的主要领域:
| 类别 | 集成示例 |
|---|---|
| 邮件 | Gmail |
| 笔记/知识库 | Notion |
| 代码托管 | GitHub |
| 团队沟通 | Slack |
| 支付 | Stripe |
| 项目管理 | Linear, Jira |
| 云存储 | Google Drive |
| 日历 | Google Calendar |
3. 记忆树 + Obsidian Wiki
一个本地优先的知识库,由你的数据和活动构建[^1]。所有连接的内容被规范化为 ≤3k token 的 Markdown 块,评分并折叠成存储在本地 SQLite中的层次化摘要树[^1]。相同的块作为 .md 文件存放在兼容 Obsidian 的仓库中,可以打开、浏览和编辑[^1]。
灵感来源:该设计灵感来自 Karpathy 的 obsidian-wiki 工作流。
4. 内置工具集
开箱即用[^1]:
- 🔍 网络搜索
- 🌐 网页抓取器
- 💻 完整编码工具集(文件系统、git、lint、test、grep)
- 🎤 原生语音(STT 输入 → ElevenLabs TTS 输出,吉祥物唇同步,Google Meet Agent)
模型路由会将每个任务发送到正确的 LLM(推理型、快速型或视觉型),只需一个订阅[^1]。还有本地 AI 通过 Ollama用于本地工作负载的选择[^1]。
关键洞察:OpenHuman 是首个能在几分钟内了解你的智能体框架。大多数智能体从零开始——Hermes 通过观察你的工作来学习;OpenClaw 等待插件输送上下文。无论哪种方式,你都需要花费数天甚至数周时间[^1]。
5. TokenJuice 智能压缩
每个工具调用、抓取结果、邮件正文、搜索负载都通过token 压缩层运行后再接触任何 LLM[^1]。HTML 转换为 Markdown,长 URL 缩短,冗长的工具输出通过可配置规则覆盖去重和总结等… CJK、emoji 和其他多字节文本按图元逐个保留——永远不剥离[^1]。用更少的 token 获得相同的信息,降低成本和延迟高达 80%[^1]。
6. 消息通道
通过你已经在使用的通道进行入站/出站交互,工作流数据保留在设备上,本地加密,视为你的财产[^1]。
7. 可选 agentmemory 后端
如果你已经在其他编码智能体中自托管了 agentmemory,OpenHuman 提供了可选的 Memory 后端来代理它——在 config.toml 中设置 memory.backend = "agentmemory",同一个持久化存储将同时服务于 OpenHuman 和 Claude Code、Cursor、Codex、OpenCode[^1]。
📦 系统要求
| 项目 | 要求 |
|---|---|
| 操作系统 | Linux / macOS / Windows |
| 编程语言 | Rust 1.93.0+ |
| 依赖 | Git、Node.js 24+、pnpm 10.10.0、CMake、Ninja、ripgrep |
🚀 快速开始
方法一:终端安装(推荐)
macOS 或 Linux x64:
1 | curl -fsSL https://raw.githubusercontent.com/tinyhumansai/openhuman/main/scripts/install.sh | bash |
Windows:
1 | irm https://raw.githubusercontent.com/tinyhumansai/openhuman/main/scripts/install.ps1 | iex |
方法二:官网下载
访问 tinyhumans.ai/openhuman 下载 DMG 或 EXE 安装包。
💻 开发构建
从源码构建
1 | # 克隆仓库 |
构建命令
1 | # Web-only 开发模式(Vite 开发服务器) |
🔧 进阶配置
模型路由配置
OpenHuman 采用单订阅多模型架构,内置路由器自动将任务分发到合适的 LLM。通过 config.toml 配置 hint 路由表(注意:官方 README 使用 hint_reasoning 格式,而非 hint:reasoning 前缀)[^1]:
1 | [model_routing] |
路由表说明:
| Hint 键名 | 典型目标模型 | 适用场景 |
|---|---|---|
hint_reasoning |
强推理模型(如 Claude Sonnet 4) | 多步规划、数学计算、重代码任务 |
hint_fast |
快速廉价模型(如 Gemini 2.0 Flash) | UI 辅助、自动补全、轻量分类 |
hint_code |
代码调优模型 | 原生编码任务 |
hint_vision |
视觉模型 | 截图、图片附件、OCR |
hint_summarize |
擅长压缩的模型 | 记忆树摘要构建 |
📖 官方文档:Automatic Model Routing
工作原理:当你在聊天消息中使用 hint:reasoning 前缀时,路由器会查找配置表并解析到对应的模型。所有路由通过 OpenHuman 单一定制订阅后端代理,无需管理多个 API Key。也可在单次调用中直接指定模型名(不带 hint: 前缀)进行精确控制。
本地 AI 配置(可选)
OpenHuman 支持通过 Ollama 或 LM Studio 启用本地 AI,用于隐私敏感型任务:
1 | # 安装 Ollama 后,运行默认本地模型 |
本地 AI 处理的负载(默认不启用,需手动开启):
| 负载类型 | 默认模型 | 用途 |
|---|---|---|
| 记忆嵌入 | all-minilm:latest |
记忆树向量搜索 |
| 摘要生成 | gemma3:1b-it-qat |
记忆树来源/主题/全局摘要 |
| 心跳循环 | 可配置 | 后台推理循环 |
注意:聊天、推理、视觉任务仍走云端前端模型。这是有意为之的设计——本地 AI 专注于低延迟、隐私敏感的重复性工作。
❓ 常见问题
OpenHuman 和 Cursor、Windsurf、Claude Code 有什么区别?
OpenHuman 是一个完整的桌面级 AI Agent 框架,而 Cursor、Windsurf 和 Claude Code 本质上是代码编辑器或编码辅助工具。OpenHuman 的核心优势在于:① 118+ 第三方集成(Gmail、Notion、Slack 等),② 记忆树技术让 AI 在几分钟内了解你的工作上下文,③ 桌面吉祥物提供拟人化交互体验,④ 支持 Google Meet 会议集成。它更像是一个通用 AI 助手,而非仅限于编码场景。
如何在本地运行 OpenHuman?
下载后解压即可运行,无需安装任何额外软件。macOS 和 Linux 用户可通过终端一键安装脚本快速部署,Windows 用户也可通过 PowerShell 安装。OpenHuman 的 UI 优先设计确保从安装到可用仅需几次点击,完全不需要终端操作。所有工作流数据保留在设备上并本地加密,确保数据隐私。
OpenHuman 可以连接我的数据吗?如何连接?
是的,OpenHuman 支持 118+ 第三方应用集成,包括 Gmail、Notion、GitHub、Slack、Stripe、Google 日历、Google Drive、Linear、Jira 等[^1]。每个连接都通过一键 OAuth 认证完成,连接后会自动暴露为 Agent 的 typed tool。核心会每 20 分钟主动抓取最新数据到记忆树中,无需手动提示或轮询循环。
OpenHuman 需要联网吗?可以完全离线使用吗?
OpenHuman 需要网络连接以访问 API 和搜索功能,但其核心数据(记忆树、工作流数据)完全存储在本地设备上。如果你通过 Ollama 或 LM Studio 配置了本地 AI 模型,部分推理任务可以在离线状态下运行。不过,模型路由和第三方集成功能仍需网络连接。
OpenHuman 支持哪些 AI 模型?可以自定义模型吗?
OpenHuman 内置模型路由系统,支持通过单一定制订阅后端代理多种 LLM,包括 Anthropic Claude、Google Gemini 等[^1]。你可以通过 config.toml 自定义每个 hint 路由的目标模型,也可以直接指定模型名进行精确控制。此外,还支持通过 Ollama 或 LM Studio 接入本地 AI 模型用于隐私敏感型任务。
什么是记忆树?它如何工作?
记忆树是 OpenHuman 的本地优先知识库,由你的数据和活动自动构建[^1]。所有连接的内容被规范化为不超过 3,000 token 的 Markdown 块,经过评分并折叠成存储在本地 SQLite 中的层次化摘要树。相同的块作为 .md 文件存放在兼容 Obsidian 的仓库中,你可以直接打开、浏览和编辑。该设计灵感来自 Karpathy 的 obsidian-wiki 工作流。
OpenHuman 的安全性如何?数据是否安全?
OpenHuman 采用多层安全设计:① 所有工作流数据保留在设备上并本地加密[^1],② 记忆树存储在本地 SQLite 中,不依赖云端,③ 第三方集成通过 OAuth 认证,数据不会直接暴露给 AI 模型,④ 采用 GPL-3.0 开源许可证,代码完全可审计。
OpenHuman 目前处于什么开发阶段?
OpenHuman 目前处于Early Beta(早期测试版)阶段,正在积极开发中[^1]。这意味着核心功能已经可用,但部分功能可能还在完善中。建议在生产环境中使用时做好备份。
OpenHuman 的 TokenJuice 智能压缩如何工作?
TokenJuice 是 OpenHuman 的token 压缩层,每个工具调用、抓取结果、邮件正文、搜索负载都通过该层运行后再接触任何 LLM[^1]。它将 HTML 转换为 Markdown,缩短长 URL,通过可配置规则对冗长的工具输出进行去重和总结。CJK、emoji 和其他多字节文本按图元逐个保留——永远不剥离。实测可降低高达 80% 的 token 成本和延迟[^1]。
[^1]: 来源:OpenHuman GitHub README
📊 OpenHuman vs 其他 AI Agent 对比
选择指南:如果你需要一个通用 AI 助手(不仅限于编码),OpenHuman 是目前最全面的开源选择。如果你专注于编码,Cursor 或 Windsurf 可能更适合。
| 特性 | OpenHuman | Cursor | Windsurf | Claude Code |
|---|---|---|---|---|
| 核心定位 | 桌面级 AI 助手 | 代码编辑器 | IDE 增强 | 编码 CLI 工具 |
| 第三方集成 | 118+(Gmail, Notion, Slack…) | 有限(GitHub 为主) | 有限 | 有限 |
| 记忆系统 | 记忆树(本地 SQLite + Obsidian) | 无 | 无 | 有(会话级) |
| 桌面吉祥物 | ✅ 拟人化交互 | ❌ | ❌ | ❌ |
| 语音交互 | ✅ STT + ElevenLabs TTS | ❌ | ❌ | ❌ |
| 会议集成 | ✅ Google Meet | ❌ | ❌ | ❌ |
| 本地 AI | ✅ Ollama / LM Studio | ❌ | ❌ | ❌ |
| 跨平台 | ✅ Linux / macOS / Windows | ✅ | ✅ | ✅ |
| 开源 | ✅ GPL-3.0 | ❌ 闭源 | ❌ 闭源 | ❌ 闭源 |
| 模型路由 | ✅ 单订阅多模型 | ❌ | ❌ | ❌ |
| 最佳适用 | 通用 AI 助手 | 专业编码 | 专业编码 | 专业编码 |
💡 总结:如果你需要一个通用 AI 助手(不仅限于编码),OpenHuman 是目前最全面的开源选择。如果你专注于编码,Cursor 或 Windsurf 可能更适合。
📚 资源链接
| 类型 | 链接 |
|---|---|
| 📖 官方文档 | https://tinyhumans.gitbook.io/openhuman/ |
| 🐦 Twitter/X | https://x.com/intent/follow?screen_name=tinyhumansai |
| 💬 Discord | https://discord.tinyhumans.ai/ |
| 📦 GitHub | https://github.com/tinyhumansai/openhuman |
| 📄 License | GPL-3.0 |
👤 本文适合谁阅读?
本教程适合以下读者:
- 🔧 开发者:想构建自己的 AI 助手或集成 OpenHuman 到工作流中
- 🧪 AI 研究者:对 AI Agent 架构和记忆系统感兴趣
- 🏢 团队负责人:评估 OpenHuman 是否适合团队使用
- 🙋 普通用户:想拥有一个能理解你工作上下文的私人 AI 助手
⚠️ 前置知识:本教程假设你具备基本的命令行使用能力和 Git 操作经验。如果你是编程新手,建议先学习基础的前端开发知识。
🏁 总结
OpenHuman 是一个强大的开源 AI Agent 框架,适合:
- ✅ 开发者构建自己的 AI 助手
- ✅ 研究人员进行 AI 实验
- ✅ 普通用户自动化日常任务
开始你的 AI Agent 之旅吧! 🚀
💬 互动:如果你尝试了 OpenHuman,欢迎在 GitHub Issues 或 Discord 分享你的体验!











