DreamServer 是一款本地优先的 AI 全栈部署方案,一条命令即可在 Linux/Windows/macOS 上搭建私有 AI 服务器。集成 LLM 推理、语音对话、图像生成、RAG 检索和工作流自动化,所有模块可自由扩展替换,数据完全自主可控无外泄。

🎤 引言

你有没有过这种经历:想本地跑个大模型聊天,结果发现要装 Ollama、装 Open WebUI、再装个向量数据库、又想接语音识别、还要弄 ComfyUI 跑图……光是把这些拼起来就够喝一壶。更别提中间的依赖冲突、端口打架、配置文件改到头秃。

Light-Heart-Labs 推出的 DreamServer 就是为解决这种"AI 拼装地狱"而生的——它把一整套本地 AI 栈打包好,你只需要一条命令,就能在自己的机器上跑起一个完整的私有 AI 平台。LLM 推理、语音对话、图像生成、RAG 检索、工作流自动化、隐私工具全部预装,所有模块还能自由拆装替换。

最香的是,数据全程不离开你的机器。不订阅、不联网、不上传,所有对话和素材都在本地硬盘上跑。对于在意隐私、又不想被云服务绑架的极客玩家来说,这玩意儿简直对胃口。


⭐ 核心功能

DreamServer 的设计哲学是"一体化 + 模块化"——开箱即用,又能拆开自定义。下面是它预装的主要模块:

LLM 推理(llama-server)

基于 llama.cpp 生态,提供 GGUF 模型推理能力。安装脚本会自动检测你的显存和内存,从内置的 model-library.json 模型库中选择最合适的模型——比如 8GB 显存给你拉个 Qwen2.5-7B,24GB 显存就给你上 14B 量化版,省得你手动挑。

语音能力(Whisper + Kokoro)

  • Whisper:语音转文字,支持多语言识别
  • Kokoro:文字转语音,听起来还挺自然

两个模块配合就能搭一个完整的语音助手,你说一句话,它回你一句。

图像生成(ComfyUI)

集成业界知名的 ComfyUI 工作流引擎,本地跑 Stable Diffusion 出图。不用再单独装 Python 环境、配 venv、装 xformers 那些乱七八糟的依赖了。

RAG 检索(Qdrant + SearXNG + Perplexica)

  • Qdrant:向量数据库,存文档切片做语义检索
  • SearXNG:自托管的元搜索引擎(聚合 Google/Bing/DuckDuckGo 等)
  • Perplexica:AI 搜索引擎,结合 LLM 做深度问答

这三件套加上 LLM,就能搭一个完全本地化的"Perplexity 替代品",搜资料不暴露搜索记录。

工作流自动化(n8n)

是的,n8n 也集成进来了。配合 LLM 节点可以做一些自动化任务,比如定时抓新闻、自动总结、自动回邮件等等。

编程代理(OpenCode + Hermes Agent)

本地编码助手,能在仓库里跑 agent 自动改代码、查文档、做重构。配合 IDE 使用效果更好。

隐私与可观测性

  • Privacy Shield:拦截所有外发请求,确保数据不外泄
  • Token Spy:监控 token 消耗
  • Langfuse:LLM 调用追踪和可观测性面板

统一 Dashboard

所有模块共用一个 Web 控制台(默认 http://localhost:3000),能切换模型、查看日志、管理扩展、监控系统状态。

扩展系统(Mod System)

这是 DreamServer 最核心的设计——每个服务都是一个 Mod。每个 Mod 就是一个目录,包含 manifest 和 compose 配置片段,可读、可改、可分叉。官方仓库自带十几个 Mod,你也可以写自己的 Mod 分享出去。

从 700 美元的迷你 PC 到 12000 美元的工作站,硬件差异仅体现在能跑的 Mod 数量。这种"分形扩展"的设计哲学非常对极客胃口。


📥 安装与使用

系统要求

  • Linux:Ubuntu 22.04+ / Debian 12+ / 主流发行版(需支持 Docker)
  • macOS:Apple Silicon(M1/M2/M3/M4),Intel Mac 不支持
  • Windows:Windows 10/11 + WSL2 或 Docker Desktop

硬件最低配置 8GB RAM(仅跑 LLM),推荐 16GB+ RAM + NVIDIA GPU(CUDA 支持)。

一键安装(Linux/macOS)

curl -fsSL https://raw.githubusercontent.com/Light-Heart-Labs/DreamServer/main/dream-server/get-dream-server.sh | bash

安装脚本会自动完成以下工作:

  1. 检测 GPU 类型(NVIDIA / Apple Silicon / 纯 CPU)
  2. 根据硬件选择合适的 GGUF 模型
  3. 生成 API Key 和随机密码
  4. 拉取 Docker 镜像并启动所有服务
  5. 输出 Dashboard 访问地址

Windows 安装

Windows 用户需要先安装 WSL2 或 Docker Desktop,然后执行官方提供的 PowerShell 安装脚本:

irm https://raw.githubusercontent.com/Light-Heart-Labs/DreamServer/main/dream-server/installers/windows/install.ps1 | iex

访问 Dashboard

安装完成后,浏览器打开 http://localhost:3000,输入脚本输出的默认凭证即可登录。

切换模型

想换个更猛的模型?编辑 dream-server/config/model-library.json,把目标模型 ID 改掉,然后重启对应 Mod:

cd ~/dream-server
./dream restart llama

添加自定义 Mod

dream-server/mods/ 下新建一个目录,比如 my-custom-mod/,写好 manifest.jsoncompose.yml,再执行 ./dream enable my-custom-mod 即可启用。

官方文档(Friendly Guide)写得比较友好,README 也提到了音频版——可以边听边装。

更多细节可以看 GitHub 仓库 README


🎯 适用场景

个人开发者

想做点 AI 原型设计,又不想每月给 OpenAI 充钱?本地装个 DreamServer,能聊天、能画图、能写代码,关键是完全免费。模型随便切,参数随便调,不用担心 API 限速。

中小企业 / 创业团队

想给公司搭一个内部 AI 助手(HR 问答、技术支持、文档检索),但又不想把客户数据喂给 ChatGPT?DreamServer 这种"一键私有化"方案就特别合适——一次部署,全公司共用,数据完全可控。

隐私敏感行业

医疗、法律、金融行业的客户数据、合同文本、研究材料,严格意义上是不能上公有云大模型的。DreamServer 提供了一个合规可行的路径——所有数据都在本地,所有模块都是 Apache-2.0 开源,可审计、可定制。

教育 / 科研

大学实验室想给学生教 AI 应用开发,但预算买不起云服务?一台装了 DreamServer 的服务器,几十个学生同时用都没问题(取决于硬件配置)。

极客玩家的"AI 玩具"

如果你就是单纯喜欢折腾、喜欢把所有 AI 工具攒一起玩,DreamServer 的 Mod 系统会让你玩得停不下来。改个 prompt 模板、写个自定义 Mod、贡献到社区,这种参与感是 SaaS 服务给不了的。


🔍 对比 / 替代方案

vs Ollama

Ollama 只是 LLM 推理引擎,只能跑对话。DreamServer 在 Ollama 的基础上加了聊天界面、语音、图像、RAG、工作流等一整套外延,是"Ollama + 全家桶" 的关系。

vs Open WebUI

Open WebUI 本质是 Ollama 的 Web 界面,专注于聊天体验。DreamServer 的范围更大——除了聊天,还包括语音、图像、工作流、隐私保护、Mod 扩展等。

vs LM Studio

LM Studio 是桌面端应用(macOS/Windows),主打"零配置对话"。DreamServer 是服务器端部署,可远程访问、多用户共用,更适合团队或长期使用场景。

vs 手动 DIY 组合

理论上你可以自己用 Docker Compose 把 Ollama + Open WebUI + ComfyUI + Qdrant + n8n 拼起来,但光是:

  • 解决端口冲突
  • 配置网络互通
  • 写好各个服务的反向代理
  • 处理不同服务的鉴权方式

就够折腾一两周。DreamServer 把这些全干完了,而且Mod 系统让后续扩展比 DIY 简单一个量级

vs 云端 SaaS(ChatGPT/Claude/Gemini)

云端方案的优点是模型强、开箱即用,缺点是:

  • 数据上云(合规风险)
  • 月费持续支出
  • API 限速
  • 模型选择受限

DreamServer 的独特价值在于:用本地硬件的成本(电费 + 折旧),换来永久的、可控的、零订阅的 AI 服务。


⚠️ 注意事项

硬件门槛不低

虽然官方说从 700 美元迷你 PC 到 12000 美元服务器都能跑,但实际体验差距很大

  • 纯 CPU 跑 7B 模型 ≈ 1-2 token/秒,能用但慢
  • NVIDIA RTX 3060 12GB 跑 7B ≈ 15-25 token/秒,体验流畅
  • 没有 NVIDIA GPU 的 Windows 用户体验会差很多

如果只是想轻度体验,可能 Ollama + Open WebUI 更轻量。

Windows 体验仍待改进

Windows 必须依赖 WSL2 或 Docker Desktop,安装链路较长。原生 PowerShell 安装脚本相对 Linux/macOS 的一键 bash 来说,体验上仍有差距。

macOS 仅支持 Apple Silicon

Intel Mac 用户直接被劝退。如果你还在用 Intel Mac,要么换机器,要么上 Linux。

项目相对年轻

当前最新版本是 v2.0.0(发布日期 2026-03-04,"Strix Halo First" 首发版)。GitHub 显示约 1.4K Stars、219 Forks(数据来源 ngjoo.com 项目档案)。社区和文档还在成长中,遇到问题可能需要自己读源码或提 Issue。

学习曲线存在

Mod 系统虽然强大,但要写出自己的 Mod,需要懂 Docker Compose、YAML、一点 Python。普通用户可能只会用现成的 Mod 而不会定制。

许可证说明

Apache-2.0 协议——商用 OK,但需要保留版权声明和许可证副本。


✅ 总结

DreamServer 把"本地 AI 部署"这件事从两天的折腾压缩到了一条命令,这是它最大的价值。它适合:

  • ✅ 想摆脱云服务订阅的个人玩家
  • ✅ 有数据合规需求的企业团队
  • ✅ 喜欢拆装自定义的极客
  • ✅ 教学场景下的本地 AI 演示

不适合:

  • ❌ 纯小白用户(Ollama + Open WebUI 更轻量)
  • ❌ 硬件配置很弱的机器(运行体验会很慢)
  • ❌ Intel Mac 用户

推荐指数:⭐⭐⭐⭐(4/5)

扣掉的一颗星留给"项目还年轻、生态待成熟"。等再过半年、社区 Mod 多起来、文档再丰富一点,完全有潜力冲到 5 星。

如果你是那种"什么都要自己掌控"的极客,DreamServer 值得一试。一条命令拉起来,整个 AI 栈就是你的玩具了。

GitHub 仓库:Light-Heart-Labs/DreamServer
官网:dreamserver.ai