DreamServer 是一款本地优先的 AI 全栈部署方案,一条命令即可在 Linux/Windows/macOS 上搭建私有 AI 服务器。集成 LLM 推理、语音对话、图像生成、RAG 检索和工作流自动化,所有模块可自由扩展替换,数据完全自主可控无外泄。
🎤 引言
你有没有过这种经历:想本地跑个大模型聊天,结果发现要装 Ollama、装 Open WebUI、再装个向量数据库、又想接语音识别、还要弄 ComfyUI 跑图……光是把这些拼起来就够喝一壶。更别提中间的依赖冲突、端口打架、配置文件改到头秃。
Light-Heart-Labs 推出的 DreamServer 就是为解决这种"AI 拼装地狱"而生的——它把一整套本地 AI 栈打包好,你只需要一条命令,就能在自己的机器上跑起一个完整的私有 AI 平台。LLM 推理、语音对话、图像生成、RAG 检索、工作流自动化、隐私工具全部预装,所有模块还能自由拆装替换。
最香的是,数据全程不离开你的机器。不订阅、不联网、不上传,所有对话和素材都在本地硬盘上跑。对于在意隐私、又不想被云服务绑架的极客玩家来说,这玩意儿简直对胃口。
⭐ 核心功能
DreamServer 的设计哲学是"一体化 + 模块化"——开箱即用,又能拆开自定义。下面是它预装的主要模块:
LLM 推理(llama-server)
基于 llama.cpp 生态,提供 GGUF 模型推理能力。安装脚本会自动检测你的显存和内存,从内置的 model-library.json 模型库中选择最合适的模型——比如 8GB 显存给你拉个 Qwen2.5-7B,24GB 显存就给你上 14B 量化版,省得你手动挑。
语音能力(Whisper + Kokoro)
- Whisper:语音转文字,支持多语言识别
- Kokoro:文字转语音,听起来还挺自然
两个模块配合就能搭一个完整的语音助手,你说一句话,它回你一句。
图像生成(ComfyUI)
集成业界知名的 ComfyUI 工作流引擎,本地跑 Stable Diffusion 出图。不用再单独装 Python 环境、配 venv、装 xformers 那些乱七八糟的依赖了。
RAG 检索(Qdrant + SearXNG + Perplexica)
- Qdrant:向量数据库,存文档切片做语义检索
- SearXNG:自托管的元搜索引擎(聚合 Google/Bing/DuckDuckGo 等)
- Perplexica:AI 搜索引擎,结合 LLM 做深度问答
这三件套加上 LLM,就能搭一个完全本地化的"Perplexity 替代品",搜资料不暴露搜索记录。
工作流自动化(n8n)
是的,n8n 也集成进来了。配合 LLM 节点可以做一些自动化任务,比如定时抓新闻、自动总结、自动回邮件等等。
编程代理(OpenCode + Hermes Agent)
本地编码助手,能在仓库里跑 agent 自动改代码、查文档、做重构。配合 IDE 使用效果更好。
隐私与可观测性
- Privacy Shield:拦截所有外发请求,确保数据不外泄
- Token Spy:监控 token 消耗
- Langfuse:LLM 调用追踪和可观测性面板
统一 Dashboard
所有模块共用一个 Web 控制台(默认 http://localhost:3000),能切换模型、查看日志、管理扩展、监控系统状态。
扩展系统(Mod System)
这是 DreamServer 最核心的设计——每个服务都是一个 Mod。每个 Mod 就是一个目录,包含 manifest 和 compose 配置片段,可读、可改、可分叉。官方仓库自带十几个 Mod,你也可以写自己的 Mod 分享出去。
从 700 美元的迷你 PC 到 12000 美元的工作站,硬件差异仅体现在能跑的 Mod 数量。这种"分形扩展"的设计哲学非常对极客胃口。
📥 安装与使用
系统要求
- Linux:Ubuntu 22.04+ / Debian 12+ / 主流发行版(需支持 Docker)
- macOS:Apple Silicon(M1/M2/M3/M4),Intel Mac 不支持
- Windows:Windows 10/11 + WSL2 或 Docker Desktop
硬件最低配置 8GB RAM(仅跑 LLM),推荐 16GB+ RAM + NVIDIA GPU(CUDA 支持)。
一键安装(Linux/macOS)
curl -fsSL https://raw.githubusercontent.com/Light-Heart-Labs/DreamServer/main/dream-server/get-dream-server.sh | bash安装脚本会自动完成以下工作:
- 检测 GPU 类型(NVIDIA / Apple Silicon / 纯 CPU)
- 根据硬件选择合适的 GGUF 模型
- 生成 API Key 和随机密码
- 拉取 Docker 镜像并启动所有服务
- 输出 Dashboard 访问地址
Windows 安装
Windows 用户需要先安装 WSL2 或 Docker Desktop,然后执行官方提供的 PowerShell 安装脚本:
irm https://raw.githubusercontent.com/Light-Heart-Labs/DreamServer/main/dream-server/installers/windows/install.ps1 | iex访问 Dashboard
安装完成后,浏览器打开 http://localhost:3000,输入脚本输出的默认凭证即可登录。
切换模型
想换个更猛的模型?编辑 dream-server/config/model-library.json,把目标模型 ID 改掉,然后重启对应 Mod:
cd ~/dream-server
./dream restart llama添加自定义 Mod
在 dream-server/mods/ 下新建一个目录,比如 my-custom-mod/,写好 manifest.json 和 compose.yml,再执行 ./dream enable my-custom-mod 即可启用。
官方文档(Friendly Guide)写得比较友好,README 也提到了音频版——可以边听边装。
更多细节可以看 GitHub 仓库 README。
🎯 适用场景
个人开发者
想做点 AI 原型设计,又不想每月给 OpenAI 充钱?本地装个 DreamServer,能聊天、能画图、能写代码,关键是完全免费。模型随便切,参数随便调,不用担心 API 限速。
中小企业 / 创业团队
想给公司搭一个内部 AI 助手(HR 问答、技术支持、文档检索),但又不想把客户数据喂给 ChatGPT?DreamServer 这种"一键私有化"方案就特别合适——一次部署,全公司共用,数据完全可控。
隐私敏感行业
医疗、法律、金融行业的客户数据、合同文本、研究材料,严格意义上是不能上公有云大模型的。DreamServer 提供了一个合规可行的路径——所有数据都在本地,所有模块都是 Apache-2.0 开源,可审计、可定制。
教育 / 科研
大学实验室想给学生教 AI 应用开发,但预算买不起云服务?一台装了 DreamServer 的服务器,几十个学生同时用都没问题(取决于硬件配置)。
极客玩家的"AI 玩具"
如果你就是单纯喜欢折腾、喜欢把所有 AI 工具攒一起玩,DreamServer 的 Mod 系统会让你玩得停不下来。改个 prompt 模板、写个自定义 Mod、贡献到社区,这种参与感是 SaaS 服务给不了的。
🔍 对比 / 替代方案
vs Ollama
Ollama 只是 LLM 推理引擎,只能跑对话。DreamServer 在 Ollama 的基础上加了聊天界面、语音、图像、RAG、工作流等一整套外延,是"Ollama + 全家桶" 的关系。
vs Open WebUI
Open WebUI 本质是 Ollama 的 Web 界面,专注于聊天体验。DreamServer 的范围更大——除了聊天,还包括语音、图像、工作流、隐私保护、Mod 扩展等。
vs LM Studio
LM Studio 是桌面端应用(macOS/Windows),主打"零配置对话"。DreamServer 是服务器端部署,可远程访问、多用户共用,更适合团队或长期使用场景。
vs 手动 DIY 组合
理论上你可以自己用 Docker Compose 把 Ollama + Open WebUI + ComfyUI + Qdrant + n8n 拼起来,但光是:
- 解决端口冲突
- 配置网络互通
- 写好各个服务的反向代理
- 处理不同服务的鉴权方式
就够折腾一两周。DreamServer 把这些全干完了,而且Mod 系统让后续扩展比 DIY 简单一个量级。
vs 云端 SaaS(ChatGPT/Claude/Gemini)
云端方案的优点是模型强、开箱即用,缺点是:
- 数据上云(合规风险)
- 月费持续支出
- API 限速
- 模型选择受限
DreamServer 的独特价值在于:用本地硬件的成本(电费 + 折旧),换来永久的、可控的、零订阅的 AI 服务。
⚠️ 注意事项
硬件门槛不低
虽然官方说从 700 美元迷你 PC 到 12000 美元服务器都能跑,但实际体验差距很大:
- 纯 CPU 跑 7B 模型 ≈ 1-2 token/秒,能用但慢
- NVIDIA RTX 3060 12GB 跑 7B ≈ 15-25 token/秒,体验流畅
- 没有 NVIDIA GPU 的 Windows 用户体验会差很多
如果只是想轻度体验,可能 Ollama + Open WebUI 更轻量。
Windows 体验仍待改进
Windows 必须依赖 WSL2 或 Docker Desktop,安装链路较长。原生 PowerShell 安装脚本相对 Linux/macOS 的一键 bash 来说,体验上仍有差距。
macOS 仅支持 Apple Silicon
Intel Mac 用户直接被劝退。如果你还在用 Intel Mac,要么换机器,要么上 Linux。
项目相对年轻
当前最新版本是 v2.0.0(发布日期 2026-03-04,"Strix Halo First" 首发版)。GitHub 显示约 1.4K Stars、219 Forks(数据来源 ngjoo.com 项目档案)。社区和文档还在成长中,遇到问题可能需要自己读源码或提 Issue。
学习曲线存在
Mod 系统虽然强大,但要写出自己的 Mod,需要懂 Docker Compose、YAML、一点 Python。普通用户可能只会用现成的 Mod 而不会定制。
许可证说明
Apache-2.0 协议——商用 OK,但需要保留版权声明和许可证副本。
✅ 总结
DreamServer 把"本地 AI 部署"这件事从两天的折腾压缩到了一条命令,这是它最大的价值。它适合:
- ✅ 想摆脱云服务订阅的个人玩家
- ✅ 有数据合规需求的企业团队
- ✅ 喜欢拆装自定义的极客
- ✅ 教学场景下的本地 AI 演示
不适合:
- ❌ 纯小白用户(Ollama + Open WebUI 更轻量)
- ❌ 硬件配置很弱的机器(运行体验会很慢)
- ❌ Intel Mac 用户
推荐指数:⭐⭐⭐⭐(4/5)
扣掉的一颗星留给"项目还年轻、生态待成熟"。等再过半年、社区 Mod 多起来、文档再丰富一点,完全有潜力冲到 5 星。
如果你是那种"什么都要自己掌控"的极客,DreamServer 值得一试。一条命令拉起来,整个 AI 栈就是你的玩具了。
GitHub 仓库:Light-Heart-Labs/DreamServer
官网:dreamserver.ai