← 首页

本地部署指南

NVIDIA DGX Spark 本地部署 OpenClaw — 在桌面上自托管私有 AI 智能体

NVIDIA DGX Spark 是一台桌面级 AI 电脑,128GB 统一内存足以在本地运行数百亿参数的大模型。结合开源的 OpenClaw 智能体框架和 Ollama 本地推理服务,你可以搭建一个完全私有、无需联网的 AI 智能体。本文介绍这套方案的适用场景、完整部署思路,并与 OpenClaw Launch 托管服务做真实对比 — 帮你选到最适合自己的路径。

NVIDIA DGX Spark 是什么?

DGX Spark 是 NVIDIA 推出的桌面 AI 超级计算机,搭载 GB10 Grace Blackwell 超级芯片,将 20 核 Arm Grace CPU 与 Blackwell GPU 集成在同一颗芯片上,共享统一内存池。核心规格:

  • 128GB LPDDR5x 统一内存 — CPU 与 GPU 共享同一内存池,模型可使用全部内存,无独立显存瓶颈
  • 最高 1 PFLOP(FP4 含稀疏性) AI 算力
  • 支持本地推理最高约 200B 参数模型,微调最高约 70B
  • 体积极小 — 约 1.1 升,真正的桌面设备
  • 价格 — 创始版 $4,699(4TB SSD);Acer、ASUS、Dell、MSI 等合作伙伴版(1TB)稍低,可通过 NVIDIA 授权渠道购买

DGX Spark 面向需要在本地运行大模型、对数据隐私有严格要求的研究人员、开发者和企业团队。

为什么在 DGX Spark 上自托管 OpenClaw?

OpenClaw 是开源的 AI 智能体框架,OpenClaw Launch 的托管服务也基于这套框架。开源意味着你可以在自己的任何机器上运行它,包括 DGX Spark。两者结合的优势:

  • 数据完全本地 — 对话内容、文件、智能体操作均不离开你的硬件,无需调用第三方云端 API
  • 离线可用 — 使用本地模型时,即使断网也能正常运行
  • 超大模型空间 — 128GB 统一内存远超普通消费级 GPU(通常 24 – 80GB 显存),可运行更大参数量的模型
  • 推理零边际成本 — 硬件买断后,本地推理不再按 token 计费

代价是:你需要自行承担硬件成本、安装配置和日常运维。对于大多数用户,OpenClaw Launch 托管服务更快、更省钱。下文会做诚实对比。

谁适合 DGX Spark 本地部署?

适合本地部署的场景

  • 有数据驻留或合规要求,数据绝对不能出境或上云
  • 需要在本地运行 70B 以上参数的大模型,避免高额云端推理费用
  • 有离线场景需求(专网、无网络环境)
  • 正在进行模型微调研究,需要同时用微调后的模型跑智能体

更适合托管服务的场景

如果你只是想快速部署一个 AI 智能体,接入 Telegram、Discord、WhatsApp 或微信,不需要本地大模型,也没有严格的数据驻留要求 — 那么 OpenClaw Launch 是更省时省力的选择:首月 $3,2 分钟上线,无需管理服务器。

DGX Spark 本地部署 vs 托管服务对比

对比维度DGX Spark + 自托管 OpenClawOpenClaw Launch 托管服务
前期成本$4,699 起(硬件)$0
每月费用电费 + 运维人力首月 $3,之后 $6 – $20/月
数据本地化完全本地,数据不出境托管于欧盟服务器
离线可用是(本地模型)否,依赖云端
可运行模型大小最高约 200B 参数云端 API 模型(20+ 种可选)
上线时间数小时(安装 + 配置)2 分钟内
运维负担全部自行管理平台代管
渠道支持支持(需自行配置)支持(一键连接)
Skills / MCP3,200+ ClawHub Skills(手动安装)3,200+ ClawHub Skills(控制台操作)

本地部署完整步骤

第1步:启动 DGX Spark

通过 NVIDIA 授权渠道购买 DGX Spark(创始版 $4,699 或合作伙伴版),开机后按 NVIDIA 官方文档(nvidia.com)完成系统初始化。DGX OS 预装了 CUDA 及 Blackwell GPU 驱动,确认 GPU 已被系统识别、基础计算任务可正常运行后,即可进入下一步。

第2步:安装本地推理服务器

在 DGX Spark 上运行本地大模型,需要一个提供 OpenAI 兼容 API 的推理服务器。Ollama 是最常见的选择,一条命令即可完成模型下载和服务启动,门槛最低。其他选项包括 vLLM(吞吐更高、配置更复杂)和基于 llama.cpp 的服务器。

按照 Ollama 官方文档(ollama.com)安装后,拉取一个模型。凭借 128GB 统一内存,你可以运行在普通 GPU 上无法装载的大参数模型。通用智能体场景推荐 32B – 70B 指令微调模型;对速度要求高、资源敏感的场景,7B – 14B 模型更合适。

Ollama 默认在 localhost:11434 提供兼容 OpenAI 格式的 API,可通过一次 curl 请求验证是否正常运行。详细步骤可参考 OpenClaw + Ollama 接入指南

第3步:安装并运行 OpenClaw

OpenClaw 开源,可直接安装在 DGX Spark 上。自托管推荐使用 Docker 方式,便于隔离和后续更新。也可以选择 npm 直接安装。

关键配置是将 OpenClaw 的模型来源指向本地 Ollama 服务,而非云端 API。在 openclaw.json 中设置模型提供商为本地推理端点,并填写你拉取的模型名称。具体字段名请参考 OpenClaw 部署教程 和上游 OpenClaw 官方文档。

整体流程:

  1. 安装 OpenClaw(推荐 Docker)
  2. openclaw.json 中配置本地 Ollama 端点为模型来源
  3. 填写与 Ollama 中拉取的模型一致的模型名称
  4. 启动 OpenClaw 网关

配置完成后,所有推理请求将路由至 DGX Spark 上的本地模型,LLM 层不再产生任何外部 API 调用。

第4步:连接聊天渠道

OpenClaw 网关在本地运行后,将其接入你常用的消息渠道。支持 Telegram、Discord、WhatsApp、微信、Slack 及网页对话。每个渠道需要对应平台的 Bot Token 或授权凭证:

  • Telegram — 通过 BotFather 创建机器人,获取 Token 填入配置
  • Discord — 在 Discord 开发者平台创建应用和 Bot,填入 Bot Token
  • WhatsApp、微信、Slack — 参考 OpenClaw 文档中对应渠道的接入步骤

自托管场景下,你需要自行管理网关 URL 和 TLS 证书。若 DGX Spark 部署在局域网内,还需要通过公网入口或隧道服务(如 Cloudflare Tunnel)让 Telegram/Discord Webhook 可以访问到你的网关。

第5步:安装 Skills 扩展能力

OpenClaw 的 3,200+ ClawHub Skills 在自托管环境下同样可用,通过智能体对话界面或 CLI 安装即可。需要外部 API Key 的 Skill(如搜索、日历等)仍需配置对应 Key,但 LLM 推理层完全在本地运行。更多 Skills 介绍见 Skills 页面

本地 vs 托管:如何选择?

两条路径都可以运行 OpenClaw,区别在于你的核心需求:

  • 需要数据完全本地、离线可用、运行超大模型 — 选 DGX Spark 自托管,承担 $4,699+ 硬件成本和运维工作
  • 想快速部署、不想管服务器 — 选 OpenClaw Launch,首月 $3,支持 20+ 云端模型(含 BYOK)、3,200+ Skills、Telegram/Discord/WhatsApp/微信一键接入,2 分钟上线

更多部署方式对比见 AI 智能体对比页面,Linux 自托管详细步骤见 Linux 部署指南,Docker 部署见 Docker 指南

常见问题(FAQ)

DGX Spark 上能运行哪些模型配合 OpenClaw 使用?

128GB 统一内存支持最高约 200B 参数模型的本地推理,以及最高约 70B 的微调。OpenClaw 智能体场景下,7B – 70B 指令微调开源模型(通过 Ollama 拉取)是常见选择。具体推荐取决于你的任务类型和 Ollama 当时可用的模型。

自托管 OpenClaw 必须用 DGX Spark 吗?

不必。OpenClaw 可以在任何安装了 DockerLinux 机器上自托管,包括普通 VPS 或 Mac(Apple Silicon)。DGX Spark 的优势在于能运行 70B+ 的大模型,以及超大统一内存。如果你不需要本地大模型,OpenClaw Launch 托管服务从 $3/月起更省心。

本地模型和云端 API 可以同时用吗?

可以。OpenClaw 支持在同一配置中使用多个模型来源。你可以将部分请求路由到本地 Ollama 模型,对于本地模型能力不足的任务回退到云端 API(OpenRouter、OpenAI、Anthropic 等)。自托管和托管服务均完整支持 BYOK(自带 API Key)。

自托管 OpenClaw 要付费吗?

OpenClaw 框架开源免费。自托管只需承担硬件和电费成本。OpenClaw Launch 是其托管服务,首月特惠 $3,之后 Lite $6/月、Pro $20/月,支持支付宝和微信支付,省去所有安装运维负担。

OpenClaw 开源,为什么还有托管服务?

自托管需要服务器、Linux 知识、Docker、网络配置和持续运维,有一定门槛。OpenClaw Launch 将这一切全部托管,包括服务器维护、版本更新、备份、渠道连接和可用性保障,让你 2 分钟内上线、无需碰服务器。DGX Spark 本地部署适合有特定隐私或离线需求的用户;托管服务适合绝大多数想快速用上 AI 智能体的个人和团队。

不想折腾硬件?2 分钟直接上线

DGX Spark + 自托管 OpenClaw 是隐私敏感和重度本地推理场景的强力方案。但对于大多数个人用户和团队 — 只想在 Telegram、Discord、WhatsApp 或微信里用上可靠的 AI 智能体 — 托管路径要简单得多。

OpenClaw Launch 提供同款开源 OpenClaw 智能体,支持 20+ 模型(含云端 BYOK)、3,200+ ClawHub Skills 和 MCP,首月特惠 $3,支持支付宝和微信支付。

不需要昂贵硬件,2 分钟部署 AI 智能体

支持 Claude / GPT / DeepSeek 等 20+ 模型,直达 Telegram、Discord、WhatsApp、微信。首月特惠 $3,支持支付宝和微信支付。

立即部署