本地部署指南

NVIDIA DGX Spark 本地部署 OpenClaw — 在桌面上自托管私有 AI 智能体

Q: DGX Spark 上能运行哪些模型配合 OpenClaw 使用？

DGX Spark 拥有 128GB 统一内存，支持最高约 200B 参数模型的本地推理，以及最高约 70B 的微调。OpenClaw 智能体场景下，通过 Ollama 拉取的 7B 至 70B 指令微调开源模型是常见选择。

Q: 自托管 OpenClaw 必须用 DGX Spark 吗？

不必。OpenClaw 可以在任何安装了 Docker 的 Linux 机器上自托管。DGX Spark 的优势在于能运行 70B+ 的大模型。如果不需要本地大模型，OpenClaw Launch 托管服务从 $3/月起更省心，2 分钟上线。

Q: 自托管 OpenClaw 要付费吗？

OpenClaw 框架开源免费，自托管只需承担硬件和电费成本。OpenClaw Launch 是托管服务，首月特惠 $3，之后 Lite $6/月、Pro $20/月，支持支付宝和微信支付。

Q: 本地模型和云端 API 可以同时用吗？

可以。OpenClaw 支持同时配置多个模型来源，可将部分请求路由到本地 Ollama 模型，其他任务回退到云端 API（OpenRouter、OpenAI、Anthropic 等）。自托管和托管服务均支持 BYOK（自带 API Key）。

NVIDIA DGX Spark 是一台桌面级 AI 电脑，128GB 统一内存足以在本地运行数百亿参数的大模型。结合开源的 OpenClaw 智能体框架和 Ollama 本地推理服务，你可以搭建一个完全私有、无需联网的 AI 智能体。本文介绍这套方案的适用场景、完整部署思路，并与 OpenClaw Launch 托管服务做真实对比 — 帮你选到最适合自己的路径。

NVIDIA DGX Spark 是什么？

DGX Spark 是 NVIDIA 推出的桌面 AI 超级计算机，搭载 GB10 Grace Blackwell 超级芯片，将 20 核 Arm Grace CPU 与 Blackwell GPU 集成在同一颗芯片上，共享统一内存池。核心规格：

128GB LPDDR5x 统一内存 — CPU 与 GPU 共享同一内存池，模型可使用全部内存，无独立显存瓶颈
最高 1 PFLOP（FP4 含稀疏性） AI 算力
支持本地推理最高约 200B 参数模型，微调最高约 70B
体积极小 — 约 1.1 升，真正的桌面设备
价格 — 创始版 $4,699（4TB SSD）；Acer、ASUS、Dell、MSI 等合作伙伴版（1TB）稍低，可通过 NVIDIA 授权渠道购买

DGX Spark 面向需要在本地运行大模型、对数据隐私有严格要求的研究人员、开发者和企业团队。

为什么在 DGX Spark 上自托管 OpenClaw？

OpenClaw 是开源的 AI 智能体框架，OpenClaw Launch 的托管服务也基于这套框架。开源意味着你可以在自己的任何机器上运行它，包括 DGX Spark。两者结合的优势：

数据完全本地 — 对话内容、文件、智能体操作均不离开你的硬件，无需调用第三方云端 API
离线可用 — 使用本地模型时，即使断网也能正常运行
超大模型空间 — 128GB 统一内存远超普通消费级 GPU（通常 24 – 80GB 显存），可运行更大参数量的模型
推理零边际成本 — 硬件买断后，本地推理不再按 token 计费

代价是：你需要自行承担硬件成本、安装配置和日常运维。对于大多数用户，OpenClaw Launch 托管服务更快、更省钱。下文会做诚实对比。

谁适合 DGX Spark 本地部署？

适合本地部署的场景

有数据驻留或合规要求，数据绝对不能出境或上云
需要在本地运行 70B 以上参数的大模型，避免高额云端推理费用
有离线场景需求（专网、无网络环境）
正在进行模型微调研究，需要同时用微调后的模型跑智能体

更适合托管服务的场景

如果你只是想快速部署一个 AI 智能体，接入 Telegram、Discord、WhatsApp 或微信，不需要本地大模型，也没有严格的数据驻留要求 — 那么 OpenClaw Launch 是更省时省力的选择：首月 $3，2 分钟上线，无需管理服务器。

DGX Spark 本地部署 vs 托管服务对比

对比维度	DGX Spark + 自托管 OpenClaw	OpenClaw Launch 托管服务
前期成本	$4,699 起（硬件）	$0
每月费用	电费 + 运维人力	首月 $3，之后 $6 – $20/月
数据本地化	完全本地，数据不出境	托管于欧盟服务器
离线可用	是（本地模型）	否，依赖云端
可运行模型大小	最高约 200B 参数	云端 API 模型（20+ 种可选）
上线时间	数小时（安装 + 配置）	2 分钟内
运维负担	全部自行管理	平台代管
渠道支持	支持（需自行配置）	支持（一键连接）
Skills / MCP	3,200+ ClawHub Skills（手动安装）	3,200+ ClawHub Skills（控制台操作）

本地部署完整步骤

第1步：启动 DGX Spark

通过 NVIDIA 授权渠道购买 DGX Spark（创始版 $4,699 或合作伙伴版），开机后按 NVIDIA 官方文档（nvidia.com）完成系统初始化。DGX OS 预装了 CUDA 及 Blackwell GPU 驱动，确认 GPU 已被系统识别、基础计算任务可正常运行后，即可进入下一步。

第2步：安装本地推理服务器

在 DGX Spark 上运行本地大模型，需要一个提供 OpenAI 兼容 API 的推理服务器。Ollama 是最常见的选择，一条命令即可完成模型下载和服务启动，门槛最低。其他选项包括 vLLM（吞吐更高、配置更复杂）和基于 llama.cpp 的服务器。

按照 Ollama 官方文档（ollama.com）安装后，拉取一个模型。凭借 128GB 统一内存，你可以运行在普通 GPU 上无法装载的大参数模型。通用智能体场景推荐 32B – 70B 指令微调模型；对速度要求高、资源敏感的场景，7B – 14B 模型更合适。

Ollama 默认在 localhost:11434 提供兼容 OpenAI 格式的 API，可通过一次 curl 请求验证是否正常运行。详细步骤可参考 OpenClaw + Ollama 接入指南。

第3步：安装并运行 OpenClaw

OpenClaw 开源，可直接安装在 DGX Spark 上。自托管推荐使用 Docker 方式，便于隔离和后续更新。也可以选择 npm 直接安装。

关键配置是将 OpenClaw 的模型来源指向本地 Ollama 服务，而非云端 API。在 openclaw.json 中设置模型提供商为本地推理端点，并填写你拉取的模型名称。具体字段名请参考 OpenClaw 部署教程和上游 OpenClaw 官方文档。

整体流程：

安装 OpenClaw（推荐 Docker）
在 openclaw.json 中配置本地 Ollama 端点为模型来源
填写与 Ollama 中拉取的模型一致的模型名称
启动 OpenClaw 网关

配置完成后，所有推理请求将路由至 DGX Spark 上的本地模型，LLM 层不再产生任何外部 API 调用。

第4步：连接聊天渠道

OpenClaw 网关在本地运行后，将其接入你常用的消息渠道。支持 Telegram、Discord、WhatsApp、微信、Slack 及网页对话。每个渠道需要对应平台的 Bot Token 或授权凭证：

Telegram — 通过 BotFather 创建机器人，获取 Token 填入配置
Discord — 在 Discord 开发者平台创建应用和 Bot，填入 Bot Token
WhatsApp、微信、Slack — 参考 OpenClaw 文档中对应渠道的接入步骤

自托管场景下，你需要自行管理网关 URL 和 TLS 证书。若 DGX Spark 部署在局域网内，还需要通过公网入口或隧道服务（如 Cloudflare Tunnel）让 Telegram/Discord Webhook 可以访问到你的网关。

第5步：安装 Skills 扩展能力

OpenClaw 的 3,200+ ClawHub Skills 在自托管环境下同样可用，通过智能体对话界面或 CLI 安装即可。需要外部 API Key 的 Skill（如搜索、日历等）仍需配置对应 Key，但 LLM 推理层完全在本地运行。更多 Skills 介绍见 Skills 页面。

本地 vs 托管：如何选择？

两条路径都可以运行 OpenClaw，区别在于你的核心需求：

需要数据完全本地、离线可用、运行超大模型 — 选 DGX Spark 自托管，承担 $4,699+ 硬件成本和运维工作
想快速部署、不想管服务器 — 选 OpenClaw Launch，首月 $3，支持 20+ 云端模型（含 BYOK）、3,200+ Skills、Telegram/Discord/WhatsApp/微信一键接入，2 分钟上线

更多部署方式对比见 AI 智能体对比页面，Linux 自托管详细步骤见 Linux 部署指南，Docker 部署见 Docker 指南。

常见问题（FAQ）

DGX Spark 上能运行哪些模型配合 OpenClaw 使用？

128GB 统一内存支持最高约 200B 参数模型的本地推理，以及最高约 70B 的微调。OpenClaw 智能体场景下，7B – 70B 指令微调开源模型（通过 Ollama 拉取）是常见选择。具体推荐取决于你的任务类型和 Ollama 当时可用的模型。

自托管 OpenClaw 必须用 DGX Spark 吗？

不必。OpenClaw 可以在任何安装了 Docker 的 Linux 机器上自托管，包括普通 VPS 或 Mac（Apple Silicon）。DGX Spark 的优势在于能运行 70B+ 的大模型，以及超大统一内存。如果你不需要本地大模型，OpenClaw Launch 托管服务从 $3/月起更省心。

本地模型和云端 API 可以同时用吗？

可以。OpenClaw 支持在同一配置中使用多个模型来源。你可以将部分请求路由到本地 Ollama 模型，对于本地模型能力不足的任务回退到云端 API（OpenRouter、OpenAI、Anthropic 等）。自托管和托管服务均完整支持 BYOK（自带 API Key）。

自托管 OpenClaw 要付费吗？

OpenClaw 框架开源免费。自托管只需承担硬件和电费成本。OpenClaw Launch 是其托管服务，首月特惠 $3，之后 Lite $6/月、Pro $20/月，支持支付宝和微信支付，省去所有安装运维负担。

OpenClaw 开源，为什么还有托管服务？

自托管需要服务器、Linux 知识、Docker、网络配置和持续运维，有一定门槛。OpenClaw Launch 将这一切全部托管，包括服务器维护、版本更新、备份、渠道连接和可用性保障，让你 2 分钟内上线、无需碰服务器。DGX Spark 本地部署适合有特定隐私或离线需求的用户；托管服务适合绝大多数想快速用上 AI 智能体的个人和团队。

不想折腾硬件？2 分钟直接上线

DGX Spark + 自托管 OpenClaw 是隐私敏感和重度本地推理场景的强力方案。但对于大多数个人用户和团队 — 只想在 Telegram、Discord、WhatsApp 或微信里用上可靠的 AI 智能体 — 托管路径要简单得多。

OpenClaw Launch 提供同款开源 OpenClaw 智能体，支持 20+ 模型（含云端 BYOK）、3,200+ ClawHub Skills 和 MCP，首月特惠 $3，支持支付宝和微信支付。