部署教程
Llama 4 部署教程:用 Meta 开源模型搭建AI助手
Llama 4 是 Meta 的开源权重大模型——Scout 主打超长上下文、Maverick 主打综合性能。开源可自托管是它最大的优势。本文介绍两种把它接入龙虾 OpenClaw 的方式。
什么是 Llama 4?
Meta 研发并开放权重的 Llama 4 包含 Scout(超长上下文)与 Maverick(高性能 MoE)等版本。因为是开源模型,你可以通过 OpenRouter 等聚合平台直接调用,也可以用 Ollama / vLLM 自托管,完全掌控数据。
Llama 4 模型怎么选
| 模型 | 适用场景 | 说明 |
|---|---|---|
meta-llama/llama-4-maverick | 复杂推理、编码、工具调用 | 高性能旗舰 |
meta-llama/llama-4-scout | 超长上下文、文档分析 | 长上下文 |
具体每百万 token 价格与可用模型 ID 请以 OpenRouter官方文档为准。
方式一:通过 OpenRouter 使用(最简单)
Llama 4 是开源权重模型,OpenRouter 直接暴露为 meta-llama/llama-4-maverick,用一个 Key 即可调用:
- 从 openrouter.ai 获取一个 OpenRouter API Key。
- 进入龙虾的 控制台 →「API Keys」,添加 OpenRouter Key。
- 把主模型设为
openrouter/meta-llama/llama-4-maverick,部署后约 30 秒上线。
方式二:自托管(Ollama / vLLM)
Llama 4 开放权重,可在自己的机器上跑,数据完全本地。用 Ollama 拉起后,在 openclaw.json 指向本地 OpenAI 兼容端点:
{
"models": {
"providers": {
"local": {
"baseUrl": "http://localhost:11434/v1",
"apiKey": "ollama"
}
}
},
"agents": {
"defaults": {
"model": {
"primary": "local/llama4"
}
}
}
}参考 Ollama 本地部署教程 完成模型拉取与启动。
不同任务的取舍
| 任务类型 | 推荐 | 原因 |
|---|---|---|
| 客服聊天、FAQ 机器人 | Llama 4 Scout | 轻量、上下文长 |
| 多步研究 / 编程 | Llama 4 Maverick | 综合性能强 |
| 超长文档分析 | Llama 4 Scout | 超长上下文窗口 |
| 自托管、数据自控 | 任一版本 | 开源权重可本地部署 |
运行时切换模型
/model meta-llama/llama-4-maverick
/model meta-llama/llama-4-scout什么时候该选 Llama 4
- 希望用开源权重模型、完全掌控数据
- 需要自托管(Ollama / vLLM)部署
- 需要超长上下文(选 Scout)
- 想用一个 OpenRouter Key 灵活切换
常见问题
龙虾支持 Llama 4 吗?
支持。Llama 4 是开源权重模型——在龙虾部署托管容器后,可通过 OpenRouter(meta-llama/llama-4-maverick)路由,或在自托管时指向本地 Ollama / vLLM 端点。每个实例独立隔离。
Llama 4 适合做智能体吗?
适合。Llama 4 支持工具调用,配合龙虾的多渠道接入,可以搭建能查资料、调工具、跨平台回复的智能体。复杂任务选系列中的旗舰版本,高频简单任务选速度优化版本即可。
数据安全吗?
通过龙虾部署时,每个用户拥有独立的 Docker 容器实例,数据完全隔离,对话不会被存储或用于模型训练。
可以随时换成其他模型吗?
可以。龙虾支持随时切换模型,无需重新部署。觉得某个任务上别的模型更合适,一键切换即可。
开始使用 Llama 4
在龙虾 OpenClaw Launch 上,几分钟就能把 Llama 4 接到你常用的聊天平台,搭建一个能调工具、跨渠道回复的 AI 助手。
访问 龙虾 OpenClaw Launch — 选择 Llama 4, 约 30 秒部署你的专属 AI 助手。