試玩 Kimi K2.5：透過 NVIDIA 免費 API 在 OpenClaw 打造隔離顧問代理

1829 字

9 分鐘

試玩 Kimi K2.5：透過 NVIDIA 免費 API 在 OpenClaw 打造隔離顧問代理

2026-02-11

AI

OpenClaw

/

AI

/

Kimi

/

設定管理

/

開發工具

起因：看到 Kimi K2.5 就想玩#

最近在滑社群的時候看到有人分享 Kimi K2.5 的表現，號稱在多項 benchmark 上超越了不少主流模型。好奇心驅使之下，剛好看到 @haltakov 在 Threads 上的貼文，只要兩步就能在 OpenClaw 裡免費接入 Kimi K2.5——去 NVIDIA Build 申請 API Key，然後改一下 openclaw.json 就好。

看起來很簡單，於是就跟著動手了。

Kimi K2.5 是什麼？#

Kimi K2.5 是由中國 AI 公司 Moonshot AI（月之暗面）在 2026 年 1 月發布的開源多模態模型，採用 MIT 授權。

幾個關鍵數字：

項目	規格
架構	Mixture-of-Experts (MoE)
總參數量	1 兆（1T）
每次推理啟動參數	320 億（32B）
Context Window	256K tokens
視覺編碼器	MoonViT（約 400M 參數）
輸入類型	文字、圖片、影片（實驗性）
訓練資料量	約 15T tokens（視覺+文字混合）

在 SWE-Bench Verified 上拿到 80.9% 的解決率，在多項視覺與推理 benchmark 中表現突出。比較引人注目的是它的 Agent Swarm 技術，可以同時協調最多 100 個子代理並行處理任務，速度比單代理快 3～4.5 倍。

簡單來說，這是一個參數量驚人但推理效率不差的開源模型，尤其在程式碼審查和多模態理解方面很有潛力。

Ollama Cloud vs NVIDIA API：該怎麼選？#

想用 Kimi K2.5，目前主要有兩種不用自架 GPU 的管道：

比較項目	Ollama Cloud (`kimi-k2.5:cloud`)	NVIDIA Build API
運作方式	安裝 Ollama 後直接 `ollama run kimi-k2.5:cloud`，推理在 Ollama 雲端完成	透過 OpenAI 相容 API 呼叫，推理在 NVIDIA 伺服器完成
本機需求	安裝 Ollama 即可，不需要 GPU	不需安裝任何東西，純 API 呼叫
費用	免費（有每小時/每週用量限制）	免費試用（Trial Service）
整合方式	Ollama API（`localhost:11434`）	OpenAI 相容 API（`integrate.api.nvidia.com`）
隱私政策	官方聲明「不保留使用者資料」	本地部署 NIM 時不上傳資料；雲端 API 未明確說明是否用於訓練
適合場景	已有 Ollama 環境、想快速體驗	需要整合進 OpenClaw 等工具的 API 呼叫

補充：如果想完全在本機跑 Kimi K2.5，完整模型需要 630GB 顯示記憶體，即使用 Unsloth 量化到 1.8-bit 也要 240GB，基本上需要多張 H200 等級的 GPU。所以對大多數人來說，雲端方案是唯一務實的選擇。

我的選擇：因為目標是在 OpenClaw 裡當顧問代理用，需要 OpenAI 相容 API 格式，NVIDIA Build API 最直接。

設定步驟#

跟著 @haltakov 的 Gist 操作，整個流程大概 5 分鐘。

Step 1：申請 NVIDIA API Key#

前往 NVIDIA Build 註冊帳號
到 API Keys 頁面建立一組新的 Key
複製下來備用（格式為 nvapi-...）

Step 2：修改 openclaw.json#

💡 如果你是從 Clawdbot 遷移過來的用戶，配置路徑可能仍在 ~/.clawdbot/。建議先完成從 Clawdbot 到 OpenClaw 的遷移再進行以下設定。

在專案根目錄的 openclaw.json 中加入 NVIDIA provider 設定：

1
{
2
  "models": {
3
    "providers": {
4
      "nvidia": {
5
        "baseUrl": "https://integrate.api.nvidia.com/v1",
6
        "apiKey": "nvapi-xxxxxxxxxxxxxxxx",
7
        "api": "openai-completions",
8
        "models": [
9
          {
10
            "id": "moonshotai/kimi-k2.5",
11
            "name": "Kimi K2.5",
12
            "reasoning": true,
13
            "input": ["text", "image"],
14
            "contextWindow": 256000,
15
            "maxTokens": 8192
16
          }
17
        ]
18
      }
19
    }
20
  }
21
}

Step 3：在代理設定中加入 Kimi 模型#

在 agents.models 區塊加入別名，方便後續指定。關於模型允許列表（agents.defaults.models）的運作機制與完整配置方式，可參考模型切換配置全解。

1
{
2
  "nvidia/moonshotai/kimi-k2.5": {
3
    "alias": "kimi"
4
  }
5
}

設定好之後重啟 OpenClaw，就能在模型選單中看到 Kimi K2.5 了。

為什麼要隔離成獨立代理？#

接通之後馬上想到一個問題：Kimi K2.5 畢竟是外部雲端模型，所有送出去的 prompt 都會經過第三方伺服器。而 OpenClaw 環境裡可能存有專案路徑、記憶檔案、甚至在對話中出現 API Token 等敏感資訊。

尤其 NVIDIA Build API 的隱私條款中，對於雲端 API 呼叫的資料是否用於模型訓練並未明確說明（僅本地部署的 NIM 明確保證「不上傳資料」）。在這種不確定性下，直接把整個主代理的上下文丟給外部模型，風險太高。

解法是：把 Kimi K2.5 隔離成一個獨立的子代理，只讓它處理去識別化後的技術問題。

設定隔離代理#

1. 定義代理身分（SOUL.md）#

在 agents/kimi/SOUL.md 中定義角色與限制：

你是一位專業的程式碼審查與邏輯分析顧問。你的職責是針對傳入的程式碼片段進行分析與建議。注意：你處於隔離環境中，無法存取外部檔案系統，請僅就提供的內容進行回應。

2. 註冊到代理列表#

在 OpenClaw 設定中定義為獨立代理：

1
{
2
  "id": "kimi-advisor",
3
  "name": "Kimi 顧問",
4
  "model": "nvidia/moonshotai/kimi-k2.5",
5
  "agentDir": "agents/kimi"
6
}

agentDir 讓這個代理擁有獨立的工作目錄，預設無法存取主代理的記憶庫或設定檔。

三重隔離機制#

環境隔離：Kimi 顧問擁有獨立目錄空間，無法讀取主代理的記憶檔或系統設定。
資料去識別化：主代理在傳送 Request 給 Kimi 前，先將 API Key、Token、私人路徑等替換成虛擬佔位符（如 <REDACTED_KEY>、/project/path）。
單向唯讀：顧問代理只負責分析與建議，不具備修改系統設定或寫入核心檔案的權限。

常見問題#

Q: Kimi K2.5 可以免費使用嗎？#

A: 可以。目前有兩種免費管道：透過 NVIDIA Build API 申請免費試用的 API Key，或使用 Ollama 的 kimi-k2.5:cloud 雲端模式。兩者都不需要自備 GPU，推理在遠端完成。NVIDIA Build 屬於 Trial Service，有一定的用量限制但足夠日常開發測試使用。

Q: OpenClaw 接入外部模型會不會洩漏我的 API Key 或私人資料？#

A: 有風險。OpenClaw 的主代理上下文中可能包含專案路徑、記憶檔案甚至 API Token 等敏感資訊，直接傳送給外部模型有洩漏的可能。建議的做法是將外部模型隔離為獨立子代理，透過 agentDir 限制其存取範圍，並在傳送 Request 前對資料進行去識別化處理。詳細設定方式可參考本文的隔離代理段落。

Q: NVIDIA Build API 和 Ollama Cloud 哪個比較適合 OpenClaw？#

A: 如果你需要整合進 OpenClaw 的代理系統，建議使用 NVIDIA Build API，因為它提供 OpenAI 相容格式，可以直接在 openclaw.json 中設定 provider。Ollama Cloud 雖然也免費，但走的是 Ollama 自己的 API 格式（localhost:11434），整合方式不同。如果你已經有 Ollama 環境，也可以考慮 Ollama Cloud 搭配本地 proxy 的方式。

總結#

Kimi K2.5 是 1T 參數的開源 MoE 模型，推理時僅啟動 32B，效能與效率兼具
透過 NVIDIA Build 免費 API 可在 5 分鐘內接入 OpenClaw
外部模型存在資料隱私風險，建議隔離為獨立子代理
三重隔離機制（環境隔離、資料去識別化、單向唯讀）確保核心資料安全
搭配 qmd 記憶系統可進一步提升代理的長期記憶與檢索能力
測試環境：macOS、OpenClaw、2026-02-11

參考來源：

@haltakov 的 Threads 教學貼文 haltakov/openclaw.json Gist（設定範例） Kimi K2.5 Model Card — NVIDIA NIM moonshotai/Kimi-K2.5 — Hugging Face MoonshotAI/Kimi-K2.5 — GitHub kimi-k2.5 — Ollama Ollama Cloud Models 說明 NVIDIA NIM 隱私討論 — NVIDIA Developer Forums