起因:看到 Kimi K2.5 就想玩
最近在滑社群的時候看到有人分享 Kimi K2.5 的表現,號稱在多項 benchmark 上超越了不少主流模型。好奇心驅使之下,剛好看到 @haltakov 在 Threads 上的貼文,只要兩步就能在 OpenClaw 裡免費接入 Kimi K2.5——去 NVIDIA Build 申請 API Key,然後改一下 openclaw.json 就好。
看起來很簡單,於是就跟著動手了。
Kimi K2.5 是什麼?
Kimi K2.5 是由中國 AI 公司 Moonshot AI(月之暗面)在 2026 年 1 月發布的開源多模態模型,採用 MIT 授權。
幾個關鍵數字:
| 項目 | 規格 |
|---|---|
| 架構 | Mixture-of-Experts (MoE) |
| 總參數量 | 1 兆(1T) |
| 每次推理啟動參數 | 320 億(32B) |
| Context Window | 256K tokens |
| 視覺編碼器 | MoonViT(約 400M 參數) |
| 輸入類型 | 文字、圖片、影片(實驗性) |
| 訓練資料量 | 約 15T tokens(視覺+文字混合) |
在 SWE-Bench Verified 上拿到 80.9% 的解決率,在多項視覺與推理 benchmark 中表現突出。比較引人注目的是它的 Agent Swarm 技術,可以同時協調最多 100 個子代理並行處理任務,速度比單代理快 3~4.5 倍。
簡單來說,這是一個參數量驚人但推理效率不差的開源模型,尤其在程式碼審查和多模態理解方面很有潛力。
Ollama Cloud vs NVIDIA API:該怎麼選?
想用 Kimi K2.5,目前主要有兩種不用自架 GPU 的管道:
| 比較項目 | Ollama Cloud (kimi-k2.5:cloud) | NVIDIA Build API |
|---|---|---|
| 運作方式 | 安裝 Ollama 後直接 ollama run kimi-k2.5:cloud,推理在 Ollama 雲端完成 | 透過 OpenAI 相容 API 呼叫,推理在 NVIDIA 伺服器完成 |
| 本機需求 | 安裝 Ollama 即可,不需要 GPU | 不需安裝任何東西,純 API 呼叫 |
| 費用 | 免費(有每小時/每週用量限制) | 免費試用(Trial Service) |
| 整合方式 | Ollama API(localhost:11434) | OpenAI 相容 API(integrate.api.nvidia.com) |
| 隱私政策 | 官方聲明「不保留使用者資料」 | 本地部署 NIM 時不上傳資料;雲端 API 未明確說明是否用於訓練 |
| 適合場景 | 已有 Ollama 環境、想快速體驗 | 需要整合進 OpenClaw 等工具的 API 呼叫 |
補充:如果想完全在本機跑 Kimi K2.5,完整模型需要 630GB 顯示記憶體,即使用 Unsloth 量化到 1.8-bit 也要 240GB,基本上需要多張 H200 等級的 GPU。所以對大多數人來說,雲端方案是唯一務實的選擇。
我的選擇:因為目標是在 OpenClaw 裡當顧問代理用,需要 OpenAI 相容 API 格式,NVIDIA Build API 最直接。
設定步驟
跟著 @haltakov 的 Gist 操作,整個流程大概 5 分鐘。
Step 1:申請 NVIDIA API Key
- 前往 NVIDIA Build 註冊帳號
- 到 API Keys 頁面 建立一組新的 Key
- 複製下來備用(格式為
nvapi-...)
Step 2:修改 openclaw.json
💡 如果你是從 Clawdbot 遷移過來的用戶,配置路徑可能仍在
~/.clawdbot/。建議先完成從 Clawdbot 到 OpenClaw 的遷移再進行以下設定。
在專案根目錄的 openclaw.json 中加入 NVIDIA provider 設定:
{ "models": { "providers": { "nvidia": { "baseUrl": "https://integrate.api.nvidia.com/v1", "apiKey": "nvapi-xxxxxxxxxxxxxxxx", "api": "openai-completions", "models": [ { "id": "moonshotai/kimi-k2.5", "name": "Kimi K2.5", "reasoning": true, "input": ["text", "image"], "contextWindow": 256000, "maxTokens": 8192 } ] } } }}Step 3:在代理設定中加入 Kimi 模型
在 agents.models 區塊加入別名,方便後續指定。關於模型允許列表(agents.defaults.models)的運作機制與完整配置方式,可參考模型切換配置全解。
{ "nvidia/moonshotai/kimi-k2.5": { "alias": "kimi" }}設定好之後重啟 OpenClaw,就能在模型選單中看到 Kimi K2.5 了。
為什麼要隔離成獨立代理?
接通之後馬上想到一個問題:Kimi K2.5 畢竟是外部雲端模型,所有送出去的 prompt 都會經過第三方伺服器。而 OpenClaw 環境裡可能存有專案路徑、記憶檔案、甚至在對話中出現 API Token 等敏感資訊。
尤其 NVIDIA Build API 的隱私條款中,對於雲端 API 呼叫的資料是否用於模型訓練並未明確說明(僅本地部署的 NIM 明確保證「不上傳資料」)。在這種不確定性下,直接把整個主代理的上下文丟給外部模型,風險太高。
解法是:把 Kimi K2.5 隔離成一個獨立的子代理,只讓它處理去識別化後的技術問題。
設定隔離代理
1. 定義代理身分(SOUL.md)
在 agents/kimi/SOUL.md 中定義角色與限制:
你是一位專業的程式碼審查與邏輯分析顧問。你的職責是針對傳入的程式碼片段進行分析與建議。注意:你處於隔離環境中,無法存取外部檔案系統,請僅就提供的內容進行回應。
2. 註冊到代理列表
在 OpenClaw 設定中定義為獨立代理:
{ "id": "kimi-advisor", "name": "Kimi 顧問", "model": "nvidia/moonshotai/kimi-k2.5", "agentDir": "agents/kimi"}agentDir 讓這個代理擁有獨立的工作目錄,預設無法存取主代理的記憶庫或設定檔。
三重隔離機制
- 環境隔離:Kimi 顧問擁有獨立目錄空間,無法讀取主代理的記憶檔或系統設定。
- 資料去識別化:主代理在傳送 Request 給 Kimi 前,先將 API Key、Token、私人路徑等替換成虛擬佔位符(如
<REDACTED_KEY>、/project/path)。 - 單向唯讀:顧問代理只負責分析與建議,不具備修改系統設定或寫入核心檔案的權限。
常見問題
Q: Kimi K2.5 可以免費使用嗎?
A: 可以。目前有兩種免費管道:透過 NVIDIA Build API 申請免費試用的 API Key,或使用 Ollama 的 kimi-k2.5:cloud 雲端模式。兩者都不需要自備 GPU,推理在遠端完成。NVIDIA Build 屬於 Trial Service,有一定的用量限制但足夠日常開發測試使用。
Q: OpenClaw 接入外部模型會不會洩漏我的 API Key 或私人資料?
A: 有風險。OpenClaw 的主代理上下文中可能包含專案路徑、記憶檔案甚至 API Token 等敏感資訊,直接傳送給外部模型有洩漏的可能。建議的做法是將外部模型隔離為獨立子代理,透過 agentDir 限制其存取範圍,並在傳送 Request 前對資料進行去識別化處理。詳細設定方式可參考本文的隔離代理段落。
Q: NVIDIA Build API 和 Ollama Cloud 哪個比較適合 OpenClaw?
A: 如果你需要整合進 OpenClaw 的代理系統,建議使用 NVIDIA Build API,因為它提供 OpenAI 相容格式,可以直接在 openclaw.json 中設定 provider。Ollama Cloud 雖然也免費,但走的是 Ollama 自己的 API 格式(localhost:11434),整合方式不同。如果你已經有 Ollama 環境,也可以考慮 Ollama Cloud 搭配本地 proxy 的方式。
總結
- Kimi K2.5 是 1T 參數的開源 MoE 模型,推理時僅啟動 32B,效能與效率兼具
- 透過 NVIDIA Build 免費 API 可在 5 分鐘內接入 OpenClaw
- 外部模型存在資料隱私風險,建議隔離為獨立子代理
- 三重隔離機制(環境隔離、資料去識別化、單向唯讀)確保核心資料安全
- 搭配 qmd 記憶系統可進一步提升代理的長期記憶與檢索能力
- 測試環境:macOS、OpenClaw、2026-02-11
參考來源:
@haltakov 的 Threads 教學貼文 haltakov/openclaw.json Gist(設定範例) Kimi K2.5 Model Card — NVIDIA NIM moonshotai/Kimi-K2.5 — Hugging Face MoonshotAI/Kimi-K2.5 — GitHub kimi-k2.5
— Ollama Ollama Cloud Models 說明 NVIDIA NIM 隱私討論 — NVIDIA Developer Forums
回報錯字、失效連結,或告訴我你想看的延伸主題。