
與任何 LLM 進行免提語音對話,支援打斷與 Live2D 動態頭像。雲端 API 版本:LLM 走 OpenAI 相容 API(預設 Zeabur AI Hub)、語音輸入用 Groq Whisper、語音輸出用免費的 Edge-TTS,無需 GPU。⚠️ 鎖在 openllmvtuber/open-llm-vtuber:latest,上游仍處於快速開發階段,重啟 service 可能拉到含 breaking change 的新版本。
與任何 LLM 進行免提語音對話,支援打斷與 Live2D 動態頭像。雲端 API 版本:LLM 走 OpenAI 相容 API(預設 Zeabur AI Hub)、語音輸入用 Groq Whisper、語音輸出用免費的 Edge-TTS,無需 GPU。⚠️ 鎖在 openllmvtuber/open-llm-vtuber:latest,上游仍處於快速開發階段,重啟 service 可能拉到含 breaking change 的新版本。

⚠️ 請注意,上游仍處於快速開發階段。 此模板使用
openllmvtuber/open-llm-vtuber:latestimage tag — 重啟 service 可能會拉到含 breaking change 的新版本(conf 結構、frontend bundle、預設模型等)。若你在/app/conf/conf.yaml有自訂內容,重啟前請先從 service console 備份一份。
Open-LLM-VTuber 是一個開源 AI VTuber,可與任何 LLM 進行免提語音對話、支援打斷,並搭配 Live2D 動態頭像。此雲端 API 版本將所有推論都走雲端 API — 無需 GPU,一鍵部署到任何 Zeabur 主機。
| 層級 | 供應商 | 費用 |
|---|---|---|
| LLM | OpenAI 相容(預設 Zeabur AI Hub) | 依用量計費 |
| ASR(語音轉文字) | Groq Whisper-large-v3-turbo | 免費額度 |
| TTS(文字轉語音) | Microsoft Edge-TTS | 免費、不需 key |
| Live2D | 瀏覽器渲染 | 免費 |
關於自動 URL 設定:上游 frontend 把
ws://127.0.0.1:12393寫死當 WebSocket / Base URL 預設(本地開發思維)。此 template 在容器啟動時注入一段 script 到index.html,把這些預設改成當前頁面 origin,使用者不需要進 Settings 改。未來上游若加 runtime config,可拿掉這個 patch。
| 供應商 | LLM_BASE_URL | LLM_MODEL |
|---|---|---|
| Zeabur AI Hub (預設) | https://hnd1.aihub.zeabur.ai/v1 | claude-haiku-4-5 |
| OpenAI | https://api.openai.com/v1 | gpt-4o-mini |
| Anthropic | https://api.anthropic.com/v1 | claude-haiku-4-5 |
| Google Gemini | https://generativelanguage.googleapis.com/v1beta/openai/ | gemini-2.5-flash |
| DeepSeek | https://api.deepseek.com/v1 | deepseek-chat |
| Groq | https://api.groq.com/openai/v1 | llama-3.3-70b-versatile |
上面 6 個 env var 涵蓋常用設定。其他想動的(換 Live2D 角色、開關 MCP 工具、切 ASR/TTS 供應商、調語音風格等)直接編 /app/conf/conf.yaml:
/app/conf/conf.yaml,點開直接在瀏覽器內編輯、改完存檔/app/conf 是持久化 volume — 編輯後重啟不會掉。上面那 6 個 env var 每次開機都會覆蓋對應的 yaml key,所以你如果想讓 env var 為準,這些 key 不用在 yaml 動。
請使用 Open-LLM-VTuber(地端 GPU 版) 模板 — 部署到含 GPU 的 dedicated server,搭配 Ollama、本地 Whisper、GPT-SoVITS。詳見 Zeabur Marketplace。
