
Conversa con cualquier LLM mediante voz manos libres, con interrupción por voz y un rostro hablante Live2D. Edición Cloud API: toda la inferencia se ejecuta vía APIs en la nube (LLM compatible con OpenAI por defecto Zeabur AI Hub, Groq Whisper para reconocimiento de voz y Edge-TTS gratuito). Sin GPU local requerida. ⚠️ Usa openllmvtuber/open-llm-vtuber:latest — el proyecto upstream está en desarrollo rápido, por lo que reiniciar el servicio puede traer cambios incompatibles.
Conversa con cualquier LLM mediante voz manos libres, con interrupción por voz y un rostro hablante Live2D. Edición Cloud API: toda la inferencia se ejecuta vía APIs en la nube (LLM compatible con OpenAI por defecto Zeabur AI Hub, Groq Whisper para reconocimiento de voz y Edge-TTS gratuito). Sin GPU local requerida. ⚠️ Usa openllmvtuber/open-llm-vtuber:latest — el proyecto upstream está en desarrollo rápido, por lo que reiniciar el servicio puede traer cambios incompatibles.

⚠️ Atención — el proyecto upstream está en desarrollo activo. Esta plantilla usa el tag
openllmvtuber/open-llm-vtuber:latest, por lo que reiniciar tu servicio puede traer una nueva compilación upstream con cambios incompatibles (esquema de configuración, bundle del frontend, modelos por defecto, etc.). Haz una copia de seguridad de/app/conf/conf.yamldesde la consola del servicio antes de reiniciar si lo has personalizado.
Open-LLM-VTuber es un VTuber de IA de código abierto que conversa con cualquier LLM mediante voz manos libres, interrupción por voz y un rostro hablante Live2D. Esta edición Cloud API ejecuta toda la inferencia a través de APIs en la nube — sin necesidad de GPU local, despliega en cualquier servidor Zeabur con un clic.
| Capa | Proveedor | Coste |
|---|---|---|
| LLM | Compatible con OpenAI (Zeabur AI Hub por defecto) | pago por token |
| ASR (voz a texto) | Groq Whisper-large-v3-turbo | nivel gratuito |
| TTS (texto a voz) | Microsoft Edge-TTS | gratis, sin clave |
| Live2D | renderizado en el navegador | gratis |
Sobre la auto-configuración de URL: El bundle del frontend upstream tiene
ws://127.0.0.1:12393hardcodeado como valor por defecto de WebSocket / Base URL (diseño para desarrollo local). Esta plantilla inyecta un pequeño script enindex.htmlal arrancar el contenedor para apuntar esos valores por defecto al origen actual de la página, evitando que tengas que tocar la UI de Settings. Si una versión upstream futura añade soporte de configuración en runtime, podremos quitar este parche.
| Proveedor | LLM_BASE_URL | LLM_MODEL |
|---|---|---|
| Zeabur AI Hub (por defecto) | https://hnd1.aihub.zeabur.ai/v1 | claude-haiku-4-5 |
| OpenAI | https://api.openai.com/v1 | gpt-4o-mini |
| Anthropic | https://api.anthropic.com/v1 | claude-haiku-4-5 |
| Google Gemini | https://generativelanguage.googleapis.com/v1beta/openai/ | gemini-2.5-flash |
| DeepSeek | https://api.deepseek.com/v1 | deepseek-chat |
| Groq | https://api.groq.com/openai/v1 | llama-3.3-70b-versatile |
Las 6 variables de entorno anteriores cubren la configuración común. Para cualquier otra cosa — cambio de personaje, herramientas MCP, intercambio de proveedor ASR/TTS, estilo de voz, etc. — edita /app/conf/conf.yaml directamente:
/app/conf/conf.yaml con el editor integrado del navegador, edítalo y guárdalo/app/conf es un volumen persistente — tus ediciones sobreviven a los reinicios. Las variables de entorno se reaplican en cada arranque y sobrescriben las claves yaml correspondientes, así que déjalas tal cual en tus ediciones si quieres que las env vars ganen.
Usa la plantilla Open-LLM-VTuber (Local GPU) — despliega en un servidor dedicado con GPU con Ollama, Whisper local y GPT-SoVITS. Consulta el Marketplace de Zeabur.
