logo
icon

Open-LLM-VTuber (Cloud API)

Conversa con cualquier LLM mediante voz manos libres, con interrupción por voz y un rostro hablante Live2D. Edición Cloud API: toda la inferencia se ejecuta vía APIs en la nube (LLM compatible con OpenAI por defecto Zeabur AI Hub, Groq Whisper para reconocimiento de voz y Edge-TTS gratuito). Sin GPU local requerida. ⚠️ Usa openllmvtuber/open-llm-vtuber:latest — el proyecto upstream está en desarrollo rápido, por lo que reiniciar el servicio puede traer cambios incompatibles.

Conversa con cualquier LLM mediante voz manos libres, con interrupción por voz y un rostro hablante Live2D. Edición Cloud API: toda la inferencia se ejecuta vía APIs en la nube (LLM compatible con OpenAI por defecto Zeabur AI Hub, Groq Whisper para reconocimiento de voz y Edge-TTS gratuito). Sin GPU local requerida. ⚠️ Usa openllmvtuber/open-llm-vtuber:latest — el proyecto upstream está en desarrollo rápido, por lo que reiniciar el servicio puede traer cambios incompatibles.

PlataformaZeabur
Implementado0
EditorzeaburZeabur
Implementado0 veces
EditorzeaburZeabur
Creado2026-06-06
Etiquetas
AIVTuber

Servicios

Open-LLM-VTuber (Cloud API)

⚠️ Atención — el proyecto upstream está en desarrollo activo. Esta plantilla usa el tag openllmvtuber/open-llm-vtuber:latest, por lo que reiniciar tu servicio puede traer una nueva compilación upstream con cambios incompatibles (esquema de configuración, bundle del frontend, modelos por defecto, etc.). Haz una copia de seguridad de /app/conf/conf.yaml desde la consola del servicio antes de reiniciar si lo has personalizado.

Open-LLM-VTuber es un VTuber de IA de código abierto que conversa con cualquier LLM mediante voz manos libres, interrupción por voz y un rostro hablante Live2D. Esta edición Cloud API ejecuta toda la inferencia a través de APIs en la nube — sin necesidad de GPU local, despliega en cualquier servidor Zeabur con un clic.

Qué incluye esta plantilla

CapaProveedorCoste
LLMCompatible con OpenAI (Zeabur AI Hub por defecto)pago por token
ASR (voz a texto)Groq Whisper-large-v3-turbonivel gratuito
TTS (texto a voz)Microsoft Edge-TTSgratis, sin clave
Live2Drenderizado en el navegadorgratis

Inicio rápido

  1. Obtén una clave API de LLM — regístrate en Zeabur AI Hub para una clave que cubre Claude / GPT / Gemini / DeepSeek, o usa OpenAI / Anthropic directamente.
  2. (Opcional) Obtén una clave API de Groq — regístrate en console.groq.com para el STT Whisper gratis. Sin esto, la entrada de voz se desactiva pero el chat de texto sigue funcionando.
  3. Haz clic en Deploy y rellena las variables.
  4. Abre la URL desplegada — empieza a chatear o haz clic en el micrófono para hablar.

Sobre la auto-configuración de URL: El bundle del frontend upstream tiene ws://127.0.0.1:12393 hardcodeado como valor por defecto de WebSocket / Base URL (diseño para desarrollo local). Esta plantilla inyecta un pequeño script en index.html al arrancar el contenedor para apuntar esos valores por defecto al origen actual de la página, evitando que tengas que tocar la UI de Settings. Si una versión upstream futura añade soporte de configuración en runtime, podremos quitar este parche.

¿Quieres usar otro proveedor de LLM?

ProveedorLLM_BASE_URLLLM_MODEL
Zeabur AI Hub (por defecto)https://hnd1.aihub.zeabur.ai/v1claude-haiku-4-5
OpenAIhttps://api.openai.com/v1gpt-4o-mini
Anthropichttps://api.anthropic.com/v1claude-haiku-4-5
Google Geminihttps://generativelanguage.googleapis.com/v1beta/openai/gemini-2.5-flash
DeepSeekhttps://api.deepseek.com/v1deepseek-chat
Groqhttps://api.groq.com/openai/v1llama-3.3-70b-versatile

Configuración avanzada

Las 6 variables de entorno anteriores cubren la configuración común. Para cualquier otra cosa — cambio de personaje, herramientas MCP, intercambio de proveedor ASR/TTS, estilo de voz, etc. — edita /app/conf/conf.yaml directamente:

  1. Abre el servicio en el dashboard de Zeabur → pestaña Archivos
  2. Abre /app/conf/conf.yaml con el editor integrado del navegador, edítalo y guárdalo
  3. Reinicia el servicio

/app/conf es un volumen persistente — tus ediciones sobreviven a los reinicios. Las variables de entorno se reaplican en cada arranque y sobrescriben las claves yaml correspondientes, así que déjalas tal cual en tus ediciones si quieres que las env vars ganen.

¿Quieres inferencia GPU local?

Usa la plantilla Open-LLM-VTuber (Local GPU) — despliega en un servidor dedicado con GPU con Ollama, Whisper local y GPT-SoVITS. Consulta el Marketplace de Zeabur.

Enlaces