logo
icon

Open-LLM-VTuber (Cloud API)

Live2D の話す顔と音声割り込みに対応した、ハンズフリー音声で任意の LLM と対話できる AI VTuber。クラウド API 版:LLM は OpenAI 互換 API(デフォルトは Zeabur AI Hub)、音声入力は Groq Whisper、音声出力は無料の Edge-TTS。GPU 不要。⚠️ openllmvtuber/open-llm-vtuber:latest を pin しているため、上流の活発な開発によりサービス再起動で破壊的変更が入る可能性があります。

Live2D の話す顔と音声割り込みに対応した、ハンズフリー音声で任意の LLM と対話できる AI VTuber。クラウド API 版:LLM は OpenAI 互換 API(デフォルトは Zeabur AI Hub)、音声入力は Groq Whisper、音声出力は無料の Edge-TTS。GPU 不要。⚠️ openllmvtuber/open-llm-vtuber:latest を pin しているため、上流の活発な開発によりサービス再起動で破壊的変更が入る可能性があります。

プラットフォームZeabur
展開済み0
発行者zeaburZeabur
展開済み0
発行者zeaburZeabur
作成日2026-06-06
タグ
AIVTuber

サービス

Open-LLM-VTuber(クラウド API 版)

⚠️ 注意:上流は活発に開発中です。 このテンプレートは openllmvtuber/open-llm-vtuber:latest を pin しているため、サービスを再起動すると破壊的変更を含む新しい上流ビルド(conf スキーマ、フロントエンドバンドル、デフォルトモデル等)に更新される可能性があります。/app/conf/conf.yaml をカスタマイズしている場合は、再起動前にサービスコンソールでスナップショットを取得してください。

Open-LLM-VTuber は、ハンズフリーの音声対話、音声割り込み、Live2D の話す顔を備えたオープンソース AI VTuber です。このクラウド API 版は、すべての推論をクラウド API で処理します — GPU 不要、任意の Zeabur サーバーにワンクリックでデプロイできます。

このテンプレートの構成

レイヤープロバイダーコスト
LLMOpenAI 互換(デフォルトは Zeabur AI Hub)トークン従量課金
ASR(音声認識)Groq Whisper-large-v3-turbo無料枠
TTS(音声合成)Microsoft Edge-TTS無料、キー不要
Live2Dブラウザでレンダリング無料

クイックスタート

  1. LLM API キーを取得Zeabur AI Hub で Claude / GPT / Gemini / DeepSeek をまとめて使えるキーを登録するか、OpenAI / Anthropic を直接利用してください。
  2. (任意)Groq API キーを取得console.groq.com で無料の Whisper STT を申請。空欄の場合は音声入力が無効になりますが、テキスト対話は引き続き可能です。
  3. Deploy をクリックして変数を入力。
  4. デプロイされた URL を開く — 対話を始めるか、マイクをクリックして話してください。

URL 自動設定について:上流のフロントエンドバンドルは ws://127.0.0.1:12393 を WebSocket / Base URL のデフォルトとしてハードコードしています(ローカル開発向け設計)。このテンプレートはコンテナ起動時に index.html へ小さなスクリプトを注入し、これらのデフォルトを現在のページ origin に向けることで、ユーザーが Settings UI を触る必要をなくしています。上流が将来 runtime 設定をサポートすれば、このパッチは削除できます。

他の LLM プロバイダーを使用したい場合

プロバイダーLLM_BASE_URLLLM_MODEL
Zeabur AI Hub (デフォルト)https://hnd1.aihub.zeabur.ai/v1claude-haiku-4-5
OpenAIhttps://api.openai.com/v1gpt-4o-mini
Anthropichttps://api.anthropic.com/v1claude-haiku-4-5
Google Geminihttps://generativelanguage.googleapis.com/v1beta/openai/gemini-2.5-flash
DeepSeekhttps://api.deepseek.com/v1deepseek-chat
Groqhttps://api.groq.com/openai/v1llama-3.3-70b-versatile

高度な設定

上記 6 つの env var で一般的な設定はカバーされます。その他の設定(Live2D キャラクター切替、MCP ツール、ASR/TTS プロバイダー切替、音声スタイル等)は /app/conf/conf.yaml を直接編集してください:

  1. Zeabur ダッシュボードで該当 service を開く → ファイル タブ
  2. /app/conf/conf.yaml を開き、ブラウザ内エディタで直接編集して保存
  3. service を再起動

/app/conf は永続ボリュームです — 編集内容は再起動しても残ります。上記 6 つの env var は起動のたびに対応する yaml キーを上書きするため、env var を優先したい場合はこれらのキーを yaml で触らないでください。

ローカル GPU 推論を使用したい場合

Open-LLM-VTuber(ローカル GPU 版) テンプレートを使用してください — Ollama、ローカル Whisper、GPT-SoVITS を備えた GPU 専用サーバーにデプロイします。詳細は Zeabur Marketplace をご覧ください。

リンク