logo
icon

ACE-Step 1.5

ACE-Step 1.5 は商用品質のオープンソース音楽生成基盤モデルです。LM + DiT ハイブリッドアーキテクチャを採用し、テキストからの音楽生成、歌詞からの楽曲生成、オーディオリペイント、カバー、LoRA ファインチューニングに対応。最低 6GB VRAM の GPU が必要です。

template cover
展開済み0
発行者DumoeDss
作成日2026-03-21
サービス
service icon
最小構成4 Cores16 GB
推奨構成8 Cores32 GB
タグ
AIMusicGPU

ACE-Step 1.5

ACE-Step 1.5 は StepFun と ACE Studio が開発したオープンソースの音楽生成基盤モデルです。言語モデル(LM)プランナーと拡散 Transformer(DiT)を組み合わせ、商用品質の音楽を生成します。

機能

  • テキストから音楽生成:テキスト記述から音楽を生成(ジャンル、ムード、BPM、キーなど)
  • 歌詞から楽曲生成:構造化された歌詞から完全な楽曲を生成
  • オーディオリペイント:既存オーディオの特定セクションを編集
  • オーディオ継続:既存オーディオクリップを延長
  • LoRA トレーニング:独自のオーディオデータでファインチューニング

起動モード

ACESTEP_MODE を設定して起動するサービスを選択:

モードポート説明
gradio(デフォルト)7860インタラクティブな Gradio ウェブ UI
api8001REST API サーバー(/generate/health

GPU 要件

VRAMモード言語モデル
6 GBDiT のみ(LM なし)なし
6-8 GBDiT + LMacestep-5Hz-lm-0.6B
8-16 GBDiT + LMacestep-5Hz-lm-1.7B
16+ GBDiT + LMacestep-5Hz-lm-4B

リンク