
ACE-Step 1.5 は商用品質のオープンソース音楽生成基盤モデルです。LM + DiT ハイブリッドアーキテクチャを採用し、テキストからの音楽生成、歌詞からの楽曲生成、オーディオリペイント、カバー、LoRA ファインチューニングに対応。最低 6GB VRAM の GPU が必要です。

ACE-Step 1.5 は StepFun と ACE Studio が開発したオープンソースの音楽生成基盤モデルです。言語モデル(LM)プランナーと拡散 Transformer(DiT)を組み合わせ、商用品質の音楽を生成します。
ACESTEP_MODE を設定して起動するサービスを選択:
| モード | ポート | 説明 |
|---|---|---|
gradio(デフォルト) | 7860 | インタラクティブな Gradio ウェブ UI |
api | 8001 | REST API サーバー(/generate、/health) |
| VRAM | モード | 言語モデル |
|---|---|---|
| 6 GB | DiT のみ(LM なし) | なし |
| 6-8 GB | DiT + LM | acestep-5Hz-lm-0.6B |
| 8-16 GB | DiT + LM | acestep-5Hz-lm-1.7B |
| 16+ GB | DiT + LM | acestep-5Hz-lm-4B |