ACE-Step 1.5 is an open-source music generation foundation model with commercial-grade quality. It features a hybrid LM + DiT architecture supporting text-to-music, lyrics-to-song, audio repainting, covers, and LoRA fine-tuning. Requires GPU with at least 6GB VRAM.


ACE-Step 1.5 es un modelo fundacional de generación musical de código abierto con calidad comercial. Presenta una arquitectura híbrida LM + DiT que soporta texto a música, letras a canciones, repintado de audio, covers y ajuste fino con LoRA. Requiere GPU con al menos 6GB de VRAM.


ACE-Step 1.5 adalah model dasar generasi musik open-source dengan kualitas komersial. Menampilkan arsitektur hibrida LM + DiT yang mendukung teks-ke-musik, lirik-ke-lagu, audio repainting, cover, dan fine-tuning LoRA. Membutuhkan GPU dengan minimal 6GB VRAM.


ACE-Step 1.5 は商用品質のオープンソース音楽生成基盤モデルです。LM + DiT ハイブリッドアーキテクチャを採用し、テキストからの音楽生成、歌詞からの楽曲生成、オーディオリペイント、カバー、LoRA ファインチューニングに対応。最低 6GB VRAM の GPU が必要です。


ACE-Step 1.5

acestep

ACE-Step 1.5 是一款开源音乐生成基础模型，具有商业级品质。采用 LM + DiT 混合架构，支持文字生成音乐、歌词生成歌曲、音频重绘、翻唱和 LoRA 微调。需要至少 6GB 显存的 GPU。


ACE-Step 1.5 是一款開源音樂生成基礎模型，具有商業級品質。採用 LM + DiT 混合架構，支援文字生成音樂、歌詞生成歌曲、音訊重繪、翻唱和 LoRA 微調。需要至少 6GB 顯存的 GPU。


Mode	Port	Description
`gradio` (default)	7860	Interactive Gradio Web UI for music generation
`api`	8001	REST API server for programmatic access (`/generate`, `/health`)

VRAM	Mode	LM Model
6 GB	DiT-only (no LM)	None
6-8 GB	DiT + LM	`acestep-5Hz-lm-0.6B`
8-16 GB	DiT + LM	`acestep-5Hz-lm-1.7B`
16+ GB	DiT + LM	`acestep-5Hz-lm-4B`

ACE-Step 1.5

Services

acestep

ACE-Step 1.5

Features

Startup Mode

GPU Requirements

Configuration

Links

Services

acestep