logo
icon

ACE-Step 1.5

ACE-Step 1.5 es un modelo fundacional de generación musical de código abierto con calidad comercial. Presenta una arquitectura híbrida LM + DiT que soporta texto a música, letras a canciones, repintado de audio, covers y ajuste fino con LoRA. Requiere GPU con al menos 6GB de VRAM.

template cover
Implementado0 veces
EditorDumoeDss
Creado2026-03-21
Servicios
service icon
Mínimo4 Cores16 GB
Recomendado8 Cores32 GB
Etiquetas
AIMusicGPU

ACE-Step 1.5

ACE-Step 1.5 es un modelo fundacional de generación musical de código abierto desarrollado por StepFun y ACE Studio. Combina un planificador de Modelo de Lenguaje (LM) con un Transformer de Difusión (DiT) para producir música de calidad comercial.

Características

  • Texto a Música: Genera música a partir de descripciones de texto (género, estado de ánimo, BPM, tonalidad, etc.)
  • Letras a Canción: Genera canciones a partir de letras estructuradas
  • Repintado de Audio: Edita secciones específicas de audio existente
  • Continuación de Audio: Extiende clips de audio existentes
  • Entrenamiento LoRA: Ajusta fino con tus propios datos de audio

Modo de Inicio

Configure ACESTEP_MODE para elegir el servicio a iniciar:

ModoPuertoDescripción
gradio (predeterminado)7860Interfaz web interactiva Gradio
api8001Servidor REST API (/generate, /health)

Requisitos de GPU

VRAMModoModelo LM
6 GBSolo DiT (sin LM)Ninguno
6-8 GBDiT + LMacestep-5Hz-lm-0.6B
8-16 GBDiT + LMacestep-5Hz-lm-1.7B
16+ GBDiT + LMacestep-5Hz-lm-4B

Enlaces