



const main = async () => {
const response = await fetch('https://api.ai.cc/v2/generate/audio', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'stable-audio',
prompt: 'lo-fi pop hip-hop ambient music',
steps: 100,
seconds_total: 10,
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/generate/audio"
payload = {
"model": "stable-audio",
"prompt": "lo-fi pop hip-hop ambient music",
"steps": 100,
"seconds_total": 10,
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

Detalle del producto
🎵 Audio estable: descripción general del modelo avanzado de generación de audio con IA
Audio estable es un innovador modelo de generación de audio desarrollado por IA de estabilidad, lanzado oficialmente en Septiembre de 2023Esta tecnología de inteligencia artificial de vanguardia está diseñada para crear pistas de audio de alta calidad directamente a partir de indicaciones textuales, lo que la hace ideal para una amplia gama de aplicaciones creativas y profesionales.
✨ Características y capacidades clave
- ✓ Salida de alta fidelidad: Genera audio estéreo de calidad profesional a una velocidad impresionante. Frecuencia de muestreo de 44,1 kHz, garantizando una calidad de sonido rica y clara adecuada para diversos medios.
- ✓ Duración del audio estructurado: Capaz de producir pistas cohesivas que incorporan estructuras musicales distintivas, incluidas introducciones atractivas, desarrollos dinámicos y outros claros.
- ✓ Creación de sonido diverso: Stable Audio se destaca por generar una amplia gama de contenido de audio, desde melodías complejas y estilos musicales variados hasta efectos de sonido realistas, satisfaciendo las necesidades matizadas de músicos y diseñadores de sonido por igual.
Casos de uso previstos
Este modelo está diseñado principalmente para:
- ● Músicos y compositores: Para ayudar en la creación de nuevas piezas musicales, pistas de acompañamiento o paisajes sonoros experimentales.
- ● Diseñadores de sonido: Para generar efectos de sonido personalizados o fondos ambientales para juegos, películas, medios interactivos y otros proyectos multimedia.
- ● Desarrolladores: Integrar capacidades de generación de audio impulsadas por IA en diversas aplicaciones y plataformas.
Stable Audio procesa principalmente Indicaciones de texto en inglés, pero su arquitectura robusta permite el procesamiento de entradas multilingües dependiendo del contexto específico proporcionado.
⚙️ Especificaciones técnicas y arquitectura
Arquitectura subyacente
Stable Audio se basa en un sofisticado arquitectura del modelo de difusión latenteOptimizado meticulosamente para la síntesis de audio. Los componentes clave de su diseño incluyen:
- ● Autocodificador altamente comprimido: Facilita la representación eficiente y de alta calidad de formas de onda de audio complejas, cruciales para el procesamiento y la generación.
- ● Transformador de difusión (DiT): Este componente se destaca en la manipulación de datos en secuencias largas, lo que permite la generación de piezas de audio coherentes y bien estructuradas.
Datos de formación y curación
Las amplias capacidades del modelo se basan en su entrenamiento en un conjunto de datos vasto y diverso:
- ● Fuente de datos y escala: El conjunto de datos de entrenamiento fue seleccionado de Biblioteca de música AudioSparx, que abarca más de 800.000 archivos de audioEsta rica colección incluye una amplia gama de música, diversos efectos de sonido y ejemplos de instrumentos individuales, lo que proporciona una base integral para comprender los elementos de audio.
- ● Curación ética y diversidad: Se hizo hincapié en el respeto derechos de los creadores Durante la curación de datos, se incluye una opción de exclusión voluntaria para artistas. Este enfoque reflexivo minimiza posibles sesgos y garantiza que los resultados generados mantengan una representación diversa.
Métricas de rendimiento
Stable Audio demuestra constantemente un sólido desempeño en todos los indicadores clave:
Nota: En pantallas más pequeñas, el contenido de la tabla se puede desplazar horizontalmente para una legibilidad óptima.
💻 Guía de uso e integración de API
Acceso a API y ejemplos de código
Stable Audio está disponible para su integración a través de Plataforma API de IA/ML, donde figura como "Audio estable".
Generación de audio mediante programación:
// Ejemplo de solicitud de API para crear una generación de audio POST /audio.create-generation-stable Content-Type: application/json { "prompt": "una pista de synthwave futurista con un ritmo enérgico y melodías de neón", "model": "stable-audio", "duration": 45 // en segundos, hasta 47 } Recuperando audio generado:
// Ejemplo de llamada API para obtener el archivo de audio generado GET /audio.fetch-generation?id={generation_id} Aceptar: audio/mpeg Documentación completa de la API
Para obtener detalles detallados sobre los parámetros de solicitud, formatos de respuesta, autenticación y manejo de errores, consulte el sitio web oficial. Documentación de la API.
⚖️ Pautas éticas y licencias
Marco de desarrollo ético
Stability AI está profundamente comprometida con el fomento desarrollo ético de la IALos aspectos clave de su enfoque para Stable Audio incluyen:
- ● Transparencia: Mantener una comunicación clara sobre las capacidades del modelo, sus posibles aplicaciones y sus limitaciones inherentes.
- ● Derechos del creador: Garantizar que todos los datos de capacitación utilizados cumplan estrictamente con las leyes de derechos de autor y brindar a los artistas una visión clara mecanismo de exclusión voluntaria para el uso de sus contenidos en futuras formaciones.
Información de licencia
Stable Audio está disponible bajo una licencia comercialEsta licencia otorga a los usuarios derechos tanto para investigación como para aplicaciones comerciales, manteniendo al mismo tiempo el cumplimiento de los estándares éticos establecidos y respetando los derechos de propiedad intelectual.
Empieza tu aventura creativa con Stable Audio. Accede a la API y empieza. aquí.
❓ Preguntas frecuentes (FAQ)
P: ¿Qué es Stable Audio y quién lo desarrolló?
A: Stable Audio es un modelo avanzado de generación de audio con IA desarrollado por Stability AI, capaz de crear pistas de audio de alta calidad a partir de indicaciones de texto.
P: ¿Cuál es la duración máxima del audio que Stable Audio puede generar?
A: Stable Audio puede generar estructuras musicales coherentes y pistas de hasta 47 segundos de duración.
P: ¿Qué tipo de datos se utilizaron para entrenar Stable Audio?
R: El modelo se entrenó con un conjunto de datos amplio y diverso de más de 800.000 archivos de audio de la biblioteca de música AudioSparx, que incluye música, efectos de sonido y pistas de instrumentos individuales.
P: ¿Se puede utilizar Stable Audio para proyectos comerciales?
R: Sí, Stable Audio está disponible bajo una licencia comercial que permite tanto la investigación como el uso comercial, con adhesión a las pautas éticas y los derechos de los creadores.
P: ¿Dónde puedo acceder a la API de Stable Audio y su documentación?
R: La API de Stable Audio está disponible en la plataforma API AI/ML y se puede encontrar documentación completa en su portal de documentación oficial.
Patio de juegos de IA



Acceso