Afuera

Charlar

desactivar

Audio estable

Descubre Stable Audio de Stability AI, un modelo avanzado de generación de audio que crea pistas de alta calidad a partir de indicaciones de texto con funciones innovadoras.

Fichas de $1 gratis para nuevos miembros

Text to Speech

Javascript

Python

                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v2/generate/audio', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'stable-audio',
      prompt: 'lo-fi pop hip-hop ambient music',
      steps: 100,
      seconds_total: 10,
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main()

                                        import requests


def main():
    url = "https://api.ai.cc/v2/generate/audio"
    payload = {
        "model": "stable-audio",
        "prompt": "lo-fi pop hip-hop ambient music",
        "steps": 100,
        "seconds_total": 10,
    }
    headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}

    response = requests.post(url, json=payload, headers=headers)
    print("Generation:", response.json())


if __name__ == "__main__":
    main()

Docs

Más de 300 modelos de IA para OpenClaw y agentes de IA

Ahorra un 20% en costes y obtén fichas gratis de 1 $.

Obtén la clave API Explorar modelos

Audio estable

Detalles del producto

🎵 Audio estable: Descripción general del modelo avanzado de generación de audio mediante IA

Audio estable es un modelo innovador de generación de audio desarrollado por IA de estabilidad, lanzado oficialmente en Septiembre de 2023Esta tecnología de IA de vanguardia está diseñada para crear pistas de audio de alta calidad directamente a partir de indicaciones de texto, lo que permite su uso en un amplio espectro de aplicaciones creativas y profesionales.

✨ Características y capacidades clave

✓ Salida de alta fidelidad: Genera audio estéreo de calidad profesional a una velocidad impresionante. Frecuencia de muestreo de 44,1 kHz, lo que garantiza una calidad de sonido rica y nítida, adecuada para diversos medios.
✓ Duración del audio estructurado: Capaz de producir temas coherentes que incorporan estructuras musicales distintivas, incluyendo introducciones atractivas, desarrollos dinámicos y finales claros.
✓ Creación sonora diversa: Stable Audio destaca por generar una amplia gama de contenido de audio, desde melodías complejas y estilos musicales variados hasta efectos de sonido realistas, satisfaciendo las necesidades específicas tanto de músicos como de diseñadores de sonido.

🎯 Casos de uso previstos

Este modelo está diseñado principalmente para:

● Músicos y compositores: Para ayudar en la creación de nuevas piezas musicales, pistas de acompañamiento o paisajes sonoros experimentales.
● Diseñadores de sonido: Para generar efectos de sonido personalizados o música ambiental para juegos, películas, medios interactivos y otros proyectos multimedia.
● Desarrolladores: Integrar capacidades de generación de audio basadas en inteligencia artificial en diversas aplicaciones y plataformas.

El audio estable procesa principalmente Indicaciones de texto en inglés, pero su sólida arquitectura permite el procesamiento de entradas multilingües en función del contexto específico proporcionado.

⚙️ Especificaciones técnicas y arquitectura

Arquitectura subyacente

Stable Audio se basa en un sofisticado Arquitectura del modelo de difusión latente, meticulosamente optimizado para la síntesis de audio. Los componentes clave de su diseño incluyen:

● Autoencoder altamente comprimido: Facilita la representación eficiente y de alta calidad de formas de onda de audio complejas, algo crucial para su procesamiento y generación.
● Transformador de difusión (DiT): Este componente destaca por su capacidad para manipular datos en secuencias largas, lo que permite generar piezas de audio coherentes y bien estructuradas.

Datos de entrenamiento y curación

Las amplias capacidades del modelo se basan en su entrenamiento con un conjunto de datos vasto y diverso:

● Fuente y escala de los datos: El conjunto de datos de entrenamiento fue seleccionado a partir de Biblioteca musical de AudioSparx, abarcando más de 800.000 archivos de audioEsta rica colección incluye una amplia variedad de música, diversos efectos de sonido y pistas individuales de instrumentos, lo que proporciona una base integral para comprender los elementos de audio.
● Curación ética y diversidad: Se hizo hincapié en el respeto derechos del creador Durante la curación de datos, se incluye una opción para que los artistas no participen. Este enfoque minucioso minimiza los posibles sesgos y garantiza que los resultados generados mantengan una representación diversa.

Métricas de rendimiento

Stable Audio demuestra un rendimiento sólido de forma constante en los indicadores clave:

Métrico	Puntaje
Índice de calidad	Alto
Longitud máxima de pista generada	Hasta 47 segundos
Frecuencia de muestreo	44,1 kHz

Nota: En pantallas más pequeñas, el contenido de la tabla se puede desplazar horizontalmente para una legibilidad óptima.

💻 Guía de uso e integración de API

Acceso a la API y ejemplos de código

Stable Audio está disponible fácilmente para su integración a través de Plataforma API de IA/MLdonde aparece listado como "Audio estable".

Generación de audio mediante programación:

// Ejemplo de solicitud API para crear generación de audio POST /audio.create-generation-stable Content-Type: application/json { "prompt": "una pista synthwave futurista con un ritmo enérgico y melodías neón", "model": "stable-audio", "duration": 45 // en segundos, hasta 47 }

Recuperación de audio generado:

// Ejemplo de llamada a la API para obtener el archivo de audio generado GET /audio.fetch-generation?id={generation_id} Accept: audio/mpeg

Documentación completa de la API

Para obtener detalles en profundidad sobre los parámetros de solicitud, los formatos de respuesta, la autenticación y el manejo de errores, consulte la documentación oficial. Documentación de la API.

⚖️ Directrices éticas y licencias

Marco de desarrollo ético

Stability AI está profundamente comprometida con el fomento de desarrollo ético de la IALos aspectos clave de su enfoque para Stable Audio incluyen:

● Transparencia: Mantener una comunicación clara sobre las capacidades del modelo, sus posibles aplicaciones y sus limitaciones inherentes.
● Derechos del creador: Garantizar que todos los datos de entrenamiento utilizados cumplan estrictamente con las leyes de derechos de autor y proporcionar a los artistas una información clara. mecanismo de exclusión voluntaria para que su contenido se utilice en futuras capacitaciones.

Información sobre licencias

El audio estable se pone a disposición bajo una licencia comercialEsta licencia otorga a los usuarios derechos tanto para aplicaciones de investigación como comerciales, manteniendo siempre el cumplimiento de las normas éticas establecidas y respetando los derechos de propiedad intelectual.

Comienza tu viaje creativo con Stable Audio. Accede a la API y empieza ya. aquí.

❓ Preguntas frecuentes (FAQ)

P: ¿Qué es Stable Audio y quién lo desarrolló?

A: Stable Audio es un modelo avanzado de generación de audio mediante IA desarrollado por Stability AI, capaz de crear pistas de audio de alta calidad a partir de indicaciones de texto.

P: ¿Cuál es la duración máxima de audio que puede generar Stable Audio?

A: Stable Audio puede generar estructuras musicales coherentes y pistas de hasta 47 segundos de duración.

P: ¿Qué tipo de datos se utilizaron para entrenar Stable Audio?

A: El modelo fue entrenado con un conjunto de datos vasto y diverso de más de 800.000 archivos de audio de la biblioteca musical AudioSparx, que incluye música, efectos de sonido y pistas individuales de instrumentos.

P: ¿Se puede utilizar Stable Audio para proyectos comerciales?

R: Sí, Stable Audio está disponible bajo una licencia comercial que permite tanto la investigación como el uso comercial, respetando las directrices éticas y los derechos del creador.

P: ¿Dónde puedo acceder a la API de Stable Audio y a su documentación?

A: La API de Stable Audio está disponible en la plataforma de API de IA/ML, y la documentación completa se puede encontrar en su portal de documentación oficial.

Campo de juegos de IA

Pruebe todos los modelos de API en el entorno de pruebas antes de integrarlos. Ofrecemos más de 300 modelos para integrar en su aplicación.

Pruébalo gratis

Más de 300 modelos de IA para
OpenClaw y agentes de IA

Ahorre un 20% en costos

Fichas de $1 gratis para nuevos miembros