qwen-bg
max-ico04
Dans
Dehors
max-ico02
Chat
max-ico03
désactiver
Audio stable
Découvrez Stable Audio de Stability AI, un modèle de génération audio avancé qui crée des pistes de haute qualité à partir d'invites textuelles grâce à des fonctionnalités innovantes.
Jetons gratuits de 1 $ pour les nouveaux membres
Text to Speech
                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v2/generate/audio', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'stable-audio',
      prompt: 'lo-fi pop hip-hop ambient music',
      steps: 100,
      seconds_total: 10,
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main()

                                
                                        import requests


def main():
    url = "https://api.ai.cc/v2/generate/audio"
    payload = {
        "model": "stable-audio",
        "prompt": "lo-fi pop hip-hop ambient music",
        "steps": 100,
        "seconds_total": 10,
    }
    headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}

    response = requests.post(url, json=payload, headers=headers)
    print("Generation:", response.json())


if __name__ == "__main__":
    main()
Docs

Une seule API pour plus de 300 modèles d'IA

Économisez 20 % sur les coûts et recevez des jetons gratuits d'une valeur de 1 $.
qwenmax-bg
image
Audio stable

Détails du produit

🎵 Audio stable : Présentation du modèle avancé de génération audio par IA

Audio stable est un modèle innovant de génération audio développé par IA de stabilité, officiellement publié en Septembre 2023Cette technologie d'IA de pointe est conçue pour créer des pistes audio de haute qualité directement à partir d'instructions textuelles, et sert un large éventail d'applications créatives et professionnelles.

✨ Principales caractéristiques et fonctionnalités

  • Sortie haute fidélité : Génère un son stéréo de qualité professionnelle à un niveau impressionnant Fréquence d'échantillonnage de 44,1 kHz, garantissant une qualité sonore riche et claire, adaptée à divers supports.
  • Durée audio structurée : Capable de produire des morceaux cohérents intégrant des structures musicales distinctes, comprenant des intros accrocheuses, des développements dynamiques et des outros claires.
  • Création sonore diversifiée : Stable Audio excelle dans la génération d'une large gamme de contenus audio, allant de mélodies complexes et de styles musicaux variés à des effets sonores réalistes, répondant ainsi aux besoins nuancés des musiciens et des concepteurs sonores.

🎯 Cas d'utilisation prévus

Ce modèle est principalement conçu pour :

  • Musiciens et compositeurs : Pour faciliter la création de nouvelles pièces musicales, de pistes d'accompagnement ou de paysages sonores expérimentaux.
  • Concepteurs sonores : Pour la création d'effets sonores ou d'ambiances sonores sur mesure pour les jeux, les films, les médias interactifs et autres projets multimédias.
  • Développeurs : Intégrer des capacités de génération audio basées sur l'IA dans diverses applications et plateformes.

Stable Audio traite principalement les données audio invites de texte en anglaismais son architecture robuste permet le traitement d'entrées multilingues en fonction du contexte spécifique fourni.

⚙️ Spécifications techniques et architecture

Architecture sous-jacente

Stable Audio repose sur une technologie sophistiquée architecture du modèle de diffusion latente, méticuleusement optimisé pour la synthèse audio. Les principaux éléments de sa conception comprennent :

  • Autoencodeur hautement compressé : Permet une représentation efficace et de haute qualité des formes d'onde audio complexes, essentielle pour le traitement et la génération.
  • Diffusion Transformer (DiT): Ce composant excelle dans la manipulation de données sur de longues séquences, permettant la génération de morceaux audio cohérents et bien structurés.

Données d'entraînement et curation

Les capacités étendues du modèle reposent sur son entraînement sur un ensemble de données vaste et diversifié :

  • Source et échelle des données : L'ensemble de données d'entraînement a été constitué à partir de Bibliothèque musicale AudioSparx, englobant plus de 800 000 fichiers audioCette riche collection comprend un large éventail de musiques, d'effets sonores variés et de pistes instrumentales individuelles, offrant une base complète pour la compréhension des éléments audio.
  • Sélection éthique et diversité : L'accent a été mis sur le respect droits d'auteur Lors de la curation des données, une option de retrait est prévue pour les artistes. Cette approche réfléchie minimise les biais potentiels et garantit une représentation diversifiée des résultats obtenus.

Indicateurs de performance

Stable Audio affiche constamment d'excellentes performances sur l'ensemble des indicateurs clés :

Métrique Score
Indice de qualité Haut
Longueur de piste maximale générée Jusqu'à 47 secondes
Taux d'échantillonnage 44,1 kHz

Remarque : Sur les écrans plus petits, le contenu du tableau peut être défilé horizontalement pour une lisibilité optimale.

💻 Guide d'utilisation et intégration API

Exemples d'accès à l'API et de code

Stable Audio est facilement disponible pour l'intégration via le Plateforme API IA/ML, où il est répertorié comme « Audio stable ».

Générer de l'audio par programmation :

// Exemple de requête API pour créer une génération audio POST /audio.create-generation-stable Content-Type: application/json { "prompt": "un morceau synthwave futuriste avec un rythme entraînant et des mélodies néon", "model": "stable-audio", "duration": 45 // en secondes, jusqu'à 47 }

Récupération de l'audio généré :

// Exemple d'appel API pour récupérer le fichier audio généré GET /audio.fetch-generation?id={generation_id} Accept: audio/mpeg

Documentation API complète

Pour plus de détails sur les paramètres de requête, les formats de réponse, l'authentification et la gestion des erreurs, veuillez consulter la documentation officielle. Documentation de l'API.

⚖️ Lignes directrices éthiques et agrément

Cadre de développement éthique

Stability AI est profondément engagée à promouvoir développement éthique de l'IALes principaux aspects de leur approche pour Stable Audio sont les suivants :

  • Transparence: Maintenir une communication claire concernant les capacités du modèle, ses applications potentielles et ses limitations inhérentes.
  • Droits du créateur : S'assurer que toutes les données de formation utilisées respectent strictement les lois sur le droit d'auteur et fournir aux artistes des informations claires mécanisme de désinscription pour l'utilisation de leur contenu dans de futures formations.

Informations sur les licences

Stable Audio est mis à disposition sous une licence licence commercialeCette licence accorde aux utilisateurs des droits pour des applications de recherche et commerciales, tout en garantissant le respect des normes éthiques établies et des droits de propriété intellectuelle.

Lancez-vous dans la création avec Stable Audio. Accédez à l'API et commencez dès maintenant ! ici.

Foire aux questions (FAQ)

Q : Qu'est-ce que Stable Audio et qui l'a développé ?

A: Stable Audio est un modèle avancé de génération audio par IA développé par Stability AI, capable de créer des pistes audio de haute qualité à partir d'invites textuelles.

Q : Quelle est la durée maximale de l'audio que Stable Audio peut générer ?

A: Stable Audio peut générer des structures musicales cohérentes et des pistes d'une durée maximale de 47 secondes.

Q : Quel type de données a été utilisé pour entraîner Stable Audio ?

A : Le modèle a été entraîné sur un vaste ensemble de données diversifié de plus de 800 000 fichiers audio provenant de la bibliothèque musicale AudioSparx, comprenant de la musique, des effets sonores et des pistes d'instruments individuels.

Q : Peut-on utiliser Stable Audio pour des projets commerciaux ?

R : Oui, Stable Audio est disponible sous une licence commerciale qui autorise à la fois la recherche et l'utilisation commerciale, dans le respect des directives éthiques et des droits des créateurs.

Q : Où puis-je accéder à l'API de Stable Audio et à sa documentation ?

A: L'API de Stable Audio est disponible sur la plateforme d'API AI/ML, et une documentation complète est disponible sur son site web. portail de documentation officiel.

Terrain de jeu de l'IA

Testez tous les modèles d'API dans l'environnement de test avant de les intégrer. Nous proposons plus de 300 modèles à intégrer à votre application.
Essai gratuit
api-droite-1
modèle-bg02-1

Une API
Plus de 300 modèles d'IA

Économisez 20 % sur vos coûts