Dans

Dehors

Chat

désactiver

Aura

Deepgram Aura : un modèle TTS en temps réel fournissant des voix semblables à celles des humains pour des agents et applications d’IA conversationnelle réactifs et à haut débit via API.

Jetons gratuits de 1 $ pour les nouveaux membres

Text to Speech

Javascript

Python

                                        const fs = require('fs');
const path = require('path');

const axios = require('axios').default;
const api = new axios.create({
  baseURL: 'https://api.ai.cc/v1',
  headers: { Authorization: 'Bearer ' },
});

const main = async () => {
  const response = await api.post(
    '/tts',
    {
      model: '#g1_aura-asteria-en',
      text: 'Hi! What are you doing today?',
    },
    { responseType: 'stream' },
  );

  const dist = path.resolve(__dirname, './audio.wav');
  const writeStream = fs.createWriteStream(dist);

  response.data.pipe(writeStream);

  writeStream.on('close', () => console.log('Audio saved to:', dist));
};

main();

                                        import os
import requests


def main():
    url = "https://api.ai.cc/v1/tts"
    headers = {
        "Authorization": "Bearer ",
    }
    payload = {
        "model": "#g1_aura-asteria-en",
        "text": "Hi! What are you doing today?",
    }

    response = requests.post(url, headers=headers, json=payload, stream=True)
    dist = os.path.join(os.path.dirname(__file__), "audio.wav")

    with open(dist, "wb") as write_stream:
        for chunk in response.iter_content(chunk_size=8192):
            if chunk:
                write_stream.write(chunk)

    print("Audio saved to:", dist)


main()

Docs

Plus de 300 modèles d'IA pour OpenClaw et agents IA

Économisez 20 % sur les coûts et recevez des jetons gratuits d'une valeur de 1 $.

Obtenir la clé API Explorer les modèles

Aura

Détails du produit

Deepgram Aura : Révolutionner la synthèse vocale en temps réel

Découvrez la nouvelle génération d'IA conversationnelle avec Aura DeepgramLancée en juin 2023, Aura est un modèle d'IA de synthèse vocale (TTS) révolutionnaire, conçu pour répondre aux exigences des applications interactives en temps réel. Elle établit une nouvelle norme en matière de qualité vocale naturelle, de rapidité inégalée et d'efficacité remarquable, transformant ainsi la façon dont les développeurs conçoivent des expériences vocales réactives.

Promoteur: Deepgram

Date de sortie : Juin 2023

Type de modèle : Synthèse vocale (TTS)

Version: 1.0 (Version initiale)

✨Principales caractéristiques et avantages

✔️ Voix naturelles à faible latence : Accédez à une gamme variée de voix naturelles et humaines avec une latence nettement inférieure à celle de toute autre IA vocale.
🚀 Optimisé pour l'IA conversationnelle : Spécialement conçu pour les agents et applications d'IA conversationnelle réactives et en temps réel, garantissant des interactions fluides et dynamiques.
🔗 Intégration transparente : S'intègre sans effort à l'API de reconnaissance vocale Nova de Deepgram, leader du secteur, créant ainsi une solution d'IA vocale complète.
🌐 Prise en charge étendue des langues : Capable de gérer plusieurs langues, accents et dialectes avec une précision et une fluidité exceptionnelles.

💡Cas d'utilisation prévus

Deepgram Aura excelle dans les scénarios exigeants interactions vocales à haut débit et agents d'IA réactifsC'est le choix idéal pour :

• Service client: Des assistants virtuels avancés pour une expérience client améliorée.
• Assistants virtuels : Créer des assistants numériques très attrayants et réalistes.
• Systèmes de réponse vocale interactive (RVI) : Fournir des interactions téléphoniques automatisées naturelles et efficaces.

🗣️Voix Aura disponibles

Deepgram Aura propose une variété de voix anglaises distinctes pour s'adapter à différentes applications et préférences :

Astéria : `#g1_aura-asteria-en`
Héra : `#g1_aura-ici-un`
Directeur: `#g1_aura-luna-one`
Stella : `#g1_aura-stella-one`
Athéna : `#g1_aura-athena-en`
Zeus: `#g1_aura-zeus-en`
Orion : `#g1_aura-orion-one`
Arches : `#g1_aura-arcas-en`
Persée : `#g1_aura-perseus-en`
Angus : `#g1_aura-angus-en`
Orphée: `#g1_aura-orpheus-one`
Hélios : `#g1_aura-helios-en`

⚙️Analyse technique approfondie d'Aura

Architecture et performances

L'architecture d'Aura témoigne du leadership de Deepgram dans le domaine des technologies vocales. Optimisée pour une vitesse et une efficacité inégaléesElle se positionne comme l'option de synthèse vocale haute qualité la plus rapide du marché. Cette innovation repose sur la vaste expertise de Deepgram en matière de traitement et de modélisation de l'audio vocal, notamment pour les applications de diffusion en temps réel lorsqu'elle est associée à leurs modèles STT.

Indicateurs de performance : Aura offre des performances inégalées, avec une latence réduite et une qualité vocale supérieure à celle de tout autre modèle de synthèse vocale comparable. Son efficacité concrète est validée par de nombreux déploiements réussis chez les clients de Deepgram.

Données d'entraînement et source de données

Aura a été rigoureusement entraînée sur des millions d'heures de données audio de haute qualitéGrâce à cet entraînement approfondi, Aura est capable de produire des voix naturelles dans diverses langues et domaines. Deepgram a constitué avec soin un ensemble de données diversifié, garantissant ainsi ses performances optimales pour de nombreux cas d'utilisation. Le seuil de connaissances du modèle correspond à sa date de lancement initiale, en juin 2023.

Diversité et atténuation des préjugés : Deepgram privilégie un développement responsable de l'IA. Des mesures importantes ont été prises pour entraîner Aura sur des données diversifiées, minimisant activement les biais potentiels et garantissant des performances équitables pour différents groupes démographiques et cas d'utilisation.

📊Aura comparé aux autres modèles de synthèse vocale

Deepgram Aura surpasse systématiquement les autres modèles TTS populaires sur plusieurs dimensions critiques :

★ Qualité vocale supérieure : Offre des voix exceptionnellement naturelles et humaines, avec une grande précision et un minimum d'erreurs.
★ Réactivité inégalée : Option TTS de haute qualité la plus rapide, elle offre une faible latence et un débit élevé, essentiels pour les interactions en temps réel.
★ Rentabilité et adaptabilité : Conçu pour gérer des entrées diverses et s'adapter parfaitement à différents accents, dialectes et cas d'utilisation, offrant un excellent rapport qualité-prix.

🚀Premiers pas avec Deepgram Aura

Exemple d'utilisation de l'API

L'intégration de Deepgram Aura à vos applications est simple. Voici un exemple d'utilisation de l'API (l'exemple de code réel sera remplacé par un texte de remplacement) :

Pour une documentation détaillée et davantage d'exemples, veuillez vous référer à la documentation officielle de l'API Deepgram.

Lignes directrices éthiques et agrément

Deepgram est profondément engagé envers développement responsable de l'IALes considérations éthiques sont intégrées à la conception et au déploiement d'Aura. L'entreprise développe activement les fonctionnalités d'Aura, avec des projets continus visant à proposer des voix plus réalistes, une prise en charge linguistique supplémentaire et de nouvelles fonctionnalités innovantes afin de garantir un impact positif.

Type de licence : Deepgram Aura est disponible sous un modèle de licence flexible, prenant en charge une utilisation commerciale et non commerciale, avec une tarification adaptée à l'utilisation.

❓Foire aux questions (FAQ)

Q : Qu'est-ce que Deepgram Aura ?

A: Deepgram Aura est un modèle d'IA de synthèse vocale (TTS) de pointe conçu pour les applications d'IA conversationnelles en temps réel, offrant une qualité vocale proche de celle de l'humain à haute vitesse et avec une grande efficacité.

Q : Qu'est-ce qui différencie Aura des autres modèles TTS ?

A: Aura se distingue par sa latence exceptionnellement faible, sa qualité vocale supérieure et son optimisation spécifique pour une IA conversationnelle réactive, ce qui la rend idéale pour les expériences interactives en temps réel.

Q : Quels sont les principaux cas d'utilisation de Deepgram Aura ?

A: Aura est parfaitement adapté aux applications nécessitant des interactions vocales à haut débit, telles que les assistants virtuels de service client, les assistants virtuels généraux et les systèmes de réponse vocale interactive (RVI) avancés.

Q : Aura prend-il en charge plusieurs langues ?

R : Oui, Aura prend en charge plusieurs langues et est conçue pour gérer efficacement divers accents et dialectes, garantissant ainsi une large applicabilité mondiale.

Q : Comment puis-je accéder à Deepgram Aura ?

A: Deepgram Aura est accessible via une API et dispose d'une documentation détaillée. Il propose une licence flexible pour une utilisation commerciale et non commerciale, avec un prix basé sur l'utilisation.

Terrain de jeu de l'IA

Testez tous les modèles d'API dans l'environnement de test avant de les intégrer. Nous proposons plus de 300 modèles à intégrer à votre application.

Essai gratuit

Plus de 300 modèles d'IA pour
OpenClaw et agents IA

Économisez 20 % sur vos coûts

Jetons gratuits de 1 $ pour les nouveaux membres