



const fs = require('fs');
const path = require('path');
const axios = require('axios').default;
const api = new axios.create({
baseURL: 'https://api.ai.cc/v1',
headers: { Authorization: 'Bearer ' },
});
const main = async () => {
const response = await api.post(
'/tts',
{
model: '#g1_aura-asteria-en',
text: 'Hi! What are you doing today?',
},
{ responseType: 'stream' },
);
const dist = path.resolve(__dirname, './audio.wav');
const writeStream = fs.createWriteStream(dist);
response.data.pipe(writeStream);
writeStream.on('close', () => console.log('Audio saved to:', dist));
};
main();
import os
import requests
def main():
url = "https://api.ai.cc/v1/tts"
headers = {
"Authorization": "Bearer ",
}
payload = {
"model": "#g1_aura-asteria-en",
"text": "Hi! What are you doing today?",
}
response = requests.post(url, headers=headers, json=payload, stream=True)
dist = os.path.join(os.path.dirname(__file__), "audio.wav")
with open(dist, "wb") as write_stream:
for chunk in response.iter_content(chunk_size=8192):
if chunk:
write_stream.write(chunk)
print("Audio saved to:", dist)
main()

Détails du produit
Deepgram Aura : Révolutionner la synthèse vocale en temps réel
Découvrez la nouvelle génération d'IA conversationnelle avec Aura DeepgramLancée en juin 2023, Aura est un modèle d'IA de synthèse vocale (TTS) révolutionnaire, conçu pour répondre aux exigences des applications interactives en temps réel. Elle établit une nouvelle norme en matière de qualité vocale naturelle, de rapidité inégalée et d'efficacité remarquable, transformant ainsi la façon dont les développeurs conçoivent des expériences vocales réactives.
Promoteur: Deepgram
Date de sortie : Juin 2023
Type de modèle : Synthèse vocale (TTS)
Version: 1.0 (Version initiale)
✨Principales caractéristiques et avantages
- ✔️ Voix naturelles à faible latence : Accédez à une gamme variée de voix naturelles et humaines avec une latence nettement inférieure à celle de toute autre IA vocale.
- 🚀 Optimisé pour l'IA conversationnelle : Spécialement conçu pour les agents et applications d'IA conversationnelle réactives et en temps réel, garantissant des interactions fluides et dynamiques.
- 🔗 Intégration transparente : S'intègre sans effort à l'API de reconnaissance vocale Nova de Deepgram, leader du secteur, créant ainsi une solution d'IA vocale complète.
- 🌐 Prise en charge étendue des langues : Capable de gérer plusieurs langues, accents et dialectes avec une précision et une fluidité exceptionnelles.
💡Cas d'utilisation prévus
Deepgram Aura excelle dans les scénarios exigeants interactions vocales à haut débit et agents d'IA réactifsC'est le choix idéal pour :
- • Service client: Des assistants virtuels avancés pour une expérience client améliorée.
- • Assistants virtuels : Créer des assistants numériques très attrayants et réalistes.
- • Systèmes de réponse vocale interactive (RVI) : Fournir des interactions téléphoniques automatisées naturelles et efficaces.
🗣️Voix Aura disponibles
Deepgram Aura propose une variété de voix anglaises distinctes pour s'adapter à différentes applications et préférences :
- Astéria : `#g1_aura-asteria-en`
- Héra : `#g1_aura-ici-un`
- Directeur: `#g1_aura-luna-one`
- Stella : `#g1_aura-stella-one`
- Athéna : `#g1_aura-athena-en`
- Zeus: `#g1_aura-zeus-en`
- Orion : `#g1_aura-orion-one`
- Arches : `#g1_aura-arcas-en`
- Persée : `#g1_aura-perseus-en`
- Angus : `#g1_aura-angus-en`
- Orphée: `#g1_aura-orpheus-one`
- Hélios : `#g1_aura-helios-en`
⚙️Analyse technique approfondie d'Aura
Architecture et performances
L'architecture d'Aura témoigne du leadership de Deepgram dans le domaine des technologies vocales. Optimisée pour une vitesse et une efficacité inégaléesElle se positionne comme l'option de synthèse vocale haute qualité la plus rapide du marché. Cette innovation repose sur la vaste expertise de Deepgram en matière de traitement et de modélisation de l'audio vocal, notamment pour les applications de diffusion en temps réel lorsqu'elle est associée à leurs modèles STT.
Indicateurs de performance : Aura offre des performances inégalées, avec une latence réduite et une qualité vocale supérieure à celle de tout autre modèle de synthèse vocale comparable. Son efficacité concrète est validée par de nombreux déploiements réussis chez les clients de Deepgram.
Données d'entraînement et source de données
Aura a été rigoureusement entraînée sur des millions d'heures de données audio de haute qualitéGrâce à cet entraînement approfondi, Aura est capable de produire des voix naturelles dans diverses langues et domaines. Deepgram a constitué avec soin un ensemble de données diversifié, garantissant ainsi ses performances optimales pour de nombreux cas d'utilisation. Le seuil de connaissances du modèle correspond à sa date de lancement initiale, en juin 2023.
Diversité et atténuation des préjugés : Deepgram privilégie un développement responsable de l'IA. Des mesures importantes ont été prises pour entraîner Aura sur des données diversifiées, minimisant activement les biais potentiels et garantissant des performances équitables pour différents groupes démographiques et cas d'utilisation.
📊Aura comparé aux autres modèles de synthèse vocale
Deepgram Aura surpasse systématiquement les autres modèles TTS populaires sur plusieurs dimensions critiques :
- ★ Qualité vocale supérieure : Offre des voix exceptionnellement naturelles et humaines, avec une grande précision et un minimum d'erreurs.
- ★ Réactivité inégalée : Option TTS de haute qualité la plus rapide, elle offre une faible latence et un débit élevé, essentiels pour les interactions en temps réel.
- ★ Rentabilité et adaptabilité : Conçu pour gérer des entrées diverses et s'adapter parfaitement à différents accents, dialectes et cas d'utilisation, offrant un excellent rapport qualité-prix.
🚀Premiers pas avec Deepgram Aura
Exemple d'utilisation de l'API
L'intégration de Deepgram Aura à vos applications est simple. Voici un exemple d'utilisation de l'API (l'exemple de code réel sera remplacé par un texte de remplacement) :
Pour une documentation détaillée et davantage d'exemples, veuillez vous référer à la documentation officielle de l'API Deepgram.
Lignes directrices éthiques et agrément
Deepgram est profondément engagé envers développement responsable de l'IALes considérations éthiques sont intégrées à la conception et au déploiement d'Aura. L'entreprise développe activement les fonctionnalités d'Aura, avec des projets continus visant à proposer des voix plus réalistes, une prise en charge linguistique supplémentaire et de nouvelles fonctionnalités innovantes afin de garantir un impact positif.
Type de licence : Deepgram Aura est disponible sous un modèle de licence flexible, prenant en charge une utilisation commerciale et non commerciale, avec une tarification adaptée à l'utilisation.
❓Foire aux questions (FAQ)
A: Deepgram Aura est un modèle d'IA de synthèse vocale (TTS) de pointe conçu pour les applications d'IA conversationnelles en temps réel, offrant une qualité vocale proche de celle de l'humain à haute vitesse et avec une grande efficacité.
A: Aura se distingue par sa latence exceptionnellement faible, sa qualité vocale supérieure et son optimisation spécifique pour une IA conversationnelle réactive, ce qui la rend idéale pour les expériences interactives en temps réel.
A: Aura est parfaitement adapté aux applications nécessitant des interactions vocales à haut débit, telles que les assistants virtuels de service client, les assistants virtuels généraux et les systèmes de réponse vocale interactive (RVI) avancés.
R : Oui, Aura prend en charge plusieurs langues et est conçue pour gérer efficacement divers accents et dialectes, garantissant ainsi une large applicabilité mondiale.
A: Deepgram Aura est accessible via une API et dispose d'une documentation détaillée. Il propose une licence flexible pour une utilisation commerciale et non commerciale, avec un prix basé sur l'utilisation.
Terrain de jeu de l'IA



Se connecter