



const fs = require('fs');
const path = require('path');
const axios = require('axios').default;
const api = new axios.create({
baseURL: 'https://api.ai.cc/v1',
headers: { Authorization: 'Bearer ' },
});
const main = async () => {
const response = await api.post(
'/tts',
{
model: '#g1_aura-asteria-en',
text: 'Hi! What are you doing today?',
},
{ responseType: 'stream' },
);
const dist = path.resolve(__dirname, './audio.wav');
const writeStream = fs.createWriteStream(dist);
response.data.pipe(writeStream);
writeStream.on('close', () => console.log('Audio saved to:', dist));
};
main();
import os
import requests
def main():
url = "https://api.ai.cc/v1/tts"
headers = {
"Authorization": "Bearer ",
}
payload = {
"model": "#g1_aura-asteria-en",
"text": "Hi! What are you doing today?",
}
response = requests.post(url, headers=headers, json=payload, stream=True)
dist = os.path.join(os.path.dirname(__file__), "audio.wav")
with open(dist, "wb") as write_stream:
for chunk in response.iter_content(chunk_size=8192):
if chunk:
write_stream.write(chunk)
print("Audio saved to:", dist)
main()

Detalles del producto
Deepgram Aura: Revolucionando la conversión de texto a voz en tiempo real.
Experimenta la próxima generación de IA conversacional con Aura de DeepgramLanzada en junio de 2023, Aura es un revolucionario modelo de IA de conversión de texto a voz (TTS) diseñado para las exigencias de las aplicaciones interactivas en tiempo real. Establece un nuevo estándar en calidad de voz similar a la humana, velocidad sin precedentes y una eficiencia excepcional, transformando la forma en que los desarrolladores crean experiencias de IA de voz con gran capacidad de respuesta.
Revelador: Deepgram
Fecha de lanzamiento: Junio de 2023
Tipo de modelo: Conversión de texto a voz (TTS)
Versión: 1.0 (Versión inicial)
✨Características y ventajas principales
- ✔️ Voces naturales de baja latencia: Acceda a una amplia gama de voces naturales y similares a las humanas con una latencia significativamente menor en comparación con cualquier otra IA de voz.
- 🚀 Optimizado para IA conversacional: Diseñado específicamente para agentes y aplicaciones de IA conversacionales que responden rápidamente y en tiempo real, garantizando interacciones fluidas y dinámicas.
- 🔗 Integración perfecta: Se integra sin esfuerzo con la API Nova Speech-to-Text de Deepgram, líder en el sector, creando una solución completa de IA de voz.
- 🌐 Amplio soporte lingüístico: Capaz de manejar múltiples idiomas, acentos y dialectos con una precisión y fluidez excepcionales.
💡Casos de uso previstos
Deepgram Aura destaca en escenarios exigentes. interacciones de voz de alto rendimiento y agentes de IA receptivosEs la opción ideal para:
- • Servicio al cliente: Impulsamos asistentes virtuales avanzados para mejorar la experiencia del cliente.
- • Asistentes virtuales: Creación de asistentes digitales altamente atractivos y realistas.
- • Sistemas de respuesta de voz interactiva (IVR): Ofrecer interacciones telefónicas automatizadas, naturales y eficientes.
🗣️Voces de Aura disponibles
Deepgram Aura ofrece una variedad de voces en inglés distintas para adaptarse a diferentes aplicaciones y preferencias:
- Asteria: `#g1_aura-asteria-en`
- Hera: `#g1_aura-aquí-uno`
- Gerente: `#g1_aura-luna-one`
- Stella: `#g1_aura-stella-one`
- Atenea: `#g1_aura-athena-en`
- Zeus: `#g1_aura-zeus-en`
- Orión: `#g1_aura-orion-one`
- Arcas: `#g1_aura-arcas-en`
- Perseo: `#g1_aura-perseus-en`
- Angus: `#g1_aura-angus-en`
- Orfeo: `#g1_aura-orpheus-one`
- Helios: `#g1_aura-helios-en`
⚙️Análisis técnico en profundidad de Aura
Arquitectura y rendimiento
La arquitectura de Aura es un testimonio del liderazgo de Deepgram en tecnología de voz. Optimizado para velocidad y eficiencia inigualablesSe posiciona como la opción de síntesis de voz de alta calidad más rápida disponible. Esta innovación surge de la amplia experiencia de Deepgram en el procesamiento y modelado de audio de voz, especialmente para casos de uso de transmisión en tiempo real, cuando se combina con sus modelos de síntesis de voz.
Métricas de rendimiento: Aura ofrece un rendimiento inigualable, con una latencia menor y una calidad de voz superior en comparación con cualquier otro modelo TTS similar. Su eficacia en el mundo real está avalada por implementaciones exitosas con numerosos clientes de Deepgram.
Datos de entrenamiento y fuente de datos
Aura ha sido entrenada rigurosamente en millones de horas de datos de audio de alta calidadEste entrenamiento exhaustivo le permite producir voces con un sonido natural en diversos idiomas y ámbitos. Deepgram ha seleccionado meticulosamente un conjunto de datos diverso, lo que garantiza el sólido rendimiento de Aura en una amplia gama de casos de uso. El umbral de conocimiento del modelo coincide con su lanzamiento inicial en junio de 2023.
Diversidad y mitigación de prejuicios: Deepgram prioriza el desarrollo responsable de la IA. Se han tomado medidas importantes para entrenar a Aura con datos diversos, minimizando activamente los posibles sesgos y garantizando un rendimiento equitativo en diferentes grupos demográficos y casos de uso.
📊Aura frente a otros modelos TTS
Deepgram Aura supera sistemáticamente a otros modelos de síntesis de voz populares en varias dimensiones críticas:
- ★ Calidad de voz superior: Ofrece voces excepcionalmente naturales y humanas con gran precisión y mínimos errores.
- ★ Capacidad de respuesta inigualable: Como la opción de síntesis de voz de alta calidad más rápida, ofrece baja latencia y alto rendimiento, características cruciales para las interacciones en tiempo real.
- ★ Rentabilidad y adaptabilidad: Diseñado para procesar diversas entradas y adaptarse sin problemas a diferentes acentos, dialectos y casos de uso, ofreciendo una excelente relación calidad-precio.
🚀Primeros pasos con Deepgram Aura
Ejemplo de uso de la API
Integrar Deepgram Aura en tus aplicaciones es muy sencillo. Aquí tienes un ejemplo típico de uso de la API (marcador de posición para el ejemplo de código real):
Para obtener documentación detallada y más ejemplos, consulte la documentación oficial de la API de Deepgram.
Directrices éticas y licencias
Deepgram está profundamente comprometido con desarrollo responsable de la IALas consideraciones éticas están integradas en el ciclo de vida de diseño e implementación de Aura. La empresa amplía activamente las capacidades de Aura, con planes continuos para lograr voces más realistas, compatibilidad con idiomas adicionales y nuevas funciones innovadoras que garanticen un impacto positivo.
Tipo de licencia: Deepgram Aura está disponible bajo un modelo de licencia flexible que admite tanto el uso comercial como el no comercial, con precios que varían en función del uso.
❓Preguntas frecuentes (FAQ)
A: Deepgram Aura es un modelo de IA de conversión de texto a voz (TTS) de última generación diseñado para aplicaciones de IA conversacionales en tiempo real, que ofrece una calidad de voz similar a la humana con alta velocidad y eficiencia.
A: Aura destaca por su latencia excepcionalmente baja, su calidad de voz superior y su optimización específica para una IA conversacional receptiva, lo que la hace ideal para experiencias interactivas en tiempo real.
A: Aura es la más adecuada para aplicaciones que requieren interacciones de voz de alto rendimiento, como asistentes virtuales de atención al cliente, asistentes virtuales generales y sistemas avanzados de respuesta de voz interactiva (IVR).
R: Sí, Aura admite varios idiomas y está diseñado para gestionar eficazmente diversos acentos y dialectos, lo que garantiza una amplia aplicabilidad global.
A: Deepgram Aura es accesible a través de una API, con documentación detallada disponible. Ofrece licencias flexibles tanto para uso comercial como no comercial, con precios basados en el uso.
Campo de juegos de IA



Acceso