qwen-bg
max-ico04
En
Afuera
max-ico02
Charlar
max-ico03
desactivar
Aura
Deepgram Aura: un modelo TTS en tiempo real que ofrece voces similares a las humanas para agentes y aplicaciones de IA conversacionales de alto rendimiento y receptivos a través de API.
Tokens gratis de $1 para nuevos miembros
Text to Speech
                                        const fs = require('fs');
const path = require('path');

const axios = require('axios').default;
const api = new axios.create({
  baseURL: 'https://api.ai.cc/v1',
  headers: { Authorization: 'Bearer ' },
});

const main = async () => {
  const response = await api.post(
    '/tts',
    {
      model: '#g1_aura-asteria-en',
      text: 'Hi! What are you doing today?',
    },
    { responseType: 'stream' },
  );

  const dist = path.resolve(__dirname, './audio.wav');
  const writeStream = fs.createWriteStream(dist);

  response.data.pipe(writeStream);

  writeStream.on('close', () => console.log('Audio saved to:', dist));
};

main();

                                
                                        import os
import requests


def main():
    url = "https://api.ai.cc/v1/tts"
    headers = {
        "Authorization": "Bearer ",
    }
    payload = {
        "model": "#g1_aura-asteria-en",
        "text": "Hi! What are you doing today?",
    }

    response = requests.post(url, headers=headers, json=payload, stream=True)
    dist = os.path.join(os.path.dirname(__file__), "audio.wav")

    with open(dist, "wb") as write_stream:
        for chunk in response.iter_content(chunk_size=8192):
            if chunk:
                write_stream.write(chunk)

    print("Audio saved to:", dist)


main()
Docs

Una API con más de 300 modelos de IA

Ahorre un 20% en costos y $1 en tokens gratis
qwenmax-bg
imagen
Aura

Detalle del producto

Deepgram Aura: Revolucionando la conversión de texto a voz en tiempo real

Experimente la próxima generación de IA conversacional con Aura de DeepgramLanzado en junio de 2023, Aura es un innovador modelo de IA de texto a voz (TTS) diseñado para las demandas de las aplicaciones interactivas en tiempo real. Establece un nuevo estándar de calidad de voz similar a la humana, velocidad inigualable y eficiencia excepcional, transformando la forma en que los desarrolladores crean experiencias de IA de voz responsivas.

Revelador: Deepgram

Fecha de lanzamiento: Junio ​​de 2023

Tipo de modelo: Texto a voz (TTS)

Versión: 1.0 (versión inicial)

Características y ventajas clave

  • ✔️ Voces naturales de baja latencia: Acceda a una amplia gama de voces naturales y similares a las humanas, con una latencia significativamente menor en comparación con cualquier IA de voz alternativa.
  • 🚀 Optimizado para IA conversacional: Diseñado específicamente para agentes y aplicaciones de IA conversacionales receptivos y en tiempo real, lo que garantiza interacciones fluidas y dinámicas.
  • 🔗 Integración perfecta: Se integra sin esfuerzo con la API de voz a texto Nova de Deepgram, líder en la industria, creando una solución de inteligencia artificial de voz completa.
  • 🌐 Amplio soporte de idiomas: Capaz de manejar múltiples idiomas, acentos y dialectos con excepcional precisión y fluidez.

💡Casos de uso previstos

Deepgram Aura destaca en escenarios exigentes interacciones de voz de alto rendimiento y agentes de IA receptivosEs la opción ideal para:

  • Servicio al cliente: Impulsando asistentes virtuales avanzados para mejorar la experiencia del cliente.
  • Asistentes virtuales: Creación de asistentes digitales muy atractivos y realistas.
  • Sistemas de respuesta de voz interactiva (IVR): Ofreciendo interacciones telefónicas automatizadas, naturales y eficientes.

🗣️Voces de aura disponibles

Deepgram Aura ofrece una variedad de voces en inglés distintas para adaptarse a diferentes aplicaciones y preferencias:

  • Asteria: `#g1_aura-asteria-en`
  • Hera: `#g1_aura-aquí-uno`
  • Gerente: `#g1_aura-luna-uno`
  • Estela: `#g1_aura-stella-one`
  • Atenea: `#g1_aura-athena-es`
  • Zeus: `#g1_aura-zeus-es`
  • Orión: `#g1_aura-orion-one`
  • Arcas: `#g1_aura-arcas-en`
  • Perseo: `#g1_aura-perseus-en`
  • Angus: `#g1_aura-angus-es`
  • Orfeo: `#g1_aura-orfeo-uno`
  • Helios: `#g1_aura-helios-en`

⚙️Análisis técnico profundo de Aura

Arquitectura y rendimiento

La arquitectura de Aura es un testimonio del liderazgo de Deepgram en tecnología de voz. Optimizado para Velocidad y eficiencia inigualablesSe posiciona como la opción TTS de alta calidad más rápida disponible. Esta innovación se basa en la amplia experiencia de Deepgram en el procesamiento y modelado de audio de voz, especialmente para casos de uso de streaming en tiempo real cuando se combina con sus modelos STT.

Métricas de rendimiento: Aura ofrece un rendimiento inigualable, con una latencia más baja y una calidad de voz superior a la de cualquier otro modelo TTS comparable. Su eficacia en el mundo real está avalada por implementaciones exitosas con numerosos clientes de Deepgram.

Datos de entrenamiento y fuente de datos

Aura ha sido entrenada rigurosamente en millones de horas de datos de audio de alta calidadEste entrenamiento exhaustivo le permite producir voces con un sonido natural en diversos idiomas y dominios. Deepgram ha seleccionado meticulosamente un conjunto de datos diverso, lo que garantiza el sólido rendimiento de Aura en una amplia gama de casos de uso. El límite de conocimiento del modelo coincide con su lanzamiento inicial en junio de 2023.

Diversidad y mitigación de sesgos: Deepgram prioriza el desarrollo responsable de IA. Se han tomado medidas significativas para entrenar a Aura con datos diversos, minimizando activamente posibles sesgos y garantizando un rendimiento equitativo en diferentes grupos demográficos y casos de uso.

📊Aura frente a otros modelos TTS

Deepgram Aura supera consistentemente a otros modelos TTS populares en varias dimensiones críticas:

  • Calidad de voz superior: Proporciona voces excepcionalmente naturales y similares a las humanas, con gran precisión y errores mínimos.
  • Capacidad de respuesta inigualable: Como la opción TTS de alta calidad más rápida, cuenta con baja latencia y alto rendimiento, cruciales para las interacciones en tiempo real.
  • Rentabilidad y adaptabilidad: Diseñado para manejar diversas entradas y adaptarse perfectamente a varios acentos, dialectos y casos de uso, brindando un valor excelente.

🚀Introducción a Deepgram Aura

Ejemplo de uso de API

Integrar Deepgram Aura en tus aplicaciones es sencillo. Aquí tienes un fragmento de código típico de la API (un marcador para un ejemplo de código real):

 

Para obtener documentación detallada y más ejemplos, consulte la documentación oficial de la API de Deepgram.

Pautas éticas y licencias

Deepgram está profundamente comprometido con desarrollo responsable de IALas consideraciones éticas se integran en el diseño y la implementación de Aura. La compañía expande activamente las capacidades de Aura, con planes continuos para voces más realistas, compatibilidad con más idiomas y nuevas funciones innovadoras para garantizar un impacto positivo.

Tipo de licencia: Deepgram Aura está disponible bajo un modelo de licencia flexible, compatible con el uso comercial y no comercial, con precios ajustados según el uso.

Preguntas frecuentes (FAQ)

P: ¿Qué es Deepgram Aura?

R: Deepgram Aura es un modelo de IA de texto a voz (TTS) de última generación diseñado para aplicaciones de IA conversacionales en tiempo real, que ofrece una calidad de voz similar a la humana a alta velocidad y eficiencia.

P: ¿Qué hace que Aura sea diferente de otros modelos TTS?

A: Aura se destaca por su latencia excepcionalmente baja, calidad de voz superior y optimización específicamente para IA conversacional receptiva, lo que la hace ideal para experiencias interactivas en tiempo real.

P: ¿Cuáles son los principales casos de uso de Deepgram Aura?

R: Aura es ideal para aplicaciones que requieren interacciones de voz de alto rendimiento, como asistentes virtuales de servicio al cliente, asistentes virtuales generales y sistemas avanzados de respuesta de voz interactiva (IVR).

P: ¿Aura admite varios idiomas?

R: Sí, Aura admite varios idiomas y está diseñado para gestionar diversos acentos y dialectos de manera eficaz, lo que garantiza una amplia aplicabilidad global.

P: ¿Cómo puedo acceder a Deepgram Aura?

R: Deepgram Aura es accesible mediante API y cuenta con documentación detallada. Ofrece licencias flexibles para uso comercial y no comercial, con un precio basado en el uso.

Patio de juegos de IA

Pruebe todos los modelos de API en el entorno de pruebas antes de integrarlos. Ofrecemos más de 300 modelos para integrar en su aplicación.
Pruébalo gratis
api-right-1
modelo-bg02-1

Una API
Más de 300 modelos de IA

Ahorre un 20% en costos