qwen-bg
max-ico04
Em
Fora
max-ico02
Bater papo
max-ico03
desativar
Aura
Deepgram Aura: Um modelo de síntese de voz em tempo real que oferece vozes semelhantes às humanas para agentes e aplicativos de IA conversacional responsivos e de alto desempenho via API.
Tokens de $1 grátis para novos membros
Text to Speech
                                        const fs = require('fs');
const path = require('path');

const axios = require('axios').default;
const api = new axios.create({
  baseURL: 'https://api.ai.cc/v1',
  headers: { Authorization: 'Bearer ' },
});

const main = async () => {
  const response = await api.post(
    '/tts',
    {
      model: '#g1_aura-asteria-en',
      text: 'Hi! What are you doing today?',
    },
    { responseType: 'stream' },
  );

  const dist = path.resolve(__dirname, './audio.wav');
  const writeStream = fs.createWriteStream(dist);

  response.data.pipe(writeStream);

  writeStream.on('close', () => console.log('Audio saved to:', dist));
};

main();

                                
                                        import os
import requests


def main():
    url = "https://api.ai.cc/v1/tts"
    headers = {
        "Authorization": "Bearer ",
    }
    payload = {
        "model": "#g1_aura-asteria-en",
        "text": "Hi! What are you doing today?",
    }

    response = requests.post(url, headers=headers, json=payload, stream=True)
    dist = os.path.join(os.path.dirname(__file__), "audio.wav")

    with open(dist, "wb") as write_stream:
        for chunk in response.iter_content(chunk_size=8192):
            if chunk:
                write_stream.write(chunk)

    print("Audio saved to:", dist)


main()
Docs

Uma API com mais de 300 modelos de IA

Economize 20% nos custos e ganhe tokens grátis de $1.
qwenmax-bg
imagem
Aura

Detalhes do produto

Deepgram Aura: Revolucionando a conversão de texto em fala em tempo real

Experimente a próxima geração de IA conversacional com Aura DeepgramLançado em junho de 2023, o Aura é um modelo de IA de conversão de texto em fala (TTS) inovador, projetado para atender às demandas de aplicativos interativos em tempo real. Ele estabelece um novo padrão para qualidade de voz semelhante à humana, velocidade incomparável e eficiência notável, transformando a maneira como os desenvolvedores criam experiências de IA de voz responsivas.

Desenvolvedor: Deepgram

Data de lançamento: Junho de 2023

Tipo de modelo: Texto para fala (TTS)

Versão: 1.0 (Versão Inicial)

Principais características e vantagens

  • ✔️ Vozes naturais com baixa latência: Acesse uma ampla variedade de vozes naturais e semelhantes às humanas com latência significativamente menor em comparação com qualquer outra IA de voz.
  • 🚀 Otimizado para IA conversacional: Projetado especificamente para agentes e aplicativos de IA conversacional responsivos e em tempo real, garantindo interações fluidas e dinâmicas.
  • 🔗 Integração perfeita: Integra-se facilmente com a API Nova Speech-to-Text da Deepgram, líder do setor, criando uma solução completa de IA de voz.
  • 🌐 Amplo suporte linguístico: Capaz de lidar com vários idiomas, sotaques e dialetos com excepcional precisão e fluência.

💡Casos de uso pretendidos

Deepgram Aura se destaca em cenários que exigem interações de voz de alto rendimento e agentes de IA responsivosÉ a escolha ideal para:

  • Atendimento ao Cliente: Potencializando assistentes virtuais avançados para uma experiência aprimorada do cliente.
  • Assistentes virtuais: Criando assistentes digitais altamente envolventes e realistas.
  • Sistemas de Resposta de Voz Interativa (IVR): Proporcionando interações telefônicas automatizadas, naturais e eficientes.

🗣️Vozes Aura disponíveis

Deepgram Aura oferece uma variedade de vozes distintas em inglês para atender a diferentes aplicações e preferências:

  • Asteria: `#g1_aura-asteria-en`
  • Hera: `#g1_aura-aqui-um`
  • Gerente: `#g1_aura-luna-one`
  • Stella: `#g1_aura-stella-one`
  • Atena: `#g1_aura-athena-en`
  • Zeus: `#g1_aura-zeus-en`
  • Órion: `#g1_aura-orion-one`
  • Arcas: `#g1_aura-arcas-en`
  • Perseu: `#g1_aura-perseus-en`
  • Angus: `#g1_aura-angus-en`
  • Orfeu: `#g1_aura-orpheus-one`
  • Hélio: `#g1_aura-helios-en`

⚙️Análise técnica aprofundada do Aura

Arquitetura e Performance

A arquitetura do Aura é uma prova da liderança da Deepgram em tecnologia de voz. Otimizado para velocidade e eficiência incomparáveisÉ a opção de TTS (conversão de fala em voz alta) mais rápida e de alta qualidade disponível. Essa inovação deriva da vasta experiência da Deepgram no processamento e modelagem de áudio de fala, especialmente para casos de uso de streaming em tempo real, quando combinada com seus modelos de STT (conversão de fala em voz alta).

Métricas de desempenho: O Aura oferece desempenho incomparável, apresentando menor latência e qualidade de voz superior em comparação com qualquer outro modelo de TTS similar. Sua eficácia no mundo real é comprovada por implantações bem-sucedidas com diversos clientes da Deepgram.

Dados de treinamento e fonte de dados

Aura foi rigorosamente treinada em milhões de horas de dados de áudio de alta qualidadeEsse extenso treinamento permite que o modelo produza vozes com som natural em diversos idiomas e domínios. A Deepgram selecionou meticulosamente um conjunto de dados diversificado, garantindo o desempenho robusto do Aura em uma ampla gama de casos de uso. O limite de conhecimento do modelo está alinhado com seu lançamento inicial em junho de 2023.

Diversidade e Mitigação de Preconceitos: A Deepgram prioriza o desenvolvimento responsável de IA. Medidas significativas foram tomadas para treinar a Aura com dados diversos, minimizando ativamente possíveis vieses e garantindo um desempenho equitativo em diferentes grupos demográficos e casos de uso.

📊Aura vs. Outros Modelos TTS

O Deepgram Aura supera consistentemente outros modelos populares de TTS em diversas dimensões críticas:

  • Qualidade de voz superior: Oferece vozes excepcionalmente naturais e semelhantes às humanas com alta precisão e erros mínimos.
  • Capacidade de resposta incomparável: Sendo a opção de TTS (síntese de fala) mais rápida e de alta qualidade, ela oferece baixa latência e alta taxa de transferência, fatores cruciais para interações em tempo real.
  • Relação custo-benefício e adaptabilidade: Projetado para lidar com diversas entradas e se adaptar perfeitamente a vários sotaques, dialetos e casos de uso, oferecendo excelente custo-benefício.

🚀Primeiros passos com o Deepgram Aura

Exemplo de uso da API

Integrar o Deepgram Aura em seus aplicativos é simples. Aqui está um exemplo típico de uso da API (exemplo de código em branco):

 

Para obter documentação detalhada e mais exemplos, consulte a documentação oficial da API Deepgram.

Diretrizes Éticas e Licenciamento

A Deepgram está profundamente comprometida com desenvolvimento responsável de IAConsiderações éticas são integradas ao ciclo de vida de design e implementação da Aura. A empresa expande ativamente as capacidades da Aura, com planos contínuos para vozes mais realistas, suporte a idiomas adicionais e novos recursos inovadores para garantir um impacto positivo.

Tipo de licença: O Deepgram Aura está disponível sob um modelo de licenciamento flexível, que permite o uso comercial e não comercial, com preços escalonados com base no uso.

Perguntas frequentes (FAQs)

P: O que é Deepgram Aura?

A: Deepgram Aura é um modelo de IA de conversão de texto em fala (TTS) de última geração, projetado para aplicações de IA conversacional em tempo real, oferecendo qualidade de voz semelhante à humana com alta velocidade e eficiência.

P: O que diferencia o Aura de outros modelos de TTS?

A: O Aura se destaca por sua latência excepcionalmente baixa, qualidade de voz superior e otimização específica para IA conversacional responsiva, tornando-o ideal para experiências interativas em tempo real.

P: Quais são os principais casos de uso do Deepgram Aura?

A: O Aura é mais adequado para aplicações que exigem interações de voz de alto rendimento, como assistentes virtuais de atendimento ao cliente, assistentes virtuais em geral e sistemas avançados de Resposta de Voz Interativa (IVR).

P: O Aura suporta vários idiomas?

A: Sim, o Aura suporta vários idiomas e foi projetado para lidar com diversos sotaques e dialetos de forma eficaz, garantindo ampla aplicabilidade global.

P: Como posso acessar o Deepgram Aura?

A: O Deepgram Aura é acessível via API, com documentação detalhada disponível. Oferece licenciamento flexível para uso comercial e não comercial, com preços baseados no uso.

Playground de IA

Teste todos os modelos de API no ambiente de sandbox antes de integrá-los. Oferecemos mais de 300 modelos para integrar ao seu aplicativo.
Experimente grátis
api-right-1
modelo-bg02-1

Uma API
Mais de 300 modelos de IA

Economize 20% nos custos