qwen-bg
max-ico04
出去
max-ico02
聊天
max-ico03
禁用
灵气
Deepgram Aura:一个实时 TTS 模型,可通过 API 为响应迅速、高吞吐量的对话式 AI 代理和应用程序提供类似人类的声音。
新会员可获赠价值 1 美元的免费Tokens
Text to Speech
                                        const fs = require('fs');
const path = require('path');

const axios = require('axios').default;
const api = new axios.create({
  baseURL: 'https://api.ai.cc/v1',
  headers: { Authorization: 'Bearer ' },
});

const main = async () => {
  const response = await api.post(
    '/tts',
    {
      model: '#g1_aura-asteria-en',
      text: 'Hi! What are you doing today?',
    },
    { responseType: 'stream' },
  );

  const dist = path.resolve(__dirname, './audio.wav');
  const writeStream = fs.createWriteStream(dist);

  response.data.pipe(writeStream);

  writeStream.on('close', () => console.log('Audio saved to:', dist));
};

main();

                                
                                        import os
import requests


def main():
    url = "https://api.ai.cc/v1/tts"
    headers = {
        "Authorization": "Bearer ",
    }
    payload = {
        "model": "#g1_aura-asteria-en",
        "text": "Hi! What are you doing today?",
    }

    response = requests.post(url, headers=headers, json=payload, stream=True)
    dist = os.path.join(os.path.dirname(__file__), "audio.wav")

    with open(dist, "wb") as write_stream:
        for chunk in response.iter_content(chunk_size=8192):
            if chunk:
                write_stream.write(chunk)

    print("Audio saved to:", dist)


main()
Docs

一个 API 包含 300 多个 AI 模型

节省20%费用并获赠价值1美元的Tokens
  • ico01-1
    API 操练场(Playground)

    在集成之前,请在沙箱环境中测试所有 API 模型。

    我们提供 300 多种模型供您集成到您的应用程序中。

    复制图片02图片01
qwenmax-bg
图片
灵气

产品详情

Deepgram Aura:革新实时文本转语音技术

体验下一代对话式人工智能 深层图灵气Aura于2023年6月发布,是一款突破性的文本转语音(TTS)人工智能模型,专为满足实时交互式应用的需求而设计。它为类人语音质量、无与伦比的速度和卓越的效率树立了新的标杆,彻底改变了开发者构建响应式语音人工智能体验的方式。

开发者: 迪普格拉姆

发布日期: 2023年6月

型号: 文本转语音(TTS)

版本: 1.0(初始版本)

主要特点和优势

  • ✔️ 自然、低延迟的语音: 与其他任何语音人工智能相比,延迟显著降低,可获取各种自然、类人的声音。
  • 🚀 针对对话式人工智能进行了优化: 专为响应迅速、实时对话式 AI 代理和应用程序而设计,确保流畅、动态的交互。
  • 🔗 无缝集成: 可轻松与 Deepgram 业界领先的 Nova 语音转文本 API 集成,打造完整的语音 AI 解决方案。
  • 🌐 广泛的语言支持: 能够以极高的准确度和流畅度处理多种语言、口音和方言。

💡预期用途

Deepgram Aura 在高要求的场景中表现出色。 高吞吐量语音交互响应式人工智能代理它是以下情况的理想选择:

  • 客户服务: 为先进的虚拟助手提供支持,以改善客户体验。
  • 虚拟助手: 打造极具吸引力且栩栩如生的数字助理。
  • 交互式语音应答(IVR)系统: 提供自然高效的自动化电话交互。

🗣️可用的灵气之声

Deepgram Aura 提供多种独特的英语语音,以满足不同的应用场景和偏好:

  • 阿斯特里亚: `#g1_aura-asteria-en`
  • 赫拉: `#g1_aura-here-one`
  • 经理: `#g1_aura-luna-one`
  • 斯特拉: `#g1_aura-stella-one`
  • 雅典娜: `#g1_aura-athena-en`
  • 宙斯: `#g1_aura-zeus-en`
  • 猎户座: `#g1_aura-orion-one`
  • 方舟: `#g1_aura-arcas-en`
  • 珀尔修斯: `#g1_aura-perseus-en`
  • 安格斯: `#g1_aura-angus-en`
  • 俄耳甫斯: `#g1_aura-orpheus-one`
  • 赫利俄斯: `#g1_aura-helios-en`

⚙️深入剖析 Aura 技术

架构与性能

Aura 的架构充分体现了 Deepgram 在语音技术领域的领先地位。针对……进行了优化 无与伦比的速度和效率它是目前速度最快、质量最高的文本转语音(TTS)解决方案。这项创新源于Deepgram在语音音频处理和建模方面的丰富经验,尤其是在与他们的语音转文本(STT)模型结合使用时,能够更好地满足实时流媒体应用的需求。

绩效指标: Aura 性能卓越,与其他同类 TTS 模型相比,延迟更低,语音质量更佳。众多 Deepgram 客户的成功部署验证了其在实际应用中的有效性。

训练数据和数据源

Aura接受过严格的训练 数百万小时的高质量音频数据经过广泛的训练,Aura 能够生成跨越多种语言和领域的自然语音。Deepgram 精心构建了一个多样化的数据集,确保 Aura 在各种应用场景中都能表现出色。该模型的知识截止时间与其 2023 年 6 月的首次发布时间一致。

多元化与偏见缓解: Deepgram始终将负责任的AI开发放在首位。公司已采取重要措施,利用多样化的数据训练Aura,积极减少潜在的偏见,并确保其在不同人群和使用场景下都能发挥公平的性能。

📊Aura 与其他 TTS 模型对比

Deepgram Aura 在多个关键维度上始终优于其他流行的 TTS 模型:

  • 卓越的语音质量: 能够以极高的准确度和极低的错误率,提供极其自然、类人的声音。
  • 无与伦比的响应速度: 作为速度最快的高质量 TTS 选项,它具有低延迟和高吞吐量,这对于实时交互至关重要。
  • 成本效益和适应性: 旨在处理各种输入,并能无缝适应各种口音、方言和使用场景,提供卓越的价值。

🚀Deepgram Aura入门指南

API 使用示例

将 Deepgram Aura 集成到您的应用程序中非常简单。以下是一个典型的 API 用法示例(占位符,实际代码示例请见此处):

 

有关详细文档和更多示例,请参阅 Deepgram API 官方文档。

道德准则与许可

Deepgram 致力于 负责任的人工智能开发伦理考量已融入Aura的设计和部署生命周期。公司积极拓展Aura的功能,持续规划更逼真的语音、更多语言支持和创新功能,以确保产生积极影响。

许可证类型: Deepgram Aura 采用灵活的许可模式,支持商业和非商业用途,价格根据使用量而定。

常见问题解答 (FAQ)

问:什么是Deepgram Aura?

答:Deepgram Aura 是一款最先进的文本转语音 (TTS) AI 模型,专为实时对话式 AI 应用而设计,能够以高速和高效的方式提供类似人类的语音质量。

问:Aura 与其他 TTS 型号有何不同?

答:Aura 的延迟极低、语音质量卓越,并针对响应式对话 AI 进行了专门优化,使其成为交互式实时体验的理想选择。

问:Deepgram Aura 的主要应用场景是什么?

答:Aura 最适合需要高吞吐量语音交互的应用,例如客户服务虚拟助手、通用虚拟助手和高级交互式语音应答 (IVR) 系统。

问:Aura是否支持多种语言?

答:是的,Aura 支持多种语言,并能有效处理各种口音和方言,确保其在全球范围内的广泛适用性。

问:如何访问Deepgram Aura?

答:Deepgram Aura 可通过 API 访问,并提供详细文档。它提供灵活的商业和非商业用途许可,价格根据使用量而定。

了解如何利用 AICC API 实现公司转型

探索如何利用 AICC API 革新您的业务!解锁强大的工具,实现流程自动化、增强决策能力并打造个性化的客户体验。
联系销售
api-right-1
模型-bg02-1

一个 API
300多个人工智能模型

节省20%的费用