在

出去

聊天

禁用

灵气

Deepgram Aura：一个实时 TTS 模型，可通过 API 为响应迅速、高吞吐量的对话式 AI 代理和应用程序提供类似人类的声音。

新会员可获赠价值 1 美元的免费Tokens

Text to Speech

Javascript

Python

                                        const fs = require('fs');
const path = require('path');

const axios = require('axios').default;
const api = new axios.create({
  baseURL: 'https://api.ai.cc/v1',
  headers: { Authorization: 'Bearer ' },
});

const main = async () => {
  const response = await api.post(
    '/tts',
    {
      model: '#g1_aura-asteria-en',
      text: 'Hi! What are you doing today?',
    },
    { responseType: 'stream' },
  );

  const dist = path.resolve(__dirname, './audio.wav');
  const writeStream = fs.createWriteStream(dist);

  response.data.pipe(writeStream);

  writeStream.on('close', () => console.log('Audio saved to:', dist));
};

main();

                                        import os
import requests


def main():
    url = "https://api.ai.cc/v1/tts"
    headers = {
        "Authorization": "Bearer ",
    }
    payload = {
        "model": "#g1_aura-asteria-en",
        "text": "Hi! What are you doing today?",
    }

    response = requests.post(url, headers=headers, json=payload, stream=True)
    dist = os.path.join(os.path.dirname(__file__), "audio.wav")

    with open(dist, "wb") as write_stream:
        for chunk in response.iter_content(chunk_size=8192):
            if chunk:
                write_stream.write(chunk)

    print("Audio saved to:", dist)


main()

Docs

300 多个适用于 OpenClaw 和 AI 代理的 AI 模型

节省20%费用并获赠价值1美元的Tokens

获取 API 密钥探索模型

灵气

产品详情

Deepgram Aura：革新实时文本转语音技术

体验下一代对话式人工智能 深层图灵气Aura于2023年6月发布，是一款突破性的文本转语音（TTS）人工智能模型，专为满足实时交互式应用的需求而设计。它为类人语音质量、无与伦比的速度和卓越的效率树立了新的标杆，彻底改变了开发者构建响应式语音人工智能体验的方式。

开发者： 迪普格拉姆

发布日期： 2023年6月

型号： 文本转语音（TTS）

版本： 1.0（初始版本）

✨主要特点和优势

✔️ 自然、低延迟的语音： 与其他任何语音人工智能相比，延迟显著降低，可获取各种自然、类人的声音。
🚀 针对对话式人工智能进行了优化： 专为响应迅速、实时对话式 AI 代理和应用程序而设计，确保流畅、动态的交互。
🔗 无缝集成： 轻松集成 Deepgram 业界领先的 Nova 语音转文本 API，打造完整的语音 AI 解决方案。
🌐 广泛的语言支持： 能够以极高的准确度和流畅度处理多种语言、口音和方言。

💡预期用途

Deepgram Aura 在高要求的场景中表现出色。 高吞吐量语音交互 和 响应式人工智能代理它是以下情况的理想选择：

• 客户服务： 为先进的虚拟助手提供支持，以改善客户体验。
• 虚拟助手： 打造极具吸引力且栩栩如生的数字助理。
• 交互式语音应答（IVR）系统： 提供自然高效的自动化电话交互。

🗣️可用的灵气之声

Deepgram Aura 提供多种独特的英语语音，以满足不同的应用场景和用户偏好：

阿斯特里亚： `#g1_aura-asteria-en`
赫拉： `#g1_aura-here-one`
经理： `#g1_aura-luna-one`
斯特拉： `#g1_aura-stella-one`
雅典娜： `#g1_aura-athena-en`
宙斯： `#g1_aura-zeus-en`
猎户座： `#g1_aura-orion-one`
方舟： `#g1_aura-arcas-en`
珀尔修斯： `#g1_aura-perseus-en`
安格斯： `#g1_aura-angus-en`
俄耳甫斯： `#g1_aura-orpheus-one`
赫利俄斯： `#g1_aura-helios-en`

⚙️深入剖析 Aura 技术

架构与性能

Aura 的架构充分体现了 Deepgram 在语音技术领域的领先地位。针对……进行了优化 无与伦比的速度和效率它是目前速度最快、质量最高的文本转语音（TTS）解决方案。这项创新源于Deepgram在语音音频处理和建模方面的丰富经验，尤其是在与他们的语音转文本（STT）模型结合使用时，能够更好地满足实时流媒体应用的需求。

绩效指标： Aura 性能卓越，与其他同类 TTS 模型相比，延迟更低，语音质量更佳。众多 Deepgram 客户的成功部署验证了其在实际应用中的有效性。

训练数据和数据源

Aura接受过严格的训练 数百万小时的高质量音频数据经过广泛的训练，Aura 能够生成跨越多种语言和领域的自然语音。Deepgram 精心构建了一个多样化的数据集，确保 Aura 在各种应用场景中都能表现出色。该模型的知识截止时间与其 2023 年 6 月的首次发布时间一致。

多元化与偏见缓解： Deepgram始终将负责任的AI开发放在首位。公司已采取重要措施，利用多样化的数据训练Aura，积极减少潜在的偏见，并确保其在不同人群和使用场景下都能发挥公平的性能。

📊Aura 与其他 TTS 模型对比

Deepgram Aura 在多个关键维度上始终优于其他流行的 TTS 模型：

★ 卓越的语音质量： 能够以极高的准确度和极低的错误率，提供极其自然、类人的声音。
★ 无与伦比的响应速度： 作为速度最快的高质量 TTS 选项，它具有低延迟和高吞吐量，这对于实时交互至关重要。
★ 成本效益和适应性： 旨在处理各种输入，并能无缝适应各种口音、方言和使用场景，提供卓越的价值。

🚀Deepgram Aura入门指南

API 使用示例

将 Deepgram Aura 集成到您的应用程序中非常简单。以下是一个典型的 API 用法示例（占位符，实际代码示例请见此处）：

有关详细文档和更多示例，请参阅 Deepgram API 官方文档。

道德准则与许可

Deepgram 致力于 负责任的人工智能开发伦理考量已融入Aura的设计和部署生命周期。公司积极拓展Aura的功能，持续规划更逼真的语音、更多语言支持和创新功能，以确保产生积极影响。

许可证类型： Deepgram Aura 采用灵活的许可模式，支持商业和非商业用途，价格根据使用量而定。

❓常见问题解答 (FAQ)

问：什么是Deepgram Aura？

答：Deepgram Aura 是一款最先进的文本转语音 (TTS) AI 模型，专为实时对话式 AI 应用而设计，能够以高速和高效的方式提供类似人类的语音质量。

问：Aura 与其他 TTS 型号有何不同？

答：Aura 的延迟极低、语音质量卓越，并针对响应式对话 AI 进行了专门优化，使其成为交互式实时体验的理想选择。

问：Deepgram Aura 的主要应用场景是什么？

答：Aura 最适合需要高吞吐量语音交互的应用，例如客户服务虚拟助手、通用虚拟助手和高级交互式语音应答 (IVR) 系统。

问：Aura是否支持多种语言？

答：是的，Aura 支持多种语言，并能有效处理各种口音和方言，确保其在全球范围内的广泛适用性。

问：如何访问Deepgram Aura？

答：Deepgram Aura 可通过 API 访问，并提供详细文档。它提供灵活的商业和非商业用途许可，价格根据使用量而定。

API 操练场（Playground）

集成前，请在沙盒环境中测试所有 API 模型。我们提供 300 多个模型供您集成到应用中。

免费试用

300 多个 AI 模型
OpenClaw 和人工智能代理

节省20%的费用