



const fs = require('fs');
const path = require('path');
const axios = require('axios').default;
const api = new axios.create({
baseURL: 'https://api.ai.cc/v1',
headers: { Authorization: 'Bearer ' },
});
const main = async () => {
const response = await api.post(
'/tts',
{
model: '#g1_aura-asteria-en',
text: 'Hi! What are you doing today?',
},
{ responseType: 'stream' },
);
const dist = path.resolve(__dirname, './audio.wav');
const writeStream = fs.createWriteStream(dist);
response.data.pipe(writeStream);
writeStream.on('close', () => console.log('Audio saved to:', dist));
};
main();
import os
import requests
def main():
url = "https://api.ai.cc/v1/tts"
headers = {
"Authorization": "Bearer ",
}
payload = {
"model": "#g1_aura-asteria-en",
"text": "Hi! What are you doing today?",
}
response = requests.post(url, headers=headers, json=payload, stream=True)
dist = os.path.join(os.path.dirname(__file__), "audio.wav")
with open(dist, "wb") as write_stream:
for chunk in response.iter_content(chunk_size=8192):
if chunk:
write_stream.write(chunk)
print("Audio saved to:", dist)
main()
- API 操练场(Playground)

在集成之前,请在沙箱环境中测试所有 API 模型。
我们提供 300 多种模型供您集成到您的应用程序中。


产品详情
Deepgram Aura:革新实时文本转语音技术
体验下一代对话式人工智能 深层图灵气Aura于2023年6月发布,是一款突破性的文本转语音(TTS)人工智能模型,专为满足实时交互式应用的需求而设计。它为类人语音质量、无与伦比的速度和卓越的效率树立了新的标杆,彻底改变了开发者构建响应式语音人工智能体验的方式。
开发者: 迪普格拉姆
发布日期: 2023年6月
型号: 文本转语音(TTS)
版本: 1.0(初始版本)
✨主要特点和优势
- ✔️ 自然、低延迟的语音: 与其他任何语音人工智能相比,延迟显著降低,可获取各种自然、类人的声音。
- 🚀 针对对话式人工智能进行了优化: 专为响应迅速、实时对话式 AI 代理和应用程序而设计,确保流畅、动态的交互。
- 🔗 无缝集成: 可轻松与 Deepgram 业界领先的 Nova 语音转文本 API 集成,打造完整的语音 AI 解决方案。
- 🌐 广泛的语言支持: 能够以极高的准确度和流畅度处理多种语言、口音和方言。
💡预期用途
Deepgram Aura 在高要求的场景中表现出色。 高吞吐量语音交互 和 响应式人工智能代理它是以下情况的理想选择:
- • 客户服务: 为先进的虚拟助手提供支持,以改善客户体验。
- • 虚拟助手: 打造极具吸引力且栩栩如生的数字助理。
- • 交互式语音应答(IVR)系统: 提供自然高效的自动化电话交互。
🗣️可用的灵气之声
Deepgram Aura 提供多种独特的英语语音,以满足不同的应用场景和偏好:
- 阿斯特里亚: `#g1_aura-asteria-en`
- 赫拉: `#g1_aura-here-one`
- 经理: `#g1_aura-luna-one`
- 斯特拉: `#g1_aura-stella-one`
- 雅典娜: `#g1_aura-athena-en`
- 宙斯: `#g1_aura-zeus-en`
- 猎户座: `#g1_aura-orion-one`
- 方舟: `#g1_aura-arcas-en`
- 珀尔修斯: `#g1_aura-perseus-en`
- 安格斯: `#g1_aura-angus-en`
- 俄耳甫斯: `#g1_aura-orpheus-one`
- 赫利俄斯: `#g1_aura-helios-en`
⚙️深入剖析 Aura 技术
架构与性能
Aura 的架构充分体现了 Deepgram 在语音技术领域的领先地位。针对……进行了优化 无与伦比的速度和效率它是目前速度最快、质量最高的文本转语音(TTS)解决方案。这项创新源于Deepgram在语音音频处理和建模方面的丰富经验,尤其是在与他们的语音转文本(STT)模型结合使用时,能够更好地满足实时流媒体应用的需求。
绩效指标: Aura 性能卓越,与其他同类 TTS 模型相比,延迟更低,语音质量更佳。众多 Deepgram 客户的成功部署验证了其在实际应用中的有效性。
训练数据和数据源
Aura接受过严格的训练 数百万小时的高质量音频数据经过广泛的训练,Aura 能够生成跨越多种语言和领域的自然语音。Deepgram 精心构建了一个多样化的数据集,确保 Aura 在各种应用场景中都能表现出色。该模型的知识截止时间与其 2023 年 6 月的首次发布时间一致。
多元化与偏见缓解: Deepgram始终将负责任的AI开发放在首位。公司已采取重要措施,利用多样化的数据训练Aura,积极减少潜在的偏见,并确保其在不同人群和使用场景下都能发挥公平的性能。
📊Aura 与其他 TTS 模型对比
Deepgram Aura 在多个关键维度上始终优于其他流行的 TTS 模型:
- ★ 卓越的语音质量: 能够以极高的准确度和极低的错误率,提供极其自然、类人的声音。
- ★ 无与伦比的响应速度: 作为速度最快的高质量 TTS 选项,它具有低延迟和高吞吐量,这对于实时交互至关重要。
- ★ 成本效益和适应性: 旨在处理各种输入,并能无缝适应各种口音、方言和使用场景,提供卓越的价值。
🚀Deepgram Aura入门指南
API 使用示例
将 Deepgram Aura 集成到您的应用程序中非常简单。以下是一个典型的 API 用法示例(占位符,实际代码示例请见此处):
有关详细文档和更多示例,请参阅 Deepgram API 官方文档。
道德准则与许可
Deepgram 致力于 负责任的人工智能开发伦理考量已融入Aura的设计和部署生命周期。公司积极拓展Aura的功能,持续规划更逼真的语音、更多语言支持和创新功能,以确保产生积极影响。
许可证类型: Deepgram Aura 采用灵活的许可模式,支持商业和非商业用途,价格根据使用量而定。
❓常见问题解答 (FAQ)
答:Deepgram Aura 是一款最先进的文本转语音 (TTS) AI 模型,专为实时对话式 AI 应用而设计,能够以高速和高效的方式提供类似人类的语音质量。
答:Aura 的延迟极低、语音质量卓越,并针对响应式对话 AI 进行了专门优化,使其成为交互式实时体验的理想选择。
答:Aura 最适合需要高吞吐量语音交互的应用,例如客户服务虚拟助手、通用虚拟助手和高级交互式语音应答 (IVR) 系统。
答:是的,Aura 支持多种语言,并能有效处理各种口音和方言,确保其在全球范围内的广泛适用性。
答:Deepgram Aura 可通过 API 访问,并提供详细文档。它提供灵活的商业和非商业用途许可,价格根据使用量而定。



登录