



const axios = require('axios').default;
const api = axios.create({
baseURL: 'https://api.ai.cc/v1',
headers: { Authorization: 'Bearer ' },
});
const main = async () => {
const response = await api.post('/tts', {
model: 'openai/tts-1',
text: 'OpenAI TTS are fast and powerful language models. Use it to convert text to natural sounding spoken text.',
voice: 'coral',
});
console.log('Audio URL:', response.data.audio.url);
console.log('Characters:', response.data.usage.characters);
};
main();
import requests
def main():
url = "https://api.ai.cc/v1/tts"
headers = {
"Authorization": "Bearer ",
}
payload = {
"model": "openai/tts-1",
"text": "OpenAI TTS are fast and powerful language models. Use it to convert text to natural sounding spoken text.",
"voice": "coral"
}
response = requests.post(url, headers=headers, json=payload)
data = response.json()
print("Audio URL:", data["audio"]["url"])
print("Characters:", data["usage"]["characters"])
main()

产品详情
💭 TTS-1(文本转语音) TTS-1 是由 OpenAI 开发的先进神经网络模型,旨在将文本转换为自然流畅的语音。它利用了自然语言处理 (NLP) 领域最先进的深度学习技术,合成的语音输出能够出色地模仿人类的语音模式、语调和节奏,使数字交互更加直观逼真。
💻技术规格
- ✔ 型号类型: 基于深度学习的TTS神经网络
- ✔ 输入: 包含标点符号、支持复杂结构的文本提示
- ✔ 输出: 高保真音频波形,提供多种格式
- ✔ 核心技术: 结合自然语言处理(NLP)驱动的声学特征预测和神经声码器,可实现更佳的语音质量
- ✔ 部署: 兼容云端或边缘部署,提供灵活性
🏆性能基准
- 卓越平均意见得分 (MOS): 在主观听力测试中始终获得高分,由于其自然性,用户明显更倾向于选择它而不是传统的 TTS 系统。
- 超低延迟: 与早期的 TTS 架构相比,延迟显著降低,从而能够为交互式应用实现近乎实时的语音合成。
- 竞争性词错误率(WER): 当合成语音与语音识别系统结合使用时,TTS-1 保持了极具竞争力的词错误率,确保了清晰度和准确性。
⭐TTS-1 API 的主要特性
- 自然流畅的语音: 说话语调、节奏和发音都像真人一样清晰。
- 上下文感知合成: 能够根据文本上下文智能地捕捉和应用适当的情感基调。
- 端到端流水线: 从文本分析到高质量音频输出的精简流程,确保一致性和效率。
- 强大的文本处理能力: 能够熟练运用各种句式结构、复杂的标点符号、数字和缩写。
- 可扩展的语音和样式选项: 可适应各种不同的嗓音类型和说话风格,并提供广泛的自定义选项。
💰定价与 API 集成
💸TTS-1 API 定价
以极具竞争力的价格体验顶级的文本转语音功能:
0.01575美元 每1000个字符
这种经济高效的结构使 TTS-1 成为小型项目和大批量企业应用的绝佳选择。
🔗无缝 API 集成
TTS-1 模型可通过强大的 AI/ML API 轻松访问,旨在直接高效地集成到您现有的系统和新项目中。
完整文档:
有关详细的 API 参考、参数指南和最佳实践,请参阅官方文档:
参考自 OpenAI TTS-1 API 文档。
💻TTS-1 代码示例
data-name = "voice.tts-openai" data-model = "openai/tts-1" > ❓常见问题解答 (FAQ)
➡什么是TTS-1 API?
TTS-1 是 OpenAI 的高级文本转语音合成模型,旨在将书面文本转换为听起来自然、高质量的语音,并提供多种语音选项和广泛的语言支持。
➡TTS-1的主要应用有哪些?
TTS-1 非常适合各种应用,包括语音助手、有声读物生成、播客创建、电子学习内容、辅助工具、IVR 系统和视频旁白。
➡TTS-1 的价格是多少?
TTS-1 API 的定价为 每1000个字符0.01575美元为各种规模的文本转语音需求提供经济高效的解决方案。
➡TTS-1 支持哪些音频格式?
该型号支持以流行格式输出高质量音频,例如: MP3、WAV、AAC 和 OGG提供从 24kbps 到 320kbps 的各种比特率选项。
➡TTS-1 是否支持 SSML(语音合成标记语言)?
是的,TTS-1 完全支持 SSML,可实现高级语音控制,从而能够精确管理发音、停顿、重音和音标,以获得专业级的效果。



登录