qwen-bg
max-ico04
出去
max-ico02
聊天
max-ico03
禁用
TTS-1
它能以最小的延迟快速生成实时音频,因此特别适合实时对话代理和交互式应用程序。
新会员可获赠价值 1 美元的免费Tokens
Text to Speech
                                        const axios = require('axios').default;

const api = axios.create({
  baseURL: 'https://api.ai.cc/v1',
  headers: { Authorization: 'Bearer ' },
});

const main = async () => {
  const response = await api.post('/tts', {
    model: 'openai/tts-1',
    text: 'OpenAI TTS are fast and powerful language models. Use it to convert text to natural sounding spoken text.',
    voice: 'coral',
  });

  console.log('Audio URL:', response.data.audio.url);
  console.log('Characters:', response.data.usage.characters);
};

main();

                                
                                        import requests


def main():
    url = "https://api.ai.cc/v1/tts"
    headers = {
        "Authorization": "Bearer ",
    }
    payload = {
        "model": "openai/tts-1",
        "text": "OpenAI TTS are fast and powerful language models. Use it to convert text to natural sounding spoken text.",
        "voice": "coral"
    }

    response = requests.post(url, headers=headers, json=payload)
    data = response.json()

    print("Audio URL:", data["audio"]["url"])
    print("Characters:", data["usage"]["characters"])


main()
Docs

一个 API 包含 300 多个 AI 模型

节省20%费用并获赠价值1美元的Tokens
qwenmax-bg
图片
TTS-1

产品详情

💭 TTS-1(文本转语音) TTS-1 是由 OpenAI 开发的先进神经网络模型,旨在将文本转换为自然流畅的语音。它利用了自然语言处理 (NLP) 领域最先进的深度学习技术,合成的语音输出能够出色地模仿人类的语音模式、语调和节奏,使数字交互更加直观逼真。

💻技术规格

  • ✔ 型号类型: 基于深度学习的TTS神经网络
  • ✔ 输入: 包含标点符号、支持复杂结构的文本提示
  • ✔ 输出: 高保真音频波形,提供多种格式
  • ✔ 核心技术: 结合自然语言处理(NLP)驱动的声学特征预测和神经声码器,可实现更佳的语音质量
  • ✔ 部署: 兼容云端或边缘部署,提供灵活性

🏆性能基准

  • 卓越平均意见得分 (MOS): 在主观听力测试中始终获得高分,由于其自​​然性,用户明显更倾向于选择它而不是传统的 TTS 系统。
  • 超低延迟: 与早期的 TTS 架构相比,延迟显著降低,从而能够为交互式应用实现近乎实时的语音合成。
  • 竞争性词错误率(WER): 当合成语音与语音识别系统结合使用时,TTS-1 保持了极具竞争力的词错误率,确保了清晰度和准确性。

TTS-1 API 的主要特性

  • 自然流畅的语音: 说话语调、节奏和发音都像真人一样清晰。
  • 上下文感知合成: 能够根据文本上下文智能地捕捉和应用适当的情感基调。
  • 端到端流水线: 从文本分析到高质量音频输出的精简流程,确保一致性和效率。
  • 强大的文本处理能力: 能够熟练运用各种句式结构、复杂的标点符号、数字和缩写。
  • 可扩展的语音和样式选项: 可适应各种不同的嗓音类型和说话风格,并提供广泛的自定义选项。

💰定价与 API 集成

💸TTS-1 API 定价

以极具竞争力的价格体验顶级的文本转语音功能:

0.01575美元 每1000个字符

这种经济高效的结构使 TTS-1 成为小型项目和大批量企业应用的绝佳选择。

🔗无缝 API 集成

TTS-1 模型可通过强大的 AI/ML API 轻松访问,旨在直接高效地集成到您现有的系统和新项目中。

完整文档:

有关详细的 API 参考、参数指南和最佳实践,请参阅官方文档:

📜 查看 API 文档

参考自 OpenAI TTS-1 API 文档

💻TTS-1 代码示例

data-name = "voice.tts-openai" data-model = "openai/tts-1" >

常见问题解答 (FAQ)

什么是TTS-1 API?

TTS-1 是 OpenAI 的高级文本转语音合成模型,旨在将书面文本转换为听起来自然、高质量的语音,并提供多种语音选项和广泛的语言支持。

TTS-1的主要应用有哪些?

TTS-1 非常适合各种应用,包括语音助手、有声读物生成、播客创建、电子学习内容、辅助工具、IVR 系统和视频旁白。

TTS-1 的价格是多少?

TTS-1 API 的定价为 每1000个字符0.01575美元为各种规模的文本转语音需求提供经济高效的解决方案。

TTS-1 支持哪些音频格式?

该型号支持以流行格式输出高质量音频,例如: MP3、WAV、AAC 和 OGG提供从 24kbps 到 320kbps 的各种比特率选项。

TTS-1 是否支持 SSML(语音合成标记语言)?

是的,TTS-1 完全支持 SSML,可实现高级语音控制,从而能够精确管理发音、停顿、重音和音标,以获得专业级的效果。

API 操练场(Playground)

集成前,请在沙盒环境中测试所有 API 模型。我们提供 300 多个模型供您集成到应用中。
免费试用
api-right-1
模型-bg02-1

一个 API
300多个人工智能模型

节省20%的费用