在

出去

聊天

禁用

TTS-1

它能以最小的延迟快速生成实时音频，因此特别适合实时对话代理和交互式应用程序。

新会员可获赠价值 1 美元的免费Tokens

Text to Speech

Javascript

Python

                                        const axios = require('axios').default;

const api = axios.create({
  baseURL: 'https://api.ai.cc/v1',
  headers: { Authorization: 'Bearer ' },
});

const main = async () => {
  const response = await api.post('/tts', {
    model: 'openai/tts-1',
    text: 'OpenAI TTS are fast and powerful language models. Use it to convert text to natural sounding spoken text.',
    voice: 'coral',
  });

  console.log('Audio URL:', response.data.audio.url);
  console.log('Characters:', response.data.usage.characters);
};

main();

                                        import requests


def main():
    url = "https://api.ai.cc/v1/tts"
    headers = {
        "Authorization": "Bearer ",
    }
    payload = {
        "model": "openai/tts-1",
        "text": "OpenAI TTS are fast and powerful language models. Use it to convert text to natural sounding spoken text.",
        "voice": "coral"
    }

    response = requests.post(url, headers=headers, json=payload)
    data = response.json()

    print("Audio URL:", data["audio"]["url"])
    print("Characters:", data["usage"]["characters"])


main()

Docs

300 多个适用于 OpenClaw 和 AI 代理的 AI 模型

节省20%费用并获赠价值1美元的Tokens

获取 API 密钥探索模型

TTS-1

产品详情

💭 TTS-1（文本转语音） TTS-1 是由 OpenAI 开发的先进神经网络模型，旨在将文本转换为自然流畅的语音。它利用了自然语言处理 (NLP) 领域最先进的深度学习技术，合成的语音输出能够出色地模仿人类的语音模式、语调和节奏，使数字交互更加直观逼真。

💻技术规格

✔ 型号类型： 基于深度学习的TTS神经网络
✔ 输入： 包含标点符号、支持复杂结构的文本提示
✔ 输出： 高保真音频波形，提供多种格式
✔ 核心技术： 结合自然语言处理（NLP）驱动的声学特征预测和神经声码器，可实现更佳的语音质量
✔ 部署： 兼容云端或边缘部署，提供灵活性

🏆性能基准

卓越平均意见得分 (MOS)： 在主观听力测试中始终获得高分，由于其自然性，用户明显更倾向于使用该系统，而非传统的 TTS 系统。
超低延迟： 与早期的 TTS 架构相比，延迟显著降低，从而能够为交互式应用实现近乎实时的语音合成。
竞争性词错误率（WER）： 当合成语音与语音识别系统结合使用时，TTS-1 保持了极具竞争力的词错误率，确保了清晰度和准确性。

⭐TTS-1 API 的主要特性

自然流畅的语音： 说话语调、节奏和发音都像真人一样清晰。
上下文感知合成： 能够根据文本上下文智能地捕捉和应用适当的情感基调。
端到端流水线： 从文本分析到高质量音频输出的精简流程，确保一致性和效率。
强大的文本处理能力： 能够熟练运用各种句式结构、复杂的标点符号、数字和缩写。
可扩展的语音和样式选项： 可适应各种不同的嗓音类型和说话风格，并提供广泛的自定义选项。

💰定价与 API 集成

💸TTS-1 API 定价

以极具竞争力的价格体验顶级的文本转语音功能：

0.01575美元每1000个字符

这种经济高效的结构使 TTS-1 成为小型项目和大批量企业应用的绝佳选择。

🔗无缝 API 集成

TTS-1 模型可通过强大的 AI/ML API 轻松访问，旨在直接高效地集成到您现有的系统和新项目中。

完整文档：

有关详细的 API 参考、参数指南和最佳实践，请参阅官方文档：

📜 查看 API 文档

参考自 OpenAI TTS-1 API 文档。

💻TTS-1 代码示例

data-name = "voice.tts-openai" data-model = "openai/tts-1" >

❓常见问题解答 (FAQ)

➡什么是TTS-1 API？

TTS-1 是 OpenAI 的高级文本转语音合成模型，旨在将书面文本转换为听起来自然、高质量的语音，并提供多种语音选项和广泛的语言支持。

➡TTS-1的主要应用有哪些？

TTS-1 非常适合各种应用，包括语音助手、有声读物生成、播客创建、电子学习内容、辅助工具、IVR 系统和视频旁白。

➡TTS-1 的价格是多少？

TTS-1 API 的定价为 每1000个字符0.01575美元为各种规模的文本转语音需求提供经济高效的解决方案。

➡TTS-1 支持哪些音频格式？

该型号支持以流行格式输出高质量音频，例如： MP3、WAV、AAC 和 OGG提供从 24kbps 到 320kbps 的各种比特率选项。

➡TTS-1 是否支持 SSML（语音合成标记语言）？

是的，TTS-1 完全支持 SSML，可实现高级语音控制，从而能够精确管理发音、停顿、重音和音标，以获得专业级的效果。

API 操练场（Playground）

集成前，请在沙盒环境中测试所有 API 模型。我们提供 300 多个模型供您集成到应用中。

免费试用

300 多个 AI 模型
OpenClaw 和人工智能代理

节省20%的费用