在

出去

聊天

禁用

ElevenLabs Turbo v2.5

它支持 120 多种语言，并具有低延迟推理功能，为响应迅速、声音自然的文本转语音应用程序树立了新的标准。

新会员可获赠价值 1 美元的免费Tokens

Text to Speech

Javascript

Python

                                        const fs = require('fs');
const path = require('path');

const axios = require('axios').default;
const api = new axios.create({
  baseURL: 'https://api.ai.cc/v1',
  headers: { Authorization: 'Bearer ' },
});

const main = async () => {
  const response = await api.post(
    '/tts',
    {
      model: 'elevenlabs/eleven_turbo_v2_5',
      text: 'Hi! What are you doing today?',
      voice: 'Alice'
    },
    { responseType: 'stream' },
  );

  const dist = path.resolve(__dirname, './audio.wav');
  const writeStream = fs.createWriteStream(dist);

  response.data.pipe(writeStream);

  writeStream.on('close', () => console.log('Audio saved to:', dist));
};

main();

                                        import os
import requests


def main():
    url = "https://api.ai.cc/v1/tts"
    headers = {
        "Authorization": "Bearer ",
    }
    payload = {
        "model": "elevenlabs/eleven_turbo_v2_5",
        "text": "Hi! What are you doing today?",
        "voice": "Alice"
    }

    response = requests.post(url, headers=headers, json=payload, stream=True)
    dist = os.path.join(os.path.dirname(__file__), "audio.wav")

    with open(dist, "wb") as write_stream:
        for chunk in response.iter_content(chunk_size=8192):
            if chunk:
                write_stream.write(chunk)

    print("Audio saved to:", dist)


main()

Docs

300 多个适用于 OpenClaw 和 AI 代理的 AI 模型

节省20%费用并获赠价值1美元的Tokens

获取 API 密钥探索模型

ElevenLabs Turbo v2.5

产品详情

Eleven Labs 的 Eleven Turbo v2.5 是一项尖端技术 人工智能模型 专为快速、高质量的文本生成并具备自然语言理解能力。它响应速度更快，输出保真度更高，因此适用于各种用途广泛的应用。

技术规格

性能基准

Eleven Turbo v2.5 在生成连贯、上下文丰富的文本方面表现出色，其效果令人惊叹。低延迟。

✅ 平均意见得分 (MOS)： 4.72/5.0（与人类语音水平相当）
🗣️语音清晰度中的词错误率（WER）： 在基准数据集上低于 3.1%。
🌐 语言覆盖范围： 127 种语言和方言，达到母语水平。

主要能力

Eleven Turbo v2.5 提供高度流畅且具有上下文感知能力的文本生成功能，使其成为实时应用的理想选择。

⚡ 超低延迟： 非常适合实时场景，例如现场配音、互动游戏NPC和响应式语音助手。
🎤 富有表现力的演讲： 具备高级韵律控制功能，可实现动态语调、情感和重音的自定义。
👤 语音克隆： 能够从极短的音频样本（短至 3 秒）中实现高保真语音复制。
🌍 多语言精通： 提供 127 种语言的母语级流畅度，包括对低资源方言的支持。

API定价

💰 经济实惠： 每1000个字符0.0945美元。

最佳使用场景

💬 对话式人工智能： 需要自然流畅对话的实时聊天机器人和虚拟助手。
✍️ 内容创作： 快速生成高质量的文章、摘要和创意写作作品。
🔊 语音应用： 为文本转语音系统提供高度自然、富有表现力的输出。
📞 客户支持： 利用准确且具有上下文感知能力的知识自动传递响应。

代码示例

使用提供的代码片段即可轻松集成 Eleven Turbo v2.5：

与其他领先型号的比较

⚡ 与 Google WaveNet (v3) 对比： 更快的推理速度 （200毫秒对比650毫秒P95）， 更广泛的语言支持 （127 对 50），MOS 值相近（4.72 对 4.75）。
⭐ 对比亚马逊 Polly Neural： 优惠 卓越的表现力 和 更低的延迟; 支持 2 倍以上的语言，并具备实时流媒体播放功能。
💡 对比 Microsoft Azure Neural TTS： 实现 更高的声音自然度 在特殊情况下（MOS 4.72 与 4.61），提供 更快的响应速度以及功能 更好的情绪建模。

需要考虑的局限性

🚫 最大输入长度： Eleven Turbo v2.5 目前的最大输入长度为 4,096 个字符这可能会限制超长篇内容的创作。
💬 低资源方言： 虽然支持 127 种语言，但一些资源匮乏的方言可能会出现问题。 清晰度或自然度略有下降 与主要全球语言相比。

常见问题解答 (FAQ)

问： Eleven Turbo v2.5 是什么？它有哪些独特之处，使其适用于实时应用？

答：Eleven Turbo v2.5 是一款专为低延迟、实时应用而设计的优化文本转语音模型。它的独特之处在于，能够在保持高语音质量的同时，以极低的计算开销实现近乎瞬时的语音生成。这使其成为响应时间至关重要的交互式应用的理想选择，例如实时对话、游戏和实时助手。

问： Turbo 版本相比标准 TTS 车型有哪些性能优势？

答：Eleven Turbo v2.5 提供了显著的性能优势，包括：大多数请求的延迟低于 100 毫秒、更低的计算资源需求、更高的并发用户吞吐量、优化的流媒体功能以及高效的内存使用。这些改进是在保持与标准版（资源占用更高）极其接近的出色语音质量的同时实现的。

问：哪些类型的实时应用程序最能从 Eleven Turbo v2.5 中受益？

答：受益最大的应用包括：实时对话人工智能和聊天机器人、互动游戏和虚拟现实体验、实时翻译服务、语音客服、教育辅导系统、需要即时反馈的辅助工具，以及任何近乎即时的语音响应能够增强用户体验和参与度的场景。

问： Eleven Turbo v2.5 是如何平衡速度和语音质量的？

答：该模型通过以下方式平衡速度和质量：优化的神经网络架构优先处理关键语音特征；高效的音频处理流程；常用音素的智能缓存；以及先进的流媒体技术，可在完整生成完成前开始音频播放。虽然一些超精细的细节可能会有所损失，但整体语音自然度对于实时应用而言仍然非常出色。

问： Eleven Turbo v2.5 的实际部署需要考虑哪些因素？

答：实际部署需要考虑的因素包括：与实时流媒体协议的兼容性、高效处理并发用户请求、与语音活动检测系统的集成、针对各种网络状况的优化，以及针对极端情况的适当回退机制。该模型的高效性使其适用于云部署和边缘计算场景，在这些场景中，低延迟至关重要。

API 操练场（Playground）

集成前，请在沙盒环境中测试所有 API 模型。我们提供 300 多个模型供您集成到应用中。

免费试用

300 多个 AI 模型
OpenClaw 和人工智能代理

节省20%的费用