Вне

Чат

запрещать

Аура 2

Благодаря поддержке высокой параллельной обработки и экономичной цене, Aura 2 обеспечивает бесперебойное, четкое и быстрое взаимодействие с голосовым ИИ в таких отраслях, как финансы, здравоохранение и поддержка клиентов.

Новые участники получат бесплатные токены номиналом 1 доллар.

Text to Speech

Javascript

Python

                                        const fs = require('fs');
const path = require('path');

const axios = require('axios').default;
const api = new axios.create({
  baseURL: 'https://api.ai.cc/v1',
  headers: { Authorization: 'Bearer ' },
});

const main = async () => {
  const response = await api.post(
    '/tts',
    {
      model: '#g1_aura-2-amalthea-en',
      text: 'Hi! What are you doing today?',
    },
    { responseType: 'stream' },
  );

  const dist = path.resolve(__dirname, './audio.wav');
  const writeStream = fs.createWriteStream(dist);

  response.data.pipe(writeStream);

  writeStream.on('close', () => console.log('Audio saved to:', dist));
};

main();

                                        import os
import requests


def main():
    url = "https://api.ai.cc/v1/tts"
    headers = {
        "Authorization": "Bearer ",
    }
    payload = {
        "model": "#g1_aura-2-amalthea-en",
        "text": "Hi! What are you doing today?",
    }

    response = requests.post(url, headers=headers, json=payload, stream=True)
    dist = os.path.join(os.path.dirname(__file__), "audio.wav")

    with open(dist, "wb") as write_stream:
        for chunk in response.iter_content(chunk_size=8192):
            if chunk:
                write_stream.write(chunk)

    print("Audio saved to:", dist)


main()

Docs

Более 300 моделей ИИ для OpenClaw и агентов ИИ.

Сэкономьте 20% на расходах и получите бесплатные токены на 1 доллар.

Получить ключ API Изучите модели

Аура 2

Подробная информация о товаре

🌟 Aura-2 от Deepgram: Превосходное решение для преобразования текста в речь в корпоративной среде

Deepgram Аура-2 является передовым решение для преобразования текста в речь (TTS) Разработан специально для корпоративных приложений. Он обеспечивает... живой, естественный синтез голоса с непревзойденной ясностью и точным произношением, характерным для данной области.

Разработанная с учетом гибкости, Aura-2 предлагает универсальные варианты развертывания, включая облачные и локальные среды, обеспечивая мгновенное создание контекстно-зависимой речи для критически важных приложений, таких как голосовые агенты, системы интерактивного голосового ответа (IVR) и продвинутые диалоги с использованием искусственного интеллекта.

⚙️ Технические характеристики

⚡ Задержка: Последовательный
💻 Технологии вывода: Архитектура с приоритетом потоковой обработки данных и ускорением на графическом процессоре, использующая квантизацию и обрезку для повышения эффективности.
📈 Масштабируемость: Распределенная среда выполнения без сохранения состояния обеспечивает быстрое масштабирование без узких мест.
🔒 Безопасность: Разработано с учетом требований к развертыванию на корпоративном уровне и соблюдению правил локализации данных.

📊 Показатели производительности

✓ Достигает задержка TTFB менее 200 мс для сверхбыстрого диалогового взаимодействия.
✓ Коэффициент реального времени (RTF) 0,111xгенерирует 1 секунду аудио примерно за 100 миллисекунд.
✓ Поддерживает тысячи одновременных сессий с стабильно низкая задержка и высококачественной продукции.
✓ Обеспечивает минимальные отклонения и низкую максимальную задержку даже при высокой параллельности, что критически важно для виртуальных агентов реального времени.
✓ Превосходит многих конкурентов. постоянно оставаясь ниже порога разговорной речи в 200 мс.
✓ Разработано с помощью ускорение с помощью графического процессора а также оптимизированную среду выполнения Enterprise Runtime, ориентированную на потоковую обработку данных, для быстрой обработки результатов.
✓ Гибкое развертывание в облаке, VPC или локально для сокращения задержек при передаче данных и соответствия требованиям законодательства.
✓ Безсостоятельная распределенная архитектура среды выполнения обеспечивает быстрое масштабирование и эффективное распределение нагрузки.

Сравнение производительности Deepgram Aura-2

Aura-2 неизменно превосходит конкурентов, таких как ElevenLabs и решения OpenAI для преобразования речи в речь, в условиях корпоративной среды, где важна низкая задержка.

💲 Цены на API

💰 0,0315 $/1000 символов

✨ Основные характеристики Aura-2

☀ Производительность в реальном времени: Задержка TTFB менее 200 мс обеспечивает естественное и плавное общение.
⏰ Быстрая генерация звука: Коэффициент RTF 0,111x, синтез 1 секунды аудио всего за чуть более 100 мс.
🔍 Точность, специфичная для конкретной области: Превосходное произношение валют, дат, технических терминов и многого другого.
💻 Масштабируемость предприятия: Поддерживает тысячи одновременных сессий без снижения задержки.
📧 Гибкость развертывания: Доступно через REST и WebSocket API; может быть развернуто в частных облаках, VPC или локально.
🎤 Каталог Broad Voice: Более 40 профессиональных голосов, подобранных для различных контекстов и интонаций.
🌐 Многоязычная перспектива на будущее: В основном на английском языке, планируется поддержка нескольких языков.

🗣️ Обзор вариантов модели: английская озвучка

Deepgram Aura-2 предлагает обширный каталог голосов, каждый из которых оптимизирован для конкретного корпоративного использования и обладает определенными характеристиками:

aura-2-amalthea-en: Приятный, располагающий женский голос для службы поддержки клиентов.
aura-2-andromeda-one: Четкий, авторитетный мужской голос, подходящий для финансовой сферы.
aura-2-apollo-en: Энергичный, молодой мужской голос для маркетинга и розничной торговли.
aura-2-arcas-en: Спокойный, нейтральный мужской голос, идеально подходящий для общения в сфере здравоохранения.
aura-2-aries-one: Уверенный, сильный мужской голос для технической поддержки.
aura-2-asteria-en: Мягкий, заботливый женский голос, ориентированный на образование и обучение.
aura-2-athena-one: Профессиональный, красноречивый женский голос для юридического и корпоративного секторов.
aura-2-atlas-en: Глубокий, уверенный мужской голос, предназначенный для логистики и транспорта.
aura-2-aurora-en: Яркий, чистый женский голос для работы в СМИ и на радио.
aura-2-callista-en: Дружелюбный, располагающий женский голос для взаимодействия с клиентами.
aura-2-cora-en: Теплый и дружелюбный женский голос, идеально подходящий для взаимодействия с клиентами и создания образовательного контента.
aura-2-cordelia-en: Четкий и профессиональный женский голос, идеально подходящий для корпоративного обучения и звонков в службу поддержки.
aura-2-delia-en: Спокойный, располагающий к себе женский голос, разработанный для использования в сфере здравоохранения и оздоровления.
aura-2-draco-en: Уверенный мужской голос, хорошо подходящий для технической поддержки и финансовых услуг.
aura-2-electra-en: Энергичный и динамичный женский голос для маркетинга и продвижения розничной торговли.
aura-2-harmonia-en: Сбалансированный женский голос, обеспечивающий четкость и успокаивающий тембр для голосовых помощников.
aura-2-helena-one: Четкий женский голос с деловым тоном, подходящий для юридического и делового секторов.
aura-2-here-one: Уверенный женский голос идеально подходит для образовательных и учебных модулей.
aura-2-hermes-en: Четкий и авторитетный мужской голос, подходящий для деловых выступлений и объявлений.
aura-2-hyperion-en: Глубокий, уверенный мужской голос, идеально подходящий для логистики, транспорта и промышленного применения.
aura-2-iris-en: Яркий и привлекательный женский голос для использования в средствах массовой информации и на радио.
aura-2-janus-one: Универсальный мужской голос, подходящий для многоцелевых корпоративных приложений.
aura-2-juno-en: Дружелюбный, располагающий женский голос для каналов обслуживания и поддержки клиентов.
aura-2-jupiter-one: Мощный, уверенный мужской голос, идеально подходящий для финансовых и консультационных услуг.
aura-2-luna-one: В сфере здравоохранения и персонального коучинга предпочтителен мягкий и нежный женский голос.
aura-2-mars-en: Мощный и чистый мужской голос, предназначенный для технических и оперативных условий.
aura-2-minerva-one: Интеллектуальный, изысканный женский голос, эффективно подходящий для обучения и образовательных целей.
аура-2-нептун-один: Спокойный мужской голос, идеально подходящий для медитации и оздоровительных приложений.
aura-2-odysseus-en: Мужской голос в повествовательном стиле, предназначенный для рассказывания историй и проведения экскурсий.
aura-2-ophelia-en: Теплый женский голос с сочувствующей интонацией, подходящий для сферы услуг.
aura-2-orion-en: Уверенный мужской голос для авторитетных заявлений и в контексте отраслевой специфики.
aura-2-orpheus-one: Приятный мужской голос с артистичным тембром, подходящий для работы в СМИ и творческих проектах.
aura-2-pandora-en: Привлекательный женский голос, созданный для маркетинга и продвижения.
aura-2-phoebe-one: Четкий, профессиональный женский голос, идеально подходящий для электронного обучения и корпоративных коммуникаций.
aura-2-pluto-one: Низкий мужской голос со спокойным нравом идеально подходит для озвучивания и закадрового текста.
аура-2-сатурн-один: Уверенный мужской голос, специально разработанный для сферы обслуживания клиентов и финансового сектора.
аура-2-селен-он: Мягкий женский голос идеально подходит для приложений, посвященных оздоровлению, медитации и уходу за собой.
aura-2-thalia-en: Яркий и выразительный женский голос, отлично подходит для розничной торговли и рекламных материалов.
aura-2-theia-en: Профессиональный женский голос, подходящий для сферы здравоохранения и юриспруденции.
aura-2-vesta-en: Четкий женский голос с размеренным темпом, подходящий для технических специалистов и сотрудников службы поддержки клиентов.
aura-2-zeus-one: Внушительный, мощный мужской голос, идеально подходящий для заявлений и презентаций руководителей.

Каждый голос разработан с учетом различных тональных качеств и соответствия контексту предприятия, что позволяет компаниям выбрать идеальный голос для своей фирменной идентичности и конкретных задач.

🌍 Варианты озвучки на испанском языке

aura-2-celeste-es: Четкий и дружелюбный женский голос на испанском языке для широкого взаимодействия с клиентами.
aura-2-star-es: Теплый и выразительный женский голос на испанском языке, идеально подходящий для образовательных и медийных целей.
aura-2-nestor-es: Уверенный мужской голос на испанском языке, предназначенный для профессиональной и корпоративной среды.

🎯 Типичные сценарии использования

👤 Агенты искусственного интеллекта для разговорной речи в реальном времени
📞 Системы интерактивного голосового ответа (IVR)
💬 Автоматизация поддержки клиентов
📢 Транзакционные уведомления (напоминания, оповещения)
🔍 Специализированные голосовые помощники, требующие точного произношения
🏠 Развертывание решений в локальной среде для работы с конфиденциальными данными

🆚 Сравнение с другими моделями

Deepgram Aura-2 против ElevenLabs Flash

Aura-2 превосходит другие устройства по следующим параметрам: использование в режиме реального времени в масштабах предприятия Благодаря стабильно низкой задержке (менее 200 мс) и гибкому развертыванию (включая локальные системы и VPC), ElevenLabs Flash предлагает очень быструю генерацию (~75 мс времени запуска), но имеет ограничения по тарифным планам и работает только в облаке. Aura-2 также примерно на 200 мс дороже. На 40% более экономично для крупномасштабных бизнес-операций.

Deepgram Aura-2 против OpenAI TTS

Aura-2 превосходит TTS от OpenAI по производительность по задержкеподдерживая стабильное время отклика менее 200 мс даже при высокой параллельности, что крайне важно для операторов в реальном времени и интерактивных голосовых систем (IVR). Технология преобразования текста в речь от OpenAI отдает приоритет выразительности голоса для офлайн-приложений или медиаприложений, жертвуя при этом некоторой скоростью в реальном времени. Архитектура Aura-2 оптимизирована для пропускная способность и масштабируемость в сложных корпоративных условиях.

Deepgram Aura-2 против Cartesia Sonic

Aura-2 предлагает более доступную стоимость за персонажа, более низкая задержка Aura-2 лучше подходит для сценариев использования, требующих быстрого и естественного общения, чем Cartesia Sonic, а также поддерживает распределенные и локальные развертывания. Cartesia Sonic в основном работает в облаке и имеет более высокую задержку (~300 мс), что делает Aura-2 более подходящей для сценариев, требующих быстрого и естественного общения. Специализированная среда выполнения Aura-2 обеспечивает снижение накладных расходов на инфраструктуру в больших масштабах.

❓ Часто задаваемые вопросы (FAQ)

В: Что делает Aura-2 уникальной в сфере моделей искусственного интеллекта?

A: Aura-2 — это передовое решение для преобразования текста в речь, разработанное для корпоративных приложений, требующих естественного синтеза голоса в реальном времени. Его уникальность заключается в исключительной четкости, точном произношении в различных областях, гибких вариантах развертывания (в облаке или локально) и стабильной задержке менее 200 мс даже при высокой параллельности.

В: Какие конкретные возможности Aura-2 предлагает для синтеза голоса в реальном времени?

A: Aura-2 обеспечивает задержку менее 200 мс (Time-To-First-Byte, TTFB) и достигает коэффициента реального времени (Real-Time Factor, RTF) 0,111x, что означает, что она генерирует 1 секунду аудио всего за чуть более 100 миллисекунд. Это обеспечивает сверхбыстрый и естественный ход разговора, что крайне важно для операторов голосового сопровождения и систем IVR.

В: Как Aura-2 обрабатывает произношения, специфичные для конкретной области?

A: Aura-2 разработана с учетом высокой точности произношения сложных терминов, включая валюту, даты, технический жаргон, URL-адреса и адреса, что делает ее идеальной для специализированных корпоративных приложений, где точность имеет первостепенное значение.

В: Какие варианты развертывания доступны для Deepgram Aura-2?

A: Aura-2 предлагает широкие возможности развертывания. Доступ к ней осуществляется через REST и WebSocket API, и ее можно развернуть в публичных облаках, частных виртуальных частных облаках (VPC) или полностью локально, чтобы соответствовать конкретным требованиям безопасности, соответствия нормативным требованиям и задержки.

В: Как Aura-2 соотносится с другими устройствами с точки зрения экономической эффективности при крупномасштабном применении?

A: Для крупномасштабных бизнес-приложений Aura-2 отличается заметной экономичностью. Например, она примерно на 40% дешевле в расчете на один символ по сравнению с некоторыми конкурентами, такими как ElevenLabs Flash, при этом обеспечивая превосходную задержку и гибкость развертывания, что крайне важно для нужд предприятий.

Игровая площадка для ИИ

Перед интеграцией протестируйте все модели API в тестовой среде. Мы предоставляем более 300 моделей для интеграции в ваше приложение.

Попробуйте бесплатно

Более 300 моделей ИИ для
OpenClaw и агенты искусственного интеллекта

Сэкономьте 20% на расходах