



const fs = require('fs');
const path = require('path');
const axios = require('axios').default;
const api = new axios.create({
baseURL: 'https://api.ai.cc/v1',
headers: { Authorization: 'Bearer ' },
});
const main = async () => {
const response = await api.post(
'/tts',
{
model: '#g1_aura-2-amalthea-en',
text: 'Hi! What are you doing today?',
},
{ responseType: 'stream' },
);
const dist = path.resolve(__dirname, './audio.wav');
const writeStream = fs.createWriteStream(dist);
response.data.pipe(writeStream);
writeStream.on('close', () => console.log('Audio saved to:', dist));
};
main();
import os
import requests
def main():
url = "https://api.ai.cc/v1/tts"
headers = {
"Authorization": "Bearer ",
}
payload = {
"model": "#g1_aura-2-amalthea-en",
"text": "Hi! What are you doing today?",
}
response = requests.post(url, headers=headers, json=payload, stream=True)
dist = os.path.join(os.path.dirname(__file__), "audio.wav")
with open(dist, "wb") as write_stream:
for chunk in response.iter_content(chunk_size=8192):
if chunk:
write_stream.write(chunk)
print("Audio saved to:", dist)
main()

Подробная информация о товаре
🌟 Aura-2 от Deepgram: Превосходное решение для преобразования текста в речь в корпоративной среде
Deepgram Аура-2 является передовым решение для преобразования текста в речь (TTS) Разработан специально для корпоративных приложений. Он обеспечивает... живой, естественный синтез голоса с непревзойденной ясностью и точным произношением, характерным для данной области.
Разработанная с учетом гибкости, Aura-2 предлагает универсальные варианты развертывания, включая облачные и локальные среды, обеспечивая мгновенное создание контекстно-зависимой речи для критически важных приложений, таких как голосовые агенты, системы интерактивного голосового ответа (IVR) и продвинутые диалоги с использованием искусственного интеллекта.
⚙️ Технические характеристики
- ⚡ Задержка: Последовательный
- 💻 Технологии вывода: Архитектура с приоритетом потоковой обработки данных и ускорением на графическом процессоре, использующая квантизацию и обрезку для повышения эффективности.
- 📈 Масштабируемость: Распределенная среда выполнения без сохранения состояния обеспечивает быстрое масштабирование без узких мест.
- 🔒 Безопасность: Разработано с учетом требований к развертыванию на корпоративном уровне и соблюдению правил локализации данных.
📊 Показатели производительности
- ✓ Достигает задержка TTFB менее 200 мс для сверхбыстрого диалогового взаимодействия.
- ✓ Коэффициент реального времени (RTF) 0,111xгенерирует 1 секунду аудио примерно за 100 миллисекунд.
- ✓ Поддерживает тысячи одновременных сессий с стабильно низкая задержка и высококачественной продукции.
- ✓ Обеспечивает минимальные отклонения и низкую максимальную задержку даже при высокой параллельности, что критически важно для виртуальных агентов реального времени.
- ✓ Превосходит многих конкурентов. постоянно оставаясь ниже порога разговорной речи в 200 мс.
- ✓ Разработано с помощью ускорение с помощью графического процессора а также оптимизированную среду выполнения Enterprise Runtime, ориентированную на потоковую обработку данных, для быстрой обработки результатов.
- ✓ Гибкое развертывание в облаке, VPC или локально для сокращения задержек при передаче данных и соответствия требованиям законодательства.
- ✓ Безсостоятельная распределенная архитектура среды выполнения обеспечивает быстрое масштабирование и эффективное распределение нагрузки.

💲 Цены на API
💰 0,0315 $/1000 символов
✨ Основные характеристики Aura-2
- ☀ Производительность в реальном времени: Задержка TTFB менее 200 мс обеспечивает естественное и плавное общение.
- ⏰ Быстрая генерация звука: Коэффициент RTF 0,111x, синтез 1 секунды аудио всего за чуть более 100 мс.
- 🔍 Точность, специфичная для конкретной области: Превосходное произношение валют, дат, технических терминов и многого другого.
- 💻 Масштабируемость предприятия: Поддерживает тысячи одновременных сессий без снижения задержки.
- 📧 Гибкость развертывания: Доступно через REST и WebSocket API; может быть развернуто в частных облаках, VPC или локально.
- 🎤 Каталог Broad Voice: Более 40 профессиональных голосов, подобранных для различных контекстов и интонаций.
- 🌐 Многоязычная перспектива на будущее: В основном на английском языке, планируется поддержка нескольких языков.
🗣️ Обзор вариантов модели: английская озвучка
Deepgram Aura-2 предлагает обширный каталог голосов, каждый из которых оптимизирован для конкретного корпоративного использования и обладает определенными характеристиками:
- aura-2-amalthea-en: Приятный, располагающий женский голос для службы поддержки клиентов.
- aura-2-andromeda-one: Четкий, авторитетный мужской голос, подходящий для финансовой сферы.
- aura-2-apollo-en: Энергичный, молодой мужской голос для маркетинга и розничной торговли.
- aura-2-arcas-en: Спокойный, нейтральный мужской голос, идеально подходящий для общения в сфере здравоохранения.
- aura-2-aries-one: Уверенный, сильный мужской голос для технической поддержки.
- aura-2-asteria-en: Мягкий, заботливый женский голос, ориентированный на образование и обучение.
- aura-2-athena-one: Профессиональный, красноречивый женский голос для юридического и корпоративного секторов.
- aura-2-atlas-en: Глубокий, уверенный мужской голос, предназначенный для логистики и транспорта.
- aura-2-aurora-en: Яркий, чистый женский голос для работы в СМИ и на радио.
- aura-2-callista-en: Дружелюбный, располагающий женский голос для взаимодействия с клиентами.
- aura-2-cora-en: Теплый и дружелюбный женский голос, идеально подходящий для взаимодействия с клиентами и создания образовательного контента.
- aura-2-cordelia-en: Четкий и профессиональный женский голос, идеально подходящий для корпоративного обучения и звонков в службу поддержки.
- aura-2-delia-en: Спокойный, располагающий к себе женский голос, разработанный для использования в сфере здравоохранения и оздоровления.
- aura-2-draco-en: Уверенный мужской голос, хорошо подходящий для технической поддержки и финансовых услуг.
- aura-2-electra-en: Энергичный и динамичный женский голос для маркетинга и продвижения розничной торговли.
- aura-2-harmonia-en: Сбалансированный женский голос, обеспечивающий четкость и успокаивающий тембр для голосовых помощников.
- aura-2-helena-one: Четкий женский голос с деловым тоном, подходящий для юридического и делового секторов.
- aura-2-here-one: Уверенный женский голос идеально подходит для образовательных и учебных модулей.
- aura-2-hermes-en: Четкий и авторитетный мужской голос, подходящий для деловых выступлений и объявлений.
- aura-2-hyperion-en: Глубокий, уверенный мужской голос, идеально подходящий для логистики, транспорта и промышленного применения.
- aura-2-iris-en: Яркий и привлекательный женский голос для использования в средствах массовой информации и на радио.
- aura-2-janus-one: Универсальный мужской голос, подходящий для многоцелевых корпоративных приложений.
- aura-2-juno-en: Дружелюбный, располагающий женский голос для каналов обслуживания и поддержки клиентов.
- aura-2-jupiter-one: Мощный, уверенный мужской голос, идеально подходящий для финансовых и консультационных услуг.
- aura-2-luna-one: В сфере здравоохранения и персонального коучинга предпочтителен мягкий и нежный женский голос.
- aura-2-mars-en: Мощный и чистый мужской голос, предназначенный для технических и оперативных условий.
- aura-2-minerva-one: Интеллектуальный, изысканный женский голос, эффективно подходящий для обучения и образовательных целей.
- aura-2-neptune-one: Спокойный мужской голос, идеально подходящий для медитации и оздоровительных приложений.
- aura-2-odysseus-en: Мужской голос в повествовательном стиле, предназначенный для рассказывания историй и проведения экскурсий.
- aura-2-ophelia-en: Теплый женский голос с сочувствующей интонацией, подходящий для сферы услуг.
- aura-2-orion-en: Уверенный мужской голос для авторитетных заявлений и в контексте отраслевой специфики.
- aura-2-orpheus-one: Приятный мужской голос с артистичным тембром, подходящий для работы в СМИ и творческих проектах.
- aura-2-pandora-en: Привлекательный женский голос, созданный для маркетинга и продвижения.
- aura-2-phoebe-one: Четкий, профессиональный женский голос, идеально подходящий для электронного обучения и корпоративных коммуникаций.
- aura-2-pluto-one: Низкий мужской голос со спокойным нравом идеально подходит для озвучивания и закадрового текста.
- аура-2-сатурн-один: Уверенный мужской голос, специально разработанный для сферы обслуживания клиентов и финансового сектора.
- аура-2-селен-он: Мягкий женский голос идеально подходит для приложений, посвященных оздоровлению, медитации и уходу за собой.
- aura-2-thalia-en: Яркий и выразительный женский голос, отлично подходит для розничной торговли и рекламных материалов.
- aura-2-theia-en: Профессиональный женский голос, подходящий для сферы здравоохранения и юриспруденции.
- aura-2-vesta-en: Четкий женский голос с размеренным темпом, подходящий для технических специалистов и сотрудников службы поддержки клиентов.
- aura-2-zeus-one: Внушительный, мощный мужской голос, идеально подходящий для заявлений и презентаций руководителей.
Каждый голос разработан с учетом различных тональных качеств и соответствия контексту предприятия, что позволяет компаниям выбрать идеальный голос для своей фирменной идентичности и конкретных задач.
🌍 Варианты озвучки на испанском языке
- aura-2-celeste-es: Четкий и дружелюбный женский голос на испанском языке для широкого взаимодействия с клиентами.
- aura-2-star-es: Теплый и выразительный женский голос на испанском языке, идеально подходящий для образовательных и медийных целей.
- aura-2-nestor-es: Уверенный мужской голос на испанском языке, предназначенный для профессиональной и корпоративной среды.
🎯 Типичные сценарии использования
- 👤 Агенты искусственного интеллекта для разговорной речи в реальном времени
- 📞 Системы интерактивного голосового ответа (IVR)
- 💬 Автоматизация поддержки клиентов
- 📢 Транзакционные уведомления (напоминания, оповещения)
- 🔍 Специализированные голосовые помощники, требующие точного произношения
- 🏠 Развертывание решений в локальной среде для работы с конфиденциальными данными
🆚 Сравнение с другими моделями
Deepgram Aura-2 против ElevenLabs Flash
Aura-2 превосходит другие устройства по следующим параметрам: использование в режиме реального времени в масштабах предприятия Благодаря стабильно низкой задержке (менее 200 мс) и гибкому развертыванию (включая локальные системы и VPC), ElevenLabs Flash предлагает очень быструю генерацию (~75 мс времени запуска), но имеет ограничения по тарифным планам и работает только в облаке. Aura-2 также примерно на 200 мс дороже. На 40% более экономично для крупномасштабных бизнес-операций.
Deepgram Aura-2 против OpenAI TTS
Aura-2 превосходит TTS от OpenAI по показателям производительность по задержкеподдерживая стабильное время отклика менее 200 мс даже при высокой параллельности, что крайне важно для операторов в реальном времени и интерактивных голосовых систем (IVR). Технология преобразования текста в речь от OpenAI отдает приоритет выразительности голоса для офлайн-приложений или медиаприложений, жертвуя при этом некоторой скоростью в реальном времени. Архитектура Aura-2 оптимизирована для пропускная способность и масштабируемость в сложных корпоративных условиях.
Deepgram Aura-2 против Cartesia Sonic
Aura-2 предлагает более доступную стоимость за персонажа, более низкая задержка Aura-2 лучше подходит для сценариев использования, требующих быстрого и естественного общения, чем Cartesia Sonic, а также поддерживает распределенные и локальные развертывания. Cartesia Sonic в основном работает в облаке и имеет более высокую задержку (~300 мс), что делает Aura-2 более подходящей для сценариев, требующих быстрого и естественного общения. Специализированная среда выполнения Aura-2 обеспечивает снижение накладных расходов на инфраструктуру в больших масштабах.
❓ Часто задаваемые вопросы (FAQ)
В: Что делает Aura-2 уникальной в сфере моделей искусственного интеллекта?
A: Aura-2 — это передовое решение для преобразования текста в речь, разработанное для корпоративных приложений, требующих естественного синтеза голоса в реальном времени. Его уникальность заключается в исключительной четкости, точном произношении в различных областях, гибких вариантах развертывания (в облаке или локально) и стабильной задержке менее 200 мс даже при высокой параллельности.
В: Какие конкретные возможности Aura-2 предлагает для синтеза голоса в реальном времени?
A: Aura-2 обеспечивает задержку менее 200 мс (Time-To-First-Byte, TTFB) и достигает коэффициента реального времени (Real-Time Factor, RTF) 0,111x, что означает, что она генерирует 1 секунду аудио всего за чуть более 100 миллисекунд. Это обеспечивает сверхбыстрый и естественный ход разговора, что крайне важно для операторов голосового сопровождения и систем IVR.
В: Как Aura-2 обрабатывает произношения, специфичные для конкретной области?
A: Aura-2 разработана с учетом высокой точности произношения сложных терминов, включая валюту, даты, технический жаргон, URL-адреса и адреса, что делает ее идеальной для специализированных корпоративных приложений, где точность имеет первостепенное значение.
В: Какие варианты развертывания доступны для Deepgram Aura-2?
A: Aura-2 предлагает широкие возможности развертывания. Доступ к ней осуществляется через REST и WebSocket API, и ее можно развернуть в публичных облаках, частных виртуальных частных облаках (VPC) или полностью локально, чтобы соответствовать конкретным требованиям безопасности, соответствия нормативным требованиям и задержки.
В: Как Aura-2 соотносится с другими устройствами с точки зрения экономической эффективности при крупномасштабном применении?
A: Для крупномасштабных бизнес-приложений Aura-2 отличается заметной экономичностью. Например, она примерно на 40% дешевле в расчете на один символ по сравнению с некоторыми конкурентами, такими как ElevenLabs Flash, при этом обеспечивая превосходную задержку и гибкость развертывания, что крайне важно для нужд предприятий.
Игровая площадка для ИИ



Авторизоваться