



const axios = require('axios').default;
const api = axios.create({
baseURL: 'https://api.ai.cc/v1',
headers: { Authorization: 'Bearer ' },
});
const main = async () => {
const response = await api.post('/tts', {
model: 'openai/tts-1',
text: 'OpenAI TTS are fast and powerful language models. Use it to convert text to natural sounding spoken text.',
voice: 'coral',
});
console.log('Audio URL:', response.data.audio.url);
console.log('Characters:', response.data.usage.characters);
};
main();
import requests
def main():
url = "https://api.ai.cc/v1/tts"
headers = {
"Authorization": "Bearer ",
}
payload = {
"model": "openai/tts-1",
"text": "OpenAI TTS are fast and powerful language models. Use it to convert text to natural sounding spoken text.",
"voice": "coral"
}
response = requests.post(url, headers=headers, json=payload)
data = response.json()
print("Audio URL:", data["audio"]["url"])
print("Characters:", data["usage"]["characters"])
main()

Detalle del producto
💭 TTS-1 (Texto a voz) Es un modelo avanzado de red neuronal desarrollado por OpenAI, diseñado para transformar texto escrito en un habla natural y atractiva. Aprovechando técnicas de aprendizaje profundo de vanguardia en Procesamiento del Lenguaje Natural (PLN), TTS-1 sintetiza una salida de voz que imita de forma excepcional los patrones, la entonación y el ritmo del habla humana, haciendo que las interacciones digitales resulten más intuitivas y realistas.
💻Especificaciones técnicas
- ✔ Tipo de modelo: Red neuronal TTS basada en aprendizaje profundo
- ✔ Entrada: Texto de instrucción que incluye puntuación y estructuras complejas de apoyo.
- ✔ Salida: Forma de onda de audio de alta fidelidad, varios formatos disponibles
- ✔ Tecnología central: Predicción de características acústicas impulsada por PNL combinada con vocoders neuronales para una calidad de voz superior
- ✔ Implementación: Compatible con implementación en la nube o en el borde, lo que ofrece flexibilidad
🏆Puntos de referencia de rendimiento
- Puntuación media de opinión excepcional (MOS): Logra constantemente altos puntajes en pruebas de escucha subjetiva, lo que demuestra una preferencia significativa del usuario sobre los sistemas TTS tradicionales debido a su naturalidad.
- Latencia ultrabaja: Latencia significativamente reducida en comparación con las arquitecturas TTS anteriores, lo que permite la síntesis de voz casi en tiempo real para aplicaciones interactivas.
- Tasas de error de palabras competitivas (WER): Cuando se utiliza voz sintetizada con sistemas de reconocimiento de voz, TTS-1 mantiene índices de error de palabras altamente competitivos, lo que garantiza claridad y precisión.
⭐Características principales de la API TTS-1
- Discurso que suena natural: Ofrece un discurso con entonación, ritmo y pronunciación claros y similares a los humanos.
- Síntesis consciente del contexto: Capta y aplica de forma inteligente tonos emocionales apropiados según el contexto textual.
- Tubería de extremo a extremo: Un proceso optimizado desde el análisis de texto hasta la salida de audio de alta calidad, garantizando consistencia y eficiencia.
- Manejo robusto de texto: Maneja con destreza diversas estructuras de oraciones, puntuación compleja, números y abreviaturas.
- Opciones de voz y estilo escalables: Adaptable a una amplia gama de tipos de voz y estilos de habla, proporcionando una amplia personalización.
💰Precios e integración de API
💸Precios de la API TTS-1
Experimente capacidades de texto a voz de primer nivel a precios competitivos:
$0.01575 por cada 1.000 caracteres
Esta estructura rentable hace que TTS-1 sea una excelente opción tanto para proyectos de pequeña escala como para aplicaciones empresariales de gran volumen.
🔗Integración perfecta de API
Se puede acceder fácilmente al modelo TTS-1 a través de una sólida API de IA/ML, diseñada para una integración sencilla y eficiente en sus sistemas existentes y nuevos proyectos.
Documentación completa:
Para obtener referencias detalladas de API, guías de parámetros y mejores prácticas, consulte la documentación oficial:
📜 Ver la documentación de la API
Referenciado desde Documentación de la API de OpenAI TTS-1.
💻Ejemplo de código para TTS-1
nombre-datos = "voz.tts-openai" modelo-datos = "openai/tts-1" > ❓Preguntas frecuentes (FAQ)
➡¿Qué es la API TTS-1?
TTS-1 es el modelo avanzado de síntesis de texto a voz de OpenAI, diseñado para convertir texto escrito en audio hablado de alta calidad y sonido natural con múltiples opciones de voz y amplio soporte de idiomas.
➡¿Cuáles son las principales aplicaciones del TTS-1?
TTS-1 es ideal para una amplia gama de aplicaciones, incluidos asistentes de voz, generación de audiolibros, creación de podcasts, contenido de aprendizaje electrónico, herramientas de accesibilidad, sistemas IVR y narración de video.
➡¿Cuanto cuesta el TTS-1?
La API TTS-1 tiene un precio de $0,01575 por cada 1000 caracteres, ofreciendo una solución rentable para diversas escalas de requisitos de conversión de texto a voz.
➡¿Qué formatos de audio admite TTS-1?
El modelo admite salida de audio de alta calidad en formatos populares como MP3, WAV, AAC y OGG, con varias opciones de tasa de bits desde 24 kbps hasta 320 kbps.
➡¿TTS-1 admite SSML (lenguaje de marcado de síntesis de voz)?
Sí, TTS-1 es totalmente compatible con SSML para un control de voz avanzado, lo que permite una gestión precisa de la pronunciación, las pausas, el énfasis y la fonética para obtener resultados de nivel profesional.
Patio de juegos de IA



Acceso