



const main = async () => {
const response = await fetch('https://api.ai.cc/v1/images/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'alibaba/wan2.5-t2i-preview',
prompt: 'A jellyfish in the ocean',
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main();
import requests
def main():
response = requests.post(
"https://api.ai.cc/v1/images/generations",
headers={
"Authorization": "Bearer ",
"Content-Type": "application/json",
},
json={
"model": "alibaba/wan2.5-t2i-preview",
"prompt": "A jellyfish in the ocean",
},
)
response.raise_for_status()
data = response.json()
print("Generation:", data)
if __name__ == "__main__":
main()

Detalle del producto
✨ Vista previa de Wan 2.5 Representa la vanguardia en la generación de texto a imagen, basándose en la exitosa serie Wan. Esta iteración introduce mejoras significativas, principalmente la eliminación de las restricciones previas sobre la longitud lateral de la imagen, lo que ofrece a los usuarios una flexibilidad inigualable en la elección de las dimensiones de píxeles dentro de un área definida. Combina magistralmente una arquitectura de IA avanzada con un meticuloso control a nivel de píxel para generar imágenes diversas, altamente detalladas y de alta fidelidad a partir de simples indicaciones textuales.
🔧 Especificaciones técnicas
- Tipo de modelo: Modelo generativo de texto a imagen
- Arquitectura: Red generativa avanzada basada en difusión
- Aporte: Indicaciones de texto en lenguaje natural
- Producción: Imágenes de resolución variable, cualquier dimensión dentro del rango de píxeles admitido
- Datos de entrenamiento: Conjunto de datos multimodales diversos, que incluyen arte, fotografías e ilustraciones digitales
- Idiomas compatibles: Ante todo Inglés, adaptable a otros lenguajes con tokenización
📈 Puntos de referencia de rendimiento
- Puntuación FID (distancia de inicio de Fréchet): 13.5 en puntos de referencia de generación de imágenes estándar, lo que indica alto realismo y calidad.
- Velocidad de inferencia: Tiempo medio de generación de 4 segundos por imagen de 512x512 en GPU modernas.
- Uso de memoria: Optimizado para ejecutarse en 12 GB y más Configuraciones de VRAM de GPU.
- Soporte de resolución: Genera con éxito imágenes de hasta 4K y más allá Sin degradación de la calidad.
- Diversidad: Genera una amplia gama de imágenes únicas para el mismo mensaje, lo que favorece la exploración creativa.
💲 Precios de la API
Solo $0,0315 por imagen
🔑 Características principales
- Detalle de alta calidad: Produce Características de imagen nítidas e intrincadas a través de varios estilos y temas.
- Adaptación de estilo flexible: Capaz de generar imágenes artísticas, realistas o estilizadas según el contexto del mensaje.
- Inferencia rápida: El diseño de modelos eficientes permite generación de imágenes más rápida en comparación con versiones anteriores.
- Resolución escalable: Adecuado para miniaturas digitales pequeñas de hasta impresiones y presentaciones a gran escala.
🚀 Casos de uso
- Creación de arte digital: Perfecto para artistas que buscan obras de arte personalizadas en cualquier tamaño y estilo.
- Marketing y publicidad: Produzca rápidamente imágenes de alta calidad adaptadas a las necesidades de la campaña.
- Generación de contenido: Mejore blogs, redes sociales y sitios web con imágenes únicas.
- Prototipado y diseño: Generar arte conceptual y elementos visuales del producto durante las primeras etapas de desarrollo.
- Materiales educativos: Cree ilustraciones o infografías atractivas para recursos didácticos.
- Entretenimiento y medios: Úselo para crear guiones gráficos, conceptos de personajes y recursos de efectos visuales.
Ejemplo de código
🔄 Comparación con otros modelos
vs Difusión estable: Wan 2.5 está optimizado para Imágenes de alta resolución con inferencia rápida y calidad constante en tamaños grandes, mientras que Stable Diffusion a veces experimenta una degradación de la calidad al aumentar la escala.
contra DALL·E 3: La vista previa de Wan 2.5 proporciona control de dimensión flexible permitiendo a los usuarios adaptar libremente los tamaños de salida, lo que lo hace especialmente ventajoso para aplicaciones de diseño e impresión especializadas.
vs Midjourney: La vista previa de Wan 2.5 es más versátil en la personalización de dimensiones y admite salidas estilizadas y fotorrealistas con generación rápida, lo que resulta atractivo para los usuarios que necesitan Flexibilidad de tamaño sin sacrificar los detalles.
vs Imagen: Wan 2.5 Preview supera a Imagen al permitir libre selección de dimensiones de la imagen dentro de los límites del área de píxeles, lo que proporciona mayor adaptabilidad para diversos casos de uso y resultados listos para imprimir.
💭 Preguntas frecuentes (FAQ)
¿Qué es Wan 2.5 Preview?
Wan 2.5 Preview es la última versión de los modelos de texto a imagen de la serie Wan, reconocidos por su alta fidelidad en la generación de imágenes a partir de indicaciones de texto. Su principal innovación reside en la eliminación de las restricciones previas sobre la longitud lateral de la imagen, ofreciendo opciones flexibles y sin restricciones de tamaño de píxeles dentro de un área definida.
¿Cómo se compara Wan 2.5 Preview con otros modelos líderes?
Wan 2.5 Preview destaca por su optimización para imágenes de alta resolución, inferencia rápida y calidad consistente en tamaños grandes, solucionando la degradación de calidad que a veces se observa en Stable Diffusion al escalar. En comparación con DALL·E 3, Midjourney e Imagen, Wan 2.5 ofrece un control de dimensión flexible superior, lo que lo convierte en una opción muy ventajosa para diseño especializado, aplicaciones de impresión y una personalización versátil de la salida sin sacrificar el detalle.
¿Cuáles son los principales casos de uso de Wan 2.5 Preview?
Es ideal para una amplia gama de aplicaciones, incluida la creación de arte digital, imágenes publicitarias y de marketing, generación de contenido general para blogs y redes sociales, creación de prototipos y diseño, materiales educativos y producción de entretenimiento y medios como guiones gráficos y efectos visuales.
¿Cuál es el precio de la API para Wan 2.5 Preview?
La API para Wan 2.5 Preview tiene un precio accesible de $0,0315 por imagen generada.
¿Cuáles son las métricas de rendimiento clave de Wan 2.5 Preview?
Cuenta con una puntuación FID de 13,5 (alta calidad), una velocidad de inferencia promedio de 4 segundos por imagen de 512x512, un uso de memoria optimizado para VRAM de GPU de más de 12 GB y admite resoluciones de hasta 4K y superiores sin degradación de la calidad. También destaca por generar diversas imágenes para la misma solicitud.
Patio de juegos de IA



Acceso