qwen-bg
ico máximo04
En
Afuera
ico-máximo02
Charlar
ico-máximo03
desactivar
Avance de Wan 2.5
Su compatibilidad con dimensiones flexibles y su salida de alta calidad lo hacen ideal para su uso en aplicaciones creativas, herramientas de marketing, sistemas de gestión de contenido y software de diseño.
Fichas de $1 gratis para nuevos miembros
Text to Speech
                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v1/images/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'alibaba/wan2.5-t2i-preview',
      prompt: 'A jellyfish in the ocean',
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main();

                                
                                        import requests


def main():
    response = requests.post(
        "https://api.ai.cc/v1/images/generations",
        headers={
            "Authorization": "Bearer ",
            "Content-Type": "application/json",
        },
        json={
            "model": "alibaba/wan2.5-t2i-preview",
            "prompt": "A jellyfish in the ocean",
        },
    )

    response.raise_for_status()
    data = response.json()

    print("Generation:", data)


if __name__ == "__main__":
    main()
Docs

Más de 300 modelos de IA para OpenClaw y agentes de IA

Ahorra un 20% en costes y obtén fichas gratis de 1 $.
qwenmax-bg
imagen
Avance de Wan 2.5

Detalles del producto

Avance de Wan 2.5 Representa la vanguardia en la generación de imágenes a partir de texto, basándose en la exitosa serie Wan. Esta versión introduce mejoras significativas, principalmente la eliminación de las restricciones anteriores sobre la longitud de los lados de la imagen, lo que brinda a los usuarios una flexibilidad sin precedentes en la elección de dimensiones de píxeles dentro de un área definida. Combina magistralmente una arquitectura de IA avanzada con un control meticuloso a nivel de píxel para generar imágenes diversas, altamente detalladas y de alta fidelidad a partir de simples indicaciones de texto.

🔧 Especificaciones técnicas

  • Tipo de modelo: Modelo generativo de texto a imagen
  • Arquitectura: Red generativa avanzada basada en difusión
  • Aporte: Indicaciones de texto en lenguaje natural
  • Producción: Imágenes de resolución variable, cualquier dimensión dentro del rango de píxeles admitido.
  • Datos de entrenamiento: Conjunto de datos multimodales diversos, que incluyen arte, fotografías e ilustraciones digitales.
  • Idiomas compatibles: Ante todo Inglésadaptable a otros idiomas con tokenización

📈 Pruebas de rendimiento

  • Puntuación FID (distancia de inicio de Fréchet): 13.5 En los parámetros de referencia estándar para la generación de imágenes, lo que indica un alto realismo y calidad.
  • Velocidad de inferencia: Tiempo de generación promedio de 4 segundos por imagen de 512x512 en GPU modernas.
  • Uso de memoria: Optimizado para ejecutarse en 12 GB o más Configuraciones de VRAM de la GPU.
  • Soporte para la resolución de problemas: Genera imágenes con éxito hasta 4K y más allá sin degradación de la calidad.
  • Diversidad: Genera una amplia gama de imágenes únicas para una misma consigna, lo que fomenta la exploración creativa.

💲 Precios de API

Solo 0,0315 dólares por imagen

🔑 Características principales

  • Detalle de alta calidad: Produce Características de imagen nítidas y complejas en diversos estilos y temas.
  • Adaptación de estilo flexible: Capaz de generar imágenes artísticas, realistas o estilizadas a partir de un contexto específico.
  • Inferencia rápida: El diseño eficiente del modelo permite generación de imágenes más rápida en comparación con versiones anteriores.
  • Resolución escalable: Adecuado para miniaturas digitales pequeñas de hasta impresiones y presentaciones de gran formato.

🚀 Casos de uso

  • Creación de arte digital: Ideal para artistas que buscan obras de arte personalizadas de cualquier tamaño y estilo.
  • Marketing y publicidad: Crea rápidamente imágenes de alta calidad adaptadas a las necesidades de la campaña.
  • Generación de contenido: Mejora tus blogs, redes sociales y sitios web con imágenes únicas.
  • Prototipado y diseño: Generar arte conceptual e imágenes del producto durante las primeras etapas de desarrollo.
  • Materiales educativos: Crea ilustraciones o infografías atractivas para materiales didácticos.
  • Entretenimiento y medios de comunicación: Útil para la creación de guiones gráficos, la conceptualización de personajes y los recursos para efectos visuales.

💻 Ejemplo de código

🔄 Comparación con otros modelos

vs Difusión estable: Wan 2.5 está optimizado para imágenes de alta resolución con inferencia rápida y una calidad constante en tamaños grandes, mientras que Stable Diffusion a veces experimenta una degradación de la calidad al aumentar la escala.

vs DALL·E 3: La vista previa de Wan 2.5 proporciona control dimensional flexible Permite a los usuarios adaptar libremente los tamaños de salida, lo que resulta especialmente ventajoso para aplicaciones especializadas de diseño e impresión.

vs Midjourney: Wan 2.5 Preview es más versátil en la personalización de dimensiones y admite salidas estilizadas y fotorrealistas con generación rápida, lo que resulta atractivo para los usuarios que necesitan Flexibilidad de tamaño sin sacrificar el detalle.

vs Imagen: Wan 2.5 Preview supera a Imagen al permitir Selección libre de las dimensiones de la imagen dentro de los límites del área de píxeles, lo que proporciona una mayor adaptabilidad para diversos casos de uso y resultados listos para imprimir.

💭 Preguntas frecuentes (FAQ)

¿Qué es Wan 2.5 Preview?

Wan 2.5 Preview es la última versión de los modelos de conversión de texto a imagen de la serie Wan, reconocidos por la alta fidelidad en la generación de imágenes a partir de textos. Su principal innovación radica en la eliminación de las restricciones previas sobre la longitud de los lados de la imagen, ofreciendo opciones de dimensiones de píxeles flexibles y sin restricciones dentro de un área definida.

¿Cómo se compara Wan 2.5 Preview con otros modelos líderes?

Wan 2.5 Preview destaca por su optimización para imágenes de alta resolución, inferencia rápida y calidad constante en tamaños grandes, solucionando la degradación de calidad que a veces se observa en Stable Diffusion al escalar. En comparación con DALL·E 3, Midjourney e Imagen, Wan 2.5 ofrece un control de dimensiones flexible superior, lo que lo hace muy ventajoso para diseño especializado, aplicaciones de impresión y personalización versátil de la salida sin sacrificar el detalle.

¿Cuáles son los principales casos de uso de la versión preliminar de Wan 2.5?

Es ideal para una amplia gama de aplicaciones, incluyendo la creación de arte digital, elementos visuales para marketing y publicidad, generación de contenido general para blogs y redes sociales, creación de prototipos y diseño, materiales educativos y producción de entretenimiento y medios de comunicación, como la creación de guiones gráficos y efectos visuales.

¿Cuál es el precio de la API para la versión preliminar de Wan 2.5?

La API para Wan 2.5 Preview tiene un precio accesible de 0,0315 dólares por imagen generada.

¿Cuáles son las métricas clave de rendimiento de la versión preliminar de Wan 2.5?

Cuenta con una puntuación FID de 13,5 (alta calidad), una velocidad de inferencia promedio de 4 segundos por imagen de 512x512, un uso de memoria optimizado para GPU VRAM de 12 GB o más, y admite resoluciones de hasta 4K y superiores sin degradación de la calidad. Además, destaca por generar imágenes diversas para una misma solicitud.

Campo de juegos de IA

Pruebe todos los modelos de API en el entorno de pruebas antes de integrarlos. Ofrecemos más de 300 modelos para integrar en su aplicación.
Pruébalo gratis
api-right-1
modelo-bg02-1

Más de 300 modelos de IA para
OpenClaw y agentes de IA

Ahorre un 20% en costos