qwen-bg
ico máximo04
En
Afuera
ico-máximo02
Charlar
ico-máximo03
desactivar
Wan 2.2 Vac Relleno
Su énfasis en mantener la coherencia temporal y contextual al tiempo que ofrece resultados de alta resolución lo hace ideal para la postproducción de vídeo avanzada y los flujos de trabajo creativos.
Fichas de $1 gratis para nuevos miembros
Text to Speech
                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v2/video/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'alibaba/wan2.2-vace-fun-a14b-inpainting',
      prompt: 'Mona Lisa puts on glasses with her hands.',
      video_url: 'https://storage.googleapis.com/falserverless/example_inputs/wan_animate_input_video.mp4',
      image_url: 'https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg',
      resolution: "720p",
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main()

                                
                                        import requests


def main():
    url = "https://api.ai.cc/v2/video/generations"
    payload = {
        "model": "alibaba/wan2.2-vace-fun-a14b-inpainting",
        "prompt": "Mona Lisa puts on glasses with her hands.",
        "video_url": "https://storage.googleapis.com/falserverless/example_inputs/wan_animate_input_video.mp4",
        "image_url": "https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg",
        "resolution": "720p",
    }
    headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}

    response = requests.post(url, json=payload, headers=headers)
    print("Generation:", response.json())


if __name__ == "__main__":
    main()
Docs

Más de 300 modelos de IA para OpenClaw y agentes de IA

Ahorra un 20% en costes y obtén fichas gratis de 1 $.
qwenmax-bg
imagen
Wan 2.2 Vac Relleno

Detalles del producto

Descripción general: Relleno de vídeo avanzado con Wan 2.2 Vace

Wan 2.2 Vac Relleno es un modelo de IA generativa de vídeo a vídeo de vanguardia diseñado para el relleno de alta calidad dentro del contenido de vídeo. Esta potente herramienta revoluciona la edición de vídeo al permitir a los usuarios enmascarar y modificar sin problemas regiones específicas en los vídeos. Mantiene meticulosamente continuidad contextual, consistencia del movimientoy una restauración precisa de los detalles, lo que garantiza un resultado final natural y pulido. Gracias a la comprensión multimodal avanzada y las tecnologías de generación de vídeo adaptativa, Wan 2.2 Vace está optimizado para ofrecer resultados impresionantes en resoluciones de hasta 720p.

Especificaciones técnicas y rendimiento

⚙️ Arquitectura principal

  • Arquitectura del modelo: Plataforma transformadora multimodal de vídeo e imagen con predicción adaptativa de escenas y movimiento.
  • Tamaño del parámetro: 14 mil millones de parámetros, lo que garantiza un nivel de detalle excepcional en la síntesis de vídeo.
  • Rango de resolución: Ofrece una resolución de hasta 720p; por defecto, se suele usar a 480p para optimizar la velocidad.
  • Procesamiento de la velocidad de fotogramas: Funciona a 16 fotogramas por segundo para una síntesis de vídeo estable.
  • Formatos de entrada/salida: Admite MP4, MOV, WebM, M4V, GIF para vídeo; JPG, JPEG, PNG, WebP, GIF, AVIF para imágenes.
  • Uso de la memoria: Uso eficiente de la GPU, compatible con flujos de trabajo tanto locales como en la nube, con un consumo moderado de memoria.

📊 Puntos de referencia de rendimiento

  • Calidad de la repintura: Excel para preservar el contexto y los detalles de la textura durante las ediciones de vídeo localizadas.
  • Estabilidad temporal: Excelente rendimiento en la continuidad del movimiento, minimizando el parpadeo en comparación con los modelos de referencia.
  • Escalado de resolución: Alta fidelidad a 720p con ligeras pérdidas de velocidad; procesamiento más rápido a 480p manteniendo la consistencia visual.
  • Longitud máxima del clip: Admite de forma fiable hasta 80-81 fotogramas; la calidad puede degradarse más allá de este límite.

Características clave para una edición de vídeo sin problemas

  • Relleno de vídeo con enmascaramiento: Permite la edición selectiva mediante el uso de un vídeo de origen y un vídeo de máscara correspondiente para retocar o reemplazar las áreas designadas.
  • Consistencia temporal: Garantiza una fluidez de movimiento y coherencia entre fotogramas, evitando el parpadeo o los artefactos comunes durante el proceso de relleno de imágenes.
  • 🔬 Restauración de alto nivel de detalle: Reconstruye texturas finas y detalles intrincados dentro de la región enmascarada para lograr una apariencia muy natural.
  • 📺 Soporte para la resolución de problemas: Ofrece una salida de vídeo flexible a 480p, 580p y hasta 720p, con escalado de calidad en función de la disponibilidad de recursos.
  • 📥 Tipos de entrada flexibles: Admite varios formatos de vídeo (MP4, MOV, WebM, M4V, GIF) y formatos de imagen (JPG, PNG, WebP) para entradas de máscara o referencia.
  • 🤝 Integración con ComfyUI: Compatible con los flujos de trabajo de ComfyUI, lo que permite combinarlo con procesos de conversión de texto a vídeo, animación de imágenes y renderizado.

Precios de API

  • 360p: $0.0525
  • 540p: $0.07875
  • 720p: $0.105

Escenarios de uso versátiles

  • 🎬 Postproducción de vídeo profesional: Ideal para retoques de efectos visuales, eliminación de objetos y reedición de escenas complejas.
  • 📈 Creación de contenido para marketing digital: Facilita la personalización automatizada de vídeos y la adaptación de la marca para campañas atractivas.
  • 🎓 Mejora del material de vídeo educativo: Permite reconstrucciones visuales o animaciones de actualización de contenido dinámico.
  • 🎨 Artes creativas y narración digital: Admite sustituciones de animación sin interrupciones y efectos visuales complejos.

Ejemplo de código

  

Comparación con otros modelos líderes

Wan 2.2 Vace vs. Seedance 1.0: Mientras Seedance 1.0 ofrece una velocidad de fotogramas ligeramente superior a 24 fps (beneficiosa para la generación de vídeo ultrasuave), Tienen 2,2 años. Proporciona una integración superior para una mayor flexibilidad en el relleno de imágenes y funciona de manera eficiente en hardware más modesto, lo que lo hace ampliamente accesible para los creadores.

Wan 2.2 Vace vs. Veo 3: Veo 3 Destaca por su avanzada función de mejora de vídeo de código cerrado, con mayor resolución y velocidad, aunque a un coste significativamente superior. Tienen 2,2 años. Se erige como una sólida alternativa de código abierto, que ofrece robustas capacidades de relleno multimodal y una integración de API más sencilla, adecuada para una amplia gama de usos profesionales.

Wan 2.2 Vace vs. Relleno de vídeo de referencia genérico: En comparación con los modelos básicos de referencia, Tienen 2,2 años. Ofrece una restauración de detalles de textura y coherencia de movimiento significativamente mejoradas. Los modelos de referencia suelen sufrir más artefactos y parpadeos, posicionamiento. Tienen 2,2 años. como la opción preferida para proyectos de retoque de vídeo de alta calidad.

Integración de API

Acceso Wan 2.2 Vac Relleno a través de la API de IA/ML. La documentación completa está disponible. disponible aquí.

Preguntas frecuentes (FAQ)

P1: ¿Para qué se diseñó principalmente Wan 2.2 Vace Inpainting?

A1: Wan 2.2 Vace Inpainting está diseñado principalmente para tareas de relleno de vídeo a vídeo de alta calidad, lo que permite a los usuarios enmascarar, modificar y rellenar sin problemas regiones específicas en los vídeos, conservando el contexto y la continuidad del movimiento.

P2: ¿Qué resolución admite Wan 2.2 Vace Inpainting?

A2: El modelo admite resoluciones de salida de hasta 720p, aunque el uso predeterminado suele estar configurado en 480p para un procesamiento más rápido manteniendo la coherencia visual.

P3: ¿Cómo garantiza Wan 2.2 Vace la coherencia temporal en los vídeos editados?

A3: Integra una arquitectura de transformación de vídeo e imagen multimodal con predicción adaptativa de escenas y movimientos, diseñada específicamente para mantener un flujo de movimiento suave y coherente entre fotogramas, evitando parpadeos o artefactos.

P4: ¿Se puede integrar Wan 2.2 Vace Inpainting con otras herramientas de IA?

A4: Sí, es compatible con los flujos de trabajo de ComfyUI, lo que permite a los usuarios combinar tareas de relleno de imágenes con otros procesos como la generación de texto a vídeo, la animación de imágenes y el relleno de bordes.

P5: ¿Cuáles son las principales ventajas de Wan 2.2 Vace sobre los modelos genéricos de relleno de imágenes?

A5: Wan 2.2 Vace ofrece una restauración de detalles de textura significativamente mejorada y una coherencia de movimiento superior, lo que resulta en menos artefactos y parpadeos en comparación con los modelos básicos de referencia, lo que lo hace ideal para proyectos donde la calidad es fundamental.

Campo de juegos de IA

Pruebe todos los modelos de API en el entorno de pruebas antes de integrarlos. Ofrecemos más de 300 modelos para integrar en su aplicación.
Pruébalo gratis
api-right-1
modelo-bg02-1

Más de 300 modelos de IA para
OpenClaw y agentes de IA

Ahorre un 20% en costos