



const main = async () => {
const response = await fetch('https://api.ai.cc/v2/video/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'alibaba/wan2.2-vace-fun-a14b-inpainting',
prompt: 'Mona Lisa puts on glasses with her hands.',
video_url: 'https://storage.googleapis.com/falserverless/example_inputs/wan_animate_input_video.mp4',
image_url: 'https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg',
resolution: "720p",
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/video/generations"
payload = {
"model": "alibaba/wan2.2-vace-fun-a14b-inpainting",
"prompt": "Mona Lisa puts on glasses with her hands.",
"video_url": "https://storage.googleapis.com/falserverless/example_inputs/wan_animate_input_video.mp4",
"image_url": "https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg",
"resolution": "720p",
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

Detalles del producto
Descripción general: Relleno de vídeo avanzado con Wan 2.2 Vace
Wan 2.2 Vac Relleno es un modelo de IA generativa de vídeo a vídeo de vanguardia diseñado para el relleno de alta calidad dentro del contenido de vídeo. Esta potente herramienta revoluciona la edición de vídeo al permitir a los usuarios enmascarar y modificar sin problemas regiones específicas en los vídeos. Mantiene meticulosamente continuidad contextual, consistencia del movimientoy una restauración precisa de los detalles, lo que garantiza un resultado final natural y pulido. Gracias a la comprensión multimodal avanzada y las tecnologías de generación de vídeo adaptativa, Wan 2.2 Vace está optimizado para ofrecer resultados impresionantes en resoluciones de hasta 720p.
Especificaciones técnicas y rendimiento
⚙️ Arquitectura principal
- Arquitectura del modelo: Plataforma transformadora multimodal de vídeo e imagen con predicción adaptativa de escenas y movimiento.
- Tamaño del parámetro: 14 mil millones de parámetros, lo que garantiza un nivel de detalle excepcional en la síntesis de vídeo.
- Rango de resolución: Ofrece una resolución de hasta 720p; por defecto, se suele usar a 480p para optimizar la velocidad.
- Procesamiento de la velocidad de fotogramas: Funciona a 16 fotogramas por segundo para una síntesis de vídeo estable.
- Formatos de entrada/salida: Admite MP4, MOV, WebM, M4V, GIF para vídeo; JPG, JPEG, PNG, WebP, GIF, AVIF para imágenes.
- Uso de la memoria: Uso eficiente de la GPU, compatible con flujos de trabajo tanto locales como en la nube, con un consumo moderado de memoria.
📊 Puntos de referencia de rendimiento
- Calidad de la repintura: Excel para preservar el contexto y los detalles de la textura durante las ediciones de vídeo localizadas.
- Estabilidad temporal: Excelente rendimiento en la continuidad del movimiento, minimizando el parpadeo en comparación con los modelos de referencia.
- Escalado de resolución: Alta fidelidad a 720p con ligeras pérdidas de velocidad; procesamiento más rápido a 480p manteniendo la consistencia visual.
- Longitud máxima del clip: Admite de forma fiable hasta 80-81 fotogramas; la calidad puede degradarse más allá de este límite.
Características clave para una edición de vídeo sin problemas
- ✨ Relleno de vídeo con enmascaramiento: Permite la edición selectiva mediante el uso de un vídeo de origen y un vídeo de máscara correspondiente para retocar o reemplazar las áreas designadas.
- ✅ Consistencia temporal: Garantiza una fluidez de movimiento y coherencia entre fotogramas, evitando el parpadeo o los artefactos comunes durante el proceso de relleno de imágenes.
- 🔬 Restauración de alto nivel de detalle: Reconstruye texturas finas y detalles intrincados dentro de la región enmascarada para lograr una apariencia muy natural.
- 📺 Soporte para la resolución de problemas: Ofrece una salida de vídeo flexible a 480p, 580p y hasta 720p, con escalado de calidad en función de la disponibilidad de recursos.
- 📥 Tipos de entrada flexibles: Admite varios formatos de vídeo (MP4, MOV, WebM, M4V, GIF) y formatos de imagen (JPG, PNG, WebP) para entradas de máscara o referencia.
- 🤝 Integración con ComfyUI: Compatible con los flujos de trabajo de ComfyUI, lo que permite combinarlo con procesos de conversión de texto a vídeo, animación de imágenes y renderizado.
Precios de API
- 360p: $0.0525
- 540p: $0.07875
- 720p: $0.105
Escenarios de uso versátiles
- 🎬 Postproducción de vídeo profesional: Ideal para retoques de efectos visuales, eliminación de objetos y reedición de escenas complejas.
- 📈 Creación de contenido para marketing digital: Facilita la personalización automatizada de vídeos y la adaptación de la marca para campañas atractivas.
- 🎓 Mejora del material de vídeo educativo: Permite reconstrucciones visuales o animaciones de actualización de contenido dinámico.
- 🎨 Artes creativas y narración digital: Admite sustituciones de animación sin interrupciones y efectos visuales complejos.
Ejemplo de código
Comparación con otros modelos líderes
Wan 2.2 Vace vs. Seedance 1.0: Mientras Seedance 1.0 ofrece una velocidad de fotogramas ligeramente superior a 24 fps (beneficiosa para la generación de vídeo ultrasuave), Tienen 2,2 años. Proporciona una integración superior para una mayor flexibilidad en el relleno de imágenes y funciona de manera eficiente en hardware más modesto, lo que lo hace ampliamente accesible para los creadores.
Wan 2.2 Vace vs. Veo 3: Veo 3 Destaca por su avanzada función de mejora de vídeo de código cerrado, con mayor resolución y velocidad, aunque a un coste significativamente superior. Tienen 2,2 años. Se erige como una sólida alternativa de código abierto, que ofrece robustas capacidades de relleno multimodal y una integración de API más sencilla, adecuada para una amplia gama de usos profesionales.
Wan 2.2 Vace vs. Relleno de vídeo de referencia genérico: En comparación con los modelos básicos de referencia, Tienen 2,2 años. Ofrece una restauración de detalles de textura y coherencia de movimiento significativamente mejoradas. Los modelos de referencia suelen sufrir más artefactos y parpadeos, posicionamiento. Tienen 2,2 años. como la opción preferida para proyectos de retoque de vídeo de alta calidad.
Integración de API
Acceso Wan 2.2 Vac Relleno a través de la API de IA/ML. La documentación completa está disponible. disponible aquí.
Preguntas frecuentes (FAQ)
P1: ¿Para qué se diseñó principalmente Wan 2.2 Vace Inpainting?
A1: Wan 2.2 Vace Inpainting está diseñado principalmente para tareas de relleno de vídeo a vídeo de alta calidad, lo que permite a los usuarios enmascarar, modificar y rellenar sin problemas regiones específicas en los vídeos, conservando el contexto y la continuidad del movimiento.
P2: ¿Qué resolución admite Wan 2.2 Vace Inpainting?
A2: El modelo admite resoluciones de salida de hasta 720p, aunque el uso predeterminado suele estar configurado en 480p para un procesamiento más rápido manteniendo la coherencia visual.
P3: ¿Cómo garantiza Wan 2.2 Vace la coherencia temporal en los vídeos editados?
A3: Integra una arquitectura de transformación de vídeo e imagen multimodal con predicción adaptativa de escenas y movimientos, diseñada específicamente para mantener un flujo de movimiento suave y coherente entre fotogramas, evitando parpadeos o artefactos.
P4: ¿Se puede integrar Wan 2.2 Vace Inpainting con otras herramientas de IA?
A4: Sí, es compatible con los flujos de trabajo de ComfyUI, lo que permite a los usuarios combinar tareas de relleno de imágenes con otros procesos como la generación de texto a vídeo, la animación de imágenes y el relleno de bordes.
P5: ¿Cuáles son las principales ventajas de Wan 2.2 Vace sobre los modelos genéricos de relleno de imágenes?
A5: Wan 2.2 Vace ofrece una restauración de detalles de textura significativamente mejorada y una coherencia de movimiento superior, lo que resulta en menos artefactos y parpadeos en comparación con los modelos básicos de referencia, lo que lo hace ideal para proyectos donde la calidad es fundamental.
Campo de juegos de IA



Acceso