



const main = async () => {
const response = await fetch('https://api.ai.cc/v2/video/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'alibaba/wan2.2-vace-fun-a14b-reframe',
prompt: 'Mona Lisa puts on glasses with her hands.',
video_url: 'https://storage.googleapis.com/falserverless/example_inputs/wan_animate_input_video.mp4',
image_url: 'https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg',
resolution: "720p",
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/video/generations"
payload = {
"model": "alibaba/wan2.2-vace-fun-a14b-reframe",
"prompt": "Mona Lisa puts on glasses with her hands.",
"video_url": "https://storage.googleapis.com/falserverless/example_inputs/wan_animate_input_video.mp4",
"image_url": "https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg",
"resolution": "720p",
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

Detalles del producto
Wan 2.2 VACE Reframe es un modelo avanzado de generación y edición de video diseñado para aplicaciones sofisticadas transformaciones de vídeo a vídeoOfrece una experiencia inigualable. control de grano fino sobre el estilo de vídeo y la dinámica de movimiento, todo ello preservando rigurosamente la identidad del sujeto y la calidad del vídeo. Construido sobre la sólida arquitectura VACE y potenciado por Pesos Wan 2.2 T2V A14BEste modelo permite a los creadores generar, reencuadrar y modificar vídeos con precisión, ya sea localmente o a través de una API, con una eficiencia y exactitud excepcionales.
🚀 Especificaciones técnicas
- Arquitectura: Arquitectura VACE combinada con el modelo basado en difusión Wan 2.2 T2V A14B.
- Condiciones de control: Admite un control preciso mediante Pose, Profundidad, MLSD (Detección de segmentos de múltiples líneas), Bordes astutos, y Control de trayectoria.
- Velocidad de fotogramas: Optimizado para una predicción de vídeo fluida a un ritmo impresionante. 81 fotogramas por segundo (fps).
- Resolución: Soportes 512p, 768p, 1024p resoluciones de salida, con capacidad teórica para 1080p en vídeos más largos.
- Tipos de entrada: Diseñado principalmente para transformaciones de vídeo a vídeo; también admite entradas adicionales como imágenes fijas e indicaciones de texto para flujos de trabajo relacionados de VACE Fun.
✨ Pruebas de rendimiento
- Calidad de vídeo: Garantiza una calidad excepcional coherencia temporal y una fidelidad del sujeto a lo largo de todos los fotogramas, lo que da como resultado un movimiento de vídeo natural y de alta calidad.
- Versatilidad: Características predicción multilingüe, ampliando su adopción entre diversas bases de usuarios globales.
- Precisión de control: Logra una precisión de generación superior al permitir control preciso supera a muchas alternativas de código abierto en cuanto a pose, profundidad y trayectorias de movimiento.
💡 Características principales
- Especialización en reencuadre de vídeo: Diseñado para reinterpretar vídeos modificando hábilmente la perspectiva, el movimiento o el estilo, al tiempo que se preserva la coherencia espacial y la identidad del sujeto del contenido original.
- Control de múltiples condiciones: Ofrece controles de entrada precisos, incluyendo: pose, mapas de profundidad, MLSD, detección de bordes de Canny y trayectorias para realizar ajustes precisos de movimiento y encuadre.
- Consistencia temporal de alta fidelidad: Mantiene transiciones fluidas entre fotogramas y un posicionamiento uniforme de los objetos, algo crucial para un reencuadre de vídeo de alta calidad, libre de parpadeos o distorsiones.
- Estabilización de movimiento y escena: Incorpora funciones avanzadas del motor VACE 2.0 para la estabilización del movimiento de la cámara, la fijación del fondo y la integración de efectos especiales (por ejemplo, fuego, humo) durante el reencuadre.
- Resolución de salida versátil: Capaz de generar vídeos reencuadrados hasta 1080p Con una reproducción fluida a más de 24 FPS, optimizada para hardware GPU de gama de consumo para uso local.
💲 Precios de API
- 360p: $0.0525
- 540p: $0.07875
- 720p: $0.105
✅ Casos de uso
- Creación de contenido: Ideal para la creación de contenido de vídeo y su adaptación para redes sociales, campañas publicitarias y entretenimiento.
- Edición de vídeo avanzada: Ideal para situaciones que requieren un estilo específico o ajustes de movimiento complejos dentro de grabaciones de vídeo ya existentes.
- Generación de animación: Crea animaciones dinámicas a partir de imágenes fijas o vídeos de referencia con un control mejorado.
- Producción de vídeo local: Permite a los usuarios generar vídeos localmente, reduciendo significativamente la dependencia de la infraestructura en la nube.
- Investigación y desarrollo: De gran utilidad para aplicaciones de investigación académica e industrial en síntesis de vídeo y transferencia de estilo.
💻 Ejemplo de código
📊 Comparación con otros modelos
vs Wan 2.1 VACE: Wan 2.2 ofrece un salto sustancial en calidad de video con velocidades de fotogramas significativamente más altas (81 fps frente a ~30 fps) y admite condiciones de control más precisas como trayectoria y MLSDAdemás, se beneficia de una compresión VAE más eficiente, lo que permite un reencuadre de vídeo más rápido y de mayor resolución, a la vez que preserva mejor la coherencia espacial que su predecesor.
vs Wan 2.2-T2V-A14B (Texto a vídeo): Mientras que Wan 2.2-T2V está optimizado para Fundamentación semántica de texto a vídeo y generación de escenas cinematográficas, Wan 2.2 VACE Reframe se especializa en reencuadre de vídeo a vídeo Con control de múltiples condiciones. Esto hace que VACE Reframe sea superior para la preservación del movimiento y del sujeto en metraje existente, en comparación con la generación de escenas sintéticas a partir de texto.
vs Wan 2.2-I2V-A14B (Imagen a vídeo): El modelo VACE Reframe está diseñado a medida por expertos para reencuadre de vídeo Con un control preciso de la trayectoria y la pose. En cambio, Wan 2.2-I2V se centra en transformar imágenes fijas en vídeos con mejora de detalles guiada por expertos. Por consiguiente, VACE Reframe es la opción preferida para editar y rediseñar vídeos existentes, mientras que I2V destaca en la animación a partir de imágenes estáticas.
🔗 Integración de API
El modelo es fácilmente accesible a través de API de IA/ML. La documentación completa es disponible aquí.
❓ Preguntas frecuentes (FAQ)
P: ¿Para qué se diseñó principalmente Wan 2.2 VACE Reframe?
A: Wan 2.2 VACE Reframe es un modelo de IA de última generación diseñado específicamente para transformaciones avanzadas de vídeo a vídeo, que ofrece un control preciso sobre el estilo y el movimiento del vídeo, al tiempo que preserva la identidad del sujeto y la calidad del vídeo.
P: ¿Qué condiciones de control específicas admite para la transformación de vídeo?
A: Admite un control granular fino a través de condiciones como Pose, Profundidad, MLSD (Detección de Segmentos de Líneas Múltiples), bordes Canny y control de trayectoria, lo que permite ajustes de movimiento y encuadre de gran precisión.
P: ¿Cómo garantiza Wan 2.2 VACE Reframe una alta calidad de vídeo y una consistencia temporal?
A: El modelo mantiene una coherencia temporal superior y una fidelidad del sujeto entre fotogramas, lo que garantiza transiciones fluidas entre fotogramas y un posicionamiento consistente de los objetos, algo fundamental para obtener vídeos reencuadrados naturales y de alta calidad.
P: ¿Cuáles son las principales diferencias entre Wan 2.2 VACE Reframe y Wan 2.2-T2V-A14B?
A: Wan 2.2 VACE Reframe se especializa en transformaciones de vídeo a vídeo con control de múltiples condiciones para metraje existente, centrándose en la preservación del movimiento y del sujeto. Wan 2.2-T2V-A14B, por el contrario, está optimizado para generar escenas cinematográficas a partir de indicaciones de texto (texto a vídeo).
P: ¿Se puede utilizar Wan 2.2 VACE Reframe para la generación de vídeo local?
R: Sí, está adaptado para hardware GPU de consumo, lo que permite a los creadores generar, reencuadrar y modificar vídeos localmente, reduciendo la dependencia de soluciones basadas en la nube.
Campo de juegos de IA



Acceso