Afuera

Charlar

desactivar

Wan 2.2 Reframe de Vace

Su innovadora arquitectura admite múltiples condiciones de control de entrada y ofrece importantes ventajas de compresión sin sacrificar la fidelidad de la salida.

Fichas de $1 gratis para nuevos miembros

Text to Speech

Javascript

Python

                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v2/video/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'alibaba/wan2.2-vace-fun-a14b-reframe',
      prompt: 'Mona Lisa puts on glasses with her hands.',
      video_url: 'https://storage.googleapis.com/falserverless/example_inputs/wan_animate_input_video.mp4',
      image_url: 'https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg',
      resolution: "720p",
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main()

                                        import requests


def main():
    url = "https://api.ai.cc/v2/video/generations"
    payload = {
        "model": "alibaba/wan2.2-vace-fun-a14b-reframe",
        "prompt": "Mona Lisa puts on glasses with her hands.",
        "video_url": "https://storage.googleapis.com/falserverless/example_inputs/wan_animate_input_video.mp4",
        "image_url": "https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg",
        "resolution": "720p",
    }
    headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}

    response = requests.post(url, json=payload, headers=headers)
    print("Generation:", response.json())


if __name__ == "__main__":
    main()

Docs

Más de 300 modelos de IA para OpenClaw y agentes de IA

Ahorra un 20% en costes y obtén fichas gratis de 1 $.

Obtén la clave API Explorar modelos

Wan 2.2 Reframe de Vace

Detalles del producto

Wan 2.2 VACE Reframe es un modelo avanzado de generación y edición de video diseñado para aplicaciones sofisticadas transformaciones de vídeo a vídeoOfrece una experiencia inigualable. control de grano fino sobre el estilo de vídeo y la dinámica de movimiento, todo ello preservando rigurosamente la identidad del sujeto y la calidad del vídeo. Construido sobre la sólida arquitectura VACE y potenciado por Pesos Wan 2.2 T2V A14BEste modelo permite a los creadores generar, reencuadrar y modificar vídeos con precisión, ya sea localmente o a través de una API, con una eficiencia y exactitud excepcionales.

🚀 Especificaciones técnicas

Arquitectura: Arquitectura VACE combinada con el modelo basado en difusión Wan 2.2 T2V A14B.
Condiciones de control: Admite un control preciso mediante Pose, Profundidad, MLSD (Detección de segmentos de múltiples líneas), Bordes astutos, y Control de trayectoria.
Velocidad de fotogramas: Optimizado para una predicción de vídeo fluida a un ritmo impresionante. 81 fotogramas por segundo (fps).
Resolución: Soportes 512p, 768p, 1024p resoluciones de salida, con capacidad teórica para 1080p en vídeos más largos.
Tipos de entrada: Diseñado principalmente para transformaciones de vídeo a vídeo; también admite entradas adicionales como imágenes fijas e indicaciones de texto para flujos de trabajo relacionados de VACE Fun.

✨ Pruebas de rendimiento

Calidad de vídeo: Garantiza una calidad excepcional coherencia temporal y una fidelidad del sujeto a lo largo de todos los fotogramas, lo que da como resultado un movimiento de vídeo natural y de alta calidad.
Versatilidad: Características predicción multilingüe, ampliando su adopción entre diversas bases de usuarios globales.
Precisión de control: Logra una precisión de generación superior al permitir control preciso supera a muchas alternativas de código abierto en cuanto a pose, profundidad y trayectorias de movimiento.

💡 Características principales

Especialización en reencuadre de vídeo: Diseñado para reinterpretar vídeos modificando hábilmente la perspectiva, el movimiento o el estilo, al tiempo que se preserva la coherencia espacial y la identidad del sujeto del contenido original.
Control de múltiples condiciones: Ofrece controles de entrada precisos, incluyendo: pose, mapas de profundidad, MLSD, detección de bordes de Canny y trayectorias para realizar ajustes precisos de movimiento y encuadre.
Consistencia temporal de alta fidelidad: Mantiene transiciones fluidas entre fotogramas y un posicionamiento uniforme de los objetos, algo crucial para un reencuadre de vídeo de alta calidad, libre de parpadeos o distorsiones.
Estabilización de movimiento y escena: Incorpora funciones avanzadas del motor VACE 2.0 para la estabilización del movimiento de la cámara, la fijación del fondo y la integración de efectos especiales (por ejemplo, fuego, humo) durante el reencuadre.
Resolución de salida versátil: Capaz de generar vídeos reencuadrados hasta 1080p Con una reproducción fluida a más de 24 FPS, optimizada para hardware GPU de gama de consumo para uso local.

💲 Precios de API

360p: $0.0525
540p: $0.07875
720p: $0.105

✅ Casos de uso

Creación de contenido: Ideal para la creación de contenido de vídeo y su adaptación para redes sociales, campañas publicitarias y entretenimiento.
Edición de vídeo avanzada: Ideal para situaciones que requieren un estilo específico o ajustes de movimiento complejos dentro de grabaciones de vídeo ya existentes.
Generación de animación: Crea animaciones dinámicas a partir de imágenes fijas o vídeos de referencia con un control mejorado.
Producción de vídeo local: Permite a los usuarios generar vídeos localmente, reduciendo significativamente la dependencia de la infraestructura en la nube.
Investigación y desarrollo: De gran utilidad para aplicaciones de investigación académica e industrial en síntesis de vídeo y transferencia de estilo.

💻 Ejemplo de código

📊 Comparación con otros modelos

vs Wan 2.1 VACE: Wan 2.2 ofrece un salto sustancial en calidad de video con velocidades de fotogramas significativamente más altas (81 fps frente a ~30 fps) y admite condiciones de control más precisas como trayectoria y MLSDAdemás, se beneficia de una compresión VAE más eficiente, lo que permite un reencuadre de vídeo más rápido y de mayor resolución, a la vez que preserva mejor la coherencia espacial que su predecesor.

vs Wan 2.2-T2V-A14B (Texto a vídeo): Mientras que Wan 2.2-T2V está optimizado para Fundamentación semántica de texto a vídeo y generación de escenas cinematográficas, Wan 2.2 VACE Reframe se especializa en reencuadre de vídeo a vídeo Con control de múltiples condiciones. Esto hace que VACE Reframe sea superior para la preservación del movimiento y del sujeto en metraje existente, en comparación con la generación de escenas sintéticas a partir de texto.

vs Wan 2.2-I2V-A14B (Imagen a vídeo): El modelo VACE Reframe está diseñado a medida por expertos para reencuadre de vídeo Con un control preciso de la trayectoria y la pose. En cambio, Wan 2.2-I2V se centra en transformar imágenes fijas en vídeos con mejora de detalles guiada por expertos. Por consiguiente, VACE Reframe es la opción preferida para editar y rediseñar vídeos existentes, mientras que I2V destaca en la animación a partir de imágenes estáticas.

🔗 Integración de API

El modelo es fácilmente accesible a través de API de IA/ML. La documentación completa es disponible aquí.

❓ Preguntas frecuentes (FAQ)

P: ¿Para qué se diseñó principalmente Wan 2.2 VACE Reframe?
A: Wan 2.2 VACE Reframe es un modelo de IA de última generación diseñado específicamente para transformaciones avanzadas de vídeo a vídeo, que ofrece un control preciso sobre el estilo y el movimiento del vídeo, al tiempo que preserva la identidad del sujeto y la calidad del vídeo.

P: ¿Qué condiciones de control específicas admite para la transformación de vídeo?
A: Admite un control granular fino a través de condiciones como Pose, Profundidad, MLSD (Detección de Segmentos de Líneas Múltiples), bordes Canny y control de trayectoria, lo que permite ajustes de movimiento y encuadre de gran precisión.

P: ¿Cómo garantiza Wan 2.2 VACE Reframe una alta calidad de vídeo y una consistencia temporal?
A: El modelo mantiene una coherencia temporal superior y una fidelidad del sujeto entre fotogramas, lo que garantiza transiciones fluidas entre fotogramas y un posicionamiento consistente de los objetos, algo fundamental para obtener vídeos reencuadrados naturales y de alta calidad.

P: ¿Cuáles son las principales diferencias entre Wan 2.2 VACE Reframe y Wan 2.2-T2V-A14B?
A: Wan 2.2 VACE Reframe se especializa en transformaciones de vídeo a vídeo con control de múltiples condiciones para metraje existente, centrándose en la preservación del movimiento y del sujeto. Wan 2.2-T2V-A14B, por el contrario, está optimizado para generar escenas cinematográficas a partir de indicaciones de texto (texto a vídeo).

P: ¿Se puede utilizar Wan 2.2 VACE Reframe para la generación de vídeo local?
R: Sí, está adaptado para hardware GPU de consumo, lo que permite a los creadores generar, reencuadrar y modificar vídeos localmente, reduciendo la dependencia de soluciones basadas en la nube.

Campo de juegos de IA

Pruebe todos los modelos de API en el entorno de pruebas antes de integrarlos. Ofrecemos más de 300 modelos para integrar en su aplicación.

Pruébalo gratis

Más de 300 modelos de IA para
OpenClaw y agentes de IA

Ahorre un 20% en costos

Fichas de $1 gratis para nuevos miembros