qwen-bg
max-ico04
En
Afuera
max-ico02
Charlar
max-ico03
desactivar
Reestructuración de Wan 2.2 Vace
Su innovadora arquitectura admite múltiples condiciones de control de entrada y ofrece importantes ventajas de compresión sin sacrificar la fidelidad de salida.
Tokens gratis de $1 para nuevos miembros
Text to Speech
                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v2/video/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'alibaba/wan2.2-vace-fun-a14b-reframe',
      prompt: 'Mona Lisa puts on glasses with her hands.',
      video_url: 'https://storage.googleapis.com/falserverless/example_inputs/wan_animate_input_video.mp4',
      image_url: 'https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg',
      resolution: "720p",
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main()

                                
                                        import requests


def main():
    url = "https://api.ai.cc/v2/video/generations"
    payload = {
        "model": "alibaba/wan2.2-vace-fun-a14b-reframe",
        "prompt": "Mona Lisa puts on glasses with her hands.",
        "video_url": "https://storage.googleapis.com/falserverless/example_inputs/wan_animate_input_video.mp4",
        "image_url": "https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg",
        "resolution": "720p",
    }
    headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}

    response = requests.post(url, json=payload, headers=headers)
    print("Generation:", response.json())


if __name__ == "__main__":
    main()
Docs

Una API con más de 300 modelos de IA

Ahorre un 20% en costos y $1 en tokens gratis
qwenmax-bg
imagen
Reestructuración de Wan 2.2 Vace

Detalle del producto

Reestructuración de Wan 2.2 VACE es un modelo avanzado de generación y edición de vídeo diseñado para aplicaciones sofisticadas transformaciones de vídeo a vídeoOfrece una experiencia incomparable control de grano fino sobre el estilo de video y la dinámica de movimiento, todo mientras se preserva rigurosamente la identidad del sujeto y la calidad del video. Construido sobre la robusta arquitectura VACE y potenciado por Pesos Wan 2.2 T2V A14BEste modelo permite a los creadores generar, replantear y modificar con precisión videos, ya sea localmente o mediante API, con una eficiencia y precisión excepcionales.

🚀 Especificaciones técnicas

  • Arquitectura: Arquitectura VACE combinada con el modelo basado en difusión Wan 2.2 T2V A14B.
  • Condiciones de control: Admite un control preciso a través de Pose, Profundidad, MLSD (Detección de segmentos de múltiples líneas), Bordes astutos, y Control de trayectoria.
  • Velocidad de cuadros: Optimizado para una predicción de video fluida a un nivel impresionante 81 cuadros por segundo (fps).
  • Resolución: Soportes 512p, 768p, 1024p resoluciones de salida, con capacidad teórica para 1080p en vídeos más largos.
  • Tipos de entrada: Diseñado principalmente para transformaciones de video a video; también admite entradas adicionales como imágenes fijas e indicaciones de texto para flujos de trabajo de VACE Fun relacionados.

✨ Puntos de referencia de rendimiento

  • Calidad de vídeo: Garantiza excepcional coherencia temporal y fidelidad del sujeto en todos los fotogramas, lo que da como resultado un movimiento de video natural y de alta calidad.
  • Versatilidad: Características predicción multilingüe, ampliando su adopción entre diversas bases de usuarios globales.
  • Precisión de control: Logra una precisión de generación superior al permitir control fino sobre trayectorias de pose, profundidad y movimiento, superando a muchas alternativas de código abierto.

💡 Características principales

  • Especialización en reencuadre de video: Diseñado para reencuadrar videos modificando hábilmente la perspectiva, el movimiento o el estilo mientras se preserva la coherencia espacial y la identidad del tema del contenido original.
  • Control de múltiples condiciones: Ofrece controles de entrada precisos que incluyen Pose, mapas de profundidad, MLSD, detección de bordes Canny y trayectorias para realizar ajustes precisos de movimiento y encuadre.
  • Consistencia temporal de alta fidelidad: Mantiene transiciones fluidas de cuadro a cuadro y un posicionamiento consistente de los objetos, algo crucial para el reencuadre de videos de alta calidad sin parpadeos ni distorsiones.
  • Estabilización de movimiento y escena: Incorpora funciones avanzadas del motor VACE 2.0 para la estabilización del movimiento de la cámara, la fijación del fondo y la integración de efectos especiales (por ejemplo, fuego, humo) durante el reencuadre.
  • Resolución de salida versátil: Capaz de generar vídeos reencuadrados hasta 1080p con reproducción fluida de más de 24 FPS, optimizada para hardware de GPU de nivel de consumidor para uso local.

💲 Precios de la API

  • 360p: $0.0525
  • 540p: $0.07875
  • 720p: $0.105

✅ Casos de uso

  • Creación de contenido: Ideal para la creación de contenidos de vídeo y su reencuadre para redes sociales, campañas publicitarias y entretenimiento.
  • Edición de vídeo avanzada: Perfecto para escenarios que requieren un estilo específico o ajustes de movimiento intrincados dentro de secuencias de video existentes.
  • Generación de animación: Cree animaciones dinámicas a partir de imágenes fijas o vídeos de referencia con un control mejorado.
  • Producción de vídeo local: Permita a los usuarios generar videos localmente, reduciendo significativamente la dependencia de la infraestructura de la nube.
  • Investigación y desarrollo: Valioso para aplicaciones de investigación académica e industrial en síntesis de video y transferencia de estilo.

Ejemplo de código

            

📊 Comparación con otros modelos

contra Wan 2.1 VACE: Wan 2.2 ofrece un salto sustancial en calidad de vídeo con velocidades de cuadro significativamente más altas (81 fps frente a ~30 fps) y admite condiciones de control más precisas como trayectoria y MLSDTambién se beneficia de una compresión VAE más eficiente, lo que permite un reencuadre de video más rápido y con mayor resolución, al tiempo que preserva mejor la coherencia espacial que su predecesor.

vs Wan 2.2-T2V-A14B (Texto a vídeo): Si bien Wan 2.2-T2V está optimizado para Fundamento semántico de texto a vídeo y generación de escenas cinematográficas, Wan 2.2 VACE Reframe se especializa en reencuadre de vídeo a vídeo Con control multicondición. Esto hace que VACE Reframe sea superior para la preservación del movimiento y el sujeto en metraje existente, a diferencia de la generación de escenas sintéticas a partir de texto.

vs Wan 2.2-I2V-A14B (imagen a vídeo): El modelo VACE Reframe está diseñado por expertos para reencuadre de vídeo Con una trayectoria precisa y controles de pose. Por el contrario, Wan 2.2-I2V se centra en la transformación de imágenes fijas en vídeos con mejoras de detalle guiadas por expertos. Por consiguiente, VACE Reframe es la opción preferida para editar y rediseñar vídeos existentes, mientras que I2V destaca en la animación a partir de imágenes estáticas.

🔗 Integración API

El modelo es fácilmente accesible a través de API de IA/ML. La documentación completa es disponible aquí.

❓ Preguntas frecuentes (FAQ)

P: ¿Para qué está diseñado principalmente Wan 2.2 VACE Reframe?
A: Wan 2.2 VACE Reframe es un modelo de IA de última generación diseñado específicamente para transformaciones avanzadas de video a video, que ofrece un control preciso sobre el estilo y el movimiento del video al tiempo que preserva la identidad del sujeto y la calidad del video.

P: ¿Qué condiciones de control específicas admite para la transformación de vídeo?
A: Admite un control granular fino a través de condiciones como Pose, Profundidad, MLSD (Detección de segmentos de múltiples líneas), bordes Canny y control de trayectoria, lo que permite ajustes de movimiento y encuadre altamente precisos.

P: ¿Cómo garantiza Wan 2.2 VACE Reframe una alta calidad de video y consistencia temporal?
R: El modelo mantiene una coherencia temporal superior y fidelidad del sujeto en todos los fotogramas, lo que garantiza transiciones suaves de fotograma a fotograma y un posicionamiento consistente de los objetos, lo cual es fundamental para obtener vídeos reencuadrados naturales y de alta calidad.

P: ¿Cuáles son las principales diferencias entre Wan 2.2 VACE Reframe y Wan 2.2-T2V-A14B?
R: Wan 2.2 VACE Reframe se especializa en transformaciones de video a video con control multicondicional para material existente, centrándose en la preservación del movimiento y del sujeto. Wan 2.2-T2V-A14B, por otro lado, está optimizado para generar escenas cinematográficas a partir de indicaciones de texto (texto a video).

P: ¿Se puede utilizar Wan 2.2 VACE Reframe para la generación de vídeo local?
R: Sí, está adaptado para hardware de GPU de consumo, lo que permite a los creadores generar, reencuadrar y modificar videos localmente, reduciendo la dependencia de soluciones basadas en la nube.

Patio de juegos de IA

Pruebe todos los modelos de API en el entorno de pruebas antes de integrarlos. Ofrecemos más de 300 modelos para integrar en su aplicación.
Pruébalo gratis
api-right-1
modelo-bg02-1

Una API
Más de 300 modelos de IA

Ahorre un 20% en costos