



const main = async () => {
const response = await fetch('https://api.ai.cc/v2/video/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'alibaba/wan2.2-vace-fun-a14b-depth',
prompt: 'Mona Lisa puts on glasses with her hands.',
video_url: 'https://storage.googleapis.com/falserverless/example_inputs/wan_animate_input_video.mp4',
image_url: 'https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg',
resolution: "720p",
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/video/generations"
payload = {
"model": "alibaba/wan2.2-vace-fun-a14b-depth",
"prompt": "Mona Lisa puts on glasses with her hands.",
"video_url": "https://storage.googleapis.com/falserverless/example_inputs/wan_animate_input_video.mp4",
"image_url": "https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg",
"resolution": "720p",
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

Detalles del producto
Wan 2.2 VACE Depth se erige como un modelo de generación de vídeo a vídeo de vanguardia, meticulosamente optimizado para control del mapa de profundidadComo miembro clave de la familia Wan 2.2 VACE Fun A14B, este modelo aprovecha la avanzada tecnología de síntesis de vídeo multimodal para producir salidas de vídeo de alta calidad con detección de profundidad. Su especialización en el acondicionamiento de profundidad proporciona una calidad inigualable. control de profundidad espacial, lo que mejora el realismo del vídeo y permite efectos visuales dinámicos.
● Capacidades y características clave
- ✓ Generación controlada por profundidad: Se centra en mapas de profundidad para guiar la creación de vídeos con una precisa percepción espacial.
- ✓ Compatibilidad con múltiples resoluciones: Genera vídeos de 512, 768 y 1024 píxeles, adaptándose a diversas necesidades de producción.
- ✓ Movimiento suave y fluido: Entrenado con 81 fotogramas a 16 fotogramas por segundo (FPS), lo que garantiza un movimiento excepcionalmente suave y fluido.
- ✓ Accesibilidad global: Ofrece soporte multilingüe para una amplia usabilidad a nivel mundial.
- ✓ Profundidad específica del tema: Facilita la generación de vídeo al especificar el sujeto con una comprensión coherente de la escena basada en la profundidad.
- ✓ Amplia compatibilidad de entrada: Compatible con varios formatos de entrada de vídeo, incluidos MP4, MOV, WebM, M4V y GIF.
● Especificaciones técnicas
- 💻 Talla del modelo: Aproximadamente 64 GB
- 🔧 Arquitectura: Construido sobre el modelo base Wan 2.2-T2V-A14B con integración del esquema VACE.
- ⏰ Velocidad de fotogramas: Genera vídeos a 16 FPS
- 📈 Duración del vídeo: Hasta 81 fotogramas por inferencia
- 🔗 Tipos de entrada: Admite entradas de vídeo sin procesar o mapas de profundidad para un control preciso.
● Puntos de referencia de rendimiento
- ✓ Demuestra predicción de vídeo de alta fidelidad con una consistencia de profundidad estable.
- ✓ Minimiza los artefactos comunes en la generación de vídeo, como la fluctuación y la inconsistencia de la escena.
- ✓ Produce movimiento de calidad cinematográfica con señales de profundidad espacial mejoradas.
- ✓ Optimizado para la generación fluida de vídeo en múltiples resoluciones y formatos.
● Casos de uso
- 🎬 Producción de vídeo cinematográfico con renderizado de profundidad preciso.
- 🔍 Previsualización y generación de vídeos conceptuales en la producción cinematográfica.
- 🎨 Animación de arte digital que requiere profundidad espacial y estabilidad de escena.
- 💰 Efectos de vídeo comerciales donde las pistas de profundidad mejoran el realismo.
- 📜 Investigación y desarrollo en síntesis de vídeo multimodal.
● Integración de API y precios
Acceda sin problemas a las capacidades de profundidad VACE de Wan 2.2 a través de la API de IA/ML. El precio se estructura según la resolución de salida:
- 💵 360p: $0.0525
- 💵 540p: $0.07875
- 💵 720p: $0.105
La documentación completa para la integración de API es disponible aquí.
● Ejemplo de código
● Comparación con otros modelos líderes
Wan 2.2 Profundidad vs. KLING 2.0
Wan 2.2 Depth aprovecha una arquitectura de mezcla de expertos con un fuerte énfasis en control preciso del mapa de profundidad para la generación de vídeo espacialmente coherente. En contraste, KLING 2.0 ofrece capacidades de síntesis de vídeo más amplias, pero con un control de movimiento menos explícito basado en la profundidad. Wan 2.2 proporciona Estabilidad temporal superior y consistencia de la escena con resoluciones de hasta 1080p.
Wan 2.2 Profundidad vs. Veo 3
Veo 3 está optimizado para la síntesis de vídeo rápida y en tiempo real, centrándose normalmente en resoluciones más bajas (por ejemplo, 720p) para mayor velocidad. Sin embargo, Wan 2.2 Depth prioriza Calidad cinematográfica con acondicionamiento de profundidad detallado y coherencia de fotogramas robusta., lo que permite obtener resultados de mayor calidad a costa de un mayor consumo de recursos computacionales.
Wan 2.2 Profundidad vs. Wan 2.1 VACE
Wan 2.2 Depth representa un avance significativo, mejorando sustancialmente fluidez de vídeo, realismo de movimiento y precisión de profundidad mediante una arquitectura mejorada. Wan 2.1 VACE es menos especializado en profundidad y a menudo produce resultados menos estables, particularmente en escenarios complejos de generación de escenas.
● Preguntas frecuentes (FAQ)
P: ¿Cuál es la principal ventaja de Wan 2.2 VACE Depth?
A: Su principal ventaja es un control sin igual sobre la generación de vídeo mediante mapas de profundidad, lo que permite una percepción espacial precisa y un mayor realismo en los resultados.
P: ¿Puede Wan 2.2 VACE Depth generar vídeos en alta resolución?
A: Sí, admite predicción de vídeo multirresolución, incluyendo 512, 768 y 1024 píxeles, que satisfacen diversos requisitos de calidad.
P: ¿Cómo garantiza una reproducción de vídeo fluida?
A: El modelo se entrena con 81 fotogramas a 16 FPS, lo cual es fundamental para producir movimiento suave, fluido y de calidad cinematográfica en los vídeos que genera.
P: ¿Qué tipos de vídeos de entrada acepta?
A: Es altamente compatible, aceptando varios tipos de entrada de video como MP4, MOV, WebM, M4V y GIF.
P: ¿Es Wan 2.2 VACE Depth adecuado para la producción cinematográfica profesional?
A: Absolutamente. Su precisa representación de profundidad, movimiento de calidad cinematográfica y capacidad para minimizar los artefactos de generación lo hacen ideal para Producción de vídeo cinematográfico y previsualización.
Campo de juegos de IA



Acceso