



const main = async () => {
const response = await fetch('https://api.ai.cc/v2/generate/video/alibaba/generation', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'wan/v2.1/1.3b/text-to-video',
prompt: 'A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background',
aspect_ratio: '16:9',
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/generate/video/alibaba/generation"
payload = {
"model": "wan/v2.1/1.3b/text-to-video",
"prompt": "A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background",
"aspect_ratio": "16:9",
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

Detalle del producto
💡Descripción general:
Ellos 2.1Desarrollado por el equipo Wan AI de Alibaba, es un modelo de base de video de vanguardia diseñado para tareas avanzadas de video generativo. Compatible con la tecnología de texto a video (T2V), incorpora innovaciones revolucionarias para ofrecer resultados de alta calidad con una eficiencia computacional excepcional.
✨Características principales:
- Generación de texto visual: Genera texto tanto en chino como en inglés dentro de los videos.
- Autocodificador variacional 3D (Wan-VAE): Codifica y decodifica videos 1080P de duración ilimitada con precisión temporal.
- Resultados de alta calidad: Produce vídeos visualmente dinámicos y temporalmente consistentes con resoluciones de hasta 720P.
🎯Uso previsto:
Wan 2.1 está diseñado para aplicaciones en:
- Industrias creativas: Producción de vídeo.
- Generación de contenido: Para campañas de marketing y redes sociales.
- Flujos de trabajo automatizados: Implica procesamiento multimedia.
🌍Soporte de idiomas:
El modelo admite la generación de texto multilingüe, incluido Chino y Inglés.
⚙️Detalles técnicos:
🏗️Arquitectura:
Wan 2.1 se basa en el paradigma del transformador de difusión con varias características innovadoras:
- Autocodificador variacional 3D (Wan-VAE): Mejora la compresión espacio-temporal y asegura la causalidad temporal durante la generación de vídeo.
- Marco de difusión de vídeo DiT: Utiliza Flow Matching con un codificador T5 para codificación de texto y capas de atención cruzada integradas en bloques de transformadores.
🚀Métricas de rendimiento:
Wan 2.1 logra un impresionante Puntuación de VBench del 84,7 %Destaca por sus escenas dinámicas, consistencia espacial y estética. Genera vídeo de 1080p a 30 FPS con movimiento realista gracias a su avanzado mecanismo de atención espacio-temporal. Como modelo líder de generación de vídeo de código abierto, rivaliza con alternativas propietarias como Sora, aunque estas podrían superarlo en ciertas áreas.
💻Uso:
Ejemplos de código:
El modelo está disponible en el API de IA/ML plataforma como "Ellos 2.1".
Parámetros:
- mensaje negativo [str]: El mensaje negativo que se debe usar. Úselo para abordar detalles que no desea que aparezcan en el video (por ejemplo, borroso o de baja resolución).
- semilla [int]: Semilla aleatoria para reproducibilidad. Si no hay ninguna, se elige una semilla aleatoria.
- relación de aspecto [9:16, 16:9]: Relación de aspecto del vídeo generado.
- pasos de inferencia [int]: Número de pasos de inferencia para el muestreo. Los valores más altos ofrecen mejor calidad, pero requieren más tiempo.
- escala de orientación [Número]: Escala de orientación sin clasificador. Controla la adherencia inmediata y la creatividad.
- cambio [número]: Parámetro de desplazamiento de la programación de ruido. Afecta la dinámica temporal.
- dechado ['unipc', 'dpm+']: El muestreador que se utilizará para la generación.
- habilitar_verificador_de_seguridad [booleano]: si se establece en verdadero, se habilitará el verificador de seguridad.
- habilitar_expansión_del_aviso [booleano]: si se debe habilitar la expansión rápida.
Para obtener el vídeo generado:
Documentación de la API:
Detallado Documentación de la API Está disponible aquí.
✅Pautas éticas:
Alibaba enfatiza el uso responsable de Wan 2.1 para aplicaciones éticas en la creación de contenido y desalienta el uso indebido, como la generación de deepfakes o la creación de contenido inapropiado.
📜Licencia:
Wan 2.1 tiene licencia Apache 2.0, permitiendo tanto el uso comercial como la investigación con términos transparentes.
Obtener la API de Wan 2.1 aquí!
❓Preguntas frecuentes (FAQ):
- P1: ¿Qué es Wan 2.1?
- Wan 2.1 es un modelo de base de video avanzado desarrollado por el equipo Wan AI de Alibaba, especializado en tareas de video generativo como Texto a video (T2V) con resultados de alta calidad y eficiencia computacional.
- P2: ¿Qué resoluciones admite Wan 2.1 para la generación de vídeo?
- El modelo es capaz de producir videos visualmente dinámicos y temporalmente consistentes en resoluciones de hasta 720P, mientras genera internamente videos de 1080p a 30 FPS para un movimiento realista.
- P3: ¿Puede Wan 2.1 generar texto dentro de los videos y en qué idiomas?
- Sí, Wan 2.1 cuenta con generación de texto visual y admite la incrustación de texto tanto en chino como en inglés dentro de los videos generados.
- P4: ¿Cuál es el modelo de licencia para Wan 2.1?
- Wan 2.1 tiene licencia Apache 2.0, que permite el uso tanto comercial como de investigación bajo términos transparentes.
- P5: ¿Cómo se compara Wan 2.1 con otros modelos de generación de video?
- Wan 2.1 alcanza una impresionante puntuación del 84,7 % en VBench y se considera un modelo líder de código abierto. Compite con alternativas propietarias como Sora, aunque su rendimiento específico puede variar según las diferentes métricas.
Patio de juegos de IA



Acceso