



const main = async () => {
const response = await fetch('https://api.ai.cc/v2/generate/video/alibaba/generation', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'wan/v2.1/1.3b/text-to-video',
prompt: 'A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background',
aspect_ratio: '16:9',
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/generate/video/alibaba/generation"
payload = {
"model": "wan/v2.1/1.3b/text-to-video",
"prompt": "A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background",
"aspect_ratio": "16:9",
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

Detalles del producto
💡Descripción general:
Ellos 2.1Desarrollado por el equipo Wan AI de Alibaba, este modelo base de vídeo de última generación está diseñado para tareas avanzadas de generación de vídeo. Compatible con la conversión de texto a vídeo (T2V), incorpora innovaciones revolucionarias para ofrecer resultados de alta calidad con una eficiencia computacional excepcional.
✨Características principales:
- Generación de texto visual: Genera texto en chino e inglés dentro de los vídeos.
- Autoencoder variacional 3D (Wan-VAE): Codifica y decodifica vídeos 1080P de duración ilimitada con precisión temporal.
- Resultados de alta calidad: Produce vídeos visualmente dinámicos y temporalmente consistentes con resoluciones de hasta 720p.
🎯Uso previsto:
Wan 2.1 está diseñado para aplicaciones en:
- Industrias creativas: Producción de vídeo.
- Generación de contenido: Para redes sociales y campañas de marketing.
- Flujos de trabajo automatizados: Que implica procesamiento multimedia.
🌍Soporte de idiomas:
El modelo admite la generación de texto multilingüe, incluyendo Chino y Inglés.
⚙️Detalles técnicos:
🏗️Arquitectura:
Wan 2.1 se basa en el paradigma del transformador de difusión con varias características innovadoras:
- Autoencoder variacional 3D (Wan-VAE): Mejora la compresión espacio-temporal y garantiza la causalidad temporal durante la generación de vídeo.
- Marco de difusión de vídeo DiT: Utiliza la técnica de coincidencia de flujo con un codificador T5 para la codificación de texto y capas de atención cruzada integradas en bloques transformadores.
🚀Métricas de rendimiento:
Wan 2.1 logra un rendimiento impresionante. Puntuación VBench del 84,7%.Destaca por su dinamismo, coherencia espacial y estética. Genera vídeo 1080p a 30 FPS con movimiento realista gracias a su avanzado mecanismo de atención espacio-temporal. Como modelo líder de generación de vídeo de código abierto, rivaliza con alternativas propietarias como Sora, aunque estas pueden superarlo en ciertos aspectos.
💻Uso:
Ejemplos de código:
El modelo está disponible en el API de IA/ML plataforma como "Ellos 2.1".
Parámetros:
- mensaje negativo [str]: La indicación negativa que se debe usar. Úsela para abordar detalles que no desea que aparezcan en el video (por ejemplo, borroso, de baja resolución).
- semilla [int]: Semilla aleatoria para la reproducibilidad. Si es None, se elige una semilla aleatoria.
- relación_de_aspecto [9:16, 16:9]: Relación de aspecto del vídeo generado.
- pasos_de_inferencia [int]: Número de pasos de inferencia para el muestreo. Valores más altos proporcionan mejor calidad, pero requieren más tiempo.
- escala de orientación [número]: Escala de orientación sin clasificadores. Controla la adherencia/creatividad de las indicaciones.
- cambio [número]: Parámetro de desplazamiento del programa de ruido. Afecta a la dinámica temporal.
- dechado ['unipc', 'dpm+']: El muestreador que se utilizará para la generación.
- habilitar_verificador_de_seguridad [booleano]: Si se establece en verdadero, se habilitará el verificador de seguridad.
- habilitar_expandir_prompt [booleano]: Indica si se debe habilitar la expansión de la solicitud.
Para obtener el vídeo generado:
Documentación de la API:
Detallado Documentación de la API Está disponible aquí.
✅Directrices éticas:
Alibaba hace hincapié en el uso responsable de Wan 2.1 para aplicaciones éticas en la creación de contenido, al tiempo que desaconseja el uso indebido, como la generación de deepfakes o la creación de contenido inapropiado.
📜Licencias:
Wan 2.1 tiene licencia bajo Apache 2.0, permitiendo tanto el uso comercial como el de investigación en términos transparentes.
Obtenga la API de WAN 2.1 aquí¡
❓Preguntas frecuentes (FAQ):
- P1: ¿Qué es Wan 2.1?
- Wan 2.1 es un modelo avanzado de base de vídeo desarrollado por el equipo Wan AI de Alibaba, especializado en tareas de vídeo generativo como la conversión de texto a vídeo (T2V) con resultados de alta calidad y eficiencia computacional.
- P2: ¿Qué resoluciones admite Wan 2.1 para la generación de vídeo?
- El modelo es capaz de producir vídeos visualmente dinámicos y temporalmente consistentes con resoluciones de hasta 720p, a la vez que genera internamente vídeo de 1080p a 30 FPS para un movimiento realista.
- P3: ¿Puede Wan 2.1 generar texto dentro de los vídeos y en qué idiomas?
- Sí, Wan 2.1 incluye generación visual de texto, compatible con la inserción de texto tanto en chino como en inglés dentro de los vídeos generados.
- P4: ¿Cuál es el modelo de licenciamiento para Wan 2.1?
- Wan 2.1 está licenciado bajo la licencia Apache 2.0, que permite tanto el uso comercial como el de investigación bajo términos transparentes.
- P5: ¿Cómo se compara Wan 2.1 con otros modelos de generación de vídeo?
- Wan 2.1 alcanza una impresionante puntuación del 84,7 % en VBench y se considera un modelo de código abierto líder. Compite con alternativas propietarias como Sora, aunque el rendimiento específico puede variar según las diferentes métricas.
Campo de juegos de IA



Acceso