



const main = async () => {
const response = await fetch('https://api.ai.cc/v2/generate/video/alibaba/generation', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'wan/v2.1/1.3b/text-to-video',
prompt: 'A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background',
aspect_ratio: '16:9',
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/generate/video/alibaba/generation"
payload = {
"model": "wan/v2.1/1.3b/text-to-video",
"prompt": "A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background",
"aspect_ratio": "16:9",
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

Detalhes do produto
💡Visão geral:
Eles 2.1Desenvolvido pela equipe Wan AI da Alibaba, o , é um modelo de base de vídeo de última geração projetado para tarefas avançadas de geração de vídeo. Com suporte para conversão de texto em vídeo (T2V), ele incorpora inovações revolucionárias para fornecer resultados de alta qualidade com excepcional eficiência computacional.
✨Principais características:
- Geração visual de texto: Gera texto em chinês e inglês dentro de vídeos.
- Autoencoder Variacional 3D (Wan-VAE): Codifica e decodifica vídeos 1080P de duração ilimitada com precisão temporal.
- Resultados de alta qualidade: Produz vídeos visualmente dinâmicos e temporalmente consistentes em resoluções de até 720p.
🎯Uso pretendido:
O Wan 2.1 foi projetado para aplicações em:
- Indústrias Criativas: Produção de vídeo.
- Geração de conteúdo: Para campanhas de marketing e redes sociais.
- Fluxos de trabalho automatizados: Envolvendo processamento multimídia.
🌍Suporte linguístico:
O modelo suporta a geração de texto multilíngue, incluindo chinês e Inglês.
⚙️Detalhes técnicos:
🏗️Arquitetura:
O Wan 2.1 é baseado no paradigma do transformador de difusão e apresenta diversas características inovadoras:
- Autoencoder Variacional 3D (Wan-VAE): Aprimora a compressão espaço-temporal e garante a causalidade temporal durante a geração de vídeo.
- Estrutura de Difusão de Vídeo DiT: Utiliza o algoritmo Flow Matching com um codificador T5 para codificação de texto e camadas de atenção cruzada incorporadas em blocos Transformer.
🚀Métricas de desempenho:
Wan 2.1 alcança um resultado impressionante. Pontuação VBench de 84,7%Com excelente desempenho em cenas dinâmicas, consistência espacial e estética, o processador gera vídeos em 1080p a 30 FPS com movimentos realistas, graças ao seu mecanismo avançado de atenção espaço-temporal. Como um dos principais modelos de geração de vídeo de código aberto, ele rivaliza com alternativas proprietárias como o Sora, embora estas possam superá-lo em certos aspectos.
💻Uso:
Exemplos de código:
O modelo está disponível em API de IA/ML plataforma como "Eles 2.1".
Parâmetros:
- prompt_negativo [str]: O comando negativo a ser usado. Use-o para se referir a detalhes que você não deseja no vídeo (por exemplo, imagem desfocada, baixa resolução).
- semente [int]: Semente aleatória para reprodução. Se None, uma semente aleatória será escolhida.
- proporção_de_aspecto [9:16, 16:9]: Proporção da tela do vídeo gerado.
- etapas_de_inferência [int]: Número de etapas de inferência para amostragem. Valores mais altos resultam em melhor qualidade, mas levam mais tempo.
- escala_de_orientação [número]: Escala de orientação sem classificador. Controla a adesão imediata/criatividade.
- mudança [número]: Parâmetro de deslocamento da programação de ruído. Afeta a dinâmica temporal.
- amostrador ['unipc', 'dpm+']: O sampler a ser usado para geração.
- ativar_verificador_de_segurança [booleano]: Se definido como verdadeiro, o verificador de segurança será ativado.
- habilitar_expansão_de_prompt [booleano]: Indica se a expansão de prompts deve ser ativada.
Para obter o vídeo gerado:
Documentação da API:
Detalhado Documentação da API Está disponível aqui.
✅Diretrizes Éticas:
A Alibaba enfatiza o uso responsável da Wan 2.1 para aplicações éticas na criação de conteúdo, ao mesmo tempo que desencoraja o uso indevido, como a geração de deepfakes ou a criação de conteúdo inadequado.
📜Licenciamento:
Wan 2.1 está licenciado sob Apache 2.0, permitindo o uso tanto comercial quanto para fins de pesquisa com termos transparentes.
Obtenha a API Wan 2.1 aqui!
❓Perguntas frequentes (FAQ):
- P1: O que é Wan 2.1?
- O Wan 2.1 é um modelo avançado de base de vídeo desenvolvido pela equipe Wan AI da Alibaba, especializado em tarefas de vídeo generativo, como conversão de texto em vídeo (T2V), com resultados de alta qualidade e eficiência computacional.
- Q2: Quais resoluções o Wan 2.1 suporta para geração de vídeo?
- O modelo é capaz de produzir vídeos visualmente dinâmicos e temporalmente consistentes em resoluções de até 720p, enquanto gera internamente vídeos em 1080p a 30 FPS para movimentos realistas.
- Q3: O Wan 2.1 consegue gerar texto dentro de vídeos e em quais idiomas?
- Sim, o Wan 2.1 apresenta geração visual de texto, com suporte para incorporação de texto em chinês e inglês nos vídeos gerados.
- Q4: Qual é o modelo de licenciamento para o Wan 2.1?
- O Wan 2.1 é licenciado sob a licença Apache 2.0, que permite o uso comercial e para fins de pesquisa em termos transparentes.
- Q5: Como o Wan 2.1 se compara a outros modelos de geração de vídeo?
- O Wan 2.1 alcança uma impressionante pontuação de 84,7% no VBench e é considerado um dos principais modelos de código aberto. Ele rivaliza com alternativas proprietárias como o Sora, embora o desempenho específico possa variar dependendo das métricas utilizadas.
Playground de IA



Conecte-se