



const main = async () => {
const response = await fetch('https://api.ai.cc/v2/video/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'alibaba/wan2.2-vace-fun-a14b-inpainting',
prompt: 'Mona Lisa puts on glasses with her hands.',
video_url: 'https://storage.googleapis.com/falserverless/example_inputs/wan_animate_input_video.mp4',
image_url: 'https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg',
resolution: "720p",
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/video/generations"
payload = {
"model": "alibaba/wan2.2-vace-fun-a14b-inpainting",
"prompt": "Mona Lisa puts on glasses with her hands.",
"video_url": "https://storage.googleapis.com/falserverless/example_inputs/wan_animate_input_video.mp4",
"image_url": "https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg",
"resolution": "720p",
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

Detalhes do produto
Visão geral: Preenchimento de vídeo avançado com Wan 2.2 Vace
Wan 2.2 Vac Inpainting é um modelo de IA generativo de vídeo para vídeo de última geração, projetado para preenchimento de alta qualidade em conteúdo de vídeo. Essa poderosa ferramenta revoluciona a edição de vídeo, permitindo que os usuários mascarem e modifiquem regiões específicas em vídeos de forma integrada. Ela mantém meticulosamente continuidade contextual, consistência de movimentoe restauração precisa de detalhes, garantindo uma saída final natural e refinada. Aproveitando a compreensão multimodal avançada e as tecnologias de geração de vídeo adaptativa, o Wan 2.2 Vace é otimizado para oferecer resultados impressionantes em resoluções de até 720p.
Especificações técnicas e desempenho
⚙️ Arquitetura Central
- Arquitetura do modelo: Infraestrutura de transformação multimodal de vídeo e imagem com previsão adaptativa de cena e movimento.
- Tamanho do parâmetro: 14 bilhões de parâmetros, garantindo detalhes precisos na síntese de vídeo.
- Faixa de resolução: Saídas de até 720p; o uso padrão geralmente é em 480p para otimizar a velocidade.
- Processamento da taxa de quadros: Opera a 16 quadros por segundo para síntese de vídeo estável.
- Formatos de entrada/saída: Suporta os formatos MP4, MOV, WebM, M4V e GIF para vídeos; e JPG, JPEG, PNG, WebP, GIF e AVIF para imagens.
- Utilização da memória: Utilização eficiente da GPU, compatível com fluxos de trabalho locais e em nuvem, com consumo moderado de memória.
📊 Indicadores de desempenho
- Qualidade do preenchimento: Excelências na preservação do contexto e dos detalhes da textura durante edições de vídeo localizadas.
- Estabilidade Temporal: Excelente desempenho na continuidade do movimento, minimizando a cintilação em comparação com os modelos de referência.
- Dimensionamento de resolução: Alta fidelidade em 720p com pequenas concessões de velocidade; processamento mais rápido em 480p com consistência visual mantida.
- Comprimento máximo do clipe: Suporta de forma confiável até 80-81 quadros; a qualidade pode degradar-se a partir desse limite.
Principais funcionalidades para uma edição de vídeo perfeita
- ✨ Retoque de vídeo com mascaramento: Permite a edição seletiva usando um vídeo de origem e um vídeo de máscara correspondente para preencher ou substituir áreas específicas.
- ✅ Consistência temporal: Garante um fluxo de movimento suave e coerência entre os quadros, evitando oscilações ou artefatos comuns durante o preenchimento de lacunas.
- 🔬 Restauração de Alta Qualidade: Reconstrói texturas finas e detalhes intrincados dentro da região mascarada para uma aparência extremamente natural.
- 📺 Suporte para resolução de problemas: Oferece saída de vídeo flexível em 480p, 580p e até 720p, com escalonamento de qualidade baseado na disponibilidade de recursos.
- 📥 Tipos de entrada flexíveis: Aceita diversos formatos de vídeo (MP4, MOV, WebM, M4V, GIF) e formatos de imagem (JPG, PNG, WebP) para entradas de máscara ou referência.
- 🤝 Integração com ComfyUI: Compatível com fluxos de trabalho ComfyUI, permitindo a combinação com pipelines de conversão de texto em vídeo, animação de imagem e outpainting.
Preços da API
- 360p: $ 0,0525
- 540p: $ 0,07875
- 720p: $ 0,105
Cenários de uso versáteis
- 🎬 Pós-produção de vídeo profissional: Ideal para retoques de efeitos visuais, remoção de objetos e reedição de cenas complexas.
- 📈 Criação de conteúdo para marketing digital: Facilita a personalização automatizada de vídeos e a adaptação da marca para campanhas envolventes.
- 🎓 Aprimoramento de material de vídeo educacional: Permite reconstruções visuais ou animações dinâmicas de atualização de conteúdo.
- 🎨 Artes Criativas e Narrativa Digital: Suporta substituições de animação perfeitas e efeitos visuais complexos.
Exemplo de código
Comparação com outros modelos líderes
Wan 2.2 Vace vs. Semente 1.0: Enquanto Semente 1.0 Oferece uma taxa de quadros ligeiramente superior, de 24 fps (benéfica para a geração de vídeos extremamente suaves). Eles têm 2,2 anos de idade. Oferece integração superior para flexibilidade de preenchimento de lacunas e opera de forma eficiente em hardware mais modesto, tornando-o amplamente acessível aos criadores.
Wan 2.2 Vace vs. Vejo 3: Vejo 3 Destaca-se no aprimoramento avançado de vídeo de código fechado, com maior resolução e velocidade, embora a um custo significativamente mais elevado. Eles têm 2,2 anos de idade. Destaca-se como uma forte alternativa de código aberto, oferecendo recursos robustos de preenchimento multimodal e integração de API mais fácil, adequada para uma ampla gama de usos profissionais.
Wan 2.2 Vace vs. Inpainting de vídeo de linha de base genérico: Em comparação com os modelos básicos de referência, Eles têm 2,2 anos de idade. Oferece restauração de detalhes de textura e coerência de movimento significativamente aprimoradas. Os modelos de referência frequentemente sofrem com mais artefatos e oscilações, além de problemas de posicionamento. Eles têm 2,2 anos de idade. como a opção preferida para projetos de retoque de vídeo de alta qualidade.
Integração de API
Acesso Wan 2.2 Vac Inpainting via API de IA/ML. A documentação completa está disponível. disponível aqui.
Perguntas frequentes (FAQ)
P1: Para que foi projetado principalmente o Wan 2.2 Vace Inpainting?
A1: O Wan 2.2 Vace Inpainting foi projetado principalmente para tarefas de preenchimento de vídeo para vídeo de alta qualidade, permitindo que os usuários mascarem, modifiquem e preencham perfeitamente regiões específicas em vídeos, preservando o contexto e a continuidade do movimento.
Q2: Qual a resolução suportada pelo Wan 2.2 Vace Inpainting?
A2: O modelo suporta resoluções de saída de até 720p, sendo o uso padrão geralmente configurado para 480p para um processamento mais rápido, mantendo a consistência visual.
Q3: Como o Wan 2.2 Vace garante a consistência temporal em vídeos editados?
A3: Ele integra uma infraestrutura de transformação de vídeo e imagem multimodal com previsão adaptativa de cena e movimento, projetada especificamente para manter um fluxo de movimento suave e coerência entre os quadros, evitando oscilações ou artefatos.
Q4: O Wan 2.2 Vace Inpainting pode ser integrado com outras ferramentas de IA?
A4: Sim, é compatível com os fluxos de trabalho do ComfyUI, permitindo que os usuários combinem tarefas de inpainting com outros pipelines, como geração de texto para vídeo, animação de imagem e outpainting.
Q5: Quais são as principais vantagens do Wan 2.2 Vace em relação aos modelos genéricos de pintura interna?
A5: O Wan 2.2 Vace oferece restauração de detalhes de textura significativamente aprimorada e coerência de movimento superior, resultando em menos artefatos e oscilações em comparação com modelos básicos, tornando-o ideal para projetos com requisitos de qualidade críticos.
Playground de IA



Conecte-se