



const main = async () => {
const response = await fetch('https://api.ai.cc/v2/video/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'alibaba/wan2.2-vace-fun-a14b-outpainting',
prompt: 'Mona Lisa puts on glasses with her hands.',
video_url: 'https://storage.googleapis.com/falserverless/example_inputs/wan_animate_input_video.mp4',
image_url: 'https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg',
resolution: "720p",
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/video/generations"
payload = {
"model": "alibaba/wan2.2-vace-fun-a14b-outpainting",
"prompt": "Mona Lisa puts on glasses with her hands.",
"video_url": "https://storage.googleapis.com/falserverless/example_inputs/wan_animate_input_video.mp4",
"image_url": "https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg",
"resolution": "720p",
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

Détails du produit
Wan 2.2 VACE Outpainting est un modèle d'IA vidéo-à-vidéo avancé conçu pour étendre les images vidéo de manière fluide au-delà de leurs limites d'origine. Cette solution innovante génère du contenu supplémentaire qui s'harmonise parfaitement avec la vidéo d'entrée, offrant des capacités de détourage vidéo créatives inégalées. Les utilisateurs bénéficient de contrôle flexible du style du contenu, de la continuité des mouvements et de la qualité de la résolution, ce qui en fait un élément clé de la gamme polyvalente Wan VACE pour les tâches de synthèse et de montage vidéo.
⚙️ Spécifications techniques
- Architecture du modèle : Wan 2.2 VACE Fun A14B, construit sur des réseaux avancés de génération et de diffusion vidéo avec une architecture VACE.
- Types d'entrée : Fichiers vidéo ou URL, prenant en charge diverses options d'encodage.
- Résolution de sortie : Options flexibles incluant 480p, 580p, 720p et jusqu'à 4K.
- Fréquence d'images vidéo : 16 images par seconde en standard ; compatible avec des fréquences d’images plus élevées pour une lecture plus fluide.
- Mémoire et performances : Optimisé pour l'exécution sur GPU, avec des variantes de modèle adaptées à GPU avec 8 Go de VRAM.
- Durée maximale de la vidéo : Efficacement capacité de longueur illimitée tout en préservant la cohérence temporelle.
- Données d'entraînement : Entraîné sur de vastes ensembles de données vidéo avec des contrôles multiconditionnels pour une sortie robuste et polyvalente.
✨ Indicateurs de performance
- Qualité de pointe : Figurant régulièrement parmi les meilleurs modèles de génération vidéo open source pour la fidélité de sa sortie.
- Cohérence temporelle : Maintient fluidité des mouvements et cohérence visuelle sur des séquences d'images étendues, un élément crucial pour une vidéo réaliste.
- Fidélité de la résolution : Réalise haute rétention des détails dans les dimensions spatiales et temporelles, même au-delà des limites du cadre initial.
- Efficacité: Offre des vitesses de génération en temps réel ou quasi réel pour le traitement vidéo HD standard, améliorant ainsi la productivité.
- Compatibilité: Fonctionne efficacement sur les GPU grand public dotés de 8 Go de VRAM standard, ce qui le rend accessible à un plus large public d'utilisateurs.
✅ Caractéristiques principales
- Peinture vidéo : Élargit les images vidéo avec un nouveau contenu contextuellement pertinent, tout en préservant la cohérence visuelle et la structure temporelle.
- Sortie haute résolution : Supporte jusqu'à Sortie en résolution 4K avec des transitions d'images d'une fluidité impeccable.
- Entrée flexible : Il accepte un large éventail de formats vidéo, notamment MP4, MOV, WEBM, M4V et GIF, assurant ainsi une large compatibilité.
- Fréquence d'images optimale : Traite les vidéos à 16 images par seconde ou plus, assurant un mouvement fluide et réaliste.
- Conditions de contrôle avancées : Prend en charge des entrées de contrôle détaillées telles que la pose, la profondeur, les contours (Canny), le MLSD et le contrôle de trajectoire pour génération de contenu précise.
- Assistance multilingue : Conçu pour s'adapter à diverses langues, facilitant ainsi son application et son accessibilité à l'échelle mondiale.
💲 Tarification de l'API
- 360p : 0,0525 $
- 540p : 0,07875 $
- 720p : 0,105 $
💡 Cas d'utilisation
- Peinture vidéo créative pour étendre les scènes cinématographiques et renforcer la profondeur narrative.
- Amélioration des effets visuels dans les flux de travail de post-production, simplifiant l'extension de scènes complexes.
- Générer des environnements vidéo étendus pour des expériences immersives de réalité virtuelle/augmentée.
- Enrichir la narration vidéo grâce à un contexte visuel supplémentaire, pour des récits plus denses.
- Génération efficace de contenu vidéo pour la publicité et les médias sociaux, avec adaptation du contenu à différents formats d'image.
💻 Exemple de code
(Cette zone est un espace réservé aux extraits de code dynamiques pour `alibaba.create-video-to-video-generation` utilisant le modèle `alibaba/wan2.2-vace-fun-a14b-outpainting`.)
⚖️ Comparaison avec d'autres modèles de pointe
Wan 2.2 VACE Outpainting contre Qwen Vidéo :
Ils 2.2 excelle dans retouche vidéo photoréaliste avec des commandes multiconditions détaillées (pose, profondeur, trajectoire), permettant un agrandissement précis de la scène. En revanche, Vidéo Qwen Les modèles se concentrent généralement sur une génération artistique et stylisée, excellant souvent dans les styles anime ou créatifs, mais accordant moins d'importance au photoréalisme et à la fluidité temporelle. C'est pourquoi Wan 2.2 est un choix supérieur pour un réalisme et une fluidité constants dans les séquences vidéo longues.
Wan 2.2 VACE Outpainting vs. KLING 2.0 :
Alors que KLING 2.0 offre une qualité de génération vidéo compétitive, Ils 2.2 le surpasse en intégrant un Architecture du ministère de l'Éducation (Mixte d'experts)Cette innovation réduit les besoins en calcul d'environ 50 % tout en améliorant la netteté et la cohérence des mouvements vidéo. De plus, Wan 2.2 offre des paramètres de contrôle plus polyvalents pour une manipulation nuancée des scènes et des mouvements, ce qui la rend idéale pour les applications de synthèse vidéo professionnelles et commerciales.
Wan 2.2 VACE Outpainting contre Haiulo 02 :
Automne 02 est connu pour sa synthèse vidéo de base fluide, mais manque des commandes de conditionnement avancées et des capacités de retouche haute résolution que Ils 2.2 Le format WAN 2.2 offre une prise en charge robuste. Sa capacité à gérer des mouvements de groupe complexes et des effets CGI détaillés constitue un avantage significatif pour les cas d'utilisation d'extension vidéo de qualité cinématographique par rapport au flux de travail plus simple du Haiulo 02.
Wan 2.2 VACE Outpainting vs. Veo 3 :
J'en vois 3 Il se concentre principalement sur la génération rapide de vidéos, en accordant moins d'importance à la qualité du rendu et au contrôle précis, et en privilégiant la création rapide de contenu. En revanche, Ils 2.2 équilibre avec brio vitesse et fidélité, offrant retouche haute résolution et temporellement cohérente avec des commandes flexibles dont Veo 3 est actuellement dépourvu.
🔗 Intégration API
Wan 2.2 VACE Outpainting est facilement accessible via l'API IA/ML. Une documentation complète est disponible. disponible ici pour les développeurs.
❓ Foire aux questions (FAQ)
Q : Qu'est-ce que Wan 2.2 VACE Outpainting ?
A: Wan 2.2 VACE Outpainting est un modèle d'IA avancé qui étend les images vidéo en générant un nouveau contenu contextuellement pertinent au-delà de leurs limites d'origine, assurant une continuité visuelle et temporelle sans faille.
Q : Comment Wan 2.2 parvient-il à une cohérence temporelle élevée ?
A: Il utilise une architecture VACE sophistiquée et des contrôles multiconditionnels, entraînés sur des ensembles de données vidéo à grande échelle, pour maintenir un mouvement fluide et des visuels cohérents sur toutes les images étendues.
Q : Puis-je contrôler le style et le contenu de la vidéo retouchée ?
R : Oui, Wan 2.2 offre un contrôle flexible sur le style du contenu et prend en charge des entrées de contrôle détaillées telles que la pose, la profondeur, le contour (Canny), le MLSD et la trajectoire pour une génération précise.
Q : Quels sont les principaux avantages de l'utilisation de Wan 2.2 pour le rendu vidéo ?
A: Les principaux avantages comprennent une sortie haute résolution (jusqu'à 4K), une cohérence temporelle de pointe, des performances GPU efficaces, la prise en charge d'une longueur vidéo illimitée et un contrôle créatif polyvalent pour divers cas d'utilisation comme l'expansion cinématographique et le contenu VR/AR.
Terrain de jeu de l'IA



Se connecter