



const main = async () => {
const response = await fetch('https://api.ai.cc/v2/video/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'alibaba/wan2.2-vace-fun-a14b-reframe',
prompt: 'Mona Lisa puts on glasses with her hands.',
video_url: 'https://storage.googleapis.com/falserverless/example_inputs/wan_animate_input_video.mp4',
image_url: 'https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg',
resolution: "720p",
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/video/generations"
payload = {
"model": "alibaba/wan2.2-vace-fun-a14b-reframe",
"prompt": "Mona Lisa puts on glasses with her hands.",
"video_url": "https://storage.googleapis.com/falserverless/example_inputs/wan_animate_input_video.mp4",
"image_url": "https://s2-111386.kwimgs.com/bs2/mmu-aiplatform-temp/kling/20240620/1.jpeg",
"resolution": "720p",
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

Détails du produit
Wan 2.2 VACE Reframe est un modèle avancé de génération et de montage vidéo conçu pour des utilisateurs sophistiqués transformations vidéo-à-vidéoElle offre des avantages inégalés contrôle précis sur le style vidéo et la dynamique des mouvements, tout en préservant rigoureusement l'identité du sujet et la qualité vidéo. Construit sur l'architecture robuste VACE et optimisé par Poids Wan 2.2 T2V A14BCe modèle permet aux créateurs de générer, de recadrer et de modifier précisément des vidéos, que ce soit localement ou via une API, avec une efficacité et une précision exceptionnelles.
🚀 Spécifications techniques
- Architecture: Architecture VACE combinée avec un modèle basé sur la diffusion Wan 2.2 T2V A14B.
- Conditions de contrôle : Permet un contrôle précis via Pose, Profondeur, MLSD (Détection de segments multi-lignes), Bords astucieux, et Contrôle de trajectoire.
- Fréquence d'images : Optimisé pour une prédiction vidéo fluide et impressionnante 81 images par seconde (ips).
- Résolution: Supports 512p, 768p, 1024p résolutions de sortie, avec une capacité théorique de 1080p dans des vidéos plus longues.
- Types d'entrée : Conçu principalement pour les transformations vidéo-à-vidéo ; prend également en charge des entrées supplémentaires telles que des images fixes et des invites textuelles pour les flux de travail VACE Fun associés.
✨ Indicateurs de performance
- Qualité vidéo : Assure une performance exceptionnelle cohérence temporelle et la fidélité du sujet d'une image à l'autre, ce qui donne une vidéo de haute qualité et naturelle.
- Versatilité: Caractéristiques prédiction multilingue, élargissant ainsi son adoption à divers publics à travers le monde.
- Précision du contrôle : Permet d'obtenir une précision de génération supérieure en activant contrôle fin en matière de pose, de profondeur et de trajectoires de mouvement, surpassant de nombreuses alternatives open source.
💡 Fonctionnalités clés
- Spécialisation en recadrage vidéo : Conçu pour recadrer les vidéos en modifiant habilement la perspective, le mouvement ou le style tout en préservant la cohérence spatiale et l'identité du sujet du contenu original.
- Contrôle multiconditionnel : Offre des commandes d'entrée précises, notamment pose, cartes de profondeur, MLSD, détection de contours de Canny et trajectoires pour des réglages précis du mouvement et du cadrage.
- Cohérence temporelle haute fidélité : Assure des transitions d'une image à l'autre fluides et un positionnement constant des objets, essentiels pour un recadrage vidéo de haute qualité, exempt de scintillement ou de distorsion.
- Stabilisation du mouvement et de la scène : Intègre des fonctionnalités avancées du moteur VACE 2.0 pour la stabilisation des mouvements de la caméra, la fixation de l'arrière-plan et l'intégration d'effets spéciaux (par exemple, feu, fumée) lors du recadrage.
- Résolution de sortie polyvalente : Capable de générer des vidéos recadrées jusqu'à 1080p avec une lecture fluide à plus de 24 FPS, optimisée pour le matériel GPU grand public pour une utilisation locale.
💲 Tarification de l'API
- 360p : 0,0525 $
- 540p : 0,07875 $
- 720p : 0,105 $
✅ Cas d'utilisation
- Création de contenu : Idéal pour la création et le recadrage de contenu vidéo pour les réseaux sociaux, les campagnes publicitaires et le divertissement.
- Montage vidéo avancé : Idéal pour les scénarios nécessitant un style spécifique ou des ajustements de mouvement complexes au sein de séquences vidéo existantes.
- Génération d'animations : Créez des animations dynamiques à partir d'images fixes ou de vidéos de référence avec un contrôle amélioré.
- Production vidéo locale : Permettre aux utilisateurs de générer des vidéos localement, réduisant ainsi considérablement la dépendance à l'égard de l'infrastructure cloud.
- Recherche et développement : Précieux pour les applications de recherche académique et industrielle en synthèse vidéo et transfert de style.
💻 Exemple de code
📊 Comparaison avec d'autres modèles
vs Wan 2.1 VACE : Wan 2.2 offre un bond en avant substantiel en qualité vidéo avec des fréquences d'images nettement plus élevées (81 images par seconde contre environ 30 images par secondeet prend en charge des conditions de contrôle plus précises comme trajectoire et MLSDIl bénéficie également d'une compression VAE plus efficace, permettant un recadrage vidéo plus rapide et à plus haute résolution tout en préservant mieux la cohérence spatiale que son prédécesseur.
vs Wan 2.2-T2V-A14B (Texte-vidéo) : Alors que Wan 2.2-T2V est optimisé pour ancrage sémantique du texte à la vidéo et la génération de scènes cinématographiques, Wan 2.2 VACE Reframe est spécialisé dans recadrage vidéo-à-vidéo Grâce à sa gestion multiconditionnelle, VACE Reframe offre une solution supérieure pour la préservation du mouvement et du sujet dans les séquences existantes, contrairement à la génération de scènes synthétiques à partir de texte.
vs Wan 2.2-I2V-A14B (Image-to-Video) : Le modèle VACE Reframe est conçu sur mesure pour recadrage vidéo VACE Reframe offre un contrôle précis de la trajectoire et de la pose. À l'inverse, Wan 2.2-I2V se concentre sur la transformation d'images fixes en vidéos, avec une amélioration des détails guidée par un expert. Par conséquent, VACE Reframe est le choix privilégié pour le montage et le stylisme de vidéos existantes, tandis qu'I2V excelle dans l'animation à partir d'images fixes.
🔗 Intégration API
Le modèle est facilement accessible via API IA/MLUne documentation complète est disponible. disponible ici.
❓ Foire aux questions (FAQ)
Q : À quoi est principalement destiné le Wan 2.2 VACE Reframe ?
A: Wan 2.2 VACE Reframe est un modèle d'IA de pointe spécialement conçu pour les transformations vidéo-à-vidéo avancées, offrant un contrôle précis sur le style et le mouvement de la vidéo tout en préservant l'identité du sujet et la qualité de la vidéo.
Q : Quelles sont les conditions de contrôle spécifiques qu'il prend en charge pour la transformation vidéo ?
A : Il prend en charge un contrôle granulaire fin grâce à des conditions telles que la pose, la profondeur, la détection de segments multi-lignes (MLSD), les contours de Canny et le contrôle de la trajectoire, permettant des ajustements de mouvement et de cadrage très précis.
Q : Comment Wan 2.2 VACE Reframe assure-t-il une haute qualité vidéo et une cohérence temporelle ?
A : Le modèle maintient une cohérence temporelle et une fidélité du sujet supérieures d'une image à l'autre, assurant des transitions fluides entre les images et un positionnement cohérent des objets, ce qui est essentiel pour des vidéos recadrées naturelles et de haute qualité.
Q : Quelles sont les principales différences entre Wan 2.2 VACE Reframe et Wan 2.2-T2V-A14B ?
A: Wan 2.2 VACE Reframe est spécialisé dans la transformation vidéo-à-vidéo avec contrôle multi-conditions des séquences existantes, en mettant l'accent sur la préservation du mouvement et du sujet. Wan 2.2-T2V-A14B, quant à lui, est optimisé pour la génération de scènes cinématographiques à partir d'invites textuelles (conversion texte-vidéo).
Q : Peut-on utiliser Wan 2.2 VACE Reframe pour la génération vidéo locale ?
R : Oui, il est adapté au matériel GPU grand public, permettant aux créateurs de générer, recadrer et modifier des vidéos localement, réduisant ainsi la dépendance aux solutions basées sur le cloud.
Terrain de jeu de l'IA



Se connecter