qwen-bg
max-ico04
Dans
Dehors
max-ico02
Chat
max-ico03
désactiver
Ils 2.1
Découvrez Wan 2.1 : le modèle vidéo révolutionnaire d’Alibaba prenant en charge T2V, I2V, la génération de texte multilingue et les tâches multimodales !
Jetons gratuits de 1 $ pour les nouveaux membres
Text to Speech
                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v2/generate/video/alibaba/generation', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'wan/v2.1/1.3b/text-to-video',
      prompt: 'A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background',
      aspect_ratio: '16:9',
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main()

                                
                                        import requests


def main():
    url = "https://api.ai.cc/v2/generate/video/alibaba/generation"
    payload = {
        "model": "wan/v2.1/1.3b/text-to-video",
        "prompt": "A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background",
        "aspect_ratio": "16:9",
    }
    headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}

    response = requests.post(url, json=payload, headers=headers)
    print("Generation:", response.json())


if __name__ == "__main__":
    main()
Docs

Une seule API pour plus de 300 modèles d'IA

Économisez 20 % sur les coûts et recevez des jetons gratuits d'une valeur de 1 $.
qwenmax-bg
image
Ils 2.1

Détails du produit

💡Aperçu:

Ils 2.1Développé par l'équipe Wan AI d'Alibaba, ce modèle de base vidéo de pointe est conçu pour les tâches de génération vidéo avancées. Prenant en charge la conversion de texte en vidéo (T2V), il intègre des innovations révolutionnaires pour fournir des résultats de haute qualité avec une efficacité de calcul exceptionnelle.

Caractéristiques principales :

  • Génération de texte visuel : Génère du texte en chinois et en anglais dans les vidéos.
  • Autoencodeur variationnel 3D (Wan-VAE) : Encode et décode des vidéos 1080p de longueur illimitée avec une précision temporelle.
  • Résultats de haute qualité : Produit des vidéos visuellement dynamiques et temporellement cohérentes à des résolutions allant jusqu'à 720p.

🎯Utilisation prévue :

Wan 2.1 est conçu pour les applications suivantes :

  • Industries créatives : Production vidéo.
  • Génération de contenu : Pour les réseaux sociaux et les campagnes marketing.
  • Flux de travail automatisés : Impliquant un traitement multimédia.

🌍Assistance linguistique :

Le modèle prend en charge la génération de texte multilingue, notamment Chinois et Anglais.

⚙️Détails techniques :

🏗️Architecture:

Wan 2.1 est basé sur le paradigme du transformateur de diffusion et intègre plusieurs fonctionnalités innovantes :

  • Autoencodeur variationnel 3D (Wan-VAE) : Améliore la compression spatio-temporelle et assure la causalité temporelle lors de la génération vidéo.
  • Cadre de diffusion vidéo DiT : Utilise la correspondance de flux avec un encodeur T5 pour l'encodage du texte et des couches d'attention croisée intégrées dans des blocs transformateurs.

🚀Indicateurs de performance :

Wan 2.1 atteint un niveau impressionnant Score VBench de 84,7 %Ce logiciel excelle dans la création de scènes dynamiques, la cohérence spatiale et l'esthétique. Il génère des vidéos 1080p à 30 images par seconde avec un rendu réaliste, grâce à son mécanisme avancé d'attention spatio-temporelle. Modèle de génération vidéo open source de premier plan, il rivalise avec des solutions propriétaires comme Sora, même si ces dernières peuvent le surpasser dans certains domaines.

💻Usage:

Exemples de code :

Le modèle est disponible sur le API IA/ML plateforme en tant que "Ils 2.1".

Paramètres :

  • invite négative [str] : L'invite négative à utiliser. Utilisez-la pour signaler les détails que vous ne souhaitez pas voir dans la vidéo (par exemple, flou, basse résolution).
  • graine [int] : Graine aléatoire pour la reproductibilité. Si None, une graine aléatoire est choisie.
  • rapport d'aspect [9:16, 16:9] : Rapport d'aspect de la vidéo générée.
  • étapes_d'inférence [int] : Nombre d’étapes d’inférence pour l’échantillonnage. Des valeurs plus élevées offrent une meilleure qualité, mais prennent plus de temps.
  • échelle_de_guidage [Nombre] : Échelle de guidage sans classificateur. Contrôle l’adhésion rapide/la créativité.
  • changement [nombre] : Paramètre de décalage du calendrier de bruit. Affecte la dynamique temporelle.
  • échantillonneur ['unipc', 'dpm+']: L'échantillonneur à utiliser pour la génération.
  • activer_vérificateur_de_sécurité [booléen] : Si la valeur est « vrai », le vérificateur de sécurité sera activé.
  • activer_prompt_expansion [booléen] : Indique s'il faut activer l'expansion de l'invite.

Pour obtenir la vidéo générée :

Documentation de l'API :

Détaillé Documentation de l'API est disponible ici.

Principes éthiques :

Alibaba met l'accent sur une utilisation responsable de Wan 2.1 pour des applications éthiques dans la création de contenu, tout en décourageant les utilisations abusives telles que la génération de deepfakes ou la création de contenu inapproprié.

📜Licences :

Wan 2.1 est distribué sous licence Apache 2.0, autorisant une utilisation à la fois commerciale et de recherche selon des conditions transparentes.

Obtenir l'API Wan 2.1 ici!

Foire aux questions (FAQ) :

Q1 : Qu'est-ce que Wan 2.1 ?
Wan 2.1 est un modèle de base vidéo avancé développé par l'équipe Wan AI d'Alibaba, spécialisé dans les tâches vidéo génératives telles que la conversion de texte en vidéo (T2V) avec des sorties de haute qualité et une efficacité de calcul.
Q2 : Quelles résolutions le protocole WAN 2.1 prend-il en charge pour la génération vidéo ?
Ce modèle est capable de produire des vidéos visuellement dynamiques et temporellement cohérentes à des résolutions allant jusqu'à 720p, tout en générant en interne des vidéos 1080p à 30 images par seconde pour un mouvement réaliste.
Q3 : Wan 2.1 peut-il générer du texte dans les vidéos, et dans quelles langues ?
Oui, Wan 2.1 propose la génération de texte visuel, prenant en charge l'intégration de texte en chinois et en anglais dans les vidéos générées.
Q4 : Quel est le modèle de licence pour Wan 2.1 ?
Wan 2.1 est distribué sous licence Apache 2.0, qui autorise une utilisation commerciale et de recherche selon des conditions transparentes.
Q5 : Comment le Wan 2.1 se compare-t-il aux autres modèles de génération vidéo ?
Wan 2.1 obtient un score impressionnant de 84,7 % sur VBench et est considéré comme un modèle open source de premier plan. Il rivalise avec des solutions propriétaires comme Sora, bien que ses performances spécifiques puissent varier selon les critères évalués.

Terrain de jeu de l'IA

Testez tous les modèles d'API dans l'environnement de test avant de les intégrer. Nous proposons plus de 300 modèles à intégrer à votre application.
Essai gratuit
api-droite-1
modèle-bg02-1

Une API
Plus de 300 modèles d'IA

Économisez 20 % sur vos coûts