



const main = async () => {
const response = await fetch('https://api.ai.cc/v2/video/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'sber-ai/kandinsky5-distill-t2v',
prompt: 'A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background',
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/video/generations"
payload = {
"model": "sber-ai/kandinsky5-distill-t2v",
"prompt": "A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background"
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

Détails du produit
✨ API Kandinsky 5 Distill : Conversion texte-vidéo légère et ultra-rapide
Kandinsky 5 Distill est une version avancée et optimisée du puissant modèle de diffusion texte-vidéo Kandinsky 5. Conçu pour une vitesse et une efficacité inégalées, il améliore considérablement accélère la génération vidéo Sans compromettre la qualité artistique. C'est le choix idéal pour le prototypage rapide, l'exploration créative et la génération de contenu percutant nécessitant des prévisualisations rapides et des flux de travail itératifs. Bénéficiez de sorties vidéo de haute qualité à une vitesse remarquable, pour un processus créatif plus agile et productif.
⚙️ Spécifications techniques
- Type de modèle : Modèle de diffusion latente utilisant une architecture de transformateur de diffusion (DiT).
- Intégration de texte : Utilise Qwen2.5-VL et CLIP pour un conditionnement sémantique robuste, garantissant que vos invites sont parfaitement comprises.
- Encodage vidéo : Utilise l'autoencodeur variationnel 3D HunyuanVideo (VAE) pour compresser efficacement les vidéos dans un espace latent.
- Optimisation: Le processus de distillation de manière significative réduit la charge de calcul, ce qui permet de réduire considérablement les temps d'inférence.
- Saisir: Accepte les invites textuelles intuitives en langage naturel.
- Sortir: Génère des vidéos de haute qualité avec des durées personnalisables, généralement de 5 à 10 secondes.
⚡ Indicateurs de performance
- Vitesse d'inférence : Réalise un accélération substantielle par rapport au Kandinsky 5 original, ce qui le rend idéal pour les prévisualisations en temps réel et les applications interactives.
- Qualité: Maintient une qualité perceptive élevée, offrant des détails précis et une progression temporelle cohérente à travers les images vidéo générées.
- Efficacité des ressources : Elle se targue d'une consommation de mémoire GPU réduite, permettant son utilisation sur les GPU grand public pour des tâches de génération vidéo rapides et accessibles.
✅ Caractéristiques principales
- Génération optimisée pour la vitesse : Conçu dès le départ pour une synthèse vidéo plus rapide sans perte significative de fidélité.
- Résultats de haute qualité : Il conserve une richesse visuelle et sémantique comparable à celle du modèle Kandinsky 5 complet, garantissant des résultats exceptionnels.
- Convivial: Prend en charge les entrées en langage naturel, permettant une itération rapide et une intégration transparente dans les flux de travail créatifs.
- Compatible avec les logiciels libres : S'appuyant sur des architectures de diffusion ouvertes, favorisant la recherche, la personnalisation et les contributions de la communauté.
- Conditionnement de texte intégré : Il intègre des mécanismes d'attention croisée poussés qui garantissent que les invites textuelles ont une influence forte et précise sur le contenu vidéo généré.
💰 Tarification de l'API Kandinsky 5 Distill
Découvrez une technologie de pointe de conversion de texte en vidéo à un prix abordable : 0,105 $ par seconde de vidéo générée.
💡 Cas d'utilisation polyvalents
- Prototypage rapide : Visualisez rapidement des storyboards, des idées conceptuelles et des ébauches de conception à une vitesse sans précédent.
- Aperçus du contenu : Générez rapidement des ébauches pour des campagnes sur les réseaux sociaux, des visuels publicitaires ou des extraits de clips musicaux.
- Bac à sable créatif : Expérimentez librement différents styles artistiques et des techniques d'ingénierie avancée pour explorer de nouvelles voies créatives.
- Démonstrations éducatives : Démontrer les capacités dynamiques de l'IA de conversion texte-vidéo en temps réel ou quasi réel à des fins éducatives ou démonstratives.
- Intégration d'applications : Intégrez de manière transparente des fonctionnalités au sein d'applications nécessitant un retour d'information immédiat sur la génération vidéo et une création rapide de contenu visuel.
💻 Exemple de code de génération
Voici un exemple d'interaction avec l'API Distill de Kandinsky 5 pour la génération vidéo :
import requests API_URL = "YOUR_API_ENDPOINT/sber-ai/kandinsky5-distill-t2v" # Remplacez par le point de terminaison réel headers = {"Authorization": "Bearer YOUR_API_KEY"} # Remplacez par votre clé API réelle payload = { "prompt": "Une ville futuriste au coucher du soleil, voitures volantes, néons, très détaillé, cinématographique", "duration": 7, # Générer une vidéo de 7 secondes "resolution": "512x512" # Spécifier la résolution vidéo } response = requests.post(API_URL, headers=headers, json=payload) response.raise_for_status() # Lever une exception en cas d'erreur HTTP video_generation_id = response.json()["id"] print(f"Génération vidéo lancée avec l'ID : {video_generation_id}") 🎬 Exemple de code de sortie
Après avoir lancé une génération, vous pouvez récupérer le résultat (par exemple, l'URL de la vidéo) à l'aide du code suivant :
import requests import time API_URL_FETCH = "YOUR_API_ENDPOINT/video_generations/{video_generation_id}" # Remplacez par le point de terminaison réel headers = {"Authorization": "Bearer YOUR_API_KEY"} # En supposant que video_generation_id ait été obtenu à partir de l'exemple de génération ci-dessus # Pour la démonstration, utilisons un espace réservé si ce n'est pas le cas # video_generation_id = "your_actual_generation_id_here" status = "pending" while status == "pending": response = requests.get(API_URL_FETCH.format(video_generation_id=video_generation_id), headers=headers) response.raise_for_status() result = response.json() status = result.get("status") if status == "completed": video_url = result.get("output_url") print(f"Vidéo générée avec succès : {video_url}") elif status == "failed": print(f"La génération de la vidéo a échoué : {result.get('error')}") break else: print(f"Statut vidéo : {status}. En attente...") time.sleep(10) # Attendre 10 secondes avant de vérifier à nouveau ⚖️ Comparaison avec d'autres modèles
Comprendre la position unique de Kandinsky 5 Distill dans le paysage de la conversion du texte en vidéo :
- vs. Kandinsky 5 Standard : Distill propose temps de génération nettement plus rapidesCe qui le rend idéal pour les itérations rapides et les prévisualisations. Bien que le Kandinsky 5 original puisse offrir des nuances légèrement plus subtiles dans les générations très complexes, Distill conserve une excellente qualité pour la grande majorité des applications pratiques.
- vs. Modèles vidéo de diffusion stable : Kandinsky 5 Distill offre des fonctionnalités spécialisées de conversion de texte en vidéo grâce à une architecture optimisée basée sur des transformateurs, produisant fréquemment des vidéos de haute qualité. plus précis sémantiquement et plus cohérent temporellementLes variantes de diffusion stable sont souvent plus polyvalentes, mais peuvent être plus lentes ou présenter une moindre cohérence temporelle dans les sorties vidéo.
- vs. Image Vidéo : Kandinsky 5 Distill priorise vitesse et accessibilité, construit sur des architectures ouvertes. À l'inverse, Imagen Video est un modèle propriétaire axé sur l'ultra-haute qualité, généralement au prix d'un coût de calcul plus élevé et d'un accès limité.
🔗 Intégration API
L'API Kandinsky 5 Distill est facilement accessible via l'API IA/ML. Une documentation complète pour l'intégration est disponible. disponible ici.
❓ Foire aux questions (FAQ)
- Q : Qu'est-ce que le Kandinsky 5 Distill et quel est son principal avantage ?
A: Kandinsky 5 Distill est un modèle de diffusion optimisé et léger pour la conversion de texte en vidéo. Son principal avantage réside dans sa capacité à générer des vidéos beaucoup plus rapidement tout en conservant une haute qualité visuelle, ce qui le rend idéal pour le prototypage rapide et les flux de travail créatifs itératifs.
- Q : Comment le Kandinsky 5 Distill se compare-t-il en termes de vitesse et de qualité au Kandinsky 5 original ?
A: Distill offre un gain de vitesse considérable pour les aperçus en temps réel par rapport à la version originale, ce qui le rend beaucoup plus rapide. Il conserve une qualité visuelle élevée avec des détails fins, adaptée à la plupart des applications pratiques, bien que la version complète puisse offrir des nuances légèrement plus subtiles dans des scénarios extrêmement complexes.
- Q : Quels sont quelques cas d'utilisation typiques du Kandinsky 5 Distill ?
A: Il est excellent pour le prototypage rapide (storyboards, concepts), les aperçus de contenu (réseaux sociaux, publicités), le sandboxing créatif, les démonstrations pédagogiques et l'intégration dans des applications nécessitant un retour d'information rapide sur la génération vidéo.
- Q : Quels sont les types d'entrée et de sortie de l'API Kandinsky 5 Distill ?
A : L'API prend en entrée des invites textuelles en langage naturel et génère des vidéos de haute qualité avec des durées personnalisables (par exemple, 5 à 10 secondes).
- Q : Le distillat Kandinsky 5 est-il économe en ressources ?
R : Oui, il est très économe en ressources avec une faible consommation de mémoire GPU, ce qui permet de l'utiliser sur des GPU grand public pour des tâches de génération vidéo rapides.
Terrain de jeu de l'IA



Se connecter