qwen-bg
max-ico04
Dans
Dehors
max-ico02
Chat
max-ico03
actif
Référence vidéo Kling O1
Il utilise une extraction de caractéristiques avancée pour préserver l'identité visuelle, telle que l'apparence, la texture et le style, à travers des scénarios et des mouvements entièrement nouveaux.
Jetons gratuits de 1 $ pour les nouveaux membres
Text to Speech
                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v2/video/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'klingai/video-o1-reference-to-video',
      prompt: 'A graceful ballerina dancing outside a circus tent on green grass, with colorful wildflowers swaying around her as she twirls and poses in the meadow.',
      image_list: [
        'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-1.png',
        'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-2.png',
        'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-3.png',
      ],
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main()

                                
                                        import requests


def main():
    url = "https://api.ai.cc/v2/video/generations"
    payload = {
        "model": "klingai/video-o1-reference-to-video",
        "prompt": "A graceful ballerina dancing outside a circus tent on green grass, with colorful wildflowers swaying around her as she twirls and poses in the meadow.",
        "image_list": [
            "https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-1.png",
            "https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-2.png",
            "https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-3.png"
        ]
    }
    headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}

    response = requests.post(url, json=payload, headers=headers)
    print("Generation:", response.json())


if __name__ == "__main__":
    main()
Docs

Une seule API pour plus de 300 modèles d'IA

Économisez 20 % sur les coûts et recevez des jetons gratuits d'une valeur de 1 $.
qwenmax-bg
image
Référence vidéo Kling O1

Détails du produit

🚀 API Kling Video O1 : Génération de références vidéo révolutionnaire

Kuaishou's Référence vidéo Kling O1 Ce système génère des vidéos d'une cohérence thématique inégalée directement à partir de références visuelles. Ce modèle multimodal unifié exploite une extraction de caractéristiques avancée pour préserver avec précision l'identité des personnages, des accessoires et des scènes dans des scénarios inédits et variés, établissant ainsi une nouvelle norme en matière de création vidéo par IA.

⚙️ Spécifications techniques

  • Prise en charge des entrées : Accepte une ou plusieurs images de référence (jusqu'à 4 points de vue par élément) aux formats JPG, JPEG ou PNG. Les références vidéo optionnelles, d'une durée maximale de 10 secondes, 200 Mo et en résolution 2K, sont également prises en charge.
  • Capacités de sortie : Génère des vidéos de 5 à 10 secondes, avec une résolution jusqu'à 2K (norme 1080p), à 30 images par seconde (ips). Les formats d'image courants, dont le 16:9, sont entièrement pris en charge.
  • Architecture du modèle : Construit sur un puissant moteur multimodal unifié qui intègre Raisonnement par chaîne de pensée (CoT), la fusion multi-éléments et un traitement sophistiqué de la vision et du langage pour une conservation précise de l'identité et une compréhension contextuelle approfondie.

📈 Indicateurs de performance

Kling Video O1 excelle à la fois en matière de cohérence d'image et de qualité de mouvement, surpassant ses concurrents dans les tâches critiques de génération de références :

  • ✅ Démontre une Amélioration de 247 % dans les tâches de génération de références par rapport à Google Veo 3.1.
  • ✅ A atteint un amélioration de 230 % sur Piste Aleph dans des benchmarks similaires.
  • ✨ Offre une stabilité d'image supérieure, réduisant efficacement le scintillement dans les scènes complexes à plusieurs sujets.
  • 🧠 Le raisonnement amélioré via CoT augmente considérablement la précision des prompts en analysant intelligemment les entrées avant le rendu.
Comparaison des performances du Kling Video O1

🌟 Principales caractéristiques du Kling Video O1

  • 🖼️ Construction de sujets multi-référentiels : Extrait des caractéristiques complètes à partir de points de vue divers, assurant une identité très stable et cohérente pour les sujets au sein de scènes dynamiques.
  • 🌍 Génération de nouveaux scénarios : Permet la création de contenus entièrement nouveaux et uniques, tels que des déplacements de personnages futuristes ou des interactions complexes, tout en préservant rigoureusement les détails de référence.
  • 🎛️ Modes professionnel/standard : Offre des modes flexibles permettant d'équilibrer qualité et vitesse, ainsi qu'une prise en charge robuste du contrôle avancé de la caméra, d'une précision de mouvement optimale et d'une simulation physique réaliste.
  • Yong Gestion des références tout-en-un : Fusionne harmonieusement plusieurs éléments (personnages, accessoires et scènes entières) pour produire des vidéos complexes, cohérentes et de haute qualité.

💲 Tarification de l'API Kling Video O1

L'API Kling Video O1 est proposée à un tarif compétitif :

  • 0,1176 $ / seconde de vidéo générée

💻 Exemple de code

Voici un exemple d'intégration de l'API Kling Video O1 :

Comparaison avec les principaux modèles d'IA

Kling Video O1 se distingue dans le paysage concurrentiel de la génération vidéo par IA :

  • 🆚 vs. Google Veo 3.1 : Kling O1 surpasse Veo 3.1 de 247 % en fidélité de référence, offrant une fusion multivue supérieure sans perte de cohérence. Veo présente souvent des limitations dans la gestion des interactions complexes entre sujets.
  • 🆚 contre Runway Gen-4.5 : Kling assure une excellente conservation de l'identité sous différents angles, ce qui en fait la solution idéale pour une cohérence professionnelle. Runway Gen-4.5 privilégie les animations textuelles, mais souffre de problèmes de stabilité lorsqu'il intègre plusieurs entrées de référence.
  • 🆚 contre Hailuo 2.3 : Le système de raisonnement avancé Chain of Thought de Kling assure une physique et un rendu de la caméra plus fluides, pour une qualité supérieure et des mouvements plus naturels. Si Hailuo 2.3 excelle en vitesse de génération, il peine généralement à maintenir la stabilité du sujet sur les clips vidéo longs.

❓ Foire aux questions (FAQ)

Qu'est-ce que la référence vidéo Kling O1 ?

Kling Video O1 est un modèle d'IA multimodal unifié de Kuaishou qui génère des vidéos avec des sujets, des accessoires et des scènes cohérents directement à partir de références d'images, même dans de nouveaux scénarios.

Quels sont les principaux types d'entrée pris en charge par Kling Video O1 ?

Il accepte principalement des images de référence uniques ou multiples (JPG, JPEG, PNG) avec jusqu'à 4 points de vue par élément, et en option des références vidéo jusqu'à 10 secondes, 200 Mo et une résolution de 2K.

Quelle est la durée des vidéos générées par Kling Video O1 et à quelle résolution ?

Les vidéos générées durent généralement de 5 à 10 secondes, avec une résolution standard de 1080p et une résolution maximale de 2K, à 30 images par seconde.

Qu'est-ce qui rend le Kling Video O1 supérieur en matière de cohérence d'identité ?

Son moteur multimodal unifié, associé au raisonnement Chain of Thought (CoT), à la fusion multi-éléments et au traitement vision-langage, assure une conservation précise et stable de l'identité dans des scènes complexes.

Quel est le coût d'utilisation de l'API Kling Video O1 ?

L'API Kling Video O1 est facturée 0,1176 $ par seconde de contenu vidéo généré.

Terrain de jeu de l'IA

Testez tous les modèles d'API dans l'environnement de test avant de les intégrer. Nous proposons plus de 300 modèles à intégrer à votre application.
Essai gratuit
api-droite-1
modèle-bg02-1

Une API
Plus de 300 modèles d'IA

Économisez 20 % sur vos coûts