



const main = async () => {
const response = await fetch('https://api.ai.cc/v2/video/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'klingai/video-o1-reference-to-video',
prompt: 'A graceful ballerina dancing outside a circus tent on green grass, with colorful wildflowers swaying around her as she twirls and poses in the meadow.',
image_list: [
'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-1.png',
'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-2.png',
'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-3.png',
],
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/video/generations"
payload = {
"model": "klingai/video-o1-reference-to-video",
"prompt": "A graceful ballerina dancing outside a circus tent on green grass, with colorful wildflowers swaying around her as she twirls and poses in the meadow.",
"image_list": [
"https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-1.png",
"https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-2.png",
"https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-3.png"
]
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

Détails du produit
🚀 API Kling Video O1 : Génération de références vidéo révolutionnaire
Kuaishou's Référence vidéo Kling O1 Ce système génère des vidéos d'une cohérence thématique inégalée directement à partir de références visuelles. Ce modèle multimodal unifié exploite une extraction de caractéristiques avancée pour préserver avec précision l'identité des personnages, des accessoires et des scènes dans des scénarios inédits et variés, établissant ainsi une nouvelle norme en matière de création vidéo par IA.
⚙️ Spécifications techniques
- Prise en charge des entrées : Accepte une ou plusieurs images de référence (jusqu'à 4 points de vue par élément) aux formats JPG, JPEG ou PNG. Les références vidéo optionnelles, d'une durée maximale de 10 secondes, 200 Mo et en résolution 2K, sont également prises en charge.
- Capacités de sortie : Génère des vidéos de 5 à 10 secondes, avec une résolution jusqu'à 2K (norme 1080p), à 30 images par seconde (ips). Les formats d'image courants, dont le 16:9, sont entièrement pris en charge.
- Architecture du modèle : Construit sur un puissant moteur multimodal unifié qui intègre Raisonnement par chaîne de pensée (CoT), la fusion multi-éléments et un traitement sophistiqué de la vision et du langage pour une conservation précise de l'identité et une compréhension contextuelle approfondie.
📈 Indicateurs de performance
Kling Video O1 excelle à la fois en matière de cohérence d'image et de qualité de mouvement, surpassant ses concurrents dans les tâches critiques de génération de références :
- ✅ Démontre une Amélioration de 247 % dans les tâches de génération de références par rapport à Google Veo 3.1.
- ✅ A atteint un amélioration de 230 % sur Piste Aleph dans des benchmarks similaires.
- ✨ Offre une stabilité d'image supérieure, réduisant efficacement le scintillement dans les scènes complexes à plusieurs sujets.
- 🧠 Le raisonnement amélioré via CoT augmente considérablement la précision des prompts en analysant intelligemment les entrées avant le rendu.
🌟 Principales caractéristiques du Kling Video O1
- 🖼️ Construction de sujets multi-référentiels : Extrait des caractéristiques complètes à partir de points de vue divers, assurant une identité très stable et cohérente pour les sujets au sein de scènes dynamiques.
- 🌍 Génération de nouveaux scénarios : Permet la création de contenus entièrement nouveaux et uniques, tels que des déplacements de personnages futuristes ou des interactions complexes, tout en préservant rigoureusement les détails de référence.
- 🎛️ Modes professionnel/standard : Offre des modes flexibles permettant d'équilibrer qualité et vitesse, ainsi qu'une prise en charge robuste du contrôle avancé de la caméra, d'une précision de mouvement optimale et d'une simulation physique réaliste.
- Yong Gestion des références tout-en-un : Fusionne harmonieusement plusieurs éléments (personnages, accessoires et scènes entières) pour produire des vidéos complexes, cohérentes et de haute qualité.
💲 Tarification de l'API Kling Video O1
L'API Kling Video O1 est proposée à un tarif compétitif :
- 0,1176 $ / seconde de vidéo générée
💻 Exemple de code
Voici un exemple d'intégration de l'API Kling Video O1 :
Comparaison avec les principaux modèles d'IA
Kling Video O1 se distingue dans le paysage concurrentiel de la génération vidéo par IA :
- 🆚 vs. Google Veo 3.1 : Kling O1 surpasse Veo 3.1 de 247 % en fidélité de référence, offrant une fusion multivue supérieure sans perte de cohérence. Veo présente souvent des limitations dans la gestion des interactions complexes entre sujets.
- 🆚 contre Runway Gen-4.5 : Kling assure une excellente conservation de l'identité sous différents angles, ce qui en fait la solution idéale pour une cohérence professionnelle. Runway Gen-4.5 privilégie les animations textuelles, mais souffre de problèmes de stabilité lorsqu'il intègre plusieurs entrées de référence.
- 🆚 contre Hailuo 2.3 : Le système de raisonnement avancé Chain of Thought de Kling assure une physique et un rendu de la caméra plus fluides, pour une qualité supérieure et des mouvements plus naturels. Si Hailuo 2.3 excelle en vitesse de génération, il peine généralement à maintenir la stabilité du sujet sur les clips vidéo longs.
❓ Foire aux questions (FAQ)
Qu'est-ce que la référence vidéo Kling O1 ?
Kling Video O1 est un modèle d'IA multimodal unifié de Kuaishou qui génère des vidéos avec des sujets, des accessoires et des scènes cohérents directement à partir de références d'images, même dans de nouveaux scénarios.
Quels sont les principaux types d'entrée pris en charge par Kling Video O1 ?
Il accepte principalement des images de référence uniques ou multiples (JPG, JPEG, PNG) avec jusqu'à 4 points de vue par élément, et en option des références vidéo jusqu'à 10 secondes, 200 Mo et une résolution de 2K.
Quelle est la durée des vidéos générées par Kling Video O1 et à quelle résolution ?
Les vidéos générées durent généralement de 5 à 10 secondes, avec une résolution standard de 1080p et une résolution maximale de 2K, à 30 images par seconde.
Qu'est-ce qui rend le Kling Video O1 supérieur en matière de cohérence d'identité ?
Son moteur multimodal unifié, associé au raisonnement Chain of Thought (CoT), à la fusion multi-éléments et au traitement vision-langage, assure une conservation précise et stable de l'identité dans des scènes complexes.
Quel est le coût d'utilisation de l'API Kling Video O1 ?
L'API Kling Video O1 est facturée 0,1176 $ par seconde de contenu vidéo généré.
Terrain de jeu de l'IA



Se connecter