Aus

Chat

aktiv

Kling Video O1 Referenz-zu-Video

Es nutzt eine fortschrittliche Merkmalsextraktion, um die visuelle Identität wie Aussehen, Textur und Stil auch in völlig neuen Szenarien und Bewegungen zu erhalten.

Gratis-Tokens im Wert von 1 $ für neue Mitglieder

Text to Speech

Javascript

Python

                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v2/video/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'klingai/video-o1-reference-to-video',
      prompt: 'A graceful ballerina dancing outside a circus tent on green grass, with colorful wildflowers swaying around her as she twirls and poses in the meadow.',
      image_list: [
        'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-1.png',
        'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-2.png',
        'https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-3.png',
      ],
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main()

                                        import requests


def main():
    url = "https://api.ai.cc/v2/video/generations"
    payload = {
        "model": "klingai/video-o1-reference-to-video",
        "prompt": "A graceful ballerina dancing outside a circus tent on green grass, with colorful wildflowers swaying around her as she twirls and poses in the meadow.",
        "image_list": [
            "https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-1.png",
            "https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-2.png",
            "https://storage.googleapis.com/falserverless/example_inputs/veo31-r2v-input-3.png"
        ]
    }
    headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}

    response = requests.post(url, json=payload, headers=headers)
    print("Generation:", response.json())


if __name__ == "__main__":
    main()

Docs

Über 300 KI-Modelle für OpenClaw & KI-Agenten

Sparen Sie 20 % der Kosten und erhalten Sie 1 $ gratis!

API-Schlüssel abrufen Modelle entdecken

Kling Video O1 Referenz-zu-Video

Produktdetails

🚀 Kling Video O1 API: Bahnbrechende Referenz-zu-Video-Generierung

Kuaishous Kling Video O1 Referenz-zu-Video Es ermöglicht die unübertroffene Generierung themenkonsistenter Videos direkt aus Bildvorlagen. Dieses einheitliche multimodale Modell nutzt fortschrittliche Merkmalsextraktion, um die Identität von Charakteren, Requisiten und Szenen in völlig neuen und vielfältigen Szenarien makellos zu bewahren und setzt damit einen neuen Standard in der KI-gestützten Videoproduktion.

⚙️ Technische Spezifikationen

Eingabeunterstützung: Akzeptiert einzelne oder mehrere Referenzbilder (bis zu 4 Ansichten pro Element) in den Formaten JPG, JPEG oder PNG. Optional werden auch Videoreferenzen mit einer Länge von bis zu 10 Sekunden, einer Größe von bis zu 200 MB und einer Auflösung von 2K unterstützt.
Ausgabekapazitäten: Erzeugt Videos mit einer Länge von 5 bis 10 Sekunden und Auflösungen bis zu 2K (1080p-Standard) bei 30 Bildern pro Sekunde (fps). Gängige Seitenverhältnisse, einschließlich 16:9, werden vollständig unterstützt.
Modellarchitektur: Basierend auf einer leistungsstarken, einheitlichen multimodalen Engine, die Folgendes integriert: Gedankenkette (CoT), Mehrelementfusion und ausgefeilte Bild-Sprach-Verarbeitung für präzise Identitätserhaltung und tiefes Kontextverständnis.

📈 Leistungsbenchmarks

Kling Video O1 zeichnet sich sowohl durch hohe Identitätskonsistenz als auch durch hervorragende Bewegungsqualität aus und übertrifft Konkurrenten bei kritischen Aufgaben der Referenzgenerierung:

✅ Zeigt ein 247% Verbesserung bei Aufgaben zur Referenzgenerierung im Vergleich zu Google Veo 3.1Die
✅ Erreichte ein 230% Verbesserung über Landebahn Aleph in vergleichbaren Benchmarks.
✨ Bietet überlegene Bildstabilität und reduziert so effektiv das Flimmern in komplexen Szenen mit mehreren Motiven.
🧠 Verbesserte Argumentation mittels CoT steigert die Genauigkeit der Eingabeaufforderung erheblich, indem Eingaben vor der Darstellung intelligent analysiert werden.

🌟 Hauptmerkmale von Kling Video O1

🖼️ Mehrfachreferenzielles Fachaufbau: Extrahiert umfassende Merkmale aus verschiedenen Blickwinkeln und gewährleistet so eine hohe Stabilität und Konsistenz der Identität der Motive in dynamischen Szenen.
🌍 Neue Szenariogenerierung: Ermöglicht die Erstellung völlig neuer und einzigartiger Inhalte, wie zum Beispiel futuristische Charakteranimationen oder komplexe Interaktionen, wobei Referenzdetails strikt beibehalten werden.
🎛️ Professionelle/Standard-Modi: Bietet flexible Modi zur Balance zwischen Qualität und Geschwindigkeit sowie robuste Unterstützung für fortschrittliche Kamerasteuerung, präzise Bewegungsgenauigkeit und realistische Physiksimulation.
Yung All-in-One-Referenzverwaltung: Verschmilzt nahtlos mehrere Themen (Charaktere, Requisiten und ganze Szenen) zu komplexen, durchgehend kohärenten und qualitativ hochwertigen Videoausgaben.

💲 Kling Video O1 API-Preise

Die Kling Video O1 API wird zu einem wettbewerbsfähigen Preis angeboten:

0,1176 $ / Sekunde von generiertem Video

💻 Codebeispiel

Hier ist ein Beispiel für die Integration der Kling Video O1 API:

Vergleich mit führenden KI-Modellen

Kling Video O1 hebt sich im wettbewerbsintensiven Umfeld der KI-Videogenerierung hervor:

🆚 im Vergleich zu Google Veo 3.1: Kling O1 übertrifft Veo 3.1 um bemerkenswerte 247 % in der Referenzgenauigkeit und bietet eine überlegene Mehransichtsfusion ohne Kohärenzverlust. Veo stößt häufig bei komplexen Interaktionen zwischen Probanden an seine Grenzen.
🆚 vs. Runway Gen-4.5: Kling bietet eine außergewöhnliche Bildqualität aus verschiedenen Blickwinkeln und ist daher ideal für professionelle Ergebnisse. Runway Gen-4.5 konzentriert sich stärker auf textbasierte Animationen, hat aber Schwierigkeiten mit der Stabilität bei der Einbindung mehrerer Referenzsignale.
🆚 gegen Hailuo 2.3: Klings fortschrittliche Chain-of-Thought-Logik sorgt für flüssigere Physik- und Kamerabewegungen und damit für höhere Qualität und natürlichere Bewegungen. Hailuo 2.3 zeichnet sich zwar durch hohe Aufnahmegeschwindigkeit aus, hat aber typischerweise Schwächen bei der Stabilisierung des Motivs in längeren Videoclips.

❓ Häufig gestellte Fragen (FAQ)

Was ist Kling Video O1 Reference-to-Video?

Kling Video O1 ist ein einheitliches multimodales KI-Modell von Kuaishou, das Videos mit konsistenten Themen, Requisiten und Szenen direkt aus Bildreferenzen generiert, selbst in neuen Szenarien.

Welche primären Eingabetypen werden von Kling Video O1 unterstützt?

Es akzeptiert primär einzelne oder mehrere Referenzbilder (JPG, JPEG, PNG) mit bis zu 4 Ansichten pro Element sowie optional Videoreferenzen mit einer Länge von bis zu 10 Sekunden, einer Größe von bis zu 200 MB und einer Auflösung von bis zu 2K.

Wie lang sind die von Kling Video O1 generierten Videos und in welcher Auflösung?

Die generierten Videos sind typischerweise 5-10 Sekunden lang, mit einer Standardauflösung von 1080p und maximal 2K bei 30 Bildern pro Sekunde.

Was macht Kling Video O1 in puncto Identitätskonsistenz überlegen?

Die einheitliche multimodale Engine, gekoppelt mit Chain of Thought (CoT)-Schlussfolgerungen, Mehrelementfusion und Bild-Sprach-Verarbeitung, gewährleistet eine präzise und stabile Identitätserhaltung in komplexen Szenen.

Welche Kosten entstehen durch die Nutzung der Kling Video O1 API?

Die Kling Video O1 API kostet 0,1176 US-Dollar pro Sekunde generierten Videoinhalts.

KI-Spielplatz

Testen Sie alle API-Modelle in der Sandbox-Umgebung, bevor Sie sie integrieren. Wir bieten über 300 Modelle zur Integration in Ihre App an.

Kostenlos testen

Mehr als 300 KI-Modelle für
OpenClaw & KI-Agenten

Sparen Sie 20 % der Kosten