Aus

Chat

deaktivieren

Sie 2.1

Entdecken Sie Wan 2.1: Alibabas bahnbrechendes Videomodell, das T2V, I2V, mehrsprachige Textgenerierung und multimodale Aufgaben unterstützt!

Gratis-Tokens im Wert von 1 $ für neue Mitglieder

Text to Speech

Javascript

Python

                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v2/generate/video/alibaba/generation', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'wan/v2.1/1.3b/text-to-video',
      prompt: 'A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background',
      aspect_ratio: '16:9',
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main()

                                        import requests


def main():
    url = "https://api.ai.cc/v2/generate/video/alibaba/generation"
    payload = {
        "model": "wan/v2.1/1.3b/text-to-video",
        "prompt": "A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background",
        "aspect_ratio": "16:9",
    }
    headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}

    response = requests.post(url, json=payload, headers=headers)
    print("Generation:", response.json())


if __name__ == "__main__":
    main()

Docs

Über 300 KI-Modelle für OpenClaw & KI-Agenten

Sparen Sie 20 % der Kosten und erhalten Sie 1 $ gratis!

API-Schlüssel abrufen Modelle entdecken

Sie 2.1

Produktdetails

💡Überblick:

Sie 2.1Das von Alibabas Wan AI-Team entwickelte Modell ist eine hochmoderne Videogrundlage für anspruchsvolle generative Videoaufgaben. Es unterstützt Text-zu-Video (T2V) und nutzt bahnbrechende Innovationen, um qualitativ hochwertige Ergebnisse bei außergewöhnlicher Recheneffizienz zu liefern.

✨Hauptmerkmale:

Visuelle Textgenerierung: Generiert innerhalb von Videos Texte in Chinesisch und Englisch.
3D Variational Autoencoder (WAN-VAE): Kodiert und dekodiert Videos in 1080P-Auflösung mit unbegrenzter Länge und zeitlicher Präzision.
Hochwertige Ergebnisse: Erzeugt visuell dynamische und zeitlich konsistente Videos mit Auflösungen von bis zu 720P.

🎯Verwendungszweck:

WAN 2.1 ist für Anwendungen in folgenden Bereichen konzipiert:

Kreativwirtschaft: Videoproduktion.
Inhaltsgenerierung: Für Social-Media- und Marketingkampagnen.
Automatisierte Arbeitsabläufe: Unter Einbeziehung von Multimedia-Verarbeitung.

🌍Sprachunterstützung:

Das Modell unterstützt die mehrsprachige Textgenerierung, einschließlich chinesisch Und EnglischDie

⚙️Technische Details:

🏗️Architektur:

WAN 2.1 basiert auf dem Diffusionstransformator-Paradigma und verfügt über mehrere innovative Funktionen:

3D Variational Autoencoder (WAN-VAE): Verbessert die raumzeitliche Kompression und gewährleistet die zeitliche Kausalität bei der Videogenerierung.
Video Diffusion DiT Framework: Verwendet Flow Matching mit einem T5-Encoder zur Textkodierung und in Transformer-Blöcken eingebetteten Cross-Attention-Layern.

🚀Leistungskennzahlen:

Wan 2.1 erzielt ein beeindruckendes Ergebnis 84,7 % V-Bench-WertungEs zeichnet sich durch seine Fähigkeit aus, dynamische Szenen, räumliche Konsistenz und Ästhetik zu erzeugen. Dank seines fortschrittlichen Raum-Zeit-Aufmerksamkeitsmechanismus generiert es 1080p-Videos mit 30 Bildern pro Sekunde und realistischen Bewegungen. Als führendes Open-Source-Videogenerierungsmodell konkurriert es mit proprietären Alternativen wie Sora, obwohl diese in einigen Bereichen überlegen sein können.

💻Verwendung:

Codebeispiele:

Das Modell ist verfügbar auf der KI/ML-API Plattform als "They 2.1"Die

Parameter:

negative_prompt [str]: Die zu verwendende negative Aufforderung. Verwenden Sie sie, um Details anzusprechen, die Sie nicht im Video haben möchten (z. B. Unschärfe, niedrige Auflösung).
Samen [int]: Zufallsgenerator für Reproduzierbarkeit. Falls None, wird ein Zufallsgenerator ausgewählt.
Seitenverhältnis [9:16, 16:9]: Seitenverhältnis des generierten Videos.
Inferenzschritte [int]: Anzahl der Inferenzschritte für die Stichprobenziehung. Höhere Werte führen zu besserer Qualität, dauern aber länger.
Leitlinienskala [Zahl]: Klassifikatorfreie Leitskala. Steuert prompte Einhaltung / Kreativität.
Schicht [Zahl]: Parameter zur Verschiebung des Rauschzeitplans. Beeinflusst die zeitliche Dynamik.
Probennehmer ['unipc', 'dpm+']: Der für die Generierung zu verwendende Sampler.
Sicherheitsprüfung aktivieren [boolean]: Wenn auf true gesetzt, wird die Sicherheitsprüfung aktiviert.
enable_prompt_expansion [boolean]: Gibt an, ob die Eingabeaufforderung erweitert werden soll.

So erhalten Sie das generierte Video:

API-Dokumentation:

Ausführlich API-Dokumentation ist hier verfügbar.

✅Ethische Richtlinien:

Alibaba betont die verantwortungsvolle Nutzung von Wan 2.1 für ethische Anwendungen bei der Inhaltserstellung und rät gleichzeitig von Missbrauch wie der Erzeugung von Deepfakes oder der Erstellung unangemessener Inhalte ab.

📜Lizenzierung:

WAN 2.1 ist lizenziert unter Apache 2.0, wodurch sowohl die kommerzielle als auch die Forschungszwecke mit transparenten Bedingungen genutzt werden können.

Get WAN 2.1 API Hier!

❓Häufig gestellte Fragen (FAQ):

Frage 1: Was ist WAN 2.1?: Wan 2.1 ist ein fortschrittliches Video-Fundamentmodell, das vom Wan AI-Team von Alibaba entwickelt wurde und sich auf generative Videoaufgaben wie Text-zu-Video (T2V) mit qualitativ hochwertigen Ausgaben und hoher Recheneffizienz spezialisiert hat.
Frage 2: Welche Auflösungen unterstützt WAN 2.1 für die Videogenerierung?: Das Modell ist in der Lage, visuell dynamische und zeitlich konsistente Videos mit Auflösungen bis zu 720P zu erzeugen und intern 1080p-Videos mit 30 FPS für realistische Bewegungen zu generieren.
Frage 3: Kann WAN 2.1 Text innerhalb von Videos generieren, und in welchen Sprachen?: Ja, Wan 2.1 bietet visuelle Textgenerierung und unterstützt das Einbetten von Text in Chinesisch und Englisch innerhalb der generierten Videos.
Frage 4: Wie sieht das Lizenzierungsmodell für WAN 2.1 aus?: Wan 2.1 ist unter der Apache 2.0-Lizenz lizenziert, die sowohl die kommerzielle als auch die Forschungszwecke unter transparenten Bedingungen erlaubt.
Frage 5: Wie schneidet WAN 2.1 im Vergleich zu anderen Videogenerationen ab?: WAN 2.1 erzielt einen beeindruckenden VBench-Wert von 84,7 % und gilt als führendes Open-Source-Modell. Es konkurriert mit proprietären Alternativen wie Sora, wobei die spezifische Leistung je nach Messgröße variieren kann.

KI-Spielplatz

Testen Sie alle API-Modelle in der Sandbox-Umgebung, bevor Sie sie integrieren. Wir bieten über 300 Modelle zur Integration in Ihre App an.

Kostenlos testen

Mehr als 300 KI-Modelle für
OpenClaw & KI-Agenten

Sparen Sie 20 % der Kosten