qwen-bg
max-ico04
In
Aus
max-ico02
Chat
max-ico03
deaktivieren
Sie 2.1
Entdecken Sie Wan 2.1: Alibabas bahnbrechendes Videomodell, das T2V, I2V, mehrsprachige Textgenerierung und multimodale Aufgaben unterstützt!
Gratis-Tokens im Wert von 1 $ für neue Mitglieder
Text to Speech
                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v2/generate/video/alibaba/generation', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'wan/v2.1/1.3b/text-to-video',
      prompt: 'A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background',
      aspect_ratio: '16:9',
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main()

                                
                                        import requests


def main():
    url = "https://api.ai.cc/v2/generate/video/alibaba/generation"
    payload = {
        "model": "wan/v2.1/1.3b/text-to-video",
        "prompt": "A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background",
        "aspect_ratio": "16:9",
    }
    headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}

    response = requests.post(url, json=payload, headers=headers)
    print("Generation:", response.json())


if __name__ == "__main__":
    main()
Docs

Eine API für über 300 KI-Modelle

Sparen Sie 20 % der Kosten und erhalten Sie 1 $ gratis!
qwenmax-bg
Bild
Sie 2.1

Produktdetails

💡Überblick:

Sie 2.1Das von Alibabas Wan AI-Team entwickelte Modell ist eine hochmoderne Videogrundlage für anspruchsvolle generative Videoaufgaben. Es unterstützt Text-zu-Video (T2V) und nutzt bahnbrechende Innovationen, um qualitativ hochwertige Ergebnisse bei außergewöhnlicher Recheneffizienz zu liefern.

Hauptmerkmale:

  • Visuelle Textgenerierung: Generiert innerhalb von Videos Texte in Chinesisch und Englisch.
  • 3D Variational Autoencoder (WAN-VAE): Kodiert und dekodiert Videos in 1080P-Auflösung mit unbegrenzter Länge und zeitlicher Präzision.
  • Hochwertige Ergebnisse: Erzeugt visuell dynamische und zeitlich konsistente Videos mit Auflösungen von bis zu 720P.

🎯Verwendungszweck:

WAN 2.1 ist für Anwendungen in folgenden Bereichen konzipiert:

  • Kreativwirtschaft: Videoproduktion.
  • Inhaltsgenerierung: Für Social-Media- und Marketingkampagnen.
  • Automatisierte Arbeitsabläufe: Unter Einbeziehung von Multimedia-Verarbeitung.

🌍Sprachunterstützung:

Das Modell unterstützt die mehrsprachige Textgenerierung, einschließlich chinesisch Und EnglischDie

⚙️Technische Details:

🏗️Architektur:

WAN 2.1 basiert auf dem Diffusionstransformator-Paradigma und verfügt über mehrere innovative Funktionen:

  • 3D Variational Autoencoder (WAN-VAE): Verbessert die raumzeitliche Kompression und gewährleistet die zeitliche Kausalität bei der Videogenerierung.
  • Video Diffusion DiT Framework: Verwendet Flow Matching mit einem T5-Encoder zur Textkodierung und in Transformer-Blöcken eingebetteten Cross-Attention-Layern.

🚀Leistungskennzahlen:

Wan 2.1 erzielt ein beeindruckendes Ergebnis 84,7 % V-Bench-WertungEs zeichnet sich durch seine Fähigkeit aus, dynamische Szenen, räumliche Konsistenz und Ästhetik zu erzeugen. Dank seines fortschrittlichen Raum-Zeit-Aufmerksamkeitsmechanismus generiert es 1080p-Videos mit 30 Bildern pro Sekunde und realistischen Bewegungen. Als führendes Open-Source-Videogenerierungsmodell konkurriert es mit proprietären Alternativen wie Sora, obwohl diese in einigen Bereichen überlegen sein können.

💻Verwendung:

Codebeispiele:

Das Modell ist verfügbar auf der KI/ML-API Plattform als "They 2.1"Die

Parameter:

  • negative_prompt [str]: Die zu verwendende negative Aufforderung. Verwenden Sie sie, um Details anzusprechen, die Sie nicht im Video haben möchten (z. B. Unschärfe, niedrige Auflösung).
  • Samen [int]: Zufallsgenerator für Reproduzierbarkeit. Falls None, wird ein Zufallsgenerator ausgewählt.
  • Seitenverhältnis [9:16, 16:9]: Seitenverhältnis des generierten Videos.
  • Inferenzschritte [int]: Anzahl der Inferenzschritte für die Stichprobenziehung. Höhere Werte führen zu besserer Qualität, dauern aber länger.
  • Leitlinienskala [Zahl]: Klassifikatorfreie Leitskala. Steuert prompte Einhaltung / Kreativität.
  • Schicht [Zahl]: Parameter zur Verschiebung des Rauschzeitplans. Beeinflusst die zeitliche Dynamik.
  • Probennehmer ['unipc', 'dpm+']: Der für die Generierung zu verwendende Sampler.
  • Sicherheitsprüfung aktivieren [boolean]: Wenn auf true gesetzt, wird die Sicherheitsprüfung aktiviert.
  • enable_prompt_expansion [boolean]: Gibt an, ob die Eingabeaufforderung erweitert werden soll.

So erhalten Sie das generierte Video:

API-Dokumentation:

Ausführlich API-Dokumentation ist hier verfügbar.

Ethische Richtlinien:

Alibaba betont die verantwortungsvolle Nutzung von Wan 2.1 für ethische Anwendungen bei der Inhaltserstellung und rät gleichzeitig von Missbrauch wie der Erzeugung von Deepfakes oder der Erstellung unangemessener Inhalte ab.

📜Lizenzierung:

WAN 2.1 ist lizenziert unter Apache 2.0, wodurch sowohl die kommerzielle als auch die Forschungszwecke mit transparenten Bedingungen genutzt werden können.

Get WAN 2.1 API Hier!

Häufig gestellte Fragen (FAQ):

Frage 1: Was ist WAN 2.1?
Wan 2.1 ist ein fortschrittliches Video-Fundamentmodell, das vom Wan AI-Team von Alibaba entwickelt wurde und sich auf generative Videoaufgaben wie Text-zu-Video (T2V) mit qualitativ hochwertigen Ausgaben und hoher Recheneffizienz spezialisiert hat.
Frage 2: Welche Auflösungen unterstützt WAN 2.1 für die Videogenerierung?
Das Modell ist in der Lage, visuell dynamische und zeitlich konsistente Videos mit Auflösungen bis zu 720P zu erzeugen und intern 1080p-Videos mit 30 FPS für realistische Bewegungen zu generieren.
Frage 3: Kann WAN 2.1 Text innerhalb von Videos generieren, und in welchen Sprachen?
Ja, Wan 2.1 bietet visuelle Textgenerierung und unterstützt das Einbetten von Text in Chinesisch und Englisch innerhalb der generierten Videos.
Frage 4: Wie sieht das Lizenzierungsmodell für WAN 2.1 aus?
Wan 2.1 ist unter der Apache 2.0-Lizenz lizenziert, die sowohl die kommerzielle als auch die Forschungszwecke unter transparenten Bedingungen erlaubt.
Frage 5: Wie schneidet WAN 2.1 im Vergleich zu anderen Videogenerationen ab?
WAN 2.1 erzielt einen beeindruckenden VBench-Wert von 84,7 % und gilt als führendes Open-Source-Modell. Es konkurriert mit proprietären Alternativen wie Sora, wobei die spezifische Leistung je nach Messgröße variieren kann.

KI-Spielplatz

Testen Sie alle API-Modelle in der Sandbox-Umgebung, bevor Sie sie integrieren. Wir bieten über 300 Modelle zur Integration in Ihre App an.
Kostenlos testen
api-right-1
Modell-BG02-1

Eine API
Mehr als 300 KI-Modelle

Sparen Sie 20 % der Kosten