



const main = async () => {
const response = await fetch('https://api.ai.cc/v2/generate/video/alibaba/generation', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'wan/v2.1/1.3b/text-to-video',
prompt: 'A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background',
aspect_ratio: '16:9',
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main()
import requests
def main():
url = "https://api.ai.cc/v2/generate/video/alibaba/generation"
payload = {
"model": "wan/v2.1/1.3b/text-to-video",
"prompt": "A DJ on the stand is playing, around a World War II battlefield, lots of explosions, thousands of dancing soldiers, between tanks shooting, barbed wire fences, lots of smoke and fire, black and white old video: hyper realistic, photorealistic, photography, super detailed, very sharp, on a very white background",
"aspect_ratio": "16:9",
}
headers = {"Authorization": "Bearer ", "Content-Type": "application/json"}
response = requests.post(url, json=payload, headers=headers)
print("Generation:", response.json())
if __name__ == "__main__":
main()

Produktdetails
💡Überblick:
Sie 2.1Das von Alibabas Wan AI-Team entwickelte Modell ist eine hochmoderne Videogrundlage für anspruchsvolle generative Videoaufgaben. Es unterstützt Text-zu-Video (T2V) und nutzt bahnbrechende Innovationen, um qualitativ hochwertige Ergebnisse bei außergewöhnlicher Recheneffizienz zu liefern.
✨Hauptmerkmale:
- Visuelle Textgenerierung: Generiert innerhalb von Videos Texte in Chinesisch und Englisch.
- 3D Variational Autoencoder (WAN-VAE): Kodiert und dekodiert Videos in 1080P-Auflösung mit unbegrenzter Länge und zeitlicher Präzision.
- Hochwertige Ergebnisse: Erzeugt visuell dynamische und zeitlich konsistente Videos mit Auflösungen von bis zu 720P.
🎯Verwendungszweck:
WAN 2.1 ist für Anwendungen in folgenden Bereichen konzipiert:
- Kreativwirtschaft: Videoproduktion.
- Inhaltsgenerierung: Für Social-Media- und Marketingkampagnen.
- Automatisierte Arbeitsabläufe: Unter Einbeziehung von Multimedia-Verarbeitung.
🌍Sprachunterstützung:
Das Modell unterstützt die mehrsprachige Textgenerierung, einschließlich chinesisch Und EnglischDie
⚙️Technische Details:
🏗️Architektur:
WAN 2.1 basiert auf dem Diffusionstransformator-Paradigma und verfügt über mehrere innovative Funktionen:
- 3D Variational Autoencoder (WAN-VAE): Verbessert die raumzeitliche Kompression und gewährleistet die zeitliche Kausalität bei der Videogenerierung.
- Video Diffusion DiT Framework: Verwendet Flow Matching mit einem T5-Encoder zur Textkodierung und in Transformer-Blöcken eingebetteten Cross-Attention-Layern.
🚀Leistungskennzahlen:
Wan 2.1 erzielt ein beeindruckendes Ergebnis 84,7 % V-Bench-WertungEs zeichnet sich durch seine Fähigkeit aus, dynamische Szenen, räumliche Konsistenz und Ästhetik zu erzeugen. Dank seines fortschrittlichen Raum-Zeit-Aufmerksamkeitsmechanismus generiert es 1080p-Videos mit 30 Bildern pro Sekunde und realistischen Bewegungen. Als führendes Open-Source-Videogenerierungsmodell konkurriert es mit proprietären Alternativen wie Sora, obwohl diese in einigen Bereichen überlegen sein können.
💻Verwendung:
Codebeispiele:
Das Modell ist verfügbar auf der KI/ML-API Plattform als "They 2.1"Die
Parameter:
- negative_prompt [str]: Die zu verwendende negative Aufforderung. Verwenden Sie sie, um Details anzusprechen, die Sie nicht im Video haben möchten (z. B. Unschärfe, niedrige Auflösung).
- Samen [int]: Zufallsgenerator für Reproduzierbarkeit. Falls None, wird ein Zufallsgenerator ausgewählt.
- Seitenverhältnis [9:16, 16:9]: Seitenverhältnis des generierten Videos.
- Inferenzschritte [int]: Anzahl der Inferenzschritte für die Stichprobenziehung. Höhere Werte führen zu besserer Qualität, dauern aber länger.
- Leitlinienskala [Zahl]: Klassifikatorfreie Leitskala. Steuert prompte Einhaltung / Kreativität.
- Schicht [Zahl]: Parameter zur Verschiebung des Rauschzeitplans. Beeinflusst die zeitliche Dynamik.
- Probennehmer ['unipc', 'dpm+']: Der für die Generierung zu verwendende Sampler.
- Sicherheitsprüfung aktivieren [boolean]: Wenn auf true gesetzt, wird die Sicherheitsprüfung aktiviert.
- enable_prompt_expansion [boolean]: Gibt an, ob die Eingabeaufforderung erweitert werden soll.
So erhalten Sie das generierte Video:
API-Dokumentation:
Ausführlich API-Dokumentation ist hier verfügbar.
✅Ethische Richtlinien:
Alibaba betont die verantwortungsvolle Nutzung von Wan 2.1 für ethische Anwendungen bei der Inhaltserstellung und rät gleichzeitig von Missbrauch wie der Erzeugung von Deepfakes oder der Erstellung unangemessener Inhalte ab.
📜Lizenzierung:
WAN 2.1 ist lizenziert unter Apache 2.0, wodurch sowohl die kommerzielle als auch die Forschungszwecke mit transparenten Bedingungen genutzt werden können.
Get WAN 2.1 API Hier!
❓Häufig gestellte Fragen (FAQ):
- Frage 1: Was ist WAN 2.1?
- Wan 2.1 ist ein fortschrittliches Video-Fundamentmodell, das vom Wan AI-Team von Alibaba entwickelt wurde und sich auf generative Videoaufgaben wie Text-zu-Video (T2V) mit qualitativ hochwertigen Ausgaben und hoher Recheneffizienz spezialisiert hat.
- Frage 2: Welche Auflösungen unterstützt WAN 2.1 für die Videogenerierung?
- Das Modell ist in der Lage, visuell dynamische und zeitlich konsistente Videos mit Auflösungen bis zu 720P zu erzeugen und intern 1080p-Videos mit 30 FPS für realistische Bewegungen zu generieren.
- Frage 3: Kann WAN 2.1 Text innerhalb von Videos generieren, und in welchen Sprachen?
- Ja, Wan 2.1 bietet visuelle Textgenerierung und unterstützt das Einbetten von Text in Chinesisch und Englisch innerhalb der generierten Videos.
- Frage 4: Wie sieht das Lizenzierungsmodell für WAN 2.1 aus?
- Wan 2.1 ist unter der Apache 2.0-Lizenz lizenziert, die sowohl die kommerzielle als auch die Forschungszwecke unter transparenten Bedingungen erlaubt.
- Frage 5: Wie schneidet WAN 2.1 im Vergleich zu anderen Videogenerationen ab?
- WAN 2.1 erzielt einen beeindruckenden VBench-Wert von 84,7 % und gilt als führendes Open-Source-Modell. Es konkurriert mit proprietären Alternativen wie Sora, wobei die spezifische Leistung je nach Messgröße variieren kann.
KI-Spielplatz



Einloggen