



const main = async () => {
const response = await fetch('https://api.ai.cc/v1/images/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'blackforestlabs/flux-2-pro-edit',
prompt: 'Combine the images so the T-Rex is wearing a business suit, sitting in a cozy small café, drinking from the mug. Blur the background slightly to create a bokeh effect.',
image_urls: [
'https://raw.githubusercontent.com/aimlapi/api-docs/main/reference-files/t-rex.png',
'https://raw.githubusercontent.com/aimlapi/api-docs/main/reference-files/blue-mug.jpg',
],
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main();
import requests
def main():
response = requests.post(
"https://api.ai.cc/v1/images/generations",
headers={
"Authorization": "Bearer ",
"Content-Type": "application/json",
},
json={
"model": "blackforestlabs/flux-2-pro-edit",
"prompt": "Combine the images so the T-Rex is wearing a business suit, sitting in a cozy small café, drinking from the mug. Blur the background slightly to create a bokeh effect.",
"image_urls": [
"https://raw.githubusercontent.com/aimlapi/api-docs/main/reference-files/t-rex.png",
"https://raw.githubusercontent.com/aimlapi/api-docs/main/reference-files/blue-mug.jpg",
],
},
)
response.raise_for_status()
data = response.json()
print("Generation:", data)
if __name__ == "__main__":
main()

Produktdetails
FLUX.2 [pro] ist ein professionelles Bildbearbeitungsmodell von Black Forest Labs, das für hochpräzise, auf mehreren Referenzen basierende Bildbearbeitungs-Workflows entwickelt wurde. Es bietet modernste Bildqualität Dieses Modell konkurriert mit führenden geschlossenen Systemen und vereint nahtlos prompte Umsetzung, visuelle Genauigkeit, Geschwindigkeit, Effizienz und Zuverlässigkeit. Es ermöglicht Benutzern, detaillierte Änderungen per Sprachbefehl vorzunehmen, wodurch aufwendige manuelle Bearbeitungen oder komplizierte Masken überflüssig werden.
⚙️Technische Spezifikationen
- Ausgabeauflösung: Bis zu 4 Megapixel (MP)
- Eingabebilder: Unterstützt mehrere Referenzbilder (bis zu 9 Bilder mit einer Gesamtauflösung von 9 MP)
- Bearbeitungssteuerung: Bearbeitungen in natürlicher Sprache mit Genauigkeit des Hex-Farbcodes für eine präzise Markenfarbabstimmung
- Ausgabeformate: PNG und JPEG
- Geschwindigkeit: Optimiert für schnelle Iterations- und Produktionsworkflows mit reduzierter Latenz
- Architektur: Kombiniert einen latenten Flusstransformator mit einem Bild-Sprach-Modell (Mistral-3, 24B Parameter) für räumliches und kontextuelles Verständnis
📊Leistungsbenchmarks
- ✅ Erreicht oder übertrifft hinsichtlich Reaktionsschnelligkeit und Bildqualität führende proprietäre Bildbearbeitungsprogramme.
- ⚡ Erreicht schnellere Generierungszeiten und niedrigere Kosten pro Megapixel als vergleichbare hochwertige Bearbeitungslösungen.
✨Hauptmerkmale
- Bearbeitung mehrerer Referenzen: Bis zu 9 Bilder werden nahtlos miteinander verschmolzen und kombiniert, wobei eine explizite Indizierung die präzise Steuerung von Elementen aus jedem Quellbild ermöglicht.
- Präzision in natürlicher Sprache: Komplexe Szenen bearbeiten, Hintergründe austauschen oder Farben anpassen, indem Sie die Änderungen in einfachem Englisch beschreiben.
- Hex-Farbsteuerung: Verwenden Sie exakte Farbcodes, um eine einheitliche und präzise Markenführung und Einhaltung des Stils zu gewährleisten.
- Strukturelle Konsistenz: Behält das ursprüngliche Layout und die Integrität der Szene bei und verbessert gleichzeitig Texturen, Beleuchtung und Details auf realistische Weise.
- Typografie und UI-Bearbeitung: Wird präzise zur Darstellung von Texten und komplexen Infografiken innerhalb von Bildern verwendet.
- Iterative Bearbeitung: Unterstützt die Verkettung von Bearbeitungsschritten für eine verbesserte Ausgabequalität über mehrere Revisionszyklen hinweg.
💰API-Preise
0,0315 $ / MP-Eingang + 0,0315 $ / MP-Ausgang
💡Anwendungsfälle
- 🚀 Pipelines für den Austausch großer Inhaltsmengen und die Stiltransformation.
- 🛍️ Bildkomposition für E-Commerce-Produkte und Optimierung von Markenassets.
- 📐 UI-Mockups und Korrekturen am digitalen Design, einschließlich Beschilderung und Infografiken.
- 🖼️ Automatisierter Hintergrundaustausch und Objekteinfügung in der Video- oder Bildproduktion.
- 🎯 Schnelles Prototyping für Marketingkampagnen, die eine präzise visuelle Kohärenz erfordern.
💻Codebeispiel
Eine vollständige API-Referenz finden Sie hier: API-Referenzen: Bildmodelle / FLUX / FLUX.2 [pro] Bearbeiten
curl -X POST https://api.aimlapi.com/image/flux-edit \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "blackforestlabs/flux-2-pro-edit", "input_images": [ { "url": "https://example.com/image1.png", "index": 0 } ], "prompt": "Ändere den Hintergrund in einen sonnigen Strand mit Palmen und klarem blauen Himmel." }' 🆚Vergleich mit anderen Modellen
vs. Stabile Diffusion: FLUX.2 [pro] zeichnet sich aus in Geschwindigkeit und Bearbeitung mehrerer Referenzen Mit natürlicher Sprachpräzision und produktionsreifer Zuverlässigkeit. Stable Diffusion ermöglicht zwar höhere fotorealistische Details und komplexe Texturen durch iterative Rauschunterdrückung, ist aber im Allgemeinen langsamer.
vs DALL·E 3: FLUX.2 [pro] Angebote überlegene Möglichkeiten zur Mehrbildkomposition und pixelgenauen Bearbeitung.DALL·E 3 ist für den Produktionseinsatz mit exakter Farbsteuerung optimiert. Es eignet sich besonders für die kreative Text-zu-Bild-Generierung mit großer stilistischer Vielfalt, ist aber weniger spezialisiert auf präzise Bildbearbeitung und die Integration mehrerer Referenzen.
vs Midjourney: Midjourney ist bekannt für seine künstlerische und stilisierte Bildgenerierung mit abstrakten Qualitäten. FLUX.2 [pro] konzentriert sich auf Fotorealismus, detaillierte Bearbeitungen und Markenkonsistenzwodurch es sich besser für kommerzielle und Produktionsanwendungen eignet.
❓Häufig gestellte Fragen (FAQ)
Frage 1: Wofür ist FLUX.2 [pro] konzipiert?
FLUX.2 [pro] ist ein professionelles Bildbearbeitungsmodell, das speziell für hochpräzise, auf mehrere Referenzen basierende Bildbearbeitungs-Workflows entwickelt wurde und höchste Qualität und Effizienz bietet.
Frage 2: Was sind die wichtigsten technischen Fähigkeiten?
Es unterstützt Ausgabeauflösungen bis zu 4 MP, verarbeitet bis zu 9 Referenzbilder und ermöglicht Bearbeitungen in natürlicher Sprache mit Hex-Farbcodegenauigkeit für präzise Steuerung.
Frage 3: Wie geht FLUX.2 [pro] mit komplexen Bearbeitungen um?
Das Modell nutzt die Präzision natürlicher Sprache für komplexe Szenenbearbeitungen, Hintergrundersetzungen und Farbanpassungen sowie Funktionen wie strukturelle Konsistenz und Typografiebearbeitung, wodurch komplizierte Änderungen unkompliziert möglich werden.
Frage 4: Was sind die Hauptvorteile gegenüber anderen Modellen wie Stable Diffusion oder DALL·E 3?
FLUX.2 [pro] zeichnet sich durch Geschwindigkeit, Multi-Referenz-Bildkomposition, Bearbeitung auf Pixelebene und die Wahrung der Markenkonsistenz aus und ist damit für präzise Bildbearbeitungsaufgaben in Produktionsqualität besser geeignet als der breitere kreative Fokus von DALL·E 3 und Midjourney oder der langsamere iterative Prozess von Stable Diffusion.
Frage 5: Was sind typische Anwendungsfälle für diese API?
Zu den wichtigsten Anwendungsbereichen gehören die Transformation großer Datenmengen, die Bildoptimierung für den E-Commerce, UI-Mockups, der automatisierte Hintergrundaustausch und das schnelle Prototyping für Marketingkampagnen.
KI-Spielplatz



Einloggen