Aus

Chat

deaktivieren

Bild 4.0 Generieren

Imagen 4 Generate-001 ist ideal für Marketing-, Design-, Verlags- und Echtzeit-Inhaltsgenerierungsanwendungen, die fotorealistische Grafiken und eine präzise Textwiedergabe erfordern.

Gratis-Tokens im Wert von 1 $ für neue Mitglieder

Text to Speech

Javascript

Python

                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v1/images/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'google/imagen-4.0-generate-001',
      prompt: 'A jellyfish in the ocean',
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main();

                                        import requests


def main():
    response = requests.post(
        "https://api.ai.cc/v1/images/generations",
        headers={
            "Authorization": "Bearer ",
            "Content-Type": "application/json",
        },
        json={
            "model": "google/imagen-4.0-generate-001",
            "prompt": "A jellyfish in the ocean",
        },
    )

    response.raise_for_status()
    data = response.json()

    print("Generation:", data)


if __name__ == "__main__":
    main()

Docs

Über 300 KI-Modelle für OpenClaw & KI-Agenten

Sparen Sie 20 % der Kosten und erhalten Sie 1 $ gratis!

API-Schlüssel abrufen Modelle entdecken

Bild 4.0 Generieren

Produktdetails

Imagen 4 Generate, ein führendes Text-zu-Bild-Modell von Google DeepMind, wurde entwickelt, um hochwertige, fotorealistische Grafiken mit außergewöhnlicher Texttreue und flexibler Stilsteuerung zu erzeugen. Es verarbeitet längere Texte effizient, unterstützt verschiedene Seitenverhältnisse und generiert Auflösungen bis zu 2K. So bietet es ein optimales Verhältnis zwischen Generierungsgeschwindigkeit und visueller Genauigkeit für vielfältige kreative und kommerzielle Anforderungen.

Technische Spezifikationen

⚙️ Bildauflösung: Bis zu 2048×2048 (2K)
🖼️ Seitenverhältnisse: 1:1, 3:4, 4:3, 9:16, 16:9
✍️ Eingabeaufforderung: Bis zu 480 Tokens (unterstützt erweiterte Texteingabeaufforderungen)
🎨 Stilsteuerung: Realismus, Abstraktion, Illustration, Markenästhetik
🅰️ Textdarstellung: Erweiterte Textverarbeitung, geeignet für gut lesbare Typografie und längere Texte auf Bildern
💾 Ausgabeformat: Einzelnes statisches Bild (JPEG/PNG)

Leistungskennzahlen

⚡ Generierungsgeschwindigkeit: Ungefähr 3–4 Sekunden pro Bild (variiert je nach Komplexität)
✨ Treue: Hohe Genauigkeit bei der Impuls-zu-Bild-Umwandlung durch präzise Elementplatzierung
📝 Textdetails: Verbesserte Darstellung für klaren, lesbaren Text, der in Bilder eingebettet ist.
📏 Flexibilität des Seitenverhältnisses: Ermöglicht quadratische, vertikale und horizontale Formate, die für vielfältige Anwendungsfälle geeignet sind.

API-Preise

0,042 $ pro Bild

Hauptkompetenzen

📸 Fotorealismus: Erzeugt scharfe, detailreiche Bilder mit dynamischer Lichtführung und Texturtreue.
🅰️ Text und Typografie: Eignet sich hervorragend für die Erstellung von Bildern mit komplexen Textkomponenten und eignet sich ideal für Marketingmaterialien, Verpackungen und redaktionelle Grafiken.
🚀 Geschwindigkeit und Effizienz: Optimiert für schnelle Iterationen in kreativen Arbeitsabläufen ohne Qualitätseinbußen.
🌈 Vielseitigkeit: Unterstützt eine breite Palette von Bildstilen und Kompositionen, von realistischen Fotos bis hin zu stilisierten Illustrationen.

Anwendungsfälle

📈 Marketing & Markenbildung: Erstellen Sie hochwertige visuelle Elemente mit präziser, markenrelevanter Typografie für digitale und Printkampagnen.
📦 Produktvisualisierung: Erstellen Sie detaillierte Mockups und Verpackungsprototypen mit eingebettetem Text und Logos.
📚 Veröffentlichung & Bildungsinhalte: Entwerfen Sie Infografiken, Comics, Layouts und redaktionelle Grafiken, die Bildmaterial und gut lesbaren Text kombinieren.
🎨 Kreative Projekte: Flexible Generierung für künstlerische Erkundungen über Stile und Formate hinweg.

Codebeispiel

Vergleich mit anderen Modellen

vs Bild 4 Ultra: Imagen 4.0-generate-001 bietet eine hervorragende Gesamtqualität und stilistische Flexibilität bei etwas langsamerer Rendering-Geschwindigkeit, ist aber breit anwendbar für verschiedene Kreative.
vs Midjourney v6: Während Midjourney den Fokus auf stilisierte und künstlerische Kompositionen legt, bietet Imagen 4 einen höheren Realismus, eine überlegene Texttreue und eine größere Auswahl an Seitenverhältnissen.
vs AB 3: DALL·E 3 integriert sich eng mit dialogorientierter KI und unterstützt Bearbeitungsfunktionen; Imagen 4 ist für produktionsreife Wiedergabetreue und flexiblere Seitenverhältnisoptionen in skalierbaren Pipelines optimiert.

Einschränkungen

❌ Keine Unterstützung für Inpainting oder Outpainting (Bildbearbeitung).
🎥 Ausgabe beschränkt auf statische Bilder; keine Video- oder Animationsgenerierung.
🔄 Die Seed-Determinanz kann je nach Systemlast variieren.
💬 Keine multimodale Eingabe (Bild + Text).

Häufig gestellte Fragen (FAQ)

❓ Wofür ist Imagen 4 Generate primär konzipiert?

Imagen 4 Generate wurde in erster Linie für die hochwertige, fotorealistische Text-zu-Bild-Generierung entwickelt und legt besonderen Wert auf exzellente Texttreue und vielseitige Stilsteuerung für kreative und kommerzielle Anwendungen.

❓ Was sind die maximale Auflösung und die unterstützten Seitenverhältnisse?

Das Modell unterstützt Bildauflösungen bis zu 2048x2048 (2K) und bietet Flexibilität mit verschiedenen Seitenverhältnissen, darunter 1:1, 3:4, 4:3, 9:16 und 16:9.

❓ Wie verarbeitet Imagen 4 Text in generierten Bildern?

Imagen 4 verfügt über fortschrittliche Textwiedergabefunktionen, die für eine saubere, gut lesbare Typografie und lesbare längere Texte sorgen, die in die generierten Bilder eingebettet sind. Dadurch eignet es sich ideal für Marketing- und redaktionelle Inhalte.

❓ Kann Imagen 4 Videos oder Animationen generieren?

Nein, Imagen 4 Generate ist auf die Erstellung einzelner statischer Bilder (JPEG/PNG) beschränkt und unterstützt keine Video- oder Animationsgenerierung.

❓ Was zeichnet Imagen 4 im Vergleich zu Modellen wie Midjourney oder DALL·E 3 aus?

Im Vergleich zu Midjourney bietet Imagen 4 einen höheren Realismus, eine bessere Textwiedergabe und eine größere Auswahl an Seitenverhältnissen. Gegenüber DALL·E 3 ist Imagen 4 für Produktionsqualität optimiert und bietet flexiblere Seitenverhältnisoptionen für skalierbare Pipelines, obwohl DALL·E 3 mit dialogorientierter KI integriert ist und Bearbeitungsfunktionen bietet.

KI-Spielplatz

Testen Sie alle API-Modelle in der Sandbox-Umgebung, bevor Sie sie integrieren. Wir bieten über 300 Modelle zur Integration in Ihre App an.

Kostenlos testen

Mehr als 300 KI-Modelle für
OpenClaw & KI-Agenten

Sparen Sie 20 % der Kosten