Dans

Dehors

Chat

désactiver

Image 3

Imagen 3 de Google génère des images réalistes à partir de texte ; des résultats plus sûrs grâce à Vertex AI.

Jetons gratuits de 1 $ pour les nouveaux membres

Text to Speech

Javascript

Python

                                        const fs = require('fs');
const path = require('path');

const main = async () => {
  const response = await fetch('https://api.ai.cc/v1/images/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      prompt: 'A jellyfish in the ocean',
      model: 'imagen-3.0-generate-002',
    }),
  }).then((res) => res.json());

  response['data'].forEach((image, i) => {
    const buffer = Buffer.from(image['url'], 'base64');
    fs.writeFileSync(path.join(__dirname, `image_${i + 1}.png`), buffer);
});
};

main();

                                        import requests


def main():
    response = requests.post(
        "https://api.ai.cc/v1/images/generations",
        headers={
            "Authorization": "Bearer ",
            "Content-Type": "application/json",
        },
        json={
            "prompt": "A jellyfish in the ocean",
            "model": "imagen-3.0-generate-002",
        },
    )

    response.raise_for_status()
    data = response.json()

    for i, image in enumerate(data["data"]):
        with open(f"image_{i+1}.png", "wb") as f:
            f.write(base64.b64decode(image["url"]))


if __name__ == "__main__":
    main()

Docs

Plus de 300 modèles d'IA pour OpenClaw et agents IA

Économisez 20 % sur les coûts et recevez des jetons gratuits d'une valeur de 1 $.

Obtenir la clé API Explorer les modèles

Image 3

Détails du produit

✨ Introduction à l'image 3

Image 3 est le modèle d'IA de pointe de Google pour la conversion de texte en image, révolutionnant la façon dont nous créons des images photoréalistes à partir de simples descriptions textuelles. Sorti en Juillet 2024Cette version s'appuie sur les précédentes en offrant un niveau de détail et un éclairage inégalés, ainsi qu'une réduction spectaculaire des artefacts visuels. Elle établit une nouvelle norme en matière de compréhension du langage naturel et introduit un rendu de texte nettement amélioré au sein des images, ouvrant ainsi un monde de possibilités créatives.

« Imagen 3 est le dernier modèle d'IA de Google pour la conversion de texte en image. Il est conçu pour générer des images photoréalistes de haute qualité à partir de descriptions textuelles, avec des détails et un éclairage améliorés, et moins d'artefacts. »
— Citation de Description de l'image originale 3

🔑 Principales caractéristiques d'Imagen 3

✨ Génération d'images de haute qualité : Crée des images réalistes avec un niveau de détail exceptionnel, un éclairage plus riche et des artefacts visuels minimaux.
💡 Compréhension améliorée du langage naturel : Amélioration significative de la capacité à interpréter des invites complexes, réduisant ainsi le besoin d'une ingénierie élaborée des invites.
✍️ Meilleur rendu du texte : Offre un rendu de texte supérieur au sein des images générées, élargissant ainsi les applications créatives.
🧠 Conscience contextuelle et cohérence : Utilise un mécanisme sophistiqué de composition de scènes pour assurer la cohérence logique des images générées.
🔍 Résolution et réalisme supérieurs : Génère des images en ultra haute définition pratiquement indiscernables de véritables photographies.

🎯 Cas d'utilisation prévus

Imagen 3 est idéal pour générer des images réalistes à partir de descriptions textuelles dans diverses applications, notamment projets de marketing, de publicité, de design et de créationIl est parfaitement adapté aux entreprises qui ont besoin de visuels personnalisés et aux développeurs qui créent des applications exigeant des capacités de génération d'images de haute qualité.

⚙️ Détails techniques

Architecture: Exploite une approche d'apprentissage profond, combinant un modèle de langage (comme le T5 de Google) avec un réseau antagoniste génératif (GAN) ou un modèle de diffusion.
Données d'entraînement : Entraîné sur des ensembles de données massifs de paires texte-image, avec des légendes enrichies pour saisir des nuances plus subtiles.
Diversité et préjugés : Intègre un filtrage et un étiquetage des données exhaustifs afin de minimiser les contenus nuisibles dans l'ensemble de données d'entraînement, garantissant ainsi une génération d'IA responsable.

📈 Indicateurs de performance

Qualité visuelle : Obtient les meilleurs scores en matière de qualité visuelle, produisant des images attrayantes et pratiquement exemptes d'artefacts.
Précision rapide : Fait preuve d'une grande précision dans ses réponses à des questions complexes.

📊 Comparaison avec d'autres modèles

L'évaluation humaine sur GenAI-Bench montre systématiquement les performances supérieures d'Imagen 3 dans les tests de préférence globale par rapport aux autres modèles de pointe.

Scores Elo de GenAI-Bench pour Imagen 3 comparés à d'autres modèles — Évaluation humaine sur GenAI-Bench : scores Elo sur le benchmark de préférence globale pour Imagen 3 par rapport aux autres modèles.

Pourcentages de victoire de GenAI-Bench pour Imagen 3 par rapport à d'autres modèles — Évaluation humaine sur GenAI-Bench : pourcentages de taux de victoire pour la préférence globale d’Imagen 3 par rapport aux autres modèles.

🚀 Premiers pas avec Imagen 3

Exemples de code :

Intégrez Imagen 3 à vos applications à l'aide des extraits de code fournis. Les images générées seront enregistrées directement sur votre ordinateur.

Paramètres de génération d'images :

num_images [int] : Spécifie le nombre d'images à générer.
graine [int] : Définit la graine aléatoire pour la génération d'images reproductibles.
enhance_prompt [booléen] : Paramètre optionnel permettant d'utiliser une fonction de réécriture d'invite basée sur LLM pour des images de meilleure qualité et mieux conformes à l'intention de l'invite originale. La désactivation de cette fonction peut affecter la qualité et la conformité des images.
convert_base64_to_url [booléen] : Si la valeur est vraie, l'URL de l'image sera renvoyée ; sinon, le fichier image sera fourni au format base64.
rapport_aspect [1:1, 9:16, 16:9, 3:4, 4:3] : Définit le format d'image de l'image générée.
génération_personne [ne_autoriser, autoriser_adulte] : Contrôle la génération de personnes par le modèle.
safety_setting [block_low_and_above, block_medium_and_above, block_only_high]: Ajoute un niveau de filtrage aux mécanismes de sécurité.

Format de réponse attendu :

Une fois la génération réussie, vous recevrez une réponse JSON similaire à celle-ci :

{  "data" : [ { "mime_type" : "image/png" , "url" : "base64image / url" , "prompt" : "invite améliorée" } ] }

Le modèle est facilement disponible sur le Plateforme API IA/ML sous le nom « Imagen 3 ».

Documentation API complète :

Détaillé Documentation de l'API est disponible pour les développeurs souhaitant obtenir des informations plus approfondies.

🛡️ Principes éthiques et IA responsable

La sécurité avant tout : Développé dans le plus grand respect des normes de sécurité et de responsabilité, et en stricte conformité avec les principes d'IA de Google.
Tatouage numérique (SynthID) : Inclut SynthID pour identifier clairement le contenu généré par l'IA, favorisant ainsi la transparence.
Prévention des contenus nuisibles : Utilise des filtres de sécurité avancés pour empêcher rigoureusement la génération de contenu nocif.
Gouvernance des données : Utilise des politiques de gouvernance des données robustes, garantissant que les données clients ne sont jamais utilisées à des fins de formation.

📄 Licence et utilisation

Lors de l'utilisation d'Imagen 3, il est essentiel de respecter les consignes de Google relatives à l'IA responsable et à son utilisation. Dans certains cas particuliers, comme la génération d'images de personnes, des autorisations supplémentaires de Google peuvent être requises. Si votre projet implique la création de telles images, veillez à suivre les procédures d'approbation nécessaires.

Accédez à l'API Imagen 3 et commencez votre aventure créative ici.

❓ Foire aux questions (FAQ)

Q1 : Qu'est-ce que l'image 3 ?

A1 : Imagen 3 est le dernier modèle d’IA de Google pour la conversion de texte en image, lancé en juillet 2024, conçu pour générer des images photoréalistes de haute qualité à partir de descriptions textuelles avec des détails, un éclairage et une compréhension du langage naturel améliorés.
Q2 : En quoi Imagen 3 améliore-t-il les versions précédentes ?

A2 : Il offre une qualité d’image supérieure, un éclairage plus riche, moins d’artefacts visuels, une meilleure compréhension des invites complexes, un rendu de texte amélioré dans les images et une génération de résolution plus élevée.
Q3 : Puis-je utiliser Imagen 3 pour des projets commerciaux ?

A3 : Oui, Imagen 3 est conçu pour diverses applications, notamment le marketing, la publicité et le design. Cependant, certaines utilisations spécifiques, comme la génération d’images de personnes, peuvent nécessiter des autorisations supplémentaires de Google.
Q4 : Quelles mesures sont en place pour une utilisation éthique de l’IA ?

A4 : Imagen 3 intègre un tatouage numérique (SynthID), utilise des filtres de sécurité pour empêcher la diffusion de contenu nuisible et suit des politiques de gouvernance des données robustes, conformément aux principes d’IA de Google.
Q5 : Où puis-je accéder à l’API Imagen 3 ?

A5 : L’API Imagen 3 est disponible sur le Plateforme API IA/MLVous trouverez une documentation API détaillée. ici.

Terrain de jeu de l'IA

Testez tous les modèles d'API dans l'environnement de test avant de les intégrer. Nous proposons plus de 300 modèles à intégrer à votre application.

Essai gratuit

Plus de 300 modèles d'IA pour
OpenClaw et agents IA

Économisez 20 % sur vos coûts

Jetons gratuits de 1 $ pour les nouveaux membres