Dans

Dehors

Chat

gpt-image-1

GPT-Image-1 d'OpenAI est un transformateur multimodal de classe GPT-4 qui convertit des invites en langage naturel (et des images de référence) en images haute fidélité et typographiquement précises, et effectue des modifications sur place avec une sécurité de niveau entreprise via une API de production.

Jetons gratuits de 1 $ pour les nouveaux membres

Text to Speech

Javascript

Python

                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v1/images/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      prompt: 'A jellyfish in the ocean',
      model: 'openai/gpt-image-1',
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main();

                                        import requests


def main():
    response = requests.post(
        "https://api.ai.cc/v1/images/generations",
        headers={
            "Authorization": "Bearer ",
            "Content-Type": "application/json",
        },
        json={
            "prompt": "A jellyfish in the ocean",
            "model": "openai/gpt-image-1",
        },
    )

    response.raise_for_status()
    data = response.json()

    print("Generation:", data)


if __name__ == "__main__":
    main()

Docs

Une seule API pour plus de 300 modèles d'IA

Économisez 20 % sur les coûts et recevez des jetons gratuits d'une valeur de 1 $.

Obtenir la clé API Explorer les modèles

gpt-image-1

Détails du produit

✨ GPT-Image-1 : Génération et édition d’images IA haute fidélité

OpenAI Image GPT-1 est un transformateur génératif multimodal natif révolutionnaire conçu pour création et édition de texte en image haute fidélitéCe modèle avancé étend un décodeur de type GPT-4 grâce à des représentations vectorielles de jetons visuels spécialisées et à une attention intermodale. Son architecture unique lui permet de suivre avec précision des instructions de conception complexes, d'exploiter une connaissance approfondie du monde et de restituer fidèlement le texte sur l'image, ce qui en fait un outil puissant pour répondre à un large éventail de besoins en matière de contenu visuel.

🚀 Spécifications techniques

Indicateurs de performance

OpenAI Image 1 est méticuleusement optimisé pour une génération d'images et une création de contenu visuel de qualité supérieure :

• Architecture: Décodeur dérivé de GPT-4 intégré avec des adaptateurs de vision et une tête d'édition masquée supplémentaire pour des capacités de peinture avancées.
• Tailles de sortie natives : Compatible avec le format carré 1024 x 1024 px, et disponible en versions écran large (1024 x 1536 px) et portrait (1536 x 1024 px). La mise à l'échelle 4K à la demande est également prise en charge.

Aperçu des tarifs de l'API

• Saisie des jetons de texte : 5,25 $
• Entrée des jetons d'image : 10,5 $
• Prix de faible qualité par génération d'image :
- 1024x1024 : 0,0116 $
- 1024x1536 : 0,017 $
- 1536x1024 : 0,017 $
• Prix moyen par génération d'image :
- 1024x1024 : 0,044 $
- 1024x1536 : 0,066 $
- 1536x1024 : 0,066 $
• Prix de haute qualité par génération d'image :
- 1024x1024 : 0,175 $
- 1024x1536 : 0,263 $
- 1536x1024 : 0,263 $

Indicateurs de performance et réalisations

⭐ GIE-Bench (2025) : GPT-Image-1 a atteint le scores de correction fonctionnelle les plus élevés parmi tous les modèles testés dans un ensemble de 1 000 tâches d'édition d'images, tout en préservant efficacement le contenu. Pour plus de détails, veuillez consulter l'étude originale : GIE-Bench (2025).
✍️ Test de charge STRICT pour le rendu de texte : Commercialisé dans ChatGPT sous le nom d'« images GPT-4o », GPT-Image-1 est l'un des deux seuls modèles propriétaires à maintenir un faible taux d'erreur sur du texte multiligne jusqu'à environ 800 caractères, surpassant nettement les diffuseurs open source. Voir le rapport complet : test de résistance strict du rendu de texte.
📈 Déploiements en entreprise : Les premiers utilisateurs, notamment Adobe Firefly, Figma Design, Canva et Wix, ont constaté une accélération à deux chiffres du délai entre la requête et la création de la ressource après l'intégration de GPT-Image-1. Pour en savoir plus sur son impact : Modèle de génération d'images OpenAI ChatGPT : Adobe, Figma.

💡 Principales fonctionnalités d'OpenAI (Image 1)

OpenAI Image 1 fournit systématiquement des résultats visuels précis, ce qui le rend idéal même pour les flux de travail créatifs les plus complexes :

🎨 Génération multi-styles : Générez des images photoréalistes, des illustrations, des animes, des illustrations vectorielles, des rendus 3D et des visualisations de données, le tout à partir d'un seul point d'accès.
✍️ Typographie précise : Créez des affiches, des maquettes d'interface utilisateur et des étiquettes multilignes avec un texte clair et lisible, même en utilisant des polices de petite taille.
🌍 Synthèse des connaissances mondiales : Exploite les capacités linguistiques de la famille GPT-4o pour placer avec précision des articles de marque, des personnes réelles ou des schémas factuels dans des images.
🔒 Sécurité de niveau entreprise : Elle intègre un filigrane de provenance, une modération ajustable et s'engage à ne proposer aucune formation sur les données clients, garantissant ainsi la conformité aux exigences légales et de sécurité de la marque.

Exemple d'une image générée avec des paramètres de haute qualité, créée avec l'invite : « Générer une image anime d'un hérisson tenant un papier sur lequel on peut lire "Essayez GPT-Image-1 dès aujourd'hui avec l'API AI/ML". »

Exemple de génération d'image GPT-1

🎯 Cas d'utilisation optimaux

• Création et marketing : Publicités sur les réseaux sociaux, visuels phares, rendus de produits mettant en scène leur style de vie.
• Conception de prototypes : Création rapide de concepts artistiques, exploration de thèmes, modifications directement sur la toile dans des outils comme Figma ou Adobe.
• Commerce électronique : Suppression d'arrière-plan, variations de couleurs, mises en scène pour les catalogues de produits.
• Éducation et édition : Diagrammes, fiches de révision, graphiques de feuilles de travail avec texte intégré.
• Préproduction de jeux/films : Storyboards, études d'environnement, variations rapides d'éléments.
• Reporting d'entreprise : Infographies et visualisations de données générées automatiquement à partir de textes analytiques.

🛠️ Exemples de code et paramètres

Exemple de code de conversion texte-image

Paramètres de conversion texte-image

• invite [str] : Le texte d'accompagnement détaillant le contenu, le style ou la composition de l'image.
• n [1-10] : Nombre d'images à générer.
• compression_sortie [int] : Niveau de compression (0-100%) pour les images générées.
• taille [1024x1024, 1024x1536, 1536x1024] : Taille souhaitée de l'image générée.
• arrière-plan [transparent, opaque, automatique] : Définit la transparence de l'arrière-plan. « Auto » laisse le modèle décider. « Transparent » exige un format de sortie « png » ou « webp ».
• modération [faible, automatique] : Contrôle le niveau de modération du contenu.
• format_de_sortie [png, jpeg, webp] : Format de l'image générée.
• qualité [faible, moyenne, élevée] : Paramètre de qualité pour l'image générée.
• response_format [url, b64_json] : Format de retour des images générées.

Exemple de code pour la retouche d'images

Paramètres de retouche d'image

• invite [str] : Texte d'instruction décrivant le contenu, le style ou la composition souhaités pour l'image modifiée.
• image [fichier | liste de fichiers] : Image(s) à modifier. Prend en charge les fichiers png, webp et jpg de moins de 50 Mo (jusqu'à 16 images).
• masque [fichier] : Un fichier PNG supplémentaire (moins de 4 Mo, mêmes dimensions que l'image) dont les zones transparentes indiquent les zones à modifier. S'applique à la première image si plusieurs sont fournies.
• n [1-10] : Nombre d'images à générer.
• compression_sortie [int] : Niveau de compression (0-100%) pour les images générées.
• taille [1024x1024, 1024x1536, 1536x1024] : Taille souhaitée de l'image générée.
• arrière-plan [transparent, opaque, automatique] : Définit la transparence de l'arrière-plan. « Auto » laisse le modèle décider. « Transparent » exige un format de sortie « png » ou « webp ».
• modération [faible, automatique] : Contrôle le niveau de modération du contenu.
• format_de_sortie [png, jpeg, webp] : Format de l'image générée.
• qualité [faible, moyenne, élevée] : Réglage de la qualité de l'image.
• response_format [url, b64_json] : Format de retour des images générées.

📊 Comparaison avec d'autres modèles leaders

• Versus DALL·E 3 : GPT-Image-1 propose Typographie plus nette et respect des délais plus élevé. DALL·E 3 reste cependant légèrement plus rapide pour les brouillons à prise unique de 512 px.
• Par rapport à Stable Diffusion XL 1.0 : GPT-Image-1 montre Améliorations majeures en matière de suivi des instructions et de rendu du texteSDXL conserve son avantage en tant qu'option entièrement open source pour un déploiement local ou hors ligne.
• Versus Midjourney v7 : Avec semences déterministes et garde-fous intégrésGPT-Image-1 prend l'avantage pour les pipelines de production. Midjourney propose toujours une palette de styles plus large, élaborée par la communauté.

🔗 Intégration API

GPT-Image-1 est facilement accessible via l'API IA/ML. Une documentation complète pour l'intégration est disponible. ici.

❓ Foire aux questions (FAQ)

Q : Qu'est-ce qui rend GPT-Image-1 unique pour la génération d'images ?
A: GPT-Image-1 est un transformateur génératif multimodal natif utilisant un décodeur de classe GPT-4. Sa force réside dans sa capacité à suivre des instructions de conception complexes, à synthétiser des connaissances du monde et à restituer avec précision du texte sur une image, établissant ainsi une nouvelle norme pour la création et l'édition d'images haute fidélité à partir de texte.
Q : Quelles sont les tailles de sortie prises en charge par GPT-Image-1 ?
A : Il prend en charge nativement les images carrées de 1024 x 1024 px, ainsi que les formats écran large (1024 x 1536 px) et portrait (1536 x 1024 px). Les utilisateurs peuvent également demander une mise à l'échelle 4K.
Q : Comment GPT-Image-1 gère-t-il le rendu du texte par rapport aux autres modèles ?
A: GPT-Image-1 (commercialisé sous le nom de « GPT-4o images » au sein de ChatGPT) excelle en matière de typographie précise. C'est l'un des rares modèles propriétaires à maintenir un faible taux d'erreur sur les textes multilignes jusqu'à environ 800 caractères, surpassant largement de nombreuses alternatives open source.
Q : Quelles sont les principales caractéristiques de sécurité de GPT-Image-1 pour une utilisation en entreprise ?
A: Pour les utilisateurs professionnels, GPT-Image-1 inclut des fonctionnalités de sécurité robustes telles que le tatouage numérique de provenance, la modération de contenu ajustable et une politique stricte de non-formation sur les données client, garantissant ainsi la conformité de la marque et la conformité légale.
Q : Où puis-je trouver la documentation de l'API pour GPT-Image-1 ?
R: La documentation API complète pour l'intégration de GPT-Image-1 est disponible sur le portail de documentation API IA/ML. Veuillez vous y référer. documentation officielle pour des instructions détaillées.

Terrain de jeu de l'IA

Testez tous les modèles d'API dans l'environnement de test avant de les intégrer. Nous proposons plus de 300 modèles à intégrer à votre application.

Essai gratuit

Une API
Plus de 300 modèles d'IA

Économisez 20 % sur vos coûts