



const main = async () => {
const response = await fetch('https://api.ai.cc/v1/images/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'openai/gpt-image-2',
prompt: 'A jellyfish in the ocean',
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main();
import requests
def main():
response = requests.post(
"https://api.ai.cc/v1/images/generations",
headers={
"Authorization": "Bearer ",
"Content-Type": "application/json",
},
json={
"model": "openai/gpt-image-2",
"prompt": "A jellyfish in the ocean",
},
)
response.raise_for_status()
data = response.json()
print("Generation:", data)
if __name__ == "__main__":
main()

Imagem GPT 2
O GPT Image 2 (gpt-image-2) é o modelo de geração de imagens mais poderoso da OpenAI até o momento — raciocina antes de desenhar, pesquisa na web em tempo real e renderiza texto pronto para produção em mais de uma dúzia de idiomas.
O que é a API GPT Image 2?
O GPT Image 2 é o modelo de imagem principal de terceira geração da OpenAI, lançado oficialmente em 21 de abril de 2026. Ele sucede o gpt-image-1 (março de 2025) e o gpt-image-1.5 (dezembro de 2025), representando o salto arquitetônico mais significativo da série.
O que diferencia o GPT Image 2 de tudo o que veio antes dele é uma mudança fundamental na forma como o modelo aborda a geração de imagens. Em vez de passar diretamente de um texto para os pixels, o GPT Image 2 primeiro pensa. Ele raciocina sobre composição, estrutura e precisão antes de definir uma saída. Essa etapa de raciocínio, emprestada dos modelos de linguagem da série O da OpenAI, é o que o torna o primeiro modelo de geração de imagens verdadeiramente autônomo do setor.
Preços da API
Geração de imagens:
- Entrada: US$ 10,40 / 1 milhão de tokens
- Entrada em cache: US$ 2,60 / 1 milhão de tokens
- Saída: US$ 39,00 / 1 milhão de tokens
Entrada de texto:
- Entrada: US$ 6,50 / 1 milhão de tokens
- Entrada em cache: US$ 1,625 / 1 milhão de tokens
Competências Essenciais
O GPT Image 2 não aprimora nenhuma dimensão específica da geração de imagens — ele expande as capacidades da categoria. Essas são as funcionalidades mais importantes para fluxos de trabalho de produção reais.
Raciocínio Agentic
Antes de gerar um único pixel, o modelo pesquisa, planeja e raciocina sobre a estrutura da imagem. Este é o primeiro modelo de imagem com raciocínio em série O integrado, resultando em menos gerações falhas em briefings complexos.
Pesquisa na Web integrada
O GPT Image 2 consegue consultar a web em tempo real antes de gerar e confirmar logotipos de marcas, detalhes de eventos, designs de produtos e referências geográficas que, de outra forma, seriam aproximadas ou alucinadas.
Renderização de texto quase perfeita
A tipografia em imagens geradas agora é legível em mais de 99% dos casos. Títulos com várias linhas, botões de chamada para ação (CTA), rótulos da interface do usuário e legendas em letras pequenas são todos tratados de forma confiável, incluindo layouts com diferentes tipos de escrita.
Resolução 2K e proporções de tela flexíveis
Gera imagens de até 2048px, com proporções de 3:1 (banners ultra-wide) a 1:3 (telas de dispositivos móveis). Abrange todos os formatos de produção, desde anúncios em redes sociais até slides de apresentação, sem necessidade de redimensionamento na pós-produção.
GPT Image 2 vs GPT Image 1.5: O que realmente mudou?
GPT Imagem 1.5 O GPT Image 2 já era um modelo eficiente em termos de adesão rápida e fotorrealismo. Ele adiciona três funcionalidades fundamentalmente novas que a versão 1.5 não possuía: raciocínio pré-geração, busca na web em tempo real e tipografia multilíngue confiável. Além disso, o limite de conhecimento foi ampliado do início de 2025 para dezembro de 2025, o que significa que os ativos de marca, designs de produtos e referências culturais atuais são renderizados com precisão, sem que o modelo recorra a versões desatualizadas.
Principais diferenças em resumo
Casos de uso
Marketing e Publicidade
Produza recursos visuais para campanhas com títulos precisos, chamadas para ação (CTAs) e textos localizados em uma única versão. A busca na web garante que as referências à marca e os detalhes do produto reflitam os ativos atuais.
Varejo e comércio eletrônico
Gere imagens de produtos nas dimensões exatas exigidas pela plataforma — miniaturas quadradas, banners amplos e anúncios verticais — sem pós-processamento. Funciona com nomes de produtos reais renderizados com a tipografia correta.
Infográficos e visualização de dados
Crie explicações visuais, ilustrações em forma de gráficos e diagramas instrucionais onde os rótulos de texto e os valores dos dados precisam ser legíveis e posicionados com precisão. Algo quase impossível anteriormente com a geração por IA.
Mockups de UI e Design de Aplicativos
Gere telas de aplicativos realistas, wireframes de interface e componentes de sistema de design. O modelo renderiza corretamente botões, barras de navegação, campos de formulário e ícones com layouts de aparência funcional.
Storyboard e Entretenimento
Gere 8 painéis de storyboard coerentes a partir de uma única descrição de cena. A consistência dos personagens entre os painéis torna o recurso viável para apresentações e fluxos de trabalho de pré-produção sem a necessidade de edição quadro a quadro.
Educação e Treinamento
Crie recursos visuais de aprendizagem, diagramas de cursos e pôsteres instrucionais formatados de acordo com os requisitos exatos de exibição. A busca na web mantém o conteúdo visual factual preciso e atualizado.
GPT Image 2 vs. Modelos de Imagem Concorrentes
O cenário de IA para processamento de imagens em 2026 é realmente competitivo. O GPT Image 2 não é a ferramenta ideal para todos os casos de uso, e entender seus pontos fortes e fracos é essencial antes de se comprometer com um fluxo de trabalho.
Solicitando a Imagem 2 do GPT de forma eficaz
Trabalhar com o GPT Image 2 envolve tanto comunicação quanto criatividade. Instruções claras e estruturadas tendem a produzir os melhores resultados.
Em vez de instruções vagas, é útil definir o contexto, a composição e o estilo em uma única descrição coerente. Por exemplo, especificar a estrutura do layout ou a hierarquia visual pode melhorar significativamente a qualidade do resultado.
A iteração é igualmente importante. Em vez de esperar a perfeição numa única passagem, refinar os resultados através de instruções subsequentes leva a trabalhos mais refinados.
Exemplo de estrutura de prompt
Perguntas frequentes
O que diferencia o GPT Image 2 de outros geradores de imagens por IA?
Ela prioriza a precisão e a rapidez, layouts estruturados e renderização de texto de alta qualidade, tornando-a mais adequada para aplicações no mundo real.
Como o GPT Image 2 lida com texto dentro de imagens?
A renderização de texto é o principal recurso do GPT Image 2. A precisão relatada é superior a 99%, incluindo suporte completo para caracteres CJK (chinês, japonês e coreano), hindi, bengali e árabe, além de alfabetos latinos. Layouts com alfabetos mistos — um requisito comum para marketing internacional — são tratados nativamente pela primeira vez em um modelo de imagem comercial.
O GPT Image 2 suporta edição?
Sim, permite o refinamento iterativo por meio de instruções subsequentes, possibilitando aos usuários aprimorar os resultados sem precisar recomeçar do zero.
Qual é a resolução máxima de saída?
O GPT Image 2 gera imagens com resolução de até 2K (2048px) via API. O suporte para resoluções acima de 2K está atualmente em versão beta e pode apresentar resultados inconsistentes. As proporções variam de 3:1 (ultra-wide) a 1:3 (ultra-tall), abrangendo todos os formatos de produção padrão.
Playground de IA



Conecte-se