qwen-bg
max-ico04
Em
Fora
max-ico02
Bater papo
max-ico03
desativar
Gerar imagem 4.0
O Imagen 4 Generate-001 é ideal para aplicações de marketing, design, publicação e geração de conteúdo em tempo real que exigem visuais fotorrealistas e renderização de texto precisa.
Tokens de $1 grátis para novos membros
Text to Speech
                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v1/images/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'google/imagen-4.0-generate-001',
      prompt: 'A jellyfish in the ocean',
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main();

                                
                                        import requests


def main():
    response = requests.post(
        "https://api.ai.cc/v1/images/generations",
        headers={
            "Authorization": "Bearer ",
            "Content-Type": "application/json",
        },
        json={
            "model": "google/imagen-4.0-generate-001",
            "prompt": "A jellyfish in the ocean",
        },
    )

    response.raise_for_status()
    data = response.json()

    print("Generation:", data)


if __name__ == "__main__":
    main()
Docs

Uma API com mais de 300 modelos de IA

Economize 20% nos custos e ganhe tokens grátis de $1.
qwenmax-bg
imagem
Gerar imagem 4.0

Detalhes do produto

O Imagen 4 Generate, um modelo de conversão de texto em imagem de última geração do Google DeepMind, foi projetado para produzir visuais fotorrealistas de alta qualidade com fidelidade de texto excepcional e controle de estilo adaptável. Ele lida com eficiência com textos mais longos, suporta diversas proporções de tela e gera resoluções de até 2K, encontrando um equilíbrio entre velocidade de geração e precisão visual para atender a diversas necessidades criativas e comerciais.

Especificações técnicas

  • ⚙️ Resolução da imagem: Até 2048×2048 (2K)
  • 🖼️ Proporções de aspecto: 1:1, 3:4, 4:3, 9:16, 16:9
  • ✍️ Entrada de comando: Até 480 tokens (suporta prompts de texto estendidos)
  • 🎨 Controle de estilo: Realismo, abstrato, ilustração, estética de marca
  • 🅰️ Renderização de texto: Manipulação avançada de texto, adequada para tipografia legível e textos mais longos em imagens.
  • 💾 Formato de saída: Imagem estática única (JPEG/PNG)

Métricas de desempenho

  • Velocidade de geração: Aproximadamente 3 a 4 segundos por imagem (varia conforme a complexidade).
  • Fidelidade: Alta precisão de resposta à imagem com posicionamento preciso dos elementos.
  • 📝 Detalhes do texto: Renderização aprimorada para texto nítido e legível incorporado em imagens.
  • 📏 Flexibilidade de proporção de tela: Permite formatos quadrados, verticais e horizontais, adequados para diversos casos de uso.

Preços da API

US$ 0,042 por imagem

Principais capacidades

  • 📸 Fotorrealismo: Produz imagens nítidas e detalhadas com iluminação dinâmica e fidelidade de textura.
  • 🅰️ Texto e Tipografia: Excelente para gerar imagens com componentes de texto complexos, ideal para materiais de marketing, embalagens e arte editorial.
  • 🚀 Velocidade e Eficiência: Otimizado para iterações rápidas em fluxos de trabalho criativos sem sacrificar a qualidade.
  • 🌈 Versatilidade: Suporta uma ampla variedade de estilos e composições de imagem, desde fotos realistas até ilustrações estilizadas.

Casos de uso

  • 📈 Marketing e Branding: Crie recursos visuais refinados com tipografia precisa e relevante para a marca, para campanhas digitais e impressas.
  • 📦 Visualização do produto: Gere maquetes detalhadas e protótipos de embalagens com texto e logotipos incorporados.
  • 📚 Publicação e conteúdo educacional: Crie infográficos, histórias em quadrinhos, layouts e recursos visuais editoriais que combinem imagens e texto legível.
  • 🎨 Projetos criativos: Geração flexível para exploração artística em diversos estilos e formatos.

Exemplo de código

Comparação com outros modelos

  • vs Imagem 4 Ultra: O Imagen 4.0-generate-001 oferece excelente fidelidade geral e flexibilidade de estilo, com uma velocidade de renderização ligeiramente mais lenta, mas ampla aplicabilidade para diversos criativos.
  • vs Midjourney v6: Enquanto a Midjourney se concentra em composições estilizadas e artísticas, a Imagen 4 oferece maior realismo, fidelidade de texto superior e uma gama mais ampla de proporções de tela.
  • vs A PARTIR DE 3: O DALL·E 3 integra-se perfeitamente com IA conversacional e oferece suporte a recursos de edição; o Imagen 4 é otimizado para fidelidade de qualidade de produção e opções de proporção mais flexíveis em fluxos de trabalho escaláveis.

Limitações

  • ❌ Não há suporte para preenchimento ou preenchimento de lacunas (edição de imagem).
  • 🎥 A saída é limitada a imagens estáticas; não é possível gerar vídeos ou animações.
  • 🔄 O determinismo das sementes pode variar dependendo da carga do sistema.
  • 💬 Sem entrada multimodal (imagem + texto).

Perguntas frequentes (FAQ)

❓ Para que serve principalmente o Imagen 4 Generate?

O Imagen 4 Generate foi projetado principalmente para a geração de texto em imagem fotorrealista de alta qualidade, enfatizando a excelente fidelidade do texto e o controle versátil de estilos para aplicações criativas e comerciais.

❓ Quais são a resolução máxima e as proporções de aspecto suportadas?

O modelo suporta resoluções de imagem de até 2048x2048 (2K) e oferece flexibilidade com múltiplas proporções, incluindo 1:1, 3:4, 4:3, 9:16 e 16:9.

❓ Como o Imagen 4 lida com texto dentro de imagens geradas?

O Imagen 4 apresenta recursos avançados de renderização de texto, garantindo tipografia limpa e legível, além de textos mais longos e legíveis incorporados às imagens geradas, tornando-o ideal para conteúdo de marketing e editorial.

❓ O Imagen 4 consegue gerar vídeos ou animações?

Não, o Imagen 4 Generate limita-se à produção de imagens estáticas individuais (JPEG/PNG) e não suporta a geração de vídeos ou animações.

❓ O que faz o Imagen 4 se destacar em comparação com modelos como o Midjourney ou o DALL·E 3?

Em comparação com o Midjourney, o Imagen 4 oferece maior realismo, fidelidade de texto superior e uma gama mais ampla de proporções de tela. Contrariamente ao DALL·E 3, o Imagen 4 é otimizado para fidelidade de qualidade profissional e opções de proporção de tela mais flexíveis para fluxos de trabalho escaláveis, embora o DALL·E 3 integre IA conversacional e ofereça recursos de edição.

Playground de IA

Teste todos os modelos de API no ambiente de sandbox antes de integrá-los. Oferecemos mais de 300 modelos para integrar ao seu aplicativo.
Experimente grátis
api-right-1
modelo-bg02-1

Uma API
Mais de 300 modelos de IA

Economize 20% nos custos