Fora

Bater papo

desativar

Gerar imagem 4.0

O Imagen 4 Generate-001 é ideal para aplicações de marketing, design, publicação e geração de conteúdo em tempo real que exigem visuais fotorrealistas e renderização de texto precisa.

Tokens de $1 grátis para novos membros

Text to Speech

Javascript

Python

                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v1/images/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'google/imagen-4.0-generate-001',
      prompt: 'A jellyfish in the ocean',
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main();

                                        import requests


def main():
    response = requests.post(
        "https://api.ai.cc/v1/images/generations",
        headers={
            "Authorization": "Bearer ",
            "Content-Type": "application/json",
        },
        json={
            "model": "google/imagen-4.0-generate-001",
            "prompt": "A jellyfish in the ocean",
        },
    )

    response.raise_for_status()
    data = response.json()

    print("Generation:", data)


if __name__ == "__main__":
    main()

Docs

Mais de 300 modelos de IA para OpenClaw e agentes de IA

Economize 20% nos custos e ganhe tokens grátis de $1.

Obter chave de API Explorar modelos

Gerar imagem 4.0

Detalhes do produto

O Imagen 4 Generate, um modelo de conversão de texto em imagem de última geração do Google DeepMind, foi projetado para produzir visuais fotorrealistas de alta qualidade com fidelidade de texto excepcional e controle de estilo adaptável. Ele lida com eficiência com textos mais longos, suporta diversas proporções de tela e gera resoluções de até 2K, encontrando um equilíbrio entre velocidade de geração e precisão visual para atender a diversas necessidades criativas e comerciais.

Especificações técnicas

⚙️ Resolução da imagem: Até 2048×2048 (2K)
🖼️ Proporções de aspecto: 1:1, 3:4, 4:3, 9:16, 16:9
✍️ Entrada de comando: Até 480 tokens (suporta prompts de texto estendidos)
🎨 Controle de estilo: Realismo, abstrato, ilustração, estética de marca
🅰️ Renderização de texto: Manipulação avançada de texto, adequada para tipografia legível e textos mais longos em imagens.
💾 Formato de saída: Imagem estática única (JPEG/PNG)

Métricas de desempenho

⚡ Velocidade de geração: Aproximadamente 3 a 4 segundos por imagem (varia conforme a complexidade).
✨ Fidelidade: Alta precisão de resposta à imagem com posicionamento preciso dos elementos.
📝 Detalhes do texto: Renderização aprimorada para texto nítido e legível incorporado em imagens.
📏 Flexibilidade de proporção de tela: Permite formatos quadrados, verticais e horizontais, adequados para diversos casos de uso.

Preços da API

US$ 0,042 por imagem

Principais capacidades

📸 Fotorrealismo: Produz imagens nítidas e detalhadas com iluminação dinâmica e fidelidade de textura.
🅰️ Texto e Tipografia: Excelente para gerar imagens com componentes de texto complexos, ideal para materiais de marketing, embalagens e arte editorial.
🚀 Velocidade e Eficiência: Otimizado para iterações rápidas em fluxos de trabalho criativos sem sacrificar a qualidade.
🌈 Versatilidade: Suporta uma ampla variedade de estilos e composições de imagem, desde fotos realistas até ilustrações estilizadas.

Casos de uso

📈 Marketing e Branding: Crie recursos visuais refinados com tipografia precisa e relevante para a marca, para campanhas digitais e impressas.
📦 Visualização do produto: Gere maquetes detalhadas e protótipos de embalagens com texto e logotipos incorporados.
📚 Publicação e conteúdo educacional: Crie infográficos, histórias em quadrinhos, layouts e recursos visuais editoriais que combinem imagens e texto legível.
🎨 Projetos criativos: Geração flexível para exploração artística em diversos estilos e formatos.

Exemplo de código

Comparação com outros modelos

vs Imagem 4 Ultra: O Imagen 4.0-generate-001 oferece excelente fidelidade geral e flexibilidade de estilo, com uma velocidade de renderização ligeiramente mais lenta, mas ampla aplicabilidade para diversos criativos.
vs Midjourney v6: Enquanto a Midjourney se concentra em composições estilizadas e artísticas, a Imagen 4 oferece maior realismo, fidelidade de texto superior e uma gama mais ampla de proporções de tela.
vs A PARTIR DE 3: O DALL·E 3 integra-se perfeitamente com IA conversacional e oferece suporte a recursos de edição; o Imagen 4 é otimizado para fidelidade de qualidade de produção e opções de proporção mais flexíveis em fluxos de trabalho escaláveis.

Limitações

❌ Não há suporte para preenchimento ou preenchimento de lacunas (edição de imagem).
🎥 A saída é limitada a imagens estáticas; não é possível gerar vídeos ou animações.
🔄 O determinismo das sementes pode variar dependendo da carga do sistema.
💬 Sem entrada multimodal (imagem + texto).

Perguntas frequentes (FAQ)

❓ Para que serve principalmente o Imagen 4 Generate?

O Imagen 4 Generate foi projetado principalmente para a geração de texto em imagem fotorrealista de alta qualidade, enfatizando a excelente fidelidade do texto e o controle versátil de estilos para aplicações criativas e comerciais.

❓ Quais são a resolução máxima e as proporções de aspecto suportadas?

O modelo suporta resoluções de imagem de até 2048x2048 (2K) e oferece flexibilidade com múltiplas proporções, incluindo 1:1, 3:4, 4:3, 9:16 e 16:9.

❓ Como o Imagen 4 lida com texto dentro de imagens geradas?

O Imagen 4 apresenta recursos avançados de renderização de texto, garantindo tipografia limpa e legível, além de textos mais longos e legíveis incorporados às imagens geradas, tornando-o ideal para conteúdo de marketing e editorial.

❓ O Imagen 4 consegue gerar vídeos ou animações?

Não, o Imagen 4 Generate limita-se à produção de imagens estáticas individuais (JPEG/PNG) e não suporta a geração de vídeos ou animações.

❓ O que faz o Imagen 4 se destacar em comparação com modelos como o Midjourney ou o DALL·E 3?

Em comparação com o Midjourney, o Imagen 4 oferece maior realismo, fidelidade de texto superior e uma gama mais ampla de proporções de tela. Contrariamente ao DALL·E 3, o Imagen 4 é otimizado para fidelidade de qualidade profissional e opções de proporção de tela mais flexíveis para fluxos de trabalho escaláveis, embora o DALL·E 3 integre IA conversacional e ofereça recursos de edição.

Playground de IA

Teste todos os modelos de API no ambiente de sandbox antes de integrá-los. Oferecemos mais de 300 modelos para integrar ao seu aplicativo.

Experimente grátis

Mais de 300 modelos de IA para
OpenClaw e Agentes de IA

Economize 20% nos custos