



const main = async () => {
const response = await fetch('https://api.ai.cc/v1/images/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'google/imagen-4.0-generate-001',
prompt: 'A jellyfish in the ocean',
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main();
import requests
def main():
response = requests.post(
"https://api.ai.cc/v1/images/generations",
headers={
"Authorization": "Bearer ",
"Content-Type": "application/json",
},
json={
"model": "google/imagen-4.0-generate-001",
"prompt": "A jellyfish in the ocean",
},
)
response.raise_for_status()
data = response.json()
print("Generation:", data)
if __name__ == "__main__":
main()

Detalhes do produto
O Imagen 4 Generate, um modelo de conversão de texto em imagem de última geração do Google DeepMind, foi projetado para produzir visuais fotorrealistas de alta qualidade com fidelidade de texto excepcional e controle de estilo adaptável. Ele lida com eficiência com textos mais longos, suporta diversas proporções de tela e gera resoluções de até 2K, encontrando um equilíbrio entre velocidade de geração e precisão visual para atender a diversas necessidades criativas e comerciais.
Especificações técnicas
- ⚙️ Resolução da imagem: Até 2048×2048 (2K)
- 🖼️ Proporções de aspecto: 1:1, 3:4, 4:3, 9:16, 16:9
- ✍️ Entrada de comando: Até 480 tokens (suporta prompts de texto estendidos)
- 🎨 Controle de estilo: Realismo, abstrato, ilustração, estética de marca
- 🅰️ Renderização de texto: Manipulação avançada de texto, adequada para tipografia legível e textos mais longos em imagens.
- 💾 Formato de saída: Imagem estática única (JPEG/PNG)
Métricas de desempenho
- ⚡ Velocidade de geração: Aproximadamente 3 a 4 segundos por imagem (varia conforme a complexidade).
- ✨ Fidelidade: Alta precisão de resposta à imagem com posicionamento preciso dos elementos.
- 📝 Detalhes do texto: Renderização aprimorada para texto nítido e legível incorporado em imagens.
- 📏 Flexibilidade de proporção de tela: Permite formatos quadrados, verticais e horizontais, adequados para diversos casos de uso.
Preços da API
US$ 0,042 por imagem
Principais capacidades
- 📸 Fotorrealismo: Produz imagens nítidas e detalhadas com iluminação dinâmica e fidelidade de textura.
- 🅰️ Texto e Tipografia: Excelente para gerar imagens com componentes de texto complexos, ideal para materiais de marketing, embalagens e arte editorial.
- 🚀 Velocidade e Eficiência: Otimizado para iterações rápidas em fluxos de trabalho criativos sem sacrificar a qualidade.
- 🌈 Versatilidade: Suporta uma ampla variedade de estilos e composições de imagem, desde fotos realistas até ilustrações estilizadas.
Casos de uso
- 📈 Marketing e Branding: Crie recursos visuais refinados com tipografia precisa e relevante para a marca, para campanhas digitais e impressas.
- 📦 Visualização do produto: Gere maquetes detalhadas e protótipos de embalagens com texto e logotipos incorporados.
- 📚 Publicação e conteúdo educacional: Crie infográficos, histórias em quadrinhos, layouts e recursos visuais editoriais que combinem imagens e texto legível.
- 🎨 Projetos criativos: Geração flexível para exploração artística em diversos estilos e formatos.
Exemplo de código
Comparação com outros modelos
- vs Imagem 4 Ultra: O Imagen 4.0-generate-001 oferece excelente fidelidade geral e flexibilidade de estilo, com uma velocidade de renderização ligeiramente mais lenta, mas ampla aplicabilidade para diversos criativos.
- vs Midjourney v6: Enquanto a Midjourney se concentra em composições estilizadas e artísticas, a Imagen 4 oferece maior realismo, fidelidade de texto superior e uma gama mais ampla de proporções de tela.
- vs A PARTIR DE 3: O DALL·E 3 integra-se perfeitamente com IA conversacional e oferece suporte a recursos de edição; o Imagen 4 é otimizado para fidelidade de qualidade de produção e opções de proporção mais flexíveis em fluxos de trabalho escaláveis.
Limitações
- ❌ Não há suporte para preenchimento ou preenchimento de lacunas (edição de imagem).
- 🎥 A saída é limitada a imagens estáticas; não é possível gerar vídeos ou animações.
- 🔄 O determinismo das sementes pode variar dependendo da carga do sistema.
- 💬 Sem entrada multimodal (imagem + texto).
Perguntas frequentes (FAQ)
❓ Para que serve principalmente o Imagen 4 Generate?
O Imagen 4 Generate foi projetado principalmente para a geração de texto em imagem fotorrealista de alta qualidade, enfatizando a excelente fidelidade do texto e o controle versátil de estilos para aplicações criativas e comerciais.
❓ Quais são a resolução máxima e as proporções de aspecto suportadas?
O modelo suporta resoluções de imagem de até 2048x2048 (2K) e oferece flexibilidade com múltiplas proporções, incluindo 1:1, 3:4, 4:3, 9:16 e 16:9.
❓ Como o Imagen 4 lida com texto dentro de imagens geradas?
O Imagen 4 apresenta recursos avançados de renderização de texto, garantindo tipografia limpa e legível, além de textos mais longos e legíveis incorporados às imagens geradas, tornando-o ideal para conteúdo de marketing e editorial.
❓ O Imagen 4 consegue gerar vídeos ou animações?
Não, o Imagen 4 Generate limita-se à produção de imagens estáticas individuais (JPEG/PNG) e não suporta a geração de vídeos ou animações.
❓ O que faz o Imagen 4 se destacar em comparação com modelos como o Midjourney ou o DALL·E 3?
Em comparação com o Midjourney, o Imagen 4 oferece maior realismo, fidelidade de texto superior e uma gama mais ampla de proporções de tela. Contrariamente ao DALL·E 3, o Imagen 4 é otimizado para fidelidade de qualidade profissional e opções de proporção de tela mais flexíveis para fluxos de trabalho escaláveis, embora o DALL·E 3 integre IA conversacional e ofereça recursos de edição.
Playground de IA



Conecte-se