



const main = async () => {
const response = await fetch('https://api.ai.cc/v1/images/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'google/imagen-4.0-generate-001',
prompt: 'A jellyfish in the ocean',
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main();
import requests
def main():
response = requests.post(
"https://api.ai.cc/v1/images/generations",
headers={
"Authorization": "Bearer ",
"Content-Type": "application/json",
},
json={
"model": "google/imagen-4.0-generate-001",
"prompt": "A jellyfish in the ocean",
},
)
response.raise_for_status()
data = response.json()
print("Generation:", data)
if __name__ == "__main__":
main()

Detalles del producto
Imagen 4 Generate, un modelo insignia de conversión de texto a imagen de Google DeepMind, está diseñado para producir imágenes fotorrealistas de alta calidad con una fidelidad de texto excepcional y un control de estilo adaptable. Maneja eficientemente textos largos, admite diversas relaciones de aspecto y genera resoluciones de hasta 2K, logrando un equilibrio entre velocidad de generación y precisión visual para satisfacer diversas necesidades creativas y comerciales.
Especificaciones técnicas
- ⚙️ Resolución de imagen: Hasta 2048×2048 (2K)
- 🖼️ Relaciones de aspecto: 1:1, 3:4, 4:3, 9:16, 16:9
- ✍️ Entrada de datos solicitada: Hasta 480 tokens (admite indicaciones de texto extendidas)
- 🎨 Control de estilo: Realismo, abstracto, ilustración, estética de marca
- 🅰️ Representación de texto: Manejo avanzado de texto, adecuado para tipografía legible y cadenas de texto más largas en imágenes.
- 💾 Formato de salida: Imagen estática única (JPEG/PNG)
Métricas de rendimiento
- ⚡ Velocidad de generación: Aproximadamente 3-4 segundos por imagen (varía según la complejidad).
- ✨ Fidelidad: Alta precisión en la conversión de la solicitud a la imagen con una colocación precisa de los elementos.
- 📝 Detalle del texto: Renderizado mejorado para obtener texto nítido y legible incrustado en imágenes.
- 📏 Flexibilidad de la relación de aspecto: Permite formatos cuadrados, verticales y horizontales adecuados para múltiples casos de uso.
Precios de API
0,042 dólares por imagen
Capacidades clave
- 📸 Fotorrealismo: Produce imágenes nítidas y detalladas con iluminación dinámica y gran fidelidad de textura.
- 🅰️ Texto y tipografía: Destaca por generar imágenes con componentes de texto complejos, ideales para material de marketing, embalaje y diseño editorial.
- 🚀 Velocidad y eficiencia: Optimizado para iteraciones rápidas en flujos de trabajo creativos sin sacrificar la calidad.
- 🌈 Versatilidad: Admite una amplia gama de estilos y composiciones de imagen, desde fotografías realistas hasta ilustraciones estilizadas.
Casos de uso
- 📈 Marketing y marca: Crea elementos visuales de alta calidad con tipografía precisa y relevante para la marca, tanto para campañas digitales como impresas.
- 📦 Visualización del producto: Genera maquetas detalladas y prototipos de embalaje con texto y logotipos integrados.
- 📚 Publicaciones y contenido educativo: Diseñar infografías, cómics, maquetaciones y elementos visuales editoriales que combinen imágenes y texto legible.
- 🎨 Proyectos creativos: Generación flexible para la exploración artística a través de diferentes estilos y formatos.
Ejemplo de código
Comparación con otros modelos
- vs Imagen 4 Ultra: Imagen 4.0-generate-001 ofrece una excelente fidelidad general y flexibilidad de estilo, con una velocidad de renderizado ligeramente más lenta, pero una amplia aplicabilidad para diversos creativos.
- vs Midjourney v6: Mientras que Midjourney se centra en composiciones estilizadas y artísticas, Imagen 4 ofrece un mayor realismo, una fidelidad de texto superior y una gama más amplia de relaciones de aspecto.
- vs DESDE 3: DALL·E 3 se integra estrechamente con la IA conversacional y admite funciones de edición; Imagen 4 está optimizada para una fidelidad de calidad de producción y opciones de relación de aspecto más flexibles en flujos de trabajo escalables.
Limitaciones
- ❌ No admite relleno de imágenes ni retoque de imágenes (edición de imágenes).
- 🎥 La salida se limita a imágenes estáticas; no se genera vídeo ni animación.
- 🔄 El determinismo de la semilla puede variar según la carga del sistema.
- 💬 No se permite la entrada multimodal (imagen + texto).
Preguntas frecuentes (FAQ)
❓ ¿Para qué se diseñó principalmente Imagen 4 Generate?
Imagen 4 Generate está diseñado principalmente para la generación de imágenes fotorrealistas de texto de alta calidad, haciendo hincapié en una excelente fidelidad del texto y un control de estilo versátil tanto para aplicaciones creativas como comerciales.
❓ ¿Cuáles son la resolución máxima y las relaciones de aspecto compatibles?
El modelo admite resoluciones de imagen de hasta 2048x2048 (2K) y ofrece flexibilidad con múltiples relaciones de aspecto, incluyendo 1:1, 3:4, 4:3, 9:16 y 16:9.
❓ ¿Cómo gestiona Imagen 4 el texto dentro de las imágenes generadas?
Imagen 4 incorpora capacidades avanzadas de renderizado de texto, lo que garantiza una tipografía limpia y legible, así como cadenas de texto más largas y legibles incrustadas en las imágenes generadas, lo que la hace ideal para contenido editorial y de marketing.
❓ ¿Puede Imagen 4 generar vídeos o animaciones?
No, Imagen 4 Generate se limita a producir imágenes estáticas individuales (JPEG/PNG) y no admite la generación de vídeo ni de animaciones.
❓ ¿Qué hace que Imagen 4 destaque en comparación con modelos como Midjourney o DALL·E 3?
En comparación con Midjourney, Imagen 4 ofrece mayor realismo, una fidelidad de texto superior y una gama más amplia de relaciones de aspecto. Frente a DALL·E 3, Imagen 4 está optimizada para una fidelidad de calidad de producción y ofrece opciones de relación de aspecto más flexibles para flujos de trabajo escalables, aunque DALL·E 3 se integra con IA conversacional y ofrece funciones de edición.
Campo de juegos de IA



Acceso