



const main = async () => {
const response = await fetch('https://api.ai.cc/v1/images/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'google/imagen-4.0-generate-001',
prompt: 'A jellyfish in the ocean',
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main();
import requests
def main():
response = requests.post(
"https://api.ai.cc/v1/images/generations",
headers={
"Authorization": "Bearer ",
"Content-Type": "application/json",
},
json={
"model": "google/imagen-4.0-generate-001",
"prompt": "A jellyfish in the ocean",
},
)
response.raise_for_status()
data = response.json()
print("Generation:", data)
if __name__ == "__main__":
main()

Detalle del producto
Imagen 4 Generate, el modelo insignia de conversión de texto a imagen de Google DeepMind, está diseñado para producir imágenes fotorrealistas de alta calidad con una fidelidad de texto excepcional y un control de estilo adaptable. Gestiona eficazmente indicaciones de texto más largas, admite diversas relaciones de aspecto y genera resoluciones de hasta 2K, logrando un equilibrio entre velocidad de generación y precisión visual para adaptarse a diversas necesidades creativas y comerciales.
Especificaciones técnicas
- ⚙️ Resolución de la imagen: Hasta 2048×2048 (2K)
- 🖼️ Relaciones de aspecto: 1:1, 3:4, 4:3, 9:16, 16:9
- ✍️ Entrada rápida: Hasta 480 tokens (admite indicaciones de texto extendidas)
- 🎨 Control de estilo: Realismo, abstracción, ilustración, estética de marca.
- 🅰️ Representación de texto: Manejo avanzado de texto, adecuado para tipografía legible y cadenas más largas en imágenes
- 💾 Formato de salida: Imagen estática única (JPEG/PNG)
Métricas de rendimiento
- ⚡ Velocidad de generación: Aproximadamente 3 a 4 segundos por imagen (varía según la complejidad)
- ✨ Fidelidad: Alta precisión de respuesta a la imagen con colocación precisa de elementos
- 📝 Detalle del texto: Representación mejorada para texto limpio y legible incrustado en imágenes
- 📏 Flexibilidad de relación de aspecto: Permite formatos cuadrados, verticales y horizontales adecuados para múltiples casos de uso.
Precios de la API
$0.042 por imagen
Capacidades clave
- 📸 Fotorrealismo: Produce imágenes nítidas y detalladas con iluminación dinámica y fidelidad de textura.
- 🅰️ Texto y tipografía: Se destaca en la generación de imágenes con componentes de texto complejos, ideal para materiales de marketing, empaques y arte editorial.
- 🚀 Velocidad y eficiencia: Optimizado para iteraciones rápidas en flujos de trabajo creativos sin sacrificar la calidad.
- 🌈 Versatilidad: Admite una amplia gama de estilos de imágenes y composiciones, desde fotografías realistas hasta ilustraciones estilizadas.
Casos de uso
- 📈 Marketing y marca: Cree recursos visuales pulidos con tipografía precisa y relevante para la marca para campañas digitales e impresas.
- 📦 Visualización del producto: Genere maquetas detalladas y prototipos de empaques con texto y logotipos integrados.
- 📚 Contenido editorial y educativo: Diseñe infografías, cómics, maquetaciones y elementos visuales editoriales que combinen imágenes y texto legible.
- 🎨 Proyectos creativos: Generación flexible para la exploración artística a través de estilos y formatos.
Ejemplo de código
Comparación con otros modelos
- contra Imagen 4 Ultra: Imagen 4.0-generate-001 ofrece una excelente fidelidad general y flexibilidad de estilo con una velocidad de renderizado ligeramente más lenta pero una amplia aplicabilidad para diversas creatividades.
- contra Midjourney v6: Mientras que Midjourney se centra en composiciones estilizadas y artísticas, Imagen 4 ofrece mayor realismo, fidelidad de texto superior y una gama más amplia de relaciones de aspecto.
- contra DESDE 3: DALL·E 3 se integra estrechamente con la IA conversacional y admite funciones de edición; Imagen 4 está optimizado para lograr fidelidad de calidad de producción y opciones de relación de aspecto más flexibles en canales escalables.
Limitaciones
- ❌ No se admite la edición de imágenes.
- 🎥 Salida limitada a imágenes estáticas; sin generación de videos o animaciones.
- 🔄El determinismo de la semilla puede variar según la carga del sistema.
- 💬 No se permite entrada multimodal (imagen + texto).
Preguntas frecuentes (FAQ)
❓ ¿Para qué está diseñado principalmente Imagen 4 Generate?
Imagen 4 Generate está diseñado principalmente para la generación de texto a imagen fotorrealista de alta calidad, enfatizando la excelente fidelidad del texto y el control de estilo versátil para aplicaciones creativas y comerciales.
❓ ¿Cuáles son la resolución máxima y las relaciones de aspecto admitidas?
El modelo admite resoluciones de imagen de hasta 2048 x 2048 (2K) y ofrece flexibilidad con múltiples relaciones de aspecto, incluidas 1:1, 3:4, 4:3, 9:16 y 16:9.
❓ ¿Cómo maneja Imagen 4 el texto dentro de las imágenes generadas?
Imagen 4 cuenta con capacidades avanzadas de representación de texto, lo que garantiza una tipografía limpia y legible y cadenas más largas y legibles integradas en las imágenes generadas, lo que la hace ideal para contenido editorial y de marketing.
❓ ¿Puede Imagen 4 generar vídeos o animaciones?
No, Imagen 4 Generate está limitado a producir imágenes estáticas individuales (JPEG/PNG) y no admite la generación de videos o animaciones.
❓ ¿Qué hace que Imagen 4 destaque en comparación con modelos como Midjourney o DALL·E 3?
En comparación con Midjourney, Imagen 4 ofrece mayor realismo, fidelidad de texto superior y una gama más amplia de relaciones de aspecto. A diferencia de DALL·E 3, Imagen 4 está optimizado para una fidelidad de calidad de producción y opciones de relación de aspecto más flexibles para flujos de trabajo escalables, aunque DALL·E 3 se integra con IA conversacional y ofrece funciones de edición.
Patio de juegos de IA



Acceso