Afuera

Charlar

desactivar

Imagen 4.0 Generate

Imagen 4 Generate-001 es ideal para aplicaciones de marketing, diseño, publicación y generación de contenido en tiempo real que requieren imágenes fotorrealistas y una representación precisa del texto.

Fichas de $1 gratis para nuevos miembros

Text to Speech

Javascript

Python

                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v1/images/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'google/imagen-4.0-generate-001',
      prompt: 'A jellyfish in the ocean',
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main();

                                        import requests


def main():
    response = requests.post(
        "https://api.ai.cc/v1/images/generations",
        headers={
            "Authorization": "Bearer ",
            "Content-Type": "application/json",
        },
        json={
            "model": "google/imagen-4.0-generate-001",
            "prompt": "A jellyfish in the ocean",
        },
    )

    response.raise_for_status()
    data = response.json()

    print("Generation:", data)


if __name__ == "__main__":
    main()

Docs

Más de 300 modelos de IA para OpenClaw y agentes de IA

Ahorra un 20% en costes y obtén fichas gratis de 1 $.

Obtén la clave API Explorar modelos

Imagen 4.0 Generate

Detalles del producto

Imagen 4 Generate, un modelo insignia de conversión de texto a imagen de Google DeepMind, está diseñado para producir imágenes fotorrealistas de alta calidad con una fidelidad de texto excepcional y un control de estilo adaptable. Maneja eficientemente textos largos, admite diversas relaciones de aspecto y genera resoluciones de hasta 2K, logrando un equilibrio entre velocidad de generación y precisión visual para satisfacer diversas necesidades creativas y comerciales.

Especificaciones técnicas

⚙️ Resolución de imagen: Hasta 2048×2048 (2K)
🖼️ Relaciones de aspecto: 1:1, 3:4, 4:3, 9:16, 16:9
✍️ Entrada de datos solicitada: Hasta 480 tokens (admite indicaciones de texto extendidas)
🎨 Control de estilo: Realismo, abstracto, ilustración, estética de marca
🅰️ Representación de texto: Manejo avanzado de texto, adecuado para tipografía legible y cadenas de texto más largas en imágenes.
💾 Formato de salida: Imagen estática única (JPEG/PNG)

Métricas de rendimiento

⚡ Velocidad de generación: Aproximadamente 3-4 segundos por imagen (varía según la complejidad).
✨ Fidelidad: Alta precisión en la conversión de la solicitud a la imagen con una colocación precisa de los elementos.
📝 Detalle del texto: Renderizado mejorado para obtener texto nítido y legible incrustado en imágenes.
📏 Flexibilidad de la relación de aspecto: Permite formatos cuadrados, verticales y horizontales adecuados para múltiples casos de uso.

Precios de API

0,042 dólares por imagen

Capacidades clave

📸 Fotorrealismo: Produce imágenes nítidas y detalladas con iluminación dinámica y gran fidelidad de textura.
🅰️ Texto y tipografía: Destaca por generar imágenes con componentes de texto complejos, ideales para material de marketing, embalaje y diseño editorial.
🚀 Velocidad y eficiencia: Optimizado para iteraciones rápidas en flujos de trabajo creativos sin sacrificar la calidad.
🌈 Versatilidad: Admite una amplia gama de estilos y composiciones de imagen, desde fotografías realistas hasta ilustraciones estilizadas.

Casos de uso

📈 Marketing y marca: Crea elementos visuales de alta calidad con tipografía precisa y relevante para la marca, tanto para campañas digitales como impresas.
📦 Visualización del producto: Genera maquetas detalladas y prototipos de embalaje con texto y logotipos integrados.
📚 Publicaciones y contenido educativo: Diseñar infografías, cómics, maquetaciones y elementos visuales editoriales que combinen imágenes y texto legible.
🎨 Proyectos creativos: Generación flexible para la exploración artística a través de diferentes estilos y formatos.

Ejemplo de código

Comparación con otros modelos

vs Imagen 4 Ultra: Imagen 4.0-generate-001 ofrece una excelente fidelidad general y flexibilidad de estilo, con una velocidad de renderizado ligeramente más lenta, pero una amplia aplicabilidad para diversos creativos.
vs Midjourney v6: Mientras que Midjourney se centra en composiciones estilizadas y artísticas, Imagen 4 ofrece un mayor realismo, una fidelidad de texto superior y una gama más amplia de relaciones de aspecto.
vs DESDE 3: DALL·E 3 se integra estrechamente con la IA conversacional y admite funciones de edición; Imagen 4 está optimizada para una fidelidad de calidad de producción y opciones de relación de aspecto más flexibles en flujos de trabajo escalables.

Limitaciones

❌ No admite relleno de imágenes ni retoque de imágenes (edición de imágenes).
🎥 La salida se limita a imágenes estáticas; no se genera vídeo ni animación.
🔄 El determinismo de la semilla puede variar según la carga del sistema.
💬 No se permite la entrada multimodal (imagen + texto).

Preguntas frecuentes (FAQ)

❓ ¿Para qué se diseñó principalmente Imagen 4 Generate?

Imagen 4 Generate está diseñado principalmente para la generación de imágenes fotorrealistas de texto de alta calidad, haciendo hincapié en una excelente fidelidad del texto y un control de estilo versátil tanto para aplicaciones creativas como comerciales.

❓ ¿Cuáles son la resolución máxima y las relaciones de aspecto compatibles?

El modelo admite resoluciones de imagen de hasta 2048x2048 (2K) y ofrece flexibilidad con múltiples relaciones de aspecto, incluyendo 1:1, 3:4, 4:3, 9:16 y 16:9.

❓ ¿Cómo gestiona Imagen 4 el texto dentro de las imágenes generadas?

Imagen 4 incorpora capacidades avanzadas de renderizado de texto, lo que garantiza una tipografía limpia y legible, así como cadenas de texto más largas y legibles incrustadas en las imágenes generadas, lo que la hace ideal para contenido editorial y de marketing.

❓ ¿Puede Imagen 4 generar vídeos o animaciones?

No, Imagen 4 Generate se limita a producir imágenes estáticas individuales (JPEG/PNG) y no admite la generación de vídeo ni de animaciones.

❓ ¿Qué hace que Imagen 4 destaque en comparación con modelos como Midjourney o DALL·E 3?

En comparación con Midjourney, Imagen 4 ofrece mayor realismo, una fidelidad de texto superior y una gama más amplia de relaciones de aspecto. Frente a DALL·E 3, Imagen 4 está optimizada para una fidelidad de calidad de producción y ofrece opciones de relación de aspecto más flexibles para flujos de trabajo escalables, aunque DALL·E 3 se integra con IA conversacional y ofrece funciones de edición.

Campo de juegos de IA

Pruebe todos los modelos de API en el entorno de pruebas antes de integrarlos. Ofrecemos más de 300 modelos para integrar en su aplicación.

Pruébalo gratis

Más de 300 modelos de IA para
OpenClaw y agentes de IA

Ahorre un 20% en costos

Fichas de $1 gratis para nuevos miembros