qwen-bg
ico máximo04
En
Afuera
ico-máximo02
Charlar
ico-máximo03
activo
Edición de imágenes Gemini 3 Pro (Nano Banana Pro)
Su capacidad para controlar y transformar imágenes con calidad de estudio, combinada con un conocimiento práctico y realista, la distingue de los demás equipos para flujos de trabajo creativos profesionales.
Fichas de $1 gratis para nuevos miembros
Text to Speech
                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v1/images/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'google/gemini-3-pro-image-preview-edit',
      prompt: 'Mona Lisa with glasses',
      image_urls: [
        'https://upload.wikimedia.org/wikipedia/commons/thumb/e/ec/Mona_Lisa%2C_by_Leonardo_da_Vinci%2C_from_C2RMF_retouched.jpg/960px-Mona_Lisa%2C_by_Leonardo_da_Vinci%2C_from_C2RMF_retouched.jpg',
        'https://upload.wikimedia.org/wikipedia/commons/thumb/a/af/Glasses_black.jpg/960px-Glasses_black.jpg',
      ]
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main();

                                
                                        import requests


def main():
    response = requests.post(
        "https://api.ai.cc/v1/images/generations",
        headers={
            "Authorization": "Bearer ",
            "Content-Type": "application/json",
        },
        json={
            "prompt": "Mona Lisa with glasses",
            "model": "google/gemini-3-pro-image-preview-edit",
            "image_urls": [
                "https://upload.wikimedia.org/wikipedia/commons/thumb/e/ec/Mona_Lisa%2C_by_Leonardo_da_Vinci%2C_from_C2RMF_retouched.jpg/960px-Mona_Lisa%2C_by_Leonardo_da_Vinci%2C_from_C2RMF_retouched.jpg",
                "https://upload.wikimedia.org/wikipedia/commons/thumb/a/af/Glasses_black.jpg/960px-Glasses_black.jpg",
            ]
        },
    )

    response.raise_for_status()
    data = response.json()

    print("Generation:", data)


if __name__ == "__main__":
    main()
Docs

Más de 300 modelos de IA para OpenClaw y agentes de IA

Ahorra un 20% en costes y obtén fichas gratis de 1 $.
qwenmax-bg
imagen
Edición de imágenes Gemini 3 Pro (Nano Banana Pro)

Detalles del producto

✨ Mejora tus imágenes con la API de imágenes Gemini 3 Pro (Nano Banana Pro)

El API de imágenes de Gemini 3 Pro, también conocido como Nano Banana Pro, representa el modelo de edición de imagen a imagen de vanguardia de Google DeepMind. Aprovecha el razonamiento avanzado de IA, la comprensión del contexto del mundo real y una fidelidad visual superior para producir creación de imágenes con calidad de estudio y capacidades de edición matizadas. Diseñada para profesionales creativos y desarrolladores exigentes, esta potente API admite flujos de trabajo complejos, desde la creación rápida de prototipos hasta la producción de infografías intrincadas, ofreciendo resultados impresionantes en ambos niveles. Resoluciones 2K y 4K.

⚙️ Especificaciones técnicas

  • Tipo de modelo: Generación y edición de imágenes (IA multimodal)
  • Arquitectura base: Construido sobre Gemini 3 Prointegrando el razonamiento experto y la comprensión de la visión.
  • Soporte para la resolución de problemas: Nativo 2K y 4K con escalado de alta fidelidad
  • Límite de tamaño de imagen: Arriba a 7 MB por imagen
  • Capacidades: Iluminación de escena compleja, ajuste del ángulo de la cámara, edición localizada
  • Formatos de salida: Amplia gama de relaciones de aspecto para redes sociales, impresión y web.

🚀 Puntos de referencia de rendimiento

  • Logros Fidelidad visual y textual con calidad de estudio, con limitaciones menores en detalles gráficos extremadamente finos o rostros pequeños.
  • Realiza edición localizada avanzada con precisión de "seleccionar, refinar y transformar" en cualquier parte de la imagen.
Ejemplo de la API de imágenes de Gemini 3 Pro

💡 Características principales

  • 🎨 Controles creativos: Control total sobre los ángulos de la cámara, los cambios de enfoque y las transformaciones de iluminación complejas (por ejemplo, de día a noche, efecto bokeh).
  • 🔍 Ediciones localizadas: Selección intuitiva y refinamiento preciso de las partes de la imagen que se deseen, lo que permite un control granular.
  • 🧠 Conocimientos del mundo real: Utiliza la tecnología de búsqueda de Google para generar contenido preciso y actualizarlo en tiempo real, garantizando así la relevancia contextual.
  • 🖼️ Salida de alta resolución: Admite imágenes listas para producción en formato nativo. Resoluciones 2K y 4K.
  • ✨ Integración multimodal: Combina a la perfección la visión con el razonamiento avanzado para la síntesis de imágenes contextuales, comprendiendo indicaciones complejas.

💲 Precios de la API de Nano Banana Pro

$0.1575 por generación

🛠️ Casos de uso potentes

  • 📊 Diseño de producto: Crea prototipos y visualiza diseños de productos directamente a partir de bocetos conceptuales.
  • 📈 Visualización de datos: Crea infografías y visualizaciones de datos complejas con texto integrado a la perfección.
  • 📸 Mejora de fotos: Edita y transforma tus fotos con ajustes de iluminación y enfoque de nivel profesional.
  • 📱 Marketing y redes sociales: Desarrollar creatividades de marketing y contenido para redes sociales diversos en múltiples formatos.
  • 📚 Narración visual: Genera escenas históricamente precisas y recursos visuales narrativos detallados para diversos medios.

💻 Ejemplo de código

// Estructura de ejemplo de llamada a la API (la implementación real puede variar) // const response = await googleDeepMindClient.gemini3ProImageEdit({ // image: 'base64_encoded_image_data', // prompt: 'Cambia la iluminación a un brillo de atardecer y agrega un efecto bokeh', // resolution: '4K' // }); // console.log(response.editedImage); 

📊 Comparación con otros modelos

vs Imagen GPT-1:

Gemini 3 Pro Image Edit destaca en edición especializada de imagen a imagen Con control avanzado sobre la iluminación, el enfoque y las ediciones localizadas. Imagen GPT-1Si bien ofrece una sólida integración multimodal para la generación iterativa, proporciona una precisión de edición ligeramente menos granular.

vs FLUX.1 Context:

Gemini 3 Pro ofrece más control integral sobre ángulos de cámara, iluminación y salida de alta resolución, lo que lo posiciona como una opción superior para la edición de imágenes con calidad de estudio y la síntesis de imágenes complejas en comparación con FLUX.1 Context.

vs Nano Banana (Imagen con flash de Gemini 2.5):

Gemini 3 Pro supone un avance significativo sobre la base de Nano Banana (Imagen con flash de Gemini 2.5) con Salida nativa 4K, una mejor integración del conocimiento del mundo real y una mayor precisión en las ediciones localizadas y la representación del texto, lo que lo convierte en el modelo de nivel más profesional.

❓ Preguntas frecuentes (FAQ)

  • P: ¿Qué es la API de imágenes Gemini 3 Pro (Nano Banana Pro)?

    A: Se trata del modelo avanzado de IA de edición de imagen a imagen de Google DeepMind, diseñado para la creación de imágenes de alta fidelidad y una edición precisa en resoluciones 2K y 4K, que incorpora razonamiento de IA y conocimiento del mundo real.

  • P: ¿Qué resoluciones admite la API de imágenes de Gemini 3 Pro?

    R: Admite de forma nativa resoluciones 2K y 4K, lo que proporciona una salida con calidad de estudio.

  • P: ¿Puedo realizar ediciones localizadas con esta API?

    R: Sí, ofrece una selección intuitiva y un refinamiento preciso de las partes específicas de la imagen, lo que permite una edición localizada y detallada.

  • P: ¿Cómo se compara la API de imágenes de Gemini 3 Pro con la API de imágenes Flash de Gemini 2.5?

    A: Gemini 3 Pro es un avance de nivel profesional que ofrece salida 4K nativa, una mejor integración del conocimiento del mundo real y una mayor precisión en las ediciones en comparación con Gemini 2.5 Flash Image.

  • P: ¿Cuáles son los principales casos de uso de Nano Banana Pro?

    A: Es ideal para la creación de prototipos de diseño de productos, la creación de infografías complejas, la edición profesional de fotografías, el desarrollo de materiales creativos de marketing y la generación de recursos visuales para contar historias.

Campo de juegos de IA

Pruebe todos los modelos de API en el entorno de pruebas antes de integrarlos. Ofrecemos más de 300 modelos para integrar en su aplicación.
Pruébalo gratis
api-right-1
modelo-bg02-1

Más de 300 modelos de IA para
OpenClaw y agentes de IA

Ahorre un 20% en costos