qwen-bg
ico máximo04
En
Afuera
ico-máximo02
Charlar
ico-máximo03
activo
FLUX.2 [pro] Edit
El modelo admite diversas tareas de edición, como la inserción, eliminación y sustitución de objetos, así como la transferencia de estilo.
Fichas de $1 gratis para nuevos miembros
Text to Speech
                                        const main = async () => {
  const response = await fetch('https://api.ai.cc/v1/images/generations', {
    method: 'POST',
    headers: {
      Authorization: 'Bearer ',
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'blackforestlabs/flux-2-pro-edit',
      prompt: 'Combine the images so the T-Rex is wearing a business suit, sitting in a cozy small café, drinking from the mug. Blur the background slightly to create a bokeh effect.',
      image_urls: [
        'https://raw.githubusercontent.com/aimlapi/api-docs/main/reference-files/t-rex.png',
        'https://raw.githubusercontent.com/aimlapi/api-docs/main/reference-files/blue-mug.jpg',
      ],
    }),
  }).then((res) => res.json());

  console.log('Generation:', response);
};

main();

                                
                                        import requests


def main():
    response = requests.post(
        "https://api.ai.cc/v1/images/generations",
        headers={
            "Authorization": "Bearer ",
            "Content-Type": "application/json",
        },
        json={
            "model": "blackforestlabs/flux-2-pro-edit",
            "prompt": "Combine the images so the T-Rex is wearing a business suit, sitting in a cozy small café, drinking from the mug. Blur the background slightly to create a bokeh effect.",
            "image_urls": [
                "https://raw.githubusercontent.com/aimlapi/api-docs/main/reference-files/t-rex.png",
                "https://raw.githubusercontent.com/aimlapi/api-docs/main/reference-files/blue-mug.jpg",
            ],
        },
    )

    response.raise_for_status()
    data = response.json()

    print("Generation:", data)


if __name__ == "__main__":
    main()
Docs

Más de 300 modelos de IA para OpenClaw y agentes de IA

Ahorra un 20% en costes y obtén fichas gratis de 1 $.
qwenmax-bg
imagen
FLUX.2 [pro] Edit

Detalles del producto

FLUX.2 [pro] es un modelo de edición de imágenes de grado de producción de Black Forest Labs, diseñado para flujos de trabajo de edición de imágenes de alta precisión y con múltiples referencias. Ofrece calidad de imagen de última generación Este modelo rivaliza con los mejores modelos cerrados, combinando a la perfección la rápida adaptación, la fidelidad visual, la velocidad, la eficiencia y la fiabilidad. Permite a los usuarios realizar modificaciones detalladas mediante comandos en lenguaje natural, eliminando la necesidad de ediciones manuales complejas o máscaras intrincadas.

⚙️Especificaciones técnicas

  • Resolución de salida: Arriba a 4 megapíxeles (MP)
  • Imágenes de entrada: Soportes múltiples imágenes de referencia (hasta 9 imágenes con una resolución total de 9 MP)
  • Control de edición: Ediciones de lenguaje natural con Precisión del código de color hexadecimal para una coincidencia de color de marca precisa
  • Formatos de salida: PNG y JPEG
  • Velocidad: Optimizado para flujos de trabajo de producción e iteración rápida con latencia reducida.
  • Arquitectura: Combina un transformador de flujo latente con un modelo de visión-lenguaje (Mistral-3, 24 mil millones de parámetros) para la comprensión espacial y contextual.

📊Indicadores de rendimiento

  • Igual o supera la rapidez de respuesta y la fidelidad visual en comparación con los principales modelos de edición de imágenes de código cerrado.
  • Logra tiempos de generación más rápidos y menores costos por megapíxel que otras soluciones de edición de alta calidad comparables.
Ilustración del flujo de trabajo de FLUX.2 [pro].

Características principales

  • Edición multirreferencial: Combina y compone a la perfección hasta 9 imágenes con indexación explícita para controlar con precisión los elementos de cada imagen de origen.
  • Precisión del lenguaje natural: Edita escenas complejas, reemplaza fondos o ajusta colores describiendo los cambios en un lenguaje sencillo.
  • Control de color hexadecimal: Utilice códigos de color exactos para lograr una imagen de marca y un estilo coherentes y precisos.
  • Consistencia estructural: Mantiene la disposición original y la integridad de la escena, al tiempo que mejora las texturas, la iluminación y los detalles de forma realista.
  • Tipografía y edición de interfaz de usuario: Maneja con precisión la representación de texto y las infografías complejas dentro de las imágenes.
  • Edición iterativa: Permite encadenar ediciones para lograr una calidad de salida más refinada a lo largo de múltiples ciclos de revisión.

💰Precios de API

$0.0315 / Entrada MP + $0,0315 / MP salida

💡Casos de uso

  • 🚀 Canalizaciones de transformación de estilo y reemplazo de contenido de alto volumen.
  • 🛍️ Composición de imágenes de productos para comercio electrónico y perfeccionamiento de los elementos de marca.
  • 📐 Maquetas de interfaz de usuario y correcciones de diseño digital, incluyendo señalización e infografías.
  • 🖼️ Sustitución automatizada del fondo e inserción de objetos en la producción de vídeo o imágenes.
  • 🎯 Prototipado rápido para campañas de marketing que requieren una coherencia visual precisa.

💻Ejemplo de código

Para consultar la referencia completa de la API, visite: Referencias de API: Modelos de imagen / FLUX / FLUX.2 [pro] Editar

 curl -X POST https://api.aimlapi.com/image/flux-edit \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "blackforestlabs/flux-2-pro-edit", "input_images": [ { "url": "https://example.com/image1.png", "index": 0 } ], "prompt": "Cambia el fondo a una playa soleada con palmeras y un cielo azul claro." }' 

🆚Comparación con otros modelos

vs Difusión estable: FLUX.2 [pro] sobresale en Edición rápida y con múltiples referencias Con precisión de lenguaje natural y fiabilidad lista para la producción. Si bien Stable Diffusion permite un mayor nivel de detalle fotorrealista y texturas complejas mediante la reducción iterativa de ruido, generalmente es más lento.

vs DALL·E 3: FLUX.2 [pro] ofertas capacidades superiores de composición de múltiples imágenes y edición a nivel de píxel, optimizado para uso en producción con control de color exacto. DALL·E 3 es más eficaz en la generación creativa de texto a imagen con una amplia variación estilística, pero está menos especializado para la edición precisa de imágenes y la integración de múltiples referencias.

vs Midjourney: Midjourney es conocida por generar imágenes artísticas y estilizadas con cualidades abstractas. FLUX.2 [pro] se centra en Fotorrealismo, ediciones detalladas y coherencia de marca., lo que la hace más adecuada para aplicaciones comerciales y de producción.

Preguntas frecuentes (FAQ)

P1: ¿Para qué está diseñado FLUX.2 [pro]?

FLUX.2 [pro] es un modelo de edición de imágenes de nivel profesional diseñado para flujos de trabajo de edición de imágenes de alta precisión y con múltiples referencias, que ofrece una calidad y eficiencia de vanguardia.

P2: ¿Cuáles son las principales capacidades técnicas?

Admite resoluciones de salida de hasta 4 MP, acepta hasta 9 imágenes de referencia de entrada y permite la edición en lenguaje natural con precisión de código de color hexadecimal para un control exacto.

P3: ¿Cómo maneja FLUX.2 [pro] las ediciones complejas?

El modelo utiliza la precisión del lenguaje natural para ediciones complejas de escenas, reemplazo de fondos y ajustes de color, junto con funciones como la coherencia estructural y la edición tipográfica, lo que facilita las modificaciones complejas.

P4: ¿Cuáles son las principales ventajas sobre otros modelos como Difusión Estable o DALL·E 3?

FLUX.2 [pro] destaca por su velocidad, composición de imágenes con múltiples referencias, edición a nivel de píxel y mantenimiento de la coherencia de la marca, lo que lo hace superior para tareas de edición de imágenes precisas y de calidad profesional en comparación con el enfoque creativo más amplio de DALL·E 3 y Midjourney, o el proceso iterativo más lento de Stable Diffusion.

P5: ¿Cuáles son los casos de uso comunes para esta API?

Entre las aplicaciones clave se incluyen la transformación de contenido de gran volumen, el perfeccionamiento de imágenes para comercio electrónico, la creación de maquetas de interfaz de usuario, el reemplazo automatizado de fondos y la creación rápida de prototipos para campañas de marketing.

Campo de juegos de IA

Pruebe todos los modelos de API en el entorno de pruebas antes de integrarlos. Ofrecemos más de 300 modelos para integrar en su aplicación.
Pruébalo gratis
api-right-1
modelo-bg02-1

Más de 300 modelos de IA para
OpenClaw y agentes de IA

Ahorre un 20% en costos