



const main = async () => {
const response = await fetch('https://api.ai.cc/v1/images/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'blackforestlabs/flux-2-pro-edit',
prompt: 'Combine the images so the T-Rex is wearing a business suit, sitting in a cozy small café, drinking from the mug. Blur the background slightly to create a bokeh effect.',
image_urls: [
'https://raw.githubusercontent.com/aimlapi/api-docs/main/reference-files/t-rex.png',
'https://raw.githubusercontent.com/aimlapi/api-docs/main/reference-files/blue-mug.jpg',
],
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main();
import requests
def main():
response = requests.post(
"https://api.ai.cc/v1/images/generations",
headers={
"Authorization": "Bearer ",
"Content-Type": "application/json",
},
json={
"model": "blackforestlabs/flux-2-pro-edit",
"prompt": "Combine the images so the T-Rex is wearing a business suit, sitting in a cozy small café, drinking from the mug. Blur the background slightly to create a bokeh effect.",
"image_urls": [
"https://raw.githubusercontent.com/aimlapi/api-docs/main/reference-files/t-rex.png",
"https://raw.githubusercontent.com/aimlapi/api-docs/main/reference-files/blue-mug.jpg",
],
},
)
response.raise_for_status()
data = response.json()
print("Generation:", data)
if __name__ == "__main__":
main()

Detalles del producto
FLUX.2 [pro] es un modelo de edición de imágenes de grado de producción de Black Forest Labs, diseñado para flujos de trabajo de edición de imágenes de alta precisión y con múltiples referencias. Ofrece calidad de imagen de última generación Este modelo rivaliza con los mejores modelos cerrados, combinando a la perfección la rápida adaptación, la fidelidad visual, la velocidad, la eficiencia y la fiabilidad. Permite a los usuarios realizar modificaciones detalladas mediante comandos en lenguaje natural, eliminando la necesidad de ediciones manuales complejas o máscaras intrincadas.
⚙️Especificaciones técnicas
- Resolución de salida: Arriba a 4 megapíxeles (MP)
- Imágenes de entrada: Soportes múltiples imágenes de referencia (hasta 9 imágenes con una resolución total de 9 MP)
- Control de edición: Ediciones de lenguaje natural con Precisión del código de color hexadecimal para una coincidencia de color de marca precisa
- Formatos de salida: PNG y JPEG
- Velocidad: Optimizado para flujos de trabajo de producción e iteración rápida con latencia reducida.
- Arquitectura: Combina un transformador de flujo latente con un modelo de visión-lenguaje (Mistral-3, 24 mil millones de parámetros) para la comprensión espacial y contextual.
📊Indicadores de rendimiento
- ✅ Igual o supera la rapidez de respuesta y la fidelidad visual en comparación con los principales modelos de edición de imágenes de código cerrado.
- ⚡ Logra tiempos de generación más rápidos y menores costos por megapíxel que otras soluciones de edición de alta calidad comparables.
✨Características principales
- Edición multirreferencial: Combina y compone a la perfección hasta 9 imágenes con indexación explícita para controlar con precisión los elementos de cada imagen de origen.
- Precisión del lenguaje natural: Edita escenas complejas, reemplaza fondos o ajusta colores describiendo los cambios en un lenguaje sencillo.
- Control de color hexadecimal: Utilice códigos de color exactos para lograr una imagen de marca y un estilo coherentes y precisos.
- Consistencia estructural: Mantiene la disposición original y la integridad de la escena, al tiempo que mejora las texturas, la iluminación y los detalles de forma realista.
- Tipografía y edición de interfaz de usuario: Maneja con precisión la representación de texto y las infografías complejas dentro de las imágenes.
- Edición iterativa: Permite encadenar ediciones para lograr una calidad de salida más refinada a lo largo de múltiples ciclos de revisión.
💰Precios de API
$0.0315 / Entrada MP + $0,0315 / MP salida
💡Casos de uso
- 🚀 Canalizaciones de transformación de estilo y reemplazo de contenido de alto volumen.
- 🛍️ Composición de imágenes de productos para comercio electrónico y perfeccionamiento de los elementos de marca.
- 📐 Maquetas de interfaz de usuario y correcciones de diseño digital, incluyendo señalización e infografías.
- 🖼️ Sustitución automatizada del fondo e inserción de objetos en la producción de vídeo o imágenes.
- 🎯 Prototipado rápido para campañas de marketing que requieren una coherencia visual precisa.
💻Ejemplo de código
Para consultar la referencia completa de la API, visite: Referencias de API: Modelos de imagen / FLUX / FLUX.2 [pro] Editar
curl -X POST https://api.aimlapi.com/image/flux-edit \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "blackforestlabs/flux-2-pro-edit", "input_images": [ { "url": "https://example.com/image1.png", "index": 0 } ], "prompt": "Cambia el fondo a una playa soleada con palmeras y un cielo azul claro." }' 🆚Comparación con otros modelos
vs Difusión estable: FLUX.2 [pro] sobresale en Edición rápida y con múltiples referencias Con precisión de lenguaje natural y fiabilidad lista para la producción. Si bien Stable Diffusion permite un mayor nivel de detalle fotorrealista y texturas complejas mediante la reducción iterativa de ruido, generalmente es más lento.
vs DALL·E 3: FLUX.2 [pro] ofertas capacidades superiores de composición de múltiples imágenes y edición a nivel de píxel, optimizado para uso en producción con control de color exacto. DALL·E 3 es más eficaz en la generación creativa de texto a imagen con una amplia variación estilística, pero está menos especializado para la edición precisa de imágenes y la integración de múltiples referencias.
vs Midjourney: Midjourney es conocida por generar imágenes artísticas y estilizadas con cualidades abstractas. FLUX.2 [pro] se centra en Fotorrealismo, ediciones detalladas y coherencia de marca., lo que la hace más adecuada para aplicaciones comerciales y de producción.
❓Preguntas frecuentes (FAQ)
P1: ¿Para qué está diseñado FLUX.2 [pro]?
FLUX.2 [pro] es un modelo de edición de imágenes de nivel profesional diseñado para flujos de trabajo de edición de imágenes de alta precisión y con múltiples referencias, que ofrece una calidad y eficiencia de vanguardia.
P2: ¿Cuáles son las principales capacidades técnicas?
Admite resoluciones de salida de hasta 4 MP, acepta hasta 9 imágenes de referencia de entrada y permite la edición en lenguaje natural con precisión de código de color hexadecimal para un control exacto.
P3: ¿Cómo maneja FLUX.2 [pro] las ediciones complejas?
El modelo utiliza la precisión del lenguaje natural para ediciones complejas de escenas, reemplazo de fondos y ajustes de color, junto con funciones como la coherencia estructural y la edición tipográfica, lo que facilita las modificaciones complejas.
P4: ¿Cuáles son las principales ventajas sobre otros modelos como Difusión Estable o DALL·E 3?
FLUX.2 [pro] destaca por su velocidad, composición de imágenes con múltiples referencias, edición a nivel de píxel y mantenimiento de la coherencia de la marca, lo que lo hace superior para tareas de edición de imágenes precisas y de calidad profesional en comparación con el enfoque creativo más amplio de DALL·E 3 y Midjourney, o el proceso iterativo más lento de Stable Diffusion.
P5: ¿Cuáles son los casos de uso comunes para esta API?
Entre las aplicaciones clave se incluyen la transformación de contenido de gran volumen, el perfeccionamiento de imágenes para comercio electrónico, la creación de maquetas de interfaz de usuario, el reemplazo automatizado de fondos y la creación rápida de prototipos para campañas de marketing.
Campo de juegos de IA



Acceso