



const main = async () => {
const response = await fetch('https://api.ai.cc/v1/images/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
model: 'blackforestlabs/flux-2-pro-edit',
prompt: 'Combine the images so the T-Rex is wearing a business suit, sitting in a cozy small café, drinking from the mug. Blur the background slightly to create a bokeh effect.',
image_urls: [
'https://raw.githubusercontent.com/aimlapi/api-docs/main/reference-files/t-rex.png',
'https://raw.githubusercontent.com/aimlapi/api-docs/main/reference-files/blue-mug.jpg',
],
}),
}).then((res) => res.json());
console.log('Generation:', response);
};
main();
import requests
def main():
response = requests.post(
"https://api.ai.cc/v1/images/generations",
headers={
"Authorization": "Bearer ",
"Content-Type": "application/json",
},
json={
"model": "blackforestlabs/flux-2-pro-edit",
"prompt": "Combine the images so the T-Rex is wearing a business suit, sitting in a cozy small café, drinking from the mug. Blur the background slightly to create a bokeh effect.",
"image_urls": [
"https://raw.githubusercontent.com/aimlapi/api-docs/main/reference-files/t-rex.png",
"https://raw.githubusercontent.com/aimlapi/api-docs/main/reference-files/blue-mug.jpg",
],
},
)
response.raise_for_status()
data = response.json()
print("Generation:", data)
if __name__ == "__main__":
main()

Detalhes do produto
FLUX.2 [pro] é um modelo de edição de imagens de nível profissional da Black Forest Labs, projetado para fluxos de trabalho de edição de imagens de alta precisão e com múltiplas referências. Ele oferece qualidade de imagem de última geração que rivaliza com os melhores modelos fechados, combinando perfeitamente aderência imediata, fidelidade visual, velocidade, eficiência e confiabilidade. Este modelo permite que os usuários executem modificações detalhadas por meio de comandos de linguagem natural, eliminando a necessidade de edição manual complexa ou máscaras intrincadas.
⚙️Especificações técnicas
- Resolução de saída: Até 4 megapixels (MP)
- Imagens de entrada: Suportes múltiplas imagens de referência (até 9 imagens totalizando 9 MP de entrada)
- Controle de edição: Edições em linguagem natural com precisão do código de cores hexadecimal para correspondência precisa de cores da marca
- Formatos de saída: PNG e JPEG
- Velocidade: Otimizado para iterações rápidas e fluxos de trabalho de produção com latência reduzida.
- Arquitetura: Combina o transformador de fluxo latente com um modelo de visão-linguagem (Mistral-3, parâmetros 24B) para compreensão espacial e contextual.
📊Indicadores de desempenho
- ✅ Apresenta desempenho igual ou superior em termos de agilidade e fidelidade visual em comparação com os principais modelos proprietários de edição de imagens.
- ⚡ Obtém tempos de geração mais rápidos e custos por megapixel mais baixos do que soluções de edição de alta qualidade comparáveis.
✨Principais características
- Edição com múltiplas referências: Combina e compõe perfeitamente até 9 imagens com indexação explícita para controlar com precisão os elementos de cada imagem de origem.
- Precisão da linguagem natural: Edite cenas complexas, substitua planos de fundo ou ajuste cores descrevendo as alterações em linguagem simples.
- Controle de cores hexadecimais: Utilize códigos de cores exatos para garantir consistência e precisão na identidade visual e no estilo da marca.
- Consistência estrutural: Mantém o layout original e a integridade da cena, ao mesmo tempo que aprimora texturas, iluminação e detalhes de forma realista.
- Tipografia e edição de interface do usuário: Gerencia com precisão a renderização de texto e infográficos complexos dentro de imagens.
- Edição iterativa: Permite o encadeamento de edições para uma qualidade de saída refinada ao longo de múltiplos ciclos de revisão.
💰Preços da API
$ 0,0315 / entrada MP + US$ 0,0315 / saída MP
💡Casos de uso
- 🚀 Pipelines de substituição de conteúdo e transformação de estilo de alto volume.
- 🛍️ Composição de imagens de produtos para e-commerce e aprimoramento de ativos de marca.
- 📐 Criação de protótipos de interface do usuário e correções de design digital, incluindo sinalização e infográficos.
- 🖼️ Substituição automática de fundo e inserção de objetos na produção de vídeo ou imagem.
- 🎯 Prototipagem rápida para campanhas de marketing que exigem coerência visual precisa.
💻Exemplo de código
Para obter uma referência completa da API, visite: Referências da API: Modelos de Imagem / FLUX / FLUX.2 [pro] Editar
curl -X POST https://api.aimlapi.com/image/flux-edit \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{ "model": "blackforestlabs/flux-2-pro-edit", "input_images": [ { "url": "https://example.com/image1.png", "index": 0 } ], "prompt": "Change the background to a sunny beach with palm trees and a clear blue sky." }' 🆚Comparação com outros modelos
vs Difusão Estável: FLUX.2 [pro] se destaca em edição rápida e com múltiplas referências Com precisão em linguagem natural e confiabilidade pronta para produção. A Difusão Estável, embora capaz de gerar detalhes fotorrealistas mais altos e texturas complexas por meio de redução de ruído iterativa, geralmente é mais lenta.
vs DALL·E 3: FLUX.2 [pro] ofertas recursos superiores de composição de múltiplas imagens e edição em nível de pixelO DALL·E 3 é otimizado para uso em produção com controle preciso de cores. Ele se destaca na geração criativa de texto para imagem com ampla variação estilística, mas é menos especializado em edição precisa de imagens e integração de múltiplas referências.
vs Meio da jornada: A Midjourney é conhecida pela criação de imagens artísticas e estilizadas com qualidades abstratas. FLUX.2 [pro] concentra-se em Fotorrealismo, edições detalhadas e consistência da marca., tornando-o mais adequado para aplicações comerciais e de produção.
❓Perguntas frequentes (FAQ)
P1: Para que foi projetado o FLUX.2 [pro]?
FLUX.2 [pro] é um modelo de edição de imagens de nível profissional, desenvolvido para fluxos de trabalho de edição de imagens de alta precisão e com múltiplas referências, oferecendo qualidade e eficiência de última geração.
Q2: Quais são as principais capacidades técnicas?
Suporta resoluções de saída de até 4 MP, aceita até 9 imagens de referência de entrada e permite edições em linguagem natural com precisão de código de cores hexadecimal para um controle preciso.
P3: Como o FLUX.2 [pro] lida com edições complexas?
O modelo utiliza a precisão da linguagem natural para edições complexas de cena, substituição de fundo e ajustes de cor, juntamente com recursos como consistência estrutural e edição tipográfica, tornando as modificações complexas simples e diretas.
Q4: Quais são as principais vantagens em relação a outros modelos como Stable Diffusion ou DALL·E 3?
O FLUX.2 [pro] destaca-se pela velocidade, composição de imagens com múltiplas referências, edição ao nível do pixel e manutenção da consistência da marca, tornando-o superior para tarefas de edição de imagem precisas e de nível de produção, em comparação com o foco criativo mais amplo do DALL·E 3 e do Midjourney, ou com o processo iterativo mais lento do Stable Diffusion.
Q5: Quais são os casos de uso comuns para esta API?
As principais aplicações incluem transformação de conteúdo em grande volume, aprimoramento de imagens para comércio eletrônico, criação de protótipos de interface do usuário, substituição automatizada de planos de fundo e prototipagem rápida para campanhas de marketing.
Playground de IA



Conecte-se