Tutorial de Controle Nativo de Computadores com GPT-5.4: Domine a Automação de Desktop com IA em Apenas 5 Minutos (API Completa + Guia do Playwright)
Tutorial de Controle Nativo por Computador GPT-5.4
Domine a automação de desktop com IA em 5 minutos — API completa + Guia do dramaturgo
A OpenAI acaba de lançar GPT-5.4 — apresentando uso nativo de computador Isso muda fundamentalmente a automação.
Pela primeira vez, uma IA de propósito geral pode veja sua tela, então Clique, digite, role e arraste. Assim como um ser humano — sem necessidade de plugins.
No teste de benchmark OSWorld, ele pontua 75,0%, superando os especialistas humanos.
Exemplo: peça para abrir o Chrome, encontrar uma fatura e responder — ele realmente fará isso. faça isso.
O que você aprenderá
- Ativar o controle do computador no ChatGPT
- API pronta para produção + configuração do Playwright
- Casos de uso reais + dicas de segurança
Como funciona (O Loop)
- Atribua uma tarefa
- Analisar captura de tela
- Ações de retorno
- Executar ações
- Repita até terminar.

Passo 1: Demonstração instantânea
- Acesse chatgpt.com
- Selecione GPT-5.4 Pensamento
- Peça para pesquisar no Google.

Etapa 2: Configuração da API
Pré-requisitos
- Chave de API
- Python 3.10+
- pip install openai playwright
- playwright instalar chromium
Código de funcionamento completo
from openai import OpenAI from playwright.sync_api import sync_playwright import base64 client = OpenAI( api_key="your-key", base_url="https://api.ai.cc/v1" ) def capture(page): return base64.b64encode(page.screenshot()).decode() with sync_playwright() as p: browser = p.chromium.launch(headless=False) page = browser.new_page() page.goto("https://example.com") response = client.responses.create( model="gpt-5.4", tools=[{"type": "computer"}], input="Search latest AI news" ) while True: call = next((x for x in response.output if x.type=="computer_call"), None) if not call: break for act in call.actions: if act.type=="click": page.mouse.click(act.x, act.y) elif act.type=="type": page.keyboard.type(act.text) response = client.responses.create( model="gpt-5.4", previous_response_id=response.id, tools=[{"type":"computer"}], input=[{ "type":"computer_call_output", "call_id":call.call_id, "output":{ "type":"computer_screenshot", "image_url":"data:image/png;base64,"+capture(page) } }] ) Casos de uso
- Automação de marketing
- Extração de leads de vendas
- Testes na Web
- Relatórios financeiros
Regras de segurança
- Utilize ambientes isolados
- Exigir confirmação para ações de risco
- Uso do monitor
Preços
- ChatGPT Plus: US$ 20/mês
- API OpenAI: preços padrão
- ai.cc: alternativa de menor custo
Perguntas frequentes
Posso usar sem programar? Sim, mas de forma limitada.
A ai.cc é a mesma coisa que a OpenAI? API compatível, mais barata.
Melhor que Claude? Pontuação de referência mais alta.
Copie o código, execute-o em minutos e deixe a IA fazer o trabalho.


Conecte-se













