Blog en vedette

Tutoriel GPT-5.4 : Maîtrisez l’automatisation de bureau par IA en seulement 5 minutes (API complète + guide Playwright)

17 mars 2026
AUTOMATISATION PAR IA • 2026

Tutoriel sur le contrôle informatique natif GPT-5.4

Maîtrisez l'automatisation de bureau par IA en 5 minutes — Guide complet de l'API et des dramaturges

OpenAI vient de tomber GPT-5.4 — introduction utilisation native de l'ordinateur qui change fondamentalement la donne en matière d'automatisation.

Pour la première fois, une IA à usage général peut voir votre écran, alors cliquer, taper, faire défiler et glisser Tout comme un humain — aucun plugin requis.

Sur le benchmark OSWorld, il obtient un score 75,0%, surpassant les experts humains.

Exemple : demandez-lui d’ouvrir Chrome, de trouver une facture et de répondre ; il le fera. fais-le.

Ce que vous apprendrez

  • Activer le contrôle de l'ordinateur dans ChatGPT
  • Configuration de l'API et de Playwright prête pour la production
  • Cas d'utilisation concrets + conseils de sécurité

Comment ça marche (La boucle)

  1. Donnez une tâche
  2. Analyser la capture d'écran
  3. Actions de retour
  4. Exécuter des actions
  5. Répéter jusqu'à ce que ce soit terminé

Étape 1 : Démo instantanée

  1. Rendez-vous sur chatgpt.com
  2. Sélectionnez GPT-5.4 Thinking
  3. Demandez-lui de faire une recherche sur Google.
La version ChatGPT est uniquement disponible en préversion. L'automatisation complète nécessite l'API.

Étape 2 : Configuration de l’API

Prérequis

  • Clé API
  • Python 3.10+
  • pip installer openai playwright
  • dramaturge installer chromium

Code fonctionnel complet

from openai import OpenAI from playwright.sync_api import sync_playwright import base64 client = OpenAI( api_key="votre-clé", base_url="https://api.ai.cc/v1" ) def capture(page): return base64.b64encode(page.screenshot()).decode() with sync_playwright() as p: browser = p.chromium.launch(headless=False) page = browser.new_page() page.goto("https://example.com") response = client.responses.create( model="gpt-5.4", tools=[{"type": "computer"}], input="Rechercher les dernières actualités IA" ) while True: call = next((x for x in response.output if x.type="computer_call"), None) if not call: break for act in call.actions: if act.type="click": page.mouse.click(act.x, act.y) elif act.type="type": page.keyboard.type(act.text) response = client.responses.create( model="gpt-5.4", previous_response_id=response.id, tools=[{"type":"computer"}], input=[{ "type":"computer_call_output", "call_id":call.call_id, "output":{ "type":"computer_screenshot", "image_url":"data:image/png;base64,"+capture(page) } }] ) 

Cas d'utilisation

  • Automatisation du marketing
  • Extraction de prospects commerciaux
  • Tests Web
  • rapports financiers

Règles de sécurité

  • Utiliser des environnements isolés
  • Exiger une confirmation pour les actions risquées
  • Surveiller l'utilisation

Tarification

  • ChatGPT Plus : 20 $/mois
  • API OpenAI : tarification standard
  • ai.cc : une alternative moins coûteuse

FAQ

Puis-je l'utiliser sans coder ? Oui, mais de façon limitée.

ai.cc est-il la même chose qu'OpenAI ? API compatible, moins chère.

Mieux que Claude ? Score de référence plus élevé.

Prêt à automatiser votre flux de travail ?

Copiez le code, exécutez-le en quelques minutes et laissez l'IA faire le travail.

Plus de 300 modèles d'IA pour
OpenClaw et agents IA

Économisez 20 % sur vos coûts