Tutoriel GPT-5.4 : Maîtrisez l’automatisation de bureau par IA en seulement 5 minutes (API complète + guide Playwright)
Tutoriel sur le contrôle informatique natif GPT-5.4
Maîtrisez l'automatisation de bureau par IA en 5 minutes — Guide complet de l'API et des dramaturges
OpenAI vient de tomber GPT-5.4 — introduction utilisation native de l'ordinateur qui change fondamentalement la donne en matière d'automatisation.
Pour la première fois, une IA à usage général peut voir votre écran, alors cliquer, taper, faire défiler et glisser Tout comme un humain — aucun plugin requis.
Sur le benchmark OSWorld, il obtient un score 75,0%, surpassant les experts humains.
Exemple : demandez-lui d’ouvrir Chrome, de trouver une facture et de répondre ; il le fera. fais-le.
Ce que vous apprendrez
- Activer le contrôle de l'ordinateur dans ChatGPT
- Configuration de l'API et de Playwright prête pour la production
- Cas d'utilisation concrets + conseils de sécurité
Comment ça marche (La boucle)
- Donnez une tâche
- Analyser la capture d'écran
- Actions de retour
- Exécuter des actions
- Répéter jusqu'à ce que ce soit terminé

Étape 1 : Démo instantanée
- Rendez-vous sur chatgpt.com
- Sélectionnez GPT-5.4 Thinking
- Demandez-lui de faire une recherche sur Google.

Étape 2 : Configuration de l’API
Prérequis
- Clé API
- Python 3.10+
- pip installer openai playwright
- dramaturge installer chromium
Code fonctionnel complet
from openai import OpenAI from playwright.sync_api import sync_playwright import base64 client = OpenAI( api_key="votre-clé", base_url="https://api.ai.cc/v1" ) def capture(page): return base64.b64encode(page.screenshot()).decode() with sync_playwright() as p: browser = p.chromium.launch(headless=False) page = browser.new_page() page.goto("https://example.com") response = client.responses.create( model="gpt-5.4", tools=[{"type": "computer"}], input="Rechercher les dernières actualités IA" ) while True: call = next((x for x in response.output if x.type="computer_call"), None) if not call: break for act in call.actions: if act.type="click": page.mouse.click(act.x, act.y) elif act.type="type": page.keyboard.type(act.text) response = client.responses.create( model="gpt-5.4", previous_response_id=response.id, tools=[{"type":"computer"}], input=[{ "type":"computer_call_output", "call_id":call.call_id, "output":{ "type":"computer_screenshot", "image_url":"data:image/png;base64,"+capture(page) } }] ) Cas d'utilisation
- Automatisation du marketing
- Extraction de prospects commerciaux
- Tests Web
- rapports financiers
Règles de sécurité
- Utiliser des environnements isolés
- Exiger une confirmation pour les actions risquées
- Surveiller l'utilisation
Tarification
- ChatGPT Plus : 20 $/mois
- API OpenAI : tarification standard
- ai.cc : une alternative moins coûteuse
FAQ
Puis-je l'utiliser sans coder ? Oui, mais de façon limitée.
ai.cc est-il la même chose qu'OpenAI ? API compatible, moins chère.
Mieux que Claude ? Score de référence plus élevé.
Copiez le code, exécutez-le en quelques minutes et laissez l'IA faire le travail.


Se connecter













