Deux personnes dans les bureaux d'OpenAI, l'une scannant une carte d'accès tandis que l'autre se tient à proximité, avec un ordinateur affichant des statistiques à l'arrière-plan.

GPT-5.4 d’OpenAI : Pourquoi toute l’industrie panique

OpenAI a dévoilé son modèle GPT-5.4 et son ChatGPT Agent cette semaine, introduisant un système d’IA capable de piloter des ordinateurs de façon autonome pour accomplir des tâches complexes comme réserver des restaurants, analyser des concurrents et conduire des recherches. L’agent, qui opère dans un environnement virtuel et nécessite le consentement de l’utilisateur pour des actions irréversibles, incarne un tournant majeur de l’IA conversationnelle vers des systèmes autonomes, bien que les démonstrations actuelles indiquent que les tâches nécessitent 15 à 30 minutes pour être finalisées.

La technologie constitue le premier modèle polyvalent à usage général d’OpenAI doté de capacités natives de pilotage d’ordinateur, surpassant les interactions traditionnelles avec les chatbots pour atteindre ce que l’entreprise qualifie de son « most capable and efficient frontier model for professional work ». Le système opère à travers un environnement virtuel dédié à l’ordinateur, ce qui lui permet de naviguer sur des sites web, remplir des formulaires et exécuter des workflows multi-étapes de façon autonome.

Dans les démonstrations relayées par The Verge, le ChatGPT Agent a prouvé sa capacité à se connecter à Google Calendar, croiser les données d’OpenTable pour les réservations de restaurants, soumettre des demandes de stationnement au bureau et générer des diaporamas basés sur une analyse de la concurrence. L’agent emploie à la fois des navigateurs textuels et visuels, ce qui lui permet de traiter le contenu web via plusieurs modalités. Selon The Verge, les tâches complexes demandent actuellement 15 à 30 minutes pour être accomplies, OpenAI privilégiant la bonne exécution des tâches plutôt que l’optimisation de la vitesse.

Barrières de sécurité et limites

OpenAI a instauré plusieurs couches de sécurité pour gérer les risques liés au contrôle autonome d’ordinateurs. Le système exige le consentement explicite de l’utilisateur avant d’exécuter des actions irréversibles, comme l’envoi d’e-mails ou la confirmation de réservations, selon des informations rapportées par The Verge. Les transactions financières demeurent limitées « pour l’instant », a déclaré l’entreprise.

Lors de l’accès à des sites sensibles tels que des portails financiers, l’agent active un « Watch Mode » qui contraint les utilisateurs à rester sur l’onglet. Si les utilisateurs naviguent ailleurs, l’agent cesse automatiquement son activité comme une mesure de protection. OpenAI a également activé des protocoles de sécurité préventifs initialement conçus pour des « high biological and chemical capabilities« , bien que l’entreprise note qu’il n’existe aucune preuve directe que le modèle pourrait aider des novices à créer un tel danger.

Le paysage concurrentiel évolue rapidement alors que les grands groupes technologiques se précipitent pour développer des capacités similaires. Google fait avancer son modèle Gemini 3 avec une forte capacité native de contrôle d’ordinateur, tandis que Anthropic cible les clients d’entreprise avec Claude 3.5v2, doté de plugins spécialisés pour les domaines de la finance, du droit et du marketing. Microsoft poursuit une approche différente avec son modèle Fara-7B, conçu pour être exécuté localement sur des appareils afin d’améliorer la confidentialité et la sécurité, selon Microsoft Research.

Cette transition vers des systèmes d’IA agentique soulève des questions fondamentales sur la responsabilité, la confidentialité des données et la gouvernance d’entreprise à mesure que les sociétés se préparent à intégrer des agents autonomes dans leurs flux de travail. L’émergence de la technologie marque un moment charnière dans le développement de l’IA, transformant l’intelligence artificielle d’un outil qui assiste vers un outil qui agit.

Sources

  • The Verge
  • TechCrunch
  • Microsoft Research Blog

Liora (ex DataScientest) est un institut de formation technologique fondé en 2017, qui figure parmi les acteurs de référence du secteur. Liora propose des formations à distance, en bootcamp ou en temps partiel, dans les métiers de la data, du cloud, de l’intelligence artificielle, du développement informatique, de la cybersécurité et de la transformation digitale. La méthode pédagogie est basée sur 80% de pratique asynchrone via une plateforme propriétaire ready to code, et 20% d’accompagnement en direct avec mentors et coachs carrière. Les formations permettent de valider des certifications RNCP de niveau 6 ou 7, souvent accompagnées d’un certificat de reconnaissance délivré par de grandes institutions françaises (Mines Paris, La Sorbonne, ECE, INSEEC, etc.). Elles préparent également à des certifications officielles délivrées par des entreprises technologiques majeures comme Microsoft, AWS ou Google Cloud. À ce jour, Liora compte plus de 50 000 alumni, répartis à travers le monde.

Liora – Your future. Decoded.