Une personne utilise un smartphone dans les bureaux de Google, avec le logo Google en arrière-plan et un environnement de travail collaboratif.

Les nouveaux agents IA de Google Gemini transforment le travail à jamais

Google a lancé en février 2026 une fonctionnalité d’IA révolutionnaire qui permet à son assistant Gemini de contrôler de manière autonome des applications tierces sur les téléphones Android, accomplissant des tâches complexes comme commander de la nourriture ou réserver des trajets sans intervention de l’utilisateur. La nouvelle capacité d’« automatisation des tâches », alimentée par le modèle Gemini 3, a fait ses débuts en avant-première sur les appareils Pixel 10 et Samsung Galaxy S26, marquant un tournant fondamental dans la manière dont les utilisateurs interagissent avec leurs smartphones.

La fonctionnalité opère via des commandes vocales simples comme « Commande-moi un Uber pour le Palace of Fine Arts », amenant Gemini à lancer l’application pertinente dans une fenêtre virtuelle et à exécuter la demande de manière autonome, selon The Verge. Les utilisateurs conservent un contrôle total tout au long du processus, en voyant l’automatisation se dérouler en temps réel et en gardant la capacité d’intervenir à tout moment.

Lorsque l’IA rencontre des ambiguïtés, comme un élément de menu en rupture de stock, elle marque une pause pour demander l’avis de l’utilisateur avant de continuer. Plus important encore, bien que Gemini puisse préparer des commandes ou des réservations de trajets jusqu’à l’étape finale, il nécessite une confirmation explicite de l’utilisateur avant de soumettre des demandes ou d’autoriser les paiements, a rapporté The Verge.

Cette version préliminaire a été lancée exclusivement aux États-Unis et en Corée, disponible uniquement sur la série Pixel 10 de Google et les appareils Galaxy S26 de Samsung.

Architecture technique et vision de l’industrie

Le système met en œuvre ce que Sameer Samat, président de l’écosystème Android, a décrit à The Verge comme une « série de piles technologiques » pour interagir avec les applications. Cela inclut l’utilisation des cadres de développement officiels lorsqu’ils sont disponibles, mais plus significativement, l’IA peut naviguer de manière autonome dans des applications inconnues en analysant visuellement leurs interfaces.

Lorsqu’il n’existe aucune intégration formelle, Gemini peut « se débrouiller tout seul », a déclaré Samat à The Verge, identifiant et interagissant avec des éléments à l’écran tels que des boutons et des champs de texte pour accomplir les tâches de manière indépendante.

Cette capacité représente une réinvention fondamentale d’Android 17 en tant que « système d’intelligence » plutôt que comme une simple plateforme pour exécuter des applications, selon les commentaires de Samat à The Verge. Sa déclaration selon laquelle « Cette technologie est en train de se concrétiser » signale la détermination de Google à mener cette transformation, s’attendant à ce que les développeurs s’adaptent au nouveau paradigme piloté par l’IA.

Ce développement place Google en tête de ses concurrents, en particulier Apple, qui n’a pas annoncé de capacités comparables pour Siri en février 2026. Samsung, en tant que partenaire de lancement, poursuit une stratégie hybride en intégrant l’IA agentique de Google tout en continuant à développer son propre assistant Bixby.

Les implications plus larges pour l’écosystème mobile sont significatives. En positionnant Gemini comme intermédiaire entre les utilisateurs et les applications, Google réduit potentiellement les opportunités d’engagement direct pour des entreprises comme Uber et DoorDash, limitant leur capacité à présenter des programmes de fidélité, des promotions ou un branding unique lors des interactions, a noté The Verge.

Sources

  • The Verge

Liora (ex DataScientest) est un institut de formation technologique fondé en 2017, qui figure parmi les acteurs de référence du secteur. Liora propose des formations à distance, en bootcamp ou en temps partiel, dans les métiers de la data, du cloud, de l’intelligence artificielle, du développement informatique, de la cybersécurité et de la transformation digitale. La méthode pédagogie est basée sur 80% de pratique asynchrone via une plateforme propriétaire ready to code, et 20% d’accompagnement en direct avec mentors et coachs carrière. Les formations permettent de valider des certifications RNCP de niveau 6 ou 7, souvent accompagnées d’un certificat de reconnaissance délivré par de grandes institutions françaises (Mines Paris, La Sorbonne, ECE, INSEEC, etc.). Elles préparent également à des certifications officielles délivrées par des entreprises technologiques majeures comme Microsoft, AWS ou Google Cloud. À ce jour, Liora compte plus de 50 000 alumni, répartis à travers le monde.

Liora – Your future. Decoded.