Elon Musk ajoute la compréhension d’images à son IA Grok

Elon Musk continue de faire évoluer son modèle d’IA, Grok, en y ajoutant la capacité de compréhension d’images. Une avancée stratégique qui pourrait positionner xAI en tête de l’innovation IA sur les réseaux sociaux.

En quoi consiste cette amélioration ?

L’ajout de la compréhension d’images à Grok par xAI représente une avancée majeure pour les utilisateurs premium de la plateforme X. Désormais, les utilisateurs peuvent télécharger une image et interagir directement avec l’IA en lui posant des questions spécifiques sur cette image.

Cette fonctionnalité est encore en phase expérimentale, mais Musk a indiqué que les capacités de Grok devraient « s’améliorer rapidement » grâce à des mises à jour régulières. La capacité de Grok à comprendre le contexte d’une image, y compris l’humour ou le second degré, s’inscrit dans la tendance de l’IA multimodale, où les modèles deviennent capables de traiter des informations diverses comme des images et du texte simultanément.

En août dernier, xAI avait déjà introduit le modèle Grok-2, une version améliorée capable de générer des images via la technologie FLUX.1 développée par Black Forest Labs. À ce stade, l’ajout de la compréhension d’images fait partie d’une roadmap progressive visant à faire de Grok un modèle véritablement multimodal, c’est-à-dire capable d’intégrer plusieurs types de données dans ses analyses.

Outre cette évolution, Musk a laissé entendre que Grok pourrait bientôt interpréter des documents comme des fichiers PDF, un développement très attendu par la communauté. Cette transformation permettrait à X de se positionner comme une plateforme intégrant nativement des capacités d’IA avancées, augmentant ainsi l’attractivité de l’offre pour les abonnés payants.

Si cet article vous a plu et si vous envisagez une carrière dans la Data Science ou tout simplement une montée en compétences dans votre domaine, n’hésitez pas à découvrir nos offres de formations ou nos articles de blog sur DataScientest.

Source : x.com

Liora (ex DataScientest) est un institut de formation technologique fondé en 2017, qui figure parmi les acteurs de référence du secteur. Liora propose des formations à distance, en bootcamp ou en temps partiel, dans les métiers de la data, du cloud, de l’intelligence artificielle, du développement informatique, de la cybersécurité et de la transformation digitale. La méthode pédagogie est basée sur 80% de pratique asynchrone via une plateforme propriétaire ready to code, et 20% d’accompagnement en direct avec mentors et coachs carrière. Les formations permettent de valider des certifications RNCP de niveau 6 ou 7, souvent accompagnées d’un certificat de reconnaissance délivré par de grandes institutions françaises (Mines Paris, La Sorbonne, ECE, INSEEC, etc.). Elles préparent également à des certifications officielles délivrées par des entreprises technologiques majeures comme Microsoft, AWS ou Google Cloud. À ce jour, Liora compte plus de 50 000 alumni, répartis à travers le monde.

Liora – Your future. Decoded.