Un développeur recrée ChatGPT depuis son téléphone

Les intelligences génératives sont les technologies phares du moment. Grâce à ChatGPT leurs performances et applications se sont développées de manière exponentielle. Jugé pourtant comme un système trop gourmand et restreint, de nombreux développeurs se tournent vers d’autres alternatives. C’est à ce moment-là que le LLaMA de Meta entre en scène, permettant à des développeurs de recréer ChatGPT depuis leur Mac ou leur téléphone.

Quelles sont les critiques faites à ChatGPT ?

Depuis son lancement, beaucoup de personnes, dont Elon Musk, se disent frustrées par les limites imposées au chatbot. Ces restrictions, définies par Open AI, l’empêchent de discuter de certains sujets sensibles. D’autres se plaignent des ressources nécessaires au bon fonctionnement de son modèle NLP, jugées comme trop gourmandes. Et même si Open AI a depuis quelques semaines donné accès à ChatGPT via son API, beaucoup s’y refusent par peur de devenir dépendant. L’espoir commun se porte alors sur un modèle de langage open source que chacun pourrait utiliser à sa guise.

Pour éviter de passer par Open AI, des solutions open source existent. Elles sont néanmoins aussi gourmandes que GPT-3, la technologie derrière ChatGPT. Et celles qui ne le sont pas ne peuvent se vanter d’avoir les mêmes performances.


C’est alors qu’arrive un nouveau challenger, le LLaMA de Meta.

Quelles sont les solutions apportées par Meta ?

Le nouveau modèle de langage apporté par Meta, LLaMA, se veut tout aussi performant que ChatGPT, tout en consommant moins. Allant de 7 à 65 milliards de paramètres, bien loin des 175 milliards de ChatGPT, Meta affirme que son modèle égale GPT-3. Également en open source, Meta a tout de même choisi de garder secret les datasets d’entraînement de son modèle. Mais comme rien n’est secret sur internet, il n’a suffit que de deux jours pour que ces datasets apparaissent sur des forums.

C’est alors que les développement autour de LLaMA se sont multipliés. En quelques jours, de nombreuses optimisations visant à réduire la taille du modèle ont permis de le faire fonctionner sur un Mac M1 ou même un Google Pixel 6. Cette optimisation est vue comme très prometteuse malgré le fait que le modèle tourne un peu au ralenti.

Les experts associent cet engouement autour de ChatGPT à celui des IA de génération comme Stable Diffusion en Août 2022. Ces algorithmes avaient bouleversé les réseaux sociaux, transformant les photos de ses utilisateurs en œuvre d’art. Reste à voir quelle sera la prochaine technologie à révolutionner le monde de l’IA. C’est pourquoi, si cet article vous a plu, et si vous envisagez une carrière dans la Data Science, n’hésitez pas à découvrir nos articles ou nos offres de formations sur DataScientest.

Source : arstechnica.com

Liora (ex DataScientest) est un institut de formation technologique fondé en 2017, qui figure parmi les acteurs de référence du secteur. Liora propose des formations à distance, en bootcamp ou en temps partiel, dans les métiers de la data, du cloud, de l’intelligence artificielle, du développement informatique, de la cybersécurité et de la transformation digitale. La méthode pédagogie est basée sur 80% de pratique asynchrone via une plateforme propriétaire ready to code, et 20% d’accompagnement en direct avec mentors et coachs carrière. Les formations permettent de valider des certifications RNCP de niveau 6 ou 7, souvent accompagnées d’un certificat de reconnaissance délivré par de grandes institutions françaises (Mines Paris, La Sorbonne, ECE, INSEEC, etc.). Elles préparent également à des certifications officielles délivrées par des entreprises technologiques majeures comme Microsoft, AWS ou Google Cloud. À ce jour, Liora compte plus de 50 000 alumni, répartis à travers le monde.

Liora – Your future. Decoded.