Hugging Face ? : Tout ce qu’il faut savoir sur cette startup IA

Hugging Face est une entreprise fournissant des bibliothèques open source contenant des modèles pré-formés. Spécialisé dans le machine learning, Hugging Face a su développer son activité avec plusieurs produits innovants basés sur l’IA. Aujourd’hui, l’entreprise entend devenir le « GitHub du machine learning ».

Qu’est-ce que Hugging Face ?

Hugging Face est une startup française créée en 2015 par Julien Chaumond et Clément Delangue. Leur objectif : rendre l’intelligence artificielle accessible à tous.

Pour cela, Hugging Face propose une librairie NLP (Natural language Processing) open-source. C’est-à-dire qu’ils offrent à leurs clients une API facilitant l’accès à des modèles pré-entraînés. Comme ces modèles de machine learning sont déjà entraînés, leur apprentissage et expérimentation sont simplifiés. En prime, ils proposent aussi des outils pour la gestion des données et des modèles existants, le développement et l’entraînement de nouveaux modèles.

Depuis ses débuts, l’entreprise connaît une croissance exponentielle et est en voie de devenir l’un des référents dans le secteur de l’intelligence artificielle. En 2020, elle a d’ailleurs été nommée comme étant l’une des entreprises les plus innovantes au monde par MIT Technology Review.

Quelles sont les solutions de Hugging Face ?

Au fil des années, Hugging Face a su développer une gamme de produits innovante basée sur l’IA. Découvrez les principaux.

La bibliothèque Transformers

Pour aider sa communauté à gérer et développer ses modèles de Machine Learning, Hugging Face propose plusieurs librairies open source. La plus connue étant Transformers, une bibliothèque conçue pour entraîner et déployer des modèles NLP basés sur Python. Ils peuvent alors réaliser une variété de tâches relatives au traitement du langage naturel, comme la classification, la génération de texte, la détection d’entités nommées, l’extraction d’informations, la réponse aux questions…

Pour réaliser toutes ces tâches, Tranformers fonctionne grâce à l’entraînement à l’inférence. 

  • L’entraînement est la méthode traditionnellement utilisée en machine learning. Il suffit de présenter des données étiquetées pour que le modèle se forme progressivement. Ses performances augmentent ainsi à mesure qu’il s’entraîne.
  • De son côté, l’inférence permet de concevoir des modèles beaucoup plus avancés, puisqu’ils s’entraînent à travers des informations non étiquetées. Chaque modèle va apprendre par lui-même (toujours sur la base de références apprises en amont).

Les autres bibliothèques

En plus de Transformers, Hugging Face propose aussi sa bibliothèque Datasets permettant d’accéder à plus de 100 jeux de données NLP.  Ou encore Tokenizers qui tokenize plus de 40 langues.

Bon à savoir : en parallèle, Hugging Face propose une formation en NLP. Les utilisateurs peuvent alors se former grâce à toutes ces bibliothèques disponibles.

Accelerate

Il s’agit d’une API permettant aux développeurs et data scientists d’exécuter leurs scripts et de coder leurs propres boucles d’entraînement. Et ce, dans différents types de configuration.

Et pour faciliter l’apprentissage du NLP, Hugging Face propose aussi à ses utilisateurs un outil CLI permettant de configurer et de tester rapidement les environnements d’entraînement.

Spaces

Hugging Face s’étant développé dans une véritable stratégie communautaire, elle propose aussi l’hébergement de modèles. Plus précisément, une zone d’échange où les membres de la communauté partagent leurs applications de Machine Learning.

Ils peuvent alors créer directement leurs apps avec Hugging Face. Et grâce au contrôle des versions, la collaboration est simplifiée pour concevoir des modèles ML encore plus performants et innovants.

Les chatbots

Hugging Face s’est d’abord fait connaître à travers ses applications de chatbot. Il convient donc de les mentionner, même s’il ne s’agit plus de leur cœur de métier. Ces dernières ont été développées grâce au modèle de traitement du langage naturel de l’entreprise (Hierarchical Multi-Task Learning – HMTL). Parmi les applications disponibles, on retrouve Chatty>, Talking Dog, Talking Egg ou encore Boloss.

À l’origine, il s’agissait surtout de chatbots pour adolescents. Mais progressivement, Hugging Face s’est développé jusqu’à devenir une référence dans le domaine du Machine Learning.

Quel avenir pour Hugging Face ?

Si Hugging a commencé comme étant un simple chatbot pour adolescent, leur ambition va aujourd’hui bien plus loin. 

Et pour cause, depuis leur création, ils multiplient les levées de fonds. 

  • Dès 2017, ils lèvent 1,2 million de dollars en pré-seed ; 
  • En 2018, c’est 4 millions en seed ;
  • En 2019, Hugging Face lève 15 millions de dollars de financement pour une série A ; 
  • En 2021, ils passent à 40 millions pour une série B, puis 100 millions pour une série C.

 

Mais alors pourquoi faire ? Devenir le « GitHub du Machine Learning » et démocratiser l’intelligence artificielle.  Et le moins que l’on puisse dire, c’est que la mission est réussie. D’une part, la startup française est déjà utilisée par les grands noms de la tech, tels que les équipes de Google, Meta, Microsoft ou encore Intel. Ce qui prouve qu’elle fait d’ores et déjà figure de référence. 

D’autre part, Hugging Face et Amazon Web Service ont annoncé leur partenariat en février 2023. L’objectif étant d’“accélérer la disponibilité des modèles nouvelle génération de Machine Learning, en les rendant plus accessibles à la communauté et en aidant les développeurs à obtenir de meilleures performances à moindre coût”.

Développez vos connaissances en ML avec Liora

Si Hugging Face entend démocratiser l’IA, il n’en reste pas moins que le machine learning nécessite des compétences spécifiques. D’où la nécessité de se former. C’est justement possible avec Liora. À travers nos formations en science des données ou traitement du langage naturel, vous développerez toutes les connaissances pratiques et théoriques pour concevoir vos propres modèles NLP.