Auteur du futur

  • Data source : Définition et détails sur leur fonctionnement

    Fake news ! Depuis quelques années, ce terme est à la mode. En cause, la fiabilité des informations. C’est justement toute l’importance des sources de données. Si dans le monde journalistique, cela renvoie à l’origine de l’information, dans le monde de la data expertise, les sources de données correspondent aux lieux de stockage qui regroupent une grande quantité d’informations. Alors qu’est-ce qu’une data source ? À quoi sert-elle ? Comment fonctionne-t-elle ? Les réponses sont ici.

    Lire la suite
  • Fine tuning vs Prompt Engineering : Quelles différences ?

    GPT-4, PaLM 2, BARD… les avancées dans le domaine de l’intelligence artificielle ne cessent de se multiplier. Et surtout, elles deviennent accessibles à tous.

    Lire la suite
  • Underfitting ou le sous-ajustement en Machine Learning

    La définition du bon modèle est primordiale pour réaliser des prédictions pertinentes en Machine Learning. Mais un mauvais ajustement des données d’apprentissage peut affecter la performance des analyses prédictives. C’est justement ce qui se passe avec l’underfitting. Alors de quoi s’agit-il ? Et comment l’éviter ? Les réponses sont ici.

    Lire la suite
  • Anthropic : redéfinir l’intelligence artificielle avec l’éthique au cœur

    Fondée par d’anciens responsables de OpenAI, fortement soutenue par Amazon, Anthropic a créé l’IA du nom de Claude. Celle-ci entend marquer sa différence avec ChatGPT ou Gemini sur des points où on ne l’attendait pas forcément.

    Lire la suite
  • Terraform : tout savoir sur l’outil d’Infrastructure as Code open source

    L’Infrastructure en tant que Code (IaC) est un concept très répandu parmi les professionnels DevOps. Il s’agit du processus de gestion et de provisionnement de l’infrastructure IT complète en utilisant des fichiers de définition lisibles par les machines. On applique donc une approche d’ingénierie logicielle aux opérations. Ceci aide à automatiser l’intégralité du Data Center grâce à des scripts de programmation. Toutefois, l’Infrastructure as Code implique de nombreux défis. L’usage du code informatique est nécessaire, et les changements ne peuvent pas être suivis. L’impact des changements est imprévisible, et il peut être difficile de les inverser. En outre, les ressources ne peuvent être automatisées. Afin de relever ces défis, HashiCorp a développé Terraform. Découvrez tout ce que vous devez savoir sur cet outil.

    Lire la suite
  • Algorithme de Dijkstra : comment trouver le plus court chemin ?

    La théorie des graphes est une branche des mathématiques et de l’informatique qui consiste à modéliser différents problèmes de la vie réelle sous forme de graphes. L’une des utilisations les plus classiques est la modélisation d’un réseau routier entre différentes villes. L’une des problématiques principales étant l’optimisation des distances entre deux points. Pour trouver le plus court chemin , on utilise souvent l’algorithme de Dijkstra. Revenons sur son fonctionnement dans cet article Voyons un exemple (tiré de Wikipedia) :

    Lire la suite
  • Pylint : Qu’est-ce que c’est ? À quoi ça sert ?

    Dans cet article, découvrez l’univers de Pylint pour transformer votre façon de programmer. Que vous soyez un développeur chevronné ou un débutant passionné, Pylint est votre allié pour améliorer la qualité de votre code.

    Lire la suite
  • Requests : tout savoir sur la bibliothèque Python de requête HTTP

    Dans le domaine de la programmation, une bibliothèque est une collection ou une sélection préconfigurée de routines, de fonctions et d’opérations pouvant être utilisées par un programme. Ces éléments sont souvent considérés comme des modules et stockés dans un format d’objet. Les bibliothèques sont importantes, car il suffit de charger un module pour profiter de tous ses avantages sans avoir besoin d’établir un lien explicite avec chaque programme associé. Ces outils sont réellement indépendants. Le langage Python regroupe plusieurs bibliothèques dédiées à la Data Science, ce qui en fait le langage de prédilection pour cette discipline. En guise d’exemples, on peut citer NumPy, Pandas ou encore Requests.

    Lire la suite
  • Hugging Face Transformers : l’API au service du NLP

    Depuis des années, l’IA suscite un intérêt grandissant avec les performances obtenues grâce à l’apprentissage automatique (Machine Learning) et, plus particulièrement, avec l’apprentissage profond (Deep Learning).

    Lire la suite
  • Gensim : La bibliothèque Python pour le topic modelling

    Gensim est une bibliothèque Open Source de traitement de langage naturel (NLP) en Python dont le but est de rendre la modélisation de sujet (topic modelling) aussi facile d’accès et efficace que possible.

    Lire la suite
  • Apache Flume : Qu’est-ce que c’est ? À quoi ça sert ?

    Toutes les entreprises, quel que soit leur taille ou leur secteur d’activité, utilisent des fichiers logs pour enregistrer l’ensemble des événements qui se déroulent sur le web serveur. Mais à l’heure du tout digital, ces événements sont de plus en plus nombreux. Les logs stockent alors une quantité de données exponentielle. Pour traiter toutes ces données, les administrateurs réseau et les DevOps ont besoin d’outils performants. C’est à cet instant qu’intervient Apache Flume. De quoi s’agit-il ? Ses avantages et ses inconvénients ? Découvrez toutes les réponses dans cet article.

    Lire la suite
  • Statsmodels : Tout savoir sur la bibliothèque Python

    Si vous avez déjà cherché à modéliser des séries temporelles vous avez sûrement entendu parler des modèles ARMA ou ARIMA. En Python la bibliothèque la plus utilisée pour cela est statsmodels. Dans cet article nous allons vous présenter rapidement les usages de statsmodels et quelques exemples d’utilisation.

    Lire la suite