Decoded©

  • Area charts : Définition, différences et limites de ces modèles

    Pour comparer des données et leur évolution temporelle, les area charts sont des outils précieux. Alors de quoi s’agit-il ? À quoi servent ces graphiques ? Quelles sont leurs limites ? Et les différents modèles ? Découvrez les réponses.

    Lire la suite
  • HDFS (Hadoop Distributed File System) : Qu’est-ce que c’est ?

    L’acronyme HDFS symbolise Hadoop Distributed File System. Comme son nom l’indique, HDFS est étroitement lié à l’outil Hadoop. À quoi sert HDFS ? Quel est le lien entre HDFS et Hadoop ? Comment HDFS fonctionne ? Nous allons répondre à toutes ces questions à l’aide de cet article.

    Lire la suite
  • Theano : Description et utilisation de cette bibliothèque Python

    Theano est une bibliothèque qui permet de résoudre des problèmes incluant un grand nombre de données grâce à des tableaux multi-dimensionnels. Découvrez ci-dessous en plus de détails comment accélérer vos recherches en utilisant Theano: étymologie, création, spécificités et inclusion dans la pipeline Python …

    Lire la suite
  • Altaïr : tout savoir sur cette bibliothèque de visualisation statistique

    Altaïr est l’étoile la plus brillante de la constellation de l’aigle. Mais Altaïr c’est aussi une bibliothèque de visualisation statistique qui fonctionne avec une grammaire visuelle. Découvrez dans cet article comment elle est utilisée et pourquoi elle est si prisée…

    Lire la suite
  • ggplot : Tout savoir sur la bibliothèque R de datavisualisation

    Dans cet article, nous allons explorer les concepts de base de ggplot, et découvrir comment construire un graphique avec cette bibliothèque pour présenter efficacement vos données.

    Lire la suite
  • TPOT : Tout sur cette bibliothèque Python de Machine Learning

    Avant de mettre un modèle de Machine Learning en production, il faut avant tout déterminer le modèle le plus adapté, sélectionner les paramètres optimaux etc… Ce sont des opérations redondantes qui vont s’appliquer à différents projets. Ne serait-il pas plus simple d’automatiser ces processus? C’est là qu’intervient TPOT.

    Lire la suite
  • Catastrophic Interference : Qu’est-ce que c’est ? Comment l’éviter ?

    L’interférence catastrophique ou catastrophic interference est un phénomène menant l’IA à oublier ce qu’elle a appris. Découvrez pourquoi c’est un grave problème en Machine Learning, et comment y remédier !

    Lire la suite
  • GROUP BY : Tout savoir de cette requête

    L’une des commandes SQL les plus utiles pour le Data Analyst est GROUP BY. Elle autorise, en toute simplicité, la génération de statistiques avancées à partir de catégories. Autant le dire, c’est une des 10 commandes que vous utiliserez le plus, donc autant savoir de quoi il s’agit.

    Lire la suite
  • Datalore : La plateforme de Data Science collaborative

    Afin de simplifier le travail des data scientists et data analysts, il y a datalore. Cette plateforme collaborative vous offre une assistance de codage intelligente. Mais concrètement, quelles sont ses fonctionnalités ? Découvrez-les dans cet article.

    Lire la suite
  • PyTorch Lightning : Le framework pour du scalable Deep Learning

    PyTorch Lightning est le nouveau framework qui permet de faire du Deep Learning à grande échelle. Découvrez ci-dessous les tenants et les aboutissants de cet outil.

    Lire la suite
  • cuML : Définition et utilisation en Machine Learning

    Lorsque nous faisons face à des datasets de grandes dimensions avec énormément d’observations et à des modèles de Machine Learning complexes avec beaucoup d’hyperparamètres, l’étape d’entraînement peut prendre plusieurs heures. Dans ce cas, une relation inverse entre le nombre de données et la performance du modèle se met en place. Alors pour réduire ce temps perdu à attendre l’exécution des algorithmes et éviter cette diminution de performance, cuML semble être la solution !

    Lire la suite
  • Couchbase : L’alternative de stockage de données à MongoDB

    Dans les années 80, avec l’essor des bases de données relationnelles, d’autres bases de données ont vu le jour afin de stocker des données différentes. Ces dernières sont appelées des bases de données NoSQL et servent à stocker des documents tels que des fichiers JSON. Une de ces bases de données la plus célèbre et utilisée est Couchbase.

    Lire la suite