Decoded©

  • Stack data : Qu’est-ce que c’est ? Pourquoi est-ce important ?

    Souvent perçues comme l’or du 21ème siècle, les données figurent parmi les ressources les plus précieuses des entreprises (et même de l’économie globale). Mais ces informations ne sont pas toujours compréhensibles et exploitables. Avant d’apporter de la valeur grâce aux données, les experts data utilisent de nombreux outils et technologies. C’est le stack data.

    Lire la suite
  • Streaming Data : Tout comprendre sur le flux continu de données

    Le Streaming Data consiste à collecter et analyser les données en flux continu en temps réel. Découvrez tout ce que vous devez savoir sur cette approche moderne, ses avantages et les problématiques qu’elle permet de résoudre !

    Lire la suite
  • 5 fonctions de Scikit-learn indispensables à connaître

    Avant de vous faire découvrir ses fonctions utiles, rappelons-nous ce qu’est Scikit-learn et dans quel cas l’utiliser. Scikit-Learn est une bibliothèque Python destinée au Machine Learning, pour l’apprentissage supervisé ou non supervisé. Elle offre également la possibilité d’analyser des modèles avec les moyens statistiques.

    Lire la suite
  • Teradata : Tout savoir sur cette solution Big data incontournable

    Grâce à son architecture massivement parallèle, Teradata permet de gérer d’énormes volumes de données. Et ce, avec une efficacité inédite puisque la plateforme ajoute régulièrement des fonctionnalités avancées qui permettent de pousser l’analyse à un autre niveau. Découvrez le système Teradata, ses formules et ses avantages.

    Lire la suite
  • L’algorithme de Kruskal : Qu’est ce que c’est ? Quel est son but ?

    Permettant d’optimiser les connexions au sein d’un réseau, l’algorithme de Kruskal figure parmi les concepts incontournables en Machine Learning. Découvrez son fonctionnement et son intérêt au quotidien.

    Lire la suite
  • Avis sur Jedha : Quelles différences avec Liora ?

    Découvrez les différences majeures entre les formations proposées par Liora et Jedha. Des niveaux de certification aux modalités d’apprentissage en passant par les avis des apprenants, faites un choix éclairé pour votre parcours en science des données.

    Lire la suite
  • Data Vault : qu’est-ce que c’est ? quels sont les avantages ?

    Le Data Vault est une approche innovante de gestion de données, offrant une méthode flexible et évolutive pour la modélisation. Découvrez tout ce qu’il faut savoir, et comment apprendre à maîtriser les différentes formes de stockage de données !

    Lire la suite
  • L’apprentissage auto-supervisé : Qu’est-ce que c’est ? Comment ça marche ?

    Dans son article de recherche publié en mars 2021, Yann LeCun, vice-président et scientifique en chef de l’intelligence artificielle chez Facebook, décrit l’apprentissage auto-supervisé comme “l’un des moyens les plus prometteurs de construire des machines dotées de connaissances de base, ou de “bon sens”, pour s’attaquer à des tâches qui dépassent de loin les capacités de l’IA d’aujourd’hui”.

    Lire la suite
  • Comment fonctionne l’algorithme de recommandation de Netflix ?

    Arrivé en France en 2014, Netflix est l’un des services de streaming les plus appréciés des français. Pour séduire ses abonnés, le service de streaming repousse constamment les limites de son système de recommandation avec de nouvelles technologies, notamment la Data Science. Une récente étude montre le fonctionnement de l’algorithme de ce système et le raisonnement qui le pousse à proposer un contenu plutôt qu’un autre.

    Lire la suite
  • Time Power Query : Tout sur les fonctions de données temporelles

    Les fonctions « Time » de Power Query sont très utiles pour manipuler les données temporelles. Découvrez tout ce que vous devez savoir sur ces différentes fonctions, et comment apprendre à les utiliser !

    Lire la suite
  • Backpropagation : Définition, usage sur les réseaux de neurones

    Il s’agit d’un outil essentiel des applications de deep learning. C’est grâce à la backpropagation qu’un algorithme prédictif va pouvoir être amélioré en permanence, éliminant toujours davantage les taux d’erreur.

    Lire la suite
  • Préprocessing: Qu’est-ce que c’est ? Comment ça marche ?

    La multiplication de l’acquisition de données et leur traitement systématique a permis l’essor des méthodes de machine learning nécessitant de nombreuses données pour tourner et s’entraîner. Bien que l’on puisse naïvement penser qu’il suffit d’un grand nombre de données pour avoir un algorithme performant, les données dont nous disposons sont la plupart du temps non adaptées et il faut la plupart du temps les traiter préalablement pour pouvoir ensuite les utiliser : c’est l’étape de preprocessing.

    Lire la suite