Decoded©

  • SQL DISTINCT : Comment utiliser cette requête ?

    Si la commande SELECT est l’une des plus couramment utilisées pour lire les données d’un tableau, elle présente quelques lacunes si elle est utilisée toute seule. C’est pourquoi, d’autres commandes lui sont associées. Ces combinaisons permettent ainsi d’affiner les résultats. Et notamment la commande SQL DISTINCT qui supprime les doublons au sein d’une Base de […]

    Lire la suite
  • Data Build Tool : Qu’est-ce que c’est ? À quoi ça sert ?

    Si les données permettent aux organisations de prendre des décisions éclairées, encore faut-il que les informations soient fiables. La phase de transformation est donc un enjeu de premier ordre pour les entreprises. Ces dernières doivent alors préparer et nettoyer les données disponibles pour en améliorer la qualité. Mais au vu de l’augmentation croissante des volumes […]

    Lire la suite
  • Coup de Pouce Maths : qu’est-ce qu’une dérivée ?

    La notion de dérivée est notamment très utilsée en DataScience pour l’apprentissage des modèles de machine learning. En dehors de ce que vous avez pu sûrement voir au lycée, les applications de cet outil mathématiques sont bien plus vastes et nous y reviendrons à la fin de cet article. Dans cet article, vous apprendrez d’abord […]

    Lire la suite
  • Power BI sur Mac : comment faire ?

    Power BI est une application très utilisée pour la Business Intelligence (BI). Cependant, étant une application de Microsoft, elle n’est pas initialement conçue pour les utilisateurs de Mac, ce qui rend difficile l’exécution de Power BI sur un appareil de la marque à la pomme. Qu’il s’agisse des MacBooks, iMacs, iPhone, ou iPad, la compatibilité […]

    Lire la suite
  • Data Science : définition, problématiques et cas d’usage

    La Data Science ou science des données est un vaste champ multi-disciplinaire visant à donner du sens aux données brutes. Data Science : définition, champs d’applications et limites actuelles, découvrez tout ce que vous devez savoir sur ce domaine complexe, devenu un enjeu prioritaire dans les entreprises de toutes les industries. Qu’est-ce que la Data […]

    Lire la suite
  • La régression logistique, qu’est-ce que c’est ?

    Si vous vous intéressez un tant soit peu au Machine Learning et aux problèmes de classification, vous avez déjà dû avoir affaire au modèle de régression logistique. Et pour cause ! Il s’agit d’un des modèles de Machine Learning les plus simples et interprétables qui existe, prend des données à la fois continues ou discrètes, […]

    Lire la suite
  • Test de Fisher : définition, principe et cas pratiques pour mieux l’appliquer

    Le test exact de Fisher est une méthode statistique appropriée à l’analyse des relations entre deux variables binaires dans de petits échantillons. Il existe de nombreuses situations où nous pouvons souhaiter repérer s’il existe une relation entre deux variables binaires.Imaginons par exemple un tableau avec deux colonnes. Dans la première, nous aurions la mention Homme […]

    Lire la suite
  • Les 4 types d’IA : Que sont-ils ? Quelles particularités ?

    L’intelligence artificielle évolue rapidement, mais connaissez-vous vraiment ses différentes formes ? De l’IA réactive à l’IA auto-consciente, chaque type possède des caractéristiques uniques qui transforment notre quotidien. Découvrez ici les 4 types d’intelligence artificielle, leurs applications concrètes et leurs différences essentielles. Qu’est-ce que l’intelligence artificielle (IA) ? Définition de l’intelligence artificielle L’intelligence artificielle (IA) désigne […]

    Lire la suite
  • Graph Neural Networks (GNN): qu’est-ce que c’est ?

    Les Graph Neural Networks (GNN) ou réseaux de neurones en graphes sont des réseaux de neurones particuliers utiles pour résoudre des problèmes difficiles à partir de graphes qui constituent une structure de données complexe. Découvrez ci-dessous plus de détails sur le fonctionnement, les architectures et les applications des GNN. En quoi consistent les réseaux de […]

    Lire la suite
  • Apache Airflow : qu’est-ce que c’est et comment l’utiliser ?

    Apache Airflow est une plateforme de planification de flux de travail open-source, très utilisée dans le domaine de l’ingénierie des données. Découvrez tout ce que vous devez savoir au sujet de cet outil du Data Engineer : fonctionnement, cas d’usage, composants principaux… L’histoire de Apache Airflow commence en 2015, dans les bureaux de AirBnB. A […]

    Lire la suite
  • Coefficient de détermination : qu’est ce que c’est et comment s’en servir ?

    Calculé par les logiciels de statistiques, le coefficient de détermination permet de comprendre combien de variables d’un facteur peuvent être expliquées par sa relation avec un autre facteur. Définition du coefficient de détermination Dans une régression linéaire, l’objectif est de déterminer une relation linéaire entre deux jeux de données. Lorsque l’on parle de coefficient de […]

    Lire la suite
  • Random Forest : Forêt d’arbre de décision- Définition et fonctionnement

    Une Random Forest (ou Forêt d’arbres de décision en français) est une technique de Machine Learning très populaire auprès des Data Scientists et pour cause : elle présente de nombreux avantages comparé aux autres algorithmes de data. C’est une technique facile à interpréter, stable, qui présente en général de bonnes accuracies et qui peut être […]

    Lire la suite