Decoded©

  • Apache Airflow : qu’est-ce que c’est et comment l’utiliser ?

    Apache Airflow est une plateforme de planification de flux de travail open-source, très utilisée dans le domaine de l’ingénierie des données. Découvrez tout ce que vous devez savoir au sujet de cet outil du Data Engineer : fonctionnement, cas d’usage, composants principaux… L’histoire de Apache Airflow commence en 2015, dans les bureaux de AirBnB. A […]

    Lire la suite
  • Coefficient de détermination : qu’est ce que c’est et comment s’en servir ?

    Calculé par les logiciels de statistiques, le coefficient de détermination permet de comprendre combien de variables d’un facteur peuvent être expliquées par sa relation avec un autre facteur. Définition du coefficient de détermination Dans une régression linéaire, l’objectif est de déterminer une relation linéaire entre deux jeux de données. Lorsque l’on parle de coefficient de […]

    Lire la suite
  • Random Forest : Forêt d’arbre de décision- Définition et fonctionnement

    Une Random Forest (ou Forêt d’arbres de décision en français) est une technique de Machine Learning très populaire auprès des Data Scientists et pour cause : elle présente de nombreux avantages comparé aux autres algorithmes de data. C’est une technique facile à interpréter, stable, qui présente en général de bonnes accuracies et qui peut être […]

    Lire la suite
  • Lovable : créez votre app web en discutant avec une IA

    Lovable est une plateforme IA qui permet de créer des applications complètes par simple conversation. Découvrez comment cet outil suédois bouleverse le développement, par la promesse de générer une app fonctionnelle en quelques minutes seulement ! Créer une application web ou mobile, c’est souvent le passage obligé entre une bonne idée… et un mur de […]

    Lire la suite
  • Calculer une moyenne avec Excel : Les 4 astuces indispensables

    Malgré l’apparition de multiples logiciels de traitement des données, Excel reste encore et toujours l’une des solutions les plus utilisées au sein des entreprises. À travers ses fonctions et ses formules, cet outil Microsoft simplifie la préparation, l’analyse et la visualisation des données. Et parmi les fonctions phares, il y a évidemment le calcul de […]

    Lire la suite
  • Convolutional Neural Network : Tout ce qu’il y a à savoir

    Dans cette partie, nous allons nous focaliser sur un des algorithmes les plus performants du Deep Learning : les Convolutional Neural Network (CNN) ou réseaux de neurones convolutifs en français. Ce sont des modèles de programmation puissants permettant notamment la reconnaissance d’images en attribuant automatiquement à chaque image fournie en entrée, une étiquette correspondant à sa classe […]

    Lire la suite
  • La régression linéaire avec Python : Comment ça fonctionne ?

    Algorithme incontournable en Machine Learning, la régression linéaire permet d’établir des relations entre une ou plusieurs variables. Pour mettre en pratique cet algorithme en toute simplicité, les data scientists peuvent se tourner vers les langages de programmation, et notamment Python. Alors comment utiliser la régression linéaire avec Python ? DataScientest répond à la question. Qu’est-ce […]

    Lire la suite
  • SQLite : Tout savoir sur cette base de données embarquée

    SQLite est un système de gestion de base de données léger et embarqué, qui ne requiert pas de serveur externe. Découvrez ses caractéristiques, ses avantages, ses applications et son intérêt en Data Science ! Les systèmes de gestion de bases de données sont des outils incontournables, tout particulièrement pour les professionnels de la Data Science. […]

    Lire la suite
  • Métriques en Machine Learning : Tout ce qu’il faut savoir

    Après avoir développé un modèle de Machine Learning, il est important de pouvoir évaluer ses performances, afin de mesurer son efficacité. Pour comparer de manière objective plusieurs modèles entre eux, l’utilisation des métriques est indispensable. Comprendre et savoir utiliser ces métriques est essentiel pour développer un modèle de Machine Learning efficace. Dans cet article, vous […]

    Lire la suite
  • Word2vec : NLP & Word Embedding

    Le word embedding désigne un ensemble de méthode d’apprentissage visant à représenter les mots d’un texte par des vecteurs de nombres réels. Aujourd’hui, nous allons vous présenter le 3ème volet de notre dossier NLP. Vous avez raté les premiers épisodes ? Pas de panique les voici : Cette section a pour but d’expliquer le fonctionnement […]

    Lire la suite
  • Chaîne de Markov : Qu’est-ce que c’est ? À quoi ça sert ?

    On dit qu’un modèle possède la propriété de Markov si son état à un instant T dépend uniquement de son état à l’instant T-1. Si on peut observer les états dans lesquels se trouve le modèle à chaque instant, on parle de modèle de Markov observable. Sinon, on parle de modèle de Markov caché. Dans […]

    Lire la suite
  • ANOVA (Analysis of Variance) : un outil fondamental pour l’analyse des données

    L’Analyse de la variance (analysis of variance) est une technique statistique simple et très utilisée afin d’examiner la relation entre deux (ou plusieurs) variables et notamment entre une variable explicative et une variable cible (ou dépendante). L’ANOVA nous permet de comprendre si la variable explicative influence la variable cible et comment. L’ANOVA est donc mobilisée […]

    Lire la suite