Decoded_©

Data & IA
18 février 2026
Apache Airflow : qu’est-ce que c’est et comment l’utiliser ?
Apache Airflow est une plateforme de planification de flux de travail open-source, très utilisée dans le domaine de l’ingénierie des données. Découvrez tout ce que vous devez savoir au sujet de cet outil du Data Engineer : fonctionnement, cas d’usage, composants principaux… L’histoire de Apache Airflow commence en 2015, dans les bureaux de AirBnB. A […]
Lire la suite
Data & IA
18 février 2026
Coefficient de détermination : qu’est ce que c’est et comment s’en servir ?
Calculé par les logiciels de statistiques, le coefficient de détermination permet de comprendre combien de variables d’un facteur peuvent être expliquées par sa relation avec un autre facteur. Définition du coefficient de détermination Dans une régression linéaire, l’objectif est de déterminer une relation linéaire entre deux jeux de données. Lorsque l’on parle de coefficient de […]
Lire la suite
Data & IA
18 février 2026
Random Forest : Forêt d’arbre de décision- Définition et fonctionnement
Une Random Forest (ou Forêt d’arbres de décision en français) est une technique de Machine Learning très populaire auprès des Data Scientists et pour cause : elle présente de nombreux avantages comparé aux autres algorithmes de data. C’est une technique facile à interpréter, stable, qui présente en général de bonnes accuracies et qui peut être […]
Lire la suite
Data & IA
18 février 2026
Lovable : créez votre app web en discutant avec une IA
Lovable est une plateforme IA qui permet de créer des applications complètes par simple conversation. Découvrez comment cet outil suédois bouleverse le développement, par la promesse de générer une app fonctionnelle en quelques minutes seulement ! Créer une application web ou mobile, c’est souvent le passage obligé entre une bonne idée… et un mur de […]
Lire la suite
Data & IA
18 février 2026
Calculer une moyenne avec Excel : Les 4 astuces indispensables
Malgré l’apparition de multiples logiciels de traitement des données, Excel reste encore et toujours l’une des solutions les plus utilisées au sein des entreprises. À travers ses fonctions et ses formules, cet outil Microsoft simplifie la préparation, l’analyse et la visualisation des données. Et parmi les fonctions phares, il y a évidemment le calcul de […]
Lire la suite
Data & IA
18 février 2026
Convolutional Neural Network : Tout ce qu’il y a à savoir
Dans cette partie, nous allons nous focaliser sur un des algorithmes les plus performants du Deep Learning : les Convolutional Neural Network (CNN) ou réseaux de neurones convolutifs en français. Ce sont des modèles de programmation puissants permettant notamment la reconnaissance d’images en attribuant automatiquement à chaque image fournie en entrée, une étiquette correspondant à sa classe […]
Lire la suite
Data & IA
18 février 2026
La régression linéaire avec Python : Comment ça fonctionne ?
Algorithme incontournable en Machine Learning, la régression linéaire permet d’établir des relations entre une ou plusieurs variables. Pour mettre en pratique cet algorithme en toute simplicité, les data scientists peuvent se tourner vers les langages de programmation, et notamment Python. Alors comment utiliser la régression linéaire avec Python ? DataScientest répond à la question. Qu’est-ce […]
Lire la suite
Data & IA
18 février 2026
SQLite : Tout savoir sur cette base de données embarquée
SQLite est un système de gestion de base de données léger et embarqué, qui ne requiert pas de serveur externe. Découvrez ses caractéristiques, ses avantages, ses applications et son intérêt en Data Science ! Les systèmes de gestion de bases de données sont des outils incontournables, tout particulièrement pour les professionnels de la Data Science. […]
Lire la suite
Data & IA
18 février 2026
Métriques en Machine Learning : Tout ce qu’il faut savoir
Après avoir développé un modèle de Machine Learning, il est important de pouvoir évaluer ses performances, afin de mesurer son efficacité. Pour comparer de manière objective plusieurs modèles entre eux, l’utilisation des métriques est indispensable. Comprendre et savoir utiliser ces métriques est essentiel pour développer un modèle de Machine Learning efficace. Dans cet article, vous […]
Lire la suite
Data & IA
18 février 2026
Word2vec : NLP & Word Embedding
Le word embedding désigne un ensemble de méthode d’apprentissage visant à représenter les mots d’un texte par des vecteurs de nombres réels. Aujourd’hui, nous allons vous présenter le 3ème volet de notre dossier NLP. Vous avez raté les premiers épisodes ? Pas de panique les voici : Cette section a pour but d’expliquer le fonctionnement […]
Lire la suite
Data & IA
18 février 2026
Chaîne de Markov : Qu’est-ce que c’est ? À quoi ça sert ?
On dit qu’un modèle possède la propriété de Markov si son état à un instant T dépend uniquement de son état à l’instant T-1. Si on peut observer les états dans lesquels se trouve le modèle à chaque instant, on parle de modèle de Markov observable. Sinon, on parle de modèle de Markov caché. Dans […]
Lire la suite
Data & IA
18 février 2026
ANOVA (Analysis of Variance) : un outil fondamental pour l’analyse des données
L’Analyse de la variance (analysis of variance) est une technique statistique simple et très utilisée afin d’examiner la relation entre deux (ou plusieurs) variables et notamment entre une variable explicative et une variable cible (ou dépendante). L’ANOVA nous permet de comprendre si la variable explicative influence la variable cible et comment. L’ANOVA est donc mobilisée […]
Lire la suite