-
Daniel, peux-tu me parler des environnements virtuels sur Python ?
Daniel vous a manqué ? Ça tombe bien, à nous aussi ! Aujourd’hui, notre expert en data science qui accompagne les apprenants tout au long de leur formation répond à ces questions : À quoi sert un environnement virtuel et comment en créer un sur Python ?
Lire la suite -
Loi des grands nombres et vote démocratique
Le vote démocratique est une solution à laquelle nous avons souvent recours pour prendre une décision en groupe et qui a été communément admise dans notre société. Son intérêt repose sur la loi des grands nombres, un principe mathématique qui permet d’approcher la probabilité d’un événement par la fréquence de sa réalisation. Que ce soit pour choisir un film, un restaurant ou un lieu de vacances, le vote permet de maximiser le nombre de personnes satisfaites par la décision prise. Mais est-il réellement la meilleure option à prendre lorsque l’objectif est de choisir entre deux propositions : une vraie et une fausse.
Lire la suite -
Apache Hive Hadoop : Le SQL au service de la prise de décision
Le framework open-source de la principale plateforme du Big Data, Hadoop, se révèle idéal pour le stockage et le traitement de quantités massives de données. Cependant, pour l’extraction de données, cette plateforme se révèle souvent complexe, chronophage et coûteuse. C’est pourquoi, la fondation Apache a développé une nouvelle alternative. Il s’agit de Apache Hive.
Lire la suite -
Data Cleaning : définition, techniques, importance en Data Science
Le Data Cleaning ou nettoyage de données est une étape indispensable en Data Science et en Machine Learning. Elle consiste à résoudre les problèmes dans les ensembles de données, afin de pouvoir les exploiter par la suite. Définitions, techniques, cas d’usage, formations…
Lire la suite -
Apache HBase : Guide introductif complet
Avec la masse et la variété des données disponibles, il convient d’adapter leur gestion. Dans un environnement où règne le Big Data, l’approche appropriée consiste à distribuer le stockage des données afin de faciliter leur traitement. Pour ce faire, une nouvelle catégorie de système de gestion de base de données appelée « No-SQL » a vu le jour. HBase en fait partie.
Lire la suite -
PyKana – L’application de reconnaissance de caractères japonais)
Le projet PyKana est la dernière partie de validation de quatre de nos apprenants, Raouf, Franck, Diahana et Marius du bootcamp Data Scientist de Mars 2021. Leur objectif est d’utiliser différents algorithmes de Machine et Deep Learning afin de réaliser de la reconnaissance de Kanas, des caractères japonais.
Lire la suite -
Generative Model ou Modèle Génératif : Tout comprendre
Il est facile d’oublier tout ce que l’on sait du monde : on sait qu’il est composé d’environnements en 3D, d’objets qui bougent, entrent en collision, interagissent ; de personnes qui marchent, parlent et pensent ; d’écrans qui affichent des informations codées en langage sur la météo, le vainqueur d’un match de basket ou ce qui s’est passé dans le football dans le passé. Les modèles génératifs peuvent être très utiles pour exploiter ces données.
Lire la suite -
Adversarial Examples : Définition et importance en machine learning
De nos jours, nous remarquons une recrudescence d’intérêt et de progrès dans les nouvelles technologies liées à l’intelligence artificielle et notamment à l’utilisation des réseaux de neurones. Nous pouvons remarquer la puissance de ceux-ci dans la classification d’images et dans la classification d’objets. À première vue, nous pouvons penser que ces réseaux de neurones sont très puissants et infaillibles. Cet article vise à comprendre les enjeux et impacts que peuvent induire les adversarial examples.
Lire la suite -
Talend, l’outil privilégié pour intégrer vos données
Talend est un éditeur de logiciel spécialisé dans l’intégration de données. Il est nommé parmi les leaders dans le Magic Quadrant Gartner 2021, pour les solutions spécialisées dans la qualité de données. Talend fournit des logiciels et services permettant l’intégration et la gestion de données, l’intégration d’applications d’entreprise, l’optimisation de la qualité des données, le stockage dans le cloud et le Big Data.
Lire la suite -
Back End : qu’est-ce que c’est et quelle importance en Data Science ?
Le back end est essentiel pour le développement web, mais aussi pour la Data Science et le Machine Learning. Découvrez tout ce que vous devez savoir à ce sujet, et comment suivre une formation dédiée.
Lire la suite -
Scatter Plot : Définition et Applications
La visualisation des données dans le monde de la data science est de nos jours au cœur de la pipeline du machine learning. La data visualization est ainsi l’une des étapes de la science des données, qui intervient juste après la collecte, le nettoyage et la normalisation des données. De nos jours, l’un des graphiques les plus utilisés est le scatter plot. Ce dernier nous permet d’analyser les données et voir les interactions entre les variables.
Lire la suite -
Music Tags Inspyrer, l’AI mélomane
Classification automatique du genre musical par un algorithme de Machine Learning L’Intelligence Artificielle commence à être bien connue pour ses capacités étonnantes et remarquables dans le domaine de la « vision par ordinateur » (classification d’images, reconnaissance faciale, …) ou le domaine du son avec la reconnaissance vocale. Qu’en est-il dans un domaine en apparence plus abstrait […]
Lire la suite
The newsletter of the future
Get a glimpse of the future straight to your inbox. Subscribe to discover tomorrow’s tech trends, exclusive tips, and offers just for our community.












