-
Le Big Data à la conquête du sport
Le Big Data et le sport peuvent-ils faire bon ménage ? À en croire les tendances actuelles, c’est une évidence : le monde entier collecte actuellement de la data sur le sport pour aider les équipes à améliorer leurs performances.
Lire la suite -
XGBoost, le grand gagnant des compétitions
XGBoost signifie eXtreme Gradient Boosting. Comme son nom l’indique, c’est un algorithme de Gradient Boosting. Il est codé en C++ et disponible dans à peu près tous les langages de programmations utiles en Machine Learning, tels que Python, R ou encore Julia.
Lire la suite -
Numériser des variables pour vos algorithmes de Machine Learning
Ça y est ! Le jeu de données est nettoyé! Plus de valeurs manquantes, les choix de modélisation ont été faits ! On a gardé certaines variables, on en a supprimé d’autres. Il faut maintenant réaliser la dernière étape avant de faire tourner les algorithmes de Machine Learning: adapter les variables à l’algorithme.
Lire la suite -
Comment apprendre à une IA à jouer au Snake?
Vous avez peut-être remarqué que les ordinateurs peuvent désormais apprendre automatiquement à jouer aux jeux ATARI. Ils battent les champions du monde au jeu de Go, les quadrupèdes simulés apprennent à courir et à sauter, et les robots à effectuer des tâches de manipulation complexes défiant l’état de l’art. Toutes ses avancées sont dues à l’éventail des possibilités du Reinforcement Learning.
Lire la suite -
Data x Foot : Droit de réponse
Episode 2 : L’escroc Rennais Hier, un article honteux traitant d’un modèle de prédiction du classement final de ligue 1 vous a été proposé ! Vous aurez évidemment remarqué l’absurdité de ce modèle avec la 10e place du SRFC, actuel détenteur de la Coupe de France, 3e au classement de Ligue 1, qualifié pour les […]
Lire la suite -
Data dans le foot : Jamais deux sans trois
Episode 3 : L’honnête Lyonnais Ces derniers jours deux articles traitant de football vous ont été proposés pour prédire l’issue de notre bien aimée ligue 1. J’aurais adoré donner raison au premier et son classement football manager plaçant en toute logique Lyon en seconde place. OL que dirige entre autres le génial, le charismatique JMA, son complice de toujours […]
Lire la suite -
Python ou R : Lequel choisir ?
Python ou R ? La réponse dans ce match en 5 rounds Tout d’abord, il faut bien comprendre qu’aucun langage de programmation n’est meilleur qu’un autre. Cependant, le fait que Python soit plus utilisé dans le monde universitaire et donc prédominant par la suite dans l’industrie est un avantage considérable si vous voulez vous former […]
Lire la suite -
Dataviz & Best Practice : Webinar n°1
Vous êtes déjà data scientist, data analyst ou data engineer, ou songez à le devenir ?
Lire la suite -
Python Avancé – Astuce n°1 : Les décorateurs
Lorsqu’on fait du Machine Learning en Python, on n’a pas nécessairement besoin de toutes les caractéristiques de ce langage: scikit-learn, numpy et pandas sont très bien développées et ne nécessitent pas beaucoup plus de connaissances que des bases en Programmation Orientée Objet et un peu de méthode.
Lire la suite -
Projet Data: Les 5 étapes cruciales
Débuter en data science c’est immanquablement se lancer dans la réalisation de projets qui peuvent prendre du temps. Comme tout projet il faut savoir s’organiser, prioriser les tâches et se fixer des étapes pour pouvoir en suivre l’évolution et rectifier la donne si besoin.
Lire la suite -
Intelligence Artificielle : Quelles limites ?
Connaissez vous Spot ? Un robot déployé dans les espaces verts de Singapour pour faire respecter la distanciation sociale. La nouvelle a donné du grain à moudre aux alarmistes de l’usage de l’IA sans limite . Il est vrai que l’image de ce robot se promenant entre les habitants pour les rappeler à l’ordre pourrait sortir d’un épisode de Black Mirror.
Lire la suite -
Correlation entre variables: comment mesurer la dépendance ?
En Data science, il est primordial de découvrir et quantifier à quel point deux variables sont liées. Ces relations peuvent être complexes et ne sont pas forcément visibles. Or certaines de ces dépendances affaiblissent les performances d’algorithme de Machine Learning comme des régressions linéaires. Il devient alors impératif de mieux préparer vos données.
Lire la suite
The newsletter of the future
Get a glimpse of the future straight to your inbox. Subscribe to discover tomorrow’s tech trends, exclusive tips, and offers just for our community.












