Decoded©

  • Data catalog GCP : Comment mieux gérer ses données 

    À l’heure du Big data et de la multiplication des volumes de données, les entreprises modernes ont plus que jamais besoin d’une gestion efficace de leurs données. C’est à cet instant qu’intervient le data catalog de GCP. Alors de quoi s’agit-il ? Pourquoi l’utiliser ? Comment ça fonctionne ? C’est ce que nous allons voir dans cet article.

    Lire la suite
  • Microsoft Fabric : Tout savoir sur cette plateforme cloud

    Microsoft Fabric est une solution de Data Science tout-en-un sous forme de service cloud SaaS, regroupant OneLake et de nombreux outils de stockage, ingénierie et analyse de données. Découvrez tout ce que vous devez savoir sur cette plateforme qui simplifie la vie des Data Scientists, et comment la maîtriser !

    Lire la suite
  • Databricks sur GCP : une synergie puissante

    Databricks, initialement fondé par les créateurs d’Apache Spark, est une technologie open source de traitement de données à grande échelle. Dans l’infrastructure GCP (Google Cloud Platforme), la combinaison de Databricks et de l’environnement Google offre une flexibilité, une échelle et une puissance de traitement inégalées.

    Lire la suite
  • SQL Server Data Tools : Qu’est-ce que c’est ? Comment ça fonctionne ?

    Microsoft SQL Server est l’un des SGBDR les plus utilisés par les entreprises pour ses multiples applications, telles que le traitement des transactions, la veille stratégique ou la business intelligence. Mais pour exploiter pleinement ce système de gestion de base de données, les entreprises ont besoin d’un outil client performant. C’est là qu’intervient le SQL Server Data Tools.

    Lire la suite
  • Le Big Data à la conquête du sport

    Le Big Data et le sport peuvent-ils faire bon ménage ? À en croire les tendances actuelles, c’est une évidence : le monde entier collecte actuellement de la data sur le sport pour aider les équipes à améliorer leurs performances.

    Lire la suite
  • XGBoost, le grand gagnant des compétitions

    XGBoost signifie eXtreme Gradient Boosting. Comme son nom l’indique, c’est un algorithme de Gradient Boosting. Il est codé en C++ et disponible dans à peu près tous les langages de programmations utiles en Machine Learning, tels que Python, R ou encore Julia.

    Lire la suite
  • Numériser des variables pour vos algorithmes de Machine Learning

    Ça y est ! Le jeu de données est nettoyé! Plus de valeurs manquantes, les choix de modélisation ont été faits ! On a gardé certaines variables, on en a supprimé d’autres. Il faut maintenant réaliser la dernière étape avant de faire tourner les algorithmes de Machine Learning: adapter les variables à l’algorithme.

    Lire la suite
  • Comment apprendre à une IA à jouer au Snake?

    Vous avez peut-être remarqué que les ordinateurs peuvent désormais apprendre automatiquement à jouer aux jeux ATARI. Ils battent les champions du monde au jeu de Go, les quadrupèdes simulés apprennent à courir et à sauter, et les robots à effectuer des tâches de manipulation complexes défiant l’état de l’art. Toutes ses avancées sont dues à l’éventail des possibilités du Reinforcement Learning.

    Lire la suite
  • Data x Foot : Droit de réponse

    Episode 2 : L’escroc Rennais Hier, un article honteux traitant d’un modèle de prédiction du classement final de ligue 1 vous a été proposé ! Vous aurez évidemment remarqué l’absurdité de ce modèle avec la 10e place du SRFC, actuel détenteur de la Coupe de France, 3e au classement de Ligue 1, qualifié pour les […]

    Lire la suite
  • Data dans le foot : Jamais deux sans trois

    Episode 3 : L’honnête Lyonnais Ces derniers jours deux articles traitant de football vous ont été proposés pour prédire l’issue de notre bien aimée ligue 1. J’aurais adoré donner raison au premier et son classement football manager plaçant en toute logique Lyon en seconde place. OL que dirige entre autres le génial, le charismatique JMA, son complice de toujours […]

    Lire la suite
  • Python ou R : Lequel choisir ?

    Python ou R ? La réponse dans ce match en 5 rounds Tout d’abord, il faut bien comprendre qu’aucun langage de programmation n’est meilleur qu’un autre. Cependant, le fait que Python soit plus utilisé dans le monde universitaire et donc prédominant par la suite dans l’industrie est un avantage considérable si vous voulez vous former […]

    Lire la suite
  • Dataviz & Best Practice : Webinar n°1

    Vous êtes déjà data scientist, data analyst ou data engineer, ou songez à le devenir ?

    Lire la suite