Decoded©

  • Cloudera : Qu’est-ce que c’est ? À quoi sert cette plateforme ?

    La Cloudera Data Platform est une solution complète de stockage, analyse et ingénierie de données conçue pour le multi-cloud hybride. Découvrez tout ce que vous devez savoir sur la CDP : histoire, fonctionnement, avantages, formations…

    Lire la suite
  • Google Tag Manager : Qu’est-ce que c’est ? Comment l’utiliser ?

    Les balises de suivi sont aujourd’hui un outil révolutionnaire pour les entreprises. Elles offrent un moyen de collecter et d’analyser de précieuses données sur les utilisateurs de leurs sites web. Grâce à Google Tag Manager (GTM), les entreprises ont enfin un outil gratuit qui va permettre de simplifier et de regrouper ces balises de suivi. Découvrez dans cet article les fonctionnalités principales de GTM et comment l’utiliser.

    Lire la suite
  • Alooma : Fonctionnement et avantages de cet outil integré à GCP

    Alooma est une plateforme d’intégration de données israélienne qui propose des solutions de data pipeline. Elle a été cofondée par Yoni Broyde et Yair Weinberger et rachetée par Google pour intégrer Google Cloud Platform pour la modique somme de 15 millions de dollars. Elle permet à vos équipes de données d’avoir de la visibilité et du contrôle. Elle rassemble toutes vos sources de données dans différents entrepôts de données tels que Amazon Redshift, Snowflake et BigQuery.

    Lire la suite
  • Data catalog GCP : Comment mieux gérer ses données 

    À l’heure du Big data et de la multiplication des volumes de données, les entreprises modernes ont plus que jamais besoin d’une gestion efficace de leurs données. C’est à cet instant qu’intervient le data catalog de GCP. Alors de quoi s’agit-il ? Pourquoi l’utiliser ? Comment ça fonctionne ? C’est ce que nous allons voir dans cet article.

    Lire la suite
  • Microsoft Fabric : Tout savoir sur cette plateforme cloud

    Microsoft Fabric est une solution de Data Science tout-en-un sous forme de service cloud SaaS, regroupant OneLake et de nombreux outils de stockage, ingénierie et analyse de données. Découvrez tout ce que vous devez savoir sur cette plateforme qui simplifie la vie des Data Scientists, et comment la maîtriser !

    Lire la suite
  • Databricks sur GCP : une synergie puissante

    Databricks, initialement fondé par les créateurs d’Apache Spark, est une technologie open source de traitement de données à grande échelle. Dans l’infrastructure GCP (Google Cloud Platforme), la combinaison de Databricks et de l’environnement Google offre une flexibilité, une échelle et une puissance de traitement inégalées.

    Lire la suite
  • SQL Server Data Tools : Qu’est-ce que c’est ? Comment ça fonctionne ?

    Microsoft SQL Server est l’un des SGBDR les plus utilisés par les entreprises pour ses multiples applications, telles que le traitement des transactions, la veille stratégique ou la business intelligence. Mais pour exploiter pleinement ce système de gestion de base de données, les entreprises ont besoin d’un outil client performant. C’est là qu’intervient le SQL Server Data Tools.

    Lire la suite
  • Le Big Data à la conquête du sport

    Le Big Data et le sport peuvent-ils faire bon ménage ? À en croire les tendances actuelles, c’est une évidence : le monde entier collecte actuellement de la data sur le sport pour aider les équipes à améliorer leurs performances.

    Lire la suite
  • XGBoost, le grand gagnant des compétitions

    XGBoost signifie eXtreme Gradient Boosting. Comme son nom l’indique, c’est un algorithme de Gradient Boosting. Il est codé en C++ et disponible dans à peu près tous les langages de programmations utiles en Machine Learning, tels que Python, R ou encore Julia.

    Lire la suite
  • Numériser des variables pour vos algorithmes de Machine Learning

    Ça y est ! Le jeu de données est nettoyé! Plus de valeurs manquantes, les choix de modélisation ont été faits ! On a gardé certaines variables, on en a supprimé d’autres. Il faut maintenant réaliser la dernière étape avant de faire tourner les algorithmes de Machine Learning: adapter les variables à l’algorithme.

    Lire la suite
  • Comment apprendre à une IA à jouer au Snake?

    Vous avez peut-être remarqué que les ordinateurs peuvent désormais apprendre automatiquement à jouer aux jeux ATARI. Ils battent les champions du monde au jeu de Go, les quadrupèdes simulés apprennent à courir et à sauter, et les robots à effectuer des tâches de manipulation complexes défiant l’état de l’art. Toutes ses avancées sont dues à l’éventail des possibilités du Reinforcement Learning.

    Lire la suite
  • Data x Foot : Droit de réponse

    Episode 2 : L’escroc Rennais Hier, un article honteux traitant d’un modèle de prédiction du classement final de ligue 1 vous a été proposé ! Vous aurez évidemment remarqué l’absurdité de ce modèle avec la 10e place du SRFC, actuel détenteur de la Coupe de France, 3e au classement de Ligue 1, qualifié pour les […]

    Lire la suite