Decoded©

  • Reverse ETL : Qu’est-ce c’est ? À quoi ça sert ?

    Si les données brutes se multiplient, les organisations doivent les transformer pour pouvoir exploiter les données disponibles et créer de la valeur. Traditionnellement, les entreprises suivaient le processus ETL pour traiter les données. Mais depuis quelques années, ce modèle change pour laisser place au reverse ETL. Alors de quoi s’agit-il ? Quelles sont les différences entre les deux méthodes ? Et quels sont les avantages du reverse ETL ? Les réponses sont dans cet article.

    Lire la suite
  • AWS SageMaker : Guide d’utilisation de la plateforme

    Amazon SageMaker est une plateforme cloud conçue par Amazon Web Services (AWS) particulièrement utile pour la Data Science. Découvrez ci-dessous plus de détails sur les fonctionnalités principales ainsi que l’utilisation des outils de la plateforme en allant du développement d’un modèle de Machine Learning jusqu’à son déploiement.

    Lire la suite
  • Mistral AI dévoile son premier modèle multimodal, en open source

    Le 11 septembre 2024, Mistral AI, jeune entreprise française spécialisée dans l’intelligence artificielle, a discrètement annoncé le lancement de Pixtral 12B, son premier modèle multimodal capable de traiter à la fois du texte et des images. Ce modèle, désormais disponible en open source sous licence Apache 2.0, peut être téléchargé via un lien torrent. Avec Pixtral 12B, Mistral AI s’inscrit dans la lignée des grands acteurs de l’IA, en proposant une solution ouverte et accessible à la communauté des développeurs.

    Lire la suite
  • Spectral Clustering : définition, fonctionnement, utilisation

    « Data drives all we do », le slogan de Cambridge Analytica se vérifie en permanence: les données influencent et structurent nos choix, en tant que consommateurs, citoyens, politiques, entrepreneurs… Ces données sont une manne d’informations décisionnelles. À petite échelle, c’est relativement simple. Mais les experts de la data ont besoin d’outils performants pour traiter et trier […]

    Lire la suite
  • PyTorch : tout savoir sur le framework de Deep Learning de Facebook

    Le langage Python étant un des plus utilisés, il contient énormément de frameworks, et beaucoup sont développés exclusivement pour la Data Science. Dans cet article, nous allons donc vous parler en détail de l’un d’entre eux : PyTorch.

    Lire la suite
  • Administrateur de base de données : rôle et formation

    Vous êtes à l’aise dans le milieu tech et dans la gestion de données ? Le métier d’administrateur de base de données est peut-être le rôle idéal à endosser. Garant d’une des ressources les plus importantes d’une entreprise, l’administrateur / administratrice de données assure la sécurité et la bonne disponibilité des informations stockées au sein des Data Base.

    Lire la suite
  • R-CNN (Region Based Convolutional Network) : tout sur ce modèle de Machine Learning

    Comment enseigner à un ordinateur la reconnaissance d’éléments dans une image ? Ce problème a fait l’objet de vastes recherches. L’apparition de R-CNN a constitué une étape majeure en la matière.

    Lire la suite
  • Code Interpreter sur ChatGPT : Comment s’en servir ?

    Vous souhaitez analyser des données, exécuter du code ou visualiser des résultats sans quitter ChatGPT ? Grâce au Code Interpreter, vous pouvez automatiser vos tâches Python les plus complexes directement dans l’interface. Découvrez comment l’activer, l’utiliser et l’exploiter pleinement pour vos projets data.

    Lire la suite
  • SQL TRIM : Découvrez comment nettoyer les espaces blancs

    SQL TRIM est une fonction dédiée à la gestion des espaces blancs au sein d’une base de données. Elle permet d’améliorer la qualité des données, et d’accroître l’efficacité des opérations. Découvrez tout ce que vous devez savoir !

    Lire la suite
  • Power Query : Comment fonctionne la gestion des erreurs ?

    #NULL!, #REF!, #DIV/0!, N/A …. Les tableaux de données contiennent régulièrement des erreurs limitant l’analyse des données. Heureusement, il est possible de les corriger à travers une bonne gestion des erreurs dans Power Query. Liora vous explique justement comment faire.

    Lire la suite
  • Réaliser de la data-visualisation grâce à Plotly

    Il est bon de savoir que Plotly, avant d’être une librairie Python très connue, est une entreprise basée à Montréal qui a été fondée par quatre personnes. Son objectif est de développer des outils de visualisation ainsi que d’analyser des données. Dans cet article, nous nous intéresserons en particulier à la librairie Python plotly.

    Lire la suite
  • Fonctionnalités de Dataiku : Quelles sont les plus utilisées ?

    Découvrez les différentes fonctionnalités de Dataiku, pour saisir tout le potentiel du Data Science Studio. À travers ce dossier, vous comprendrez pourquoi cette plateforme est devenue incontournable pour les Data Scientists !

    Lire la suite