Decoded©

  • Reverse ETL : Qu’est-ce c’est ? À quoi ça sert ?

    Si les données brutes se multiplient, les organisations doivent les transformer pour pouvoir exploiter les données disponibles et créer de la valeur. Traditionnellement, les entreprises suivaient le processus ETL pour traiter les données. Mais depuis quelques années, ce modèle change pour laisser place au reverse ETL. Alors de quoi s’agit-il ? Quelles sont les différences entre les deux méthodes ? Et quels sont les avantages du reverse ETL ? Les réponses sont dans cet article.

    Lire la suite
  • SQL ROWCOUNT : Tout savoir sur les formules SQL

    Les bases de données SQL comptent généralement plusieurs centaines, voire plusieurs milliers de lignes. Mais bien souvent, les modifications, sélections, mises à jour et autres instructions ne concernent que quelques lignes. Pour savoir précisément combien de lignes ont été affectées par vos différentes opérations, il est possible d’utiliser SQL ROWCOUNT. Décryptage.

    Lire la suite
  • Mistral AI dévoile son premier modèle multimodal, en open source

    Le 11 septembre 2024, Mistral AI, jeune entreprise française spécialisée dans l’intelligence artificielle, a discrètement annoncé le lancement de Pixtral 12B, son premier modèle multimodal capable de traiter à la fois du texte et des images. Ce modèle, désormais disponible en open source sous licence Apache 2.0, peut être téléchargé via un lien torrent. Avec Pixtral 12B, Mistral AI s’inscrit dans la lignée des grands acteurs de l’IA, en proposant une solution ouverte et accessible à la communauté des développeurs.

    Lire la suite
  • R-CNN (Region Based Convolutional Network) : tout sur ce modèle de Machine Learning

    Comment enseigner à un ordinateur la reconnaissance d’éléments dans une image ? Ce problème a fait l’objet de vastes recherches. L’apparition de R-CNN a constitué une étape majeure en la matière.

    Lire la suite
  • Power Query : Comment fonctionne la gestion des erreurs ?

    #NULL!, #REF!, #DIV/0!, N/A …. Les tableaux de données contiennent régulièrement des erreurs limitant l’analyse des données. Heureusement, il est possible de les corriger à travers une bonne gestion des erreurs dans Power Query. Liora vous explique justement comment faire.

    Lire la suite
  • Fonctionnalités de Dataiku : Quelles sont les plus utilisées ?

    Découvrez les différentes fonctionnalités de Dataiku, pour saisir tout le potentiel du Data Science Studio. À travers ce dossier, vous comprendrez pourquoi cette plateforme est devenue incontournable pour les Data Scientists !

    Lire la suite
  • Comment fusionner des cellules sur Excel ?

    Pour traiter les données, Microsoft Excel reste l’outil incontournable. Avec ses multiples fonctionnalités, il facilite la préparation et la lecture des jeux de données. Et parmi les fonctions à maîtriser, il y a évidemment la fusion de cellules.

    Lire la suite
  • AI Hallucinations : Qu’est-ce qu’est ? Quelles conséquences ?

    L’erreur est humaine, dit-on ! Mais pas seulement. Les machines intelligentes peuvent aussi se tromper. On parle alors d’hallucinations de l’AI. De quoi s’agit-il ? Quelles sont les causes ? Les conséquences ? Et surtout, comment prévenir les AI hallucinations ? Liora répond à vos questions.

    Lire la suite
  • Claude 4 : le nouveau modèle d’Anthropic capable de travailler en totale autonomie

    Le 22 mai 2025, Anthropic a présenté Claude 4, une nouvelle génération de modèles d’intelligence artificielle conçus pour améliorer l’autonomie et les capacités de raisonnement sur des tâches longues et complexes. Cette nouvelle version comprend deux variantes principales : Claude Opus 4, destiné aux tâches de codage avancé, et Claude Sonnet 4, optimisé pour des usages plus généralistes.

    Lire la suite
  • Fonction Read_SQL sur Pandas : Comment ça fonctionne ?

    Pour gérer et analyser les données fonctionnelles, les experts data peuvent utiliser une grande variété d’outils. Et notamment SQL ou Panda.

    Lire la suite
  • La loi de puissance : comprendre les relations entre les variables

    Et si tout était lié ? Alors peut-être pas tout. Mais une grande partie des phénomènes naturels. C’est en tout cas ce que révèle la loi de puissance. Ce concept mathématique établit des relations dynamiques entre les variables qui ne suivent pourtant pas les mêmes modèles. Découvrez plus en détail cette loi.

    Lire la suite
  • PostgreSQL : Qu’est-ce que c’est ? Comment ça fonctionne ?

    De nos jours, les besoins en stockage de données sont évolutifs et en constante croissance. Pour cela, plusieurs solutions de Système de Gestion de Base de Données (SGBD) existent. Certaines sont très populaires, comme MySQL, et d’autres solutions moins connues du grand public sont davantage prisées par les professionnels. C’est le cas de PostgreSQL, un système de gestion de base de données relationnelle orienté objet (SGBDRO), robuste, open source et capable de prendre en charge en toute fiabilité des gros volumes de données, en offrant des performances optimales.

    Lire la suite