Decoded©

  • Data Cleaning : définition, techniques, importance en Data Science

    Le Data Cleaning ou nettoyage de données est une étape indispensable en Data Science et en Machine Learning. Elle consiste à résoudre les problèmes dans les ensembles de données, afin de pouvoir les exploiter par la suite. Définitions, techniques, cas d’usage, formations…

    Lire la suite
  • Apache HBase : Guide introductif complet

    Avec la masse et la variété des données disponibles, il convient d’adapter leur gestion. Dans un environnement où règne le Big Data, l’approche appropriée consiste à distribuer le stockage des données afin de faciliter leur traitement. Pour ce faire, une nouvelle catégorie de système de gestion de base de données appelée « No-SQL » a vu le jour. HBase en fait partie.

    Lire la suite
  • PyKana – L’application de reconnaissance de caractères japonais)

    Le projet PyKana est la dernière partie de validation de quatre de nos apprenants, Raouf, Franck, Diahana et Marius du bootcamp Data Scientist de Mars 2021. Leur objectif est d’utiliser différents algorithmes de Machine et Deep Learning afin de réaliser de la reconnaissance de Kanas, des caractères japonais.

    Lire la suite
  • Generative Model ou Modèle Génératif : Tout comprendre

    Il est facile d’oublier tout ce que l’on sait du monde : on sait qu’il est composé d’environnements en 3D, d’objets qui bougent, entrent en collision, interagissent ; de personnes qui marchent, parlent et pensent ; d’écrans qui affichent des informations codées en langage sur la météo, le vainqueur d’un match de basket ou ce qui s’est passé dans le football dans le passé. Les modèles génératifs peuvent être très utiles pour exploiter ces données.

    Lire la suite
  • Adversarial Examples : Définition et importance en machine learning

    De nos jours, nous remarquons une recrudescence d’intérêt et de progrès dans les nouvelles technologies liées à l’intelligence artificielle et notamment à l’utilisation des réseaux de neurones. Nous pouvons remarquer la puissance de ceux-ci dans la classification d’images et dans la classification d’objets. À première vue, nous pouvons penser que ces réseaux de neurones sont très puissants et infaillibles. Cet article vise à comprendre les enjeux et impacts que peuvent induire les adversarial examples.

    Lire la suite
  • DevSecOps : définition, quelle différence avec DevOps ?

    Le DevSecOps est une méthodologie de développement logiciel. Elle consiste à ajouter la sécurité au cycle de développement DevOps, intégrant déjà les équipes de développeurs et les équipes opérationnelles d’ingénieurs IT. Découvrez tout ce que vous devez savoir sur cette approche : définition, avantages, meilleures pratiques, formations…

    Lire la suite
  • C.a.l.m.s DevOps : un guide pour la transformation digitale

    Afin de répondre aux besoins clients, la culture DevOps se développe au sein des entreprises. Mais celle-ci implique un changement de paradigme qu’il convient de préparer et d’implémenter de manière réfléchie. C’est justement le rôle du modèle c.a.l.m.s DevOps.

    Lire la suite
  • Apache Airflow

    Apache Airflow es una plataforma de planificación de flujos de trabajo de código abierto ampliamente utilizada en ingeniería de datos. Descubre todo lo que necesitas saber sobre esta herramienta del Data Engineer : funcionamiento, casos de uso, componentes principales, etc.

    Lire la suite
  • DataDays #3 : Comment la data science peut-elle résoudre les problèmes environnementaux ?

    Alors que les dirigeants mondiaux se réunissent pour la COP26 à Glasgow en Ecosse, DataScientest accueillait pour le DataDays #3, FarmPyStep et Nébula, deux projets data visant à mieux comprendre l’évolution du climat et à évaluer notre impact environnemental. Retour sur deux projets innovants et bénéfiques pour l’environnement.

    Lire la suite
  • Le Data Poisoning: une menace pour les modèles de Machine Learning

    Parmi les nombreuses attaques informatiques qui existent et qui s’attaquent aux systèmes informatiques, le Data Poisoning se caractérise par la falsification des données d’entraînement des modèles de Machine Learning. Qu’est-ce que cela signifie ? Est-ce que cela représente un réel danger ? Voici un petit aperçu de cette attaque particulière, des menaces qui en découlent et moyens de s’en défendre.

    Lire la suite
  • Imageio : la bibliothèque Python dédiée aux données d’images

    Imageio est une bibliothèque Python dédiée aux données d’images. Découvrez tout ce qu’il y a à savoir pour maitriser Imageio : fonctionnement, commandes, installation, formations…

    Lire la suite
  • Machine Learning et Voyage : une aubaine pour le secteur

    Vous n’êtes toujours pas convaincu que le Machine Learning et l’intelligence artificielle sont présents dans notre quotidien, même lors de l’organisation de nos voyages ? Cet article vous fera changer d’avis.

    Lire la suite