Decoded©

  • 4 projets Blockchain & Data Science à découvrir

    On peut penser, de par leurs différentes approches de la donnée, que la Blockchain et les Data Sciences sont des disciplines purement indépendantes. Alors que la Blockchain est actuellement en pleine émergence, notamment avec l’engouement mondial autour des crypto-monnaies, les data sciences représentent une technologie déjà bien établie. Cependant, ces deux innovations, qui permettent de révolutionner le monde du travail et le rapport de l’humain à la technologie, ne sont pas tant éloignées que ça. Nous allons le voir plus en détail dans cet article.

    Lire la suite
  • Daniel, peux-tu me parler des environnements virtuels sur Python ?

    Daniel vous a manqué ? Ça tombe bien, à nous aussi ! Aujourd’hui, notre expert en data science qui accompagne les apprenants tout au long de leur formation répond à ces questions : À quoi sert un environnement virtuel et comment en créer un sur Python ?

    Lire la suite
  • Loi des grands nombres et vote démocratique

    Le vote démocratique est une solution à laquelle nous avons souvent recours pour prendre une décision en groupe et qui a été communément admise dans notre société. Son intérêt repose sur la loi des grands nombres, un principe mathématique qui permet d’approcher la probabilité d’un événement par la fréquence de sa réalisation. Que ce soit pour choisir un film, un restaurant ou un lieu de vacances, le vote permet de maximiser le nombre de personnes satisfaites par la décision prise. Mais est-il réellement la meilleure option à prendre lorsque l’objectif est de choisir entre deux propositions : une vraie et une fausse.

    Lire la suite
  • Apache Hive Hadoop : Le SQL au service de la prise de décision

    Le framework open-source de la principale plateforme du Big Data, Hadoop, se révèle idéal pour le stockage et le traitement de quantités massives de données. Cependant, pour l’extraction de données, cette plateforme se révèle souvent complexe, chronophage et coûteuse. C’est pourquoi, la fondation Apache a développé une nouvelle alternative. Il s’agit de Apache Hive.

    Lire la suite
  • Data Cleaning : définition, techniques, importance en Data Science

    Le Data Cleaning ou nettoyage de données est une étape indispensable en Data Science et en Machine Learning. Elle consiste à résoudre les problèmes dans les ensembles de données, afin de pouvoir les exploiter par la suite. Définitions, techniques, cas d’usage, formations…

    Lire la suite
  • Apache HBase : Guide introductif complet

    Avec la masse et la variété des données disponibles, il convient d’adapter leur gestion. Dans un environnement où règne le Big Data, l’approche appropriée consiste à distribuer le stockage des données afin de faciliter leur traitement. Pour ce faire, une nouvelle catégorie de système de gestion de base de données appelée « No-SQL » a vu le jour. HBase en fait partie.

    Lire la suite
  • PyKana – L’application de reconnaissance de caractères japonais)

    Le projet PyKana est la dernière partie de validation de quatre de nos apprenants, Raouf, Franck, Diahana et Marius du bootcamp Data Scientist de Mars 2021. Leur objectif est d’utiliser différents algorithmes de Machine et Deep Learning afin de réaliser de la reconnaissance de Kanas, des caractères japonais.

    Lire la suite
  • Generative Model ou Modèle Génératif : Tout comprendre

    Il est facile d’oublier tout ce que l’on sait du monde : on sait qu’il est composé d’environnements en 3D, d’objets qui bougent, entrent en collision, interagissent ; de personnes qui marchent, parlent et pensent ; d’écrans qui affichent des informations codées en langage sur la météo, le vainqueur d’un match de basket ou ce qui s’est passé dans le football dans le passé. Les modèles génératifs peuvent être très utiles pour exploiter ces données.

    Lire la suite
  • Adversarial Examples : Définition et importance en machine learning

    De nos jours, nous remarquons une recrudescence d’intérêt et de progrès dans les nouvelles technologies liées à l’intelligence artificielle et notamment à l’utilisation des réseaux de neurones. Nous pouvons remarquer la puissance de ceux-ci dans la classification d’images et dans la classification d’objets. À première vue, nous pouvons penser que ces réseaux de neurones sont très puissants et infaillibles. Cet article vise à comprendre les enjeux et impacts que peuvent induire les adversarial examples.

    Lire la suite
  • DevSecOps : définition, quelle différence avec DevOps ?

    Le DevSecOps est une méthodologie de développement logiciel. Elle consiste à ajouter la sécurité au cycle de développement DevOps, intégrant déjà les équipes de développeurs et les équipes opérationnelles d’ingénieurs IT. Découvrez tout ce que vous devez savoir sur cette approche : définition, avantages, meilleures pratiques, formations…

    Lire la suite
  • C.a.l.m.s DevOps : un guide pour la transformation digitale

    Afin de répondre aux besoins clients, la culture DevOps se développe au sein des entreprises. Mais celle-ci implique un changement de paradigme qu’il convient de préparer et d’implémenter de manière réfléchie. C’est justement le rôle du modèle c.a.l.m.s DevOps.

    Lire la suite
  • Apache Airflow

    Apache Airflow es una plataforma de planificación de flujos de trabajo de código abierto ampliamente utilizada en ingeniería de datos. Descubre todo lo que necesitas saber sobre esta herramienta del Data Engineer : funcionamiento, casos de uso, componentes principales, etc.

    Lire la suite