Decoded©

  • DataDays #3 : Comment la data science peut-elle résoudre les problèmes environnementaux ?

    Alors que les dirigeants mondiaux se réunissent pour la COP26 à Glasgow en Ecosse, DataScientest accueillait pour le DataDays #3, FarmPyStep et Nébula, deux projets data visant à mieux comprendre l’évolution du climat et à évaluer notre impact environnemental. Retour sur deux projets innovants et bénéfiques pour l’environnement.

    Lire la suite
  • Le Data Poisoning: une menace pour les modèles de Machine Learning

    Parmi les nombreuses attaques informatiques qui existent et qui s’attaquent aux systèmes informatiques, le Data Poisoning se caractérise par la falsification des données d’entraînement des modèles de Machine Learning. Qu’est-ce que cela signifie ? Est-ce que cela représente un réel danger ? Voici un petit aperçu de cette attaque particulière, des menaces qui en découlent et moyens de s’en défendre.

    Lire la suite
  • Imageio : la bibliothèque Python dédiée aux données d’images

    Imageio est une bibliothèque Python dédiée aux données d’images. Découvrez tout ce qu’il y a à savoir pour maitriser Imageio : fonctionnement, commandes, installation, formations…

    Lire la suite
  • Machine Learning et Voyage : une aubaine pour le secteur

    Vous n’êtes toujours pas convaincu que le Machine Learning et l’intelligence artificielle sont présents dans notre quotidien, même lors de l’organisation de nos voyages ? Cet article vous fera changer d’avis.

    Lire la suite
  • Adversarial Training : qu’est-ce que c’est ?

    Depuis les années 2010, grâce aux progrès du Machine Learning et notamment du Deep Learning avec les réseaux neuronaux profonds, les erreurs sont devenues de plus en plus rares. Aujourd’hui elles sont même très exceptionnelles. Cependant, ces modèles continuent parfois de se tromper, sans que les chercheurs réussissent à développer des systèmes de défense efficaces.

    Lire la suite
  • Gouvernance des données en entreprise : Comment faire ?

    La mise en place d’une gouvernance des données, bien qu’incontournable pour examiner la production et l’efficacité d’une entreprise, peut parfois relever du défi. Il existe pourtant des processus clairs pour permettre aux collaborateurs d’utiliser au mieux les données à leur disposition et optimiser la prise de décision des dirigeants.

    Lire la suite
  • Data Quality : Pourquoi est-elle si importante ?

    Depuis l’explosion du big data, de grands volumes de données ont été récoltés par les entreprises du numérique. Cependant, comme le dit l’expression célèbre dans le milieu de l’informatique : Garbage In, Garbage Out, les informations qu’une entreprise peut tirer des données ne sont bonnes que si les données le sont elles-mêmes. Afin de pouvoir exploiter les données correctement, il est très important de s’assurer de leur qualité et de mettre en place des stratégies de Data Quality au sein d’une entreprise.

    Lire la suite
  • Xplenty : les points clés de ce système d’intégration de données

    Le traitement, la transformation et l’intégration du Big Data peuvent compliquer les entreprises. Des facteurs tels que l’échelle, les formats de fichiers complexes, la connectivité et l’accès aux API peuvent ajouter des difficultés. Souvent, cela nécessite du codage et toute une équipe informatique pour se déployer.

    Lire la suite
  • Créer des cartes dynamiques avec uMap

    Le problème de l’édition de cartes de plus en plus dynamiques et intuitives est un enjeu majeur de la transformation numérique du XXIe siècle. Le logiciel d’édition et de partages uMap permet de satisfaire ce besoin en créant une nouvelle manière de créer des cartes, plus dynamiques et à l’utilisation active par l’utilisateur.

    Lire la suite
  • Installer Tensorflow avec Anaconda sur macOS : la marche à suivre

    Le framework TensorFlow de Google permet de distribuer les calculs informatiques entre de multiples CPU et GPU. Cette parallélisation est très utile pour accélérer l’entraînement Machine Learning, et de nombreux développeurs et Data Scientists exploitent cet outil.

    Lire la suite
  • Qu’est-ce que c’est le Predictive Modelling ?

    Quel temps fera-t-il demain ? Peut-on prévoir le cours de la bourse ? Peut-on « deviner » si un patient sera ou pas atteint d’une maladie ? Comment faire pour mieux comprendre le comportement des clients afin de leur proposer une offre adaptée ? Ce sont des questions auxquelles les data scientists et les statisticiens s’engagent à chercher des réponses en utilisant des méthodes de modélisation prédictive ou predictive modelling.

    Lire la suite
  • Git : Tutoriel sur le système de contrôle de versions du développeur

    Un système de contrôle de versions (version control system VSC en anglais ou encore version control manager VCM ) est un outil permettant la gestion de différentes versions d’un code source informatique.

    Lire la suite