Decoded©

  • NLP Twitter – Analyse de Sentiment

    Aujourd’hui, Twitter est utilisé par des centaines de millions de personnes dans le monde entier. Plus précisément, l’estimation actuelle s’élève à environ 330 millions d’utilisateurs actifs mensuels et 145 millions d’utilisateurs actifs quotidiens sur Twitter. Autre chiffre intéressant : 63 % des utilisateurs de Twitter dans le monde ont entre 35 et 65 ans. L’objectif de cet article est de réaliser une analyse exploratoire et visuelle des tweets présents dans notre jeu de données. Dans un second temps, le but sera de parvenir à classifier à l’aide de différents modèles disponibles en Python, les sentiments des tweets selon qu’ils soient plutôt positifs, neutres ou négatifs. Autrement dit réunir sentiment analysis et NLP.

    Lire la suite
  • AI Dungeon : l’IA au service du ludique !

    La réalisation de jeux fait partie des applications populaires des méthodes d’intelligence artificielle. 2019 a vu naitre l’un des jeux les plus intéressants qui utilisent ces méthodes : AI Dungeon.

    Lire la suite
  • La programmation python pour les nuls – Episode 4

    Table des matières: Episode 1 – Introduction –Variables –types Episode 2–Opérateurs–Boucles–Fonctions Episode 3 – Import des données –Data cleaning – Data processing Episode 4 Import des bibliothèques Python ​ Import des données Gestion des valeurs manquantes Cheat Sheet Python Pour ce dernier volet nous allons mettre en pratique les méthodes vues précédemment afin de préparer […]

    Lire la suite
  • SQL Tuto : Top 5 des méthodes les plus utiles

    Le SQL ou « Structured Query Language » est un langage de programmation aujourd’hui quasiment indispensable pour gérer des bases de données. (Retrouvez la fiche mémo SQL). Dans un monde où la donnée est une ressource à part entière, on comprend aisément pourquoi savoir utiliser ce langage est une compétence très recherchée.

    Lire la suite
  • Comment la Data Science transforme le secteur de l’aéronautique ?

    La Data Science est une véritable révolution pour l’industrie de l’aéronautique et le secteur aérien. Découvrez comment les données sont exploitées par les compagnies aériennes et les constructeurs d’avions, et pourquoi devenir Data Scientist dans ce domaine.

    Lire la suite
  • Découvrir l’Apprentissage supervisé en 5 questions

    Le domaine de l’apprentissage automatique (plus communément appelé Machine Learning) comprend des problématiques d’apprentissage supervisé, non supervisé et semi-supervisé. Si vous souhaitez en savoir plus sur le Machine Learning, notre dossier est fait pour ça. Dans cet article nous allons nous intéresser à l’une des étapes initiales du Machine Learning: l’apprentissage supervisé.

    Lire la suite
  • Top 10 des fonctions natives de Python

    Dans cet article, vous allez découvrir une dizaine de fonctions natives Python (buit-in) qui vous seront à coup sûr très utiles ! Vous démarrez en Python ?

    Lire la suite
  • Data Exploration ou exploration de données : définition, outils, formations…

    La Data Exploration ou exploration de données est la première étape de l’analyse de données. Découvrez tout ce que vous devez savoir à ce sujet, et comment acquérir les compétences nécessaires grâce aux formations DataScientest.

    Lire la suite
  • MPG, le foot dans toute sa data

    Connaissez vous MPG ? C’est un jeu en ligne permettant à différents joueurs de s’affronter chaque week-end entre eux par l’intermédiaire d’équipes de football virtuelles, composées de joueurs réels issus de 5 championnats européens (Ligue 1, Ligue 2, Premier League, La Liga et la Serie A).

    Lire la suite
  • Bien choisir sa base de données: Typologie

    La collecte des données est la première étape pour créer un modèle de Machine Learning. Il est donc essentiel de choisir un modèle de base de données qui offre les caractéristiques dont votre application a le plus besoin. Les bases de données relationnelles et NoSQL constituent les deux familles de systèmes les plus utilisées. Leur structure, le stockage des données qu’elles assurent et leur accessibilité diffèrent. Dans cet article nous allons examiner chacune de leur caractéristique spécifique.

    Lire la suite
  • Qu’est-ce que l’Apprentissage automatique ?

    L’apprentissage automatique ou machine learning réside dans le fait de rassembler une large quantité d’exemples afin de déterminer les schémas sous-jacents pour ensuite les utiliser afin d’effectuer des pronostics concernant de nouveaux exemples.

    Lire la suite
  • GitLab : tout savoir sur le dépôt Git dédié au DevOps

    GitLab est un service d’hébergement de code et de gestion de version, doublé d’une plateforme DevOps complète. Découvrez tout ce que vous devez savoir sur le sujet : fonctionnement, différences avec GitHub, cas d’usage pour la Data Science et le Machine Learning, formations…

    Lire la suite