Decoded©

  • Comment booster sa productivité Excel grâce à PowerQuery ?

    L’analyse et la préparation des données représente bien souvent près de 80% du travail d’un data analyst ou data scientist. C’est donc un goulet d’étranglement qui ralentit considérablement le travail d’exploitation des données. Heureusement il existe certains outils pour réduire cette activité chronophage ! PowerQuery en est un des plus puissants et nous allons vous le présenter dans cet article.

    Lire la suite
  • RGPD: Définition et impacts sur les entreprises

    Depuis le 25 mai 2018, toute entreprise européenne ou non européenne, si elle commercialise ses produits ou services dans un pays de l’Union européenne, doit s’adapter au règlement général sur la protection des données (RGPD) ou general data protection regulation.

    Lire la suite
  • Les KPIs : Key Performance Indicators

    KPI est un acronyme anglais (Key Performance Indicator) qui peut être traduit par un indicateur clé de performance (ICP). Un KPI donne la possibilité à une entreprise de diriger correctement une campagne marketing par exemple et d’en mesurer l’efficacité grâce à l’utilisation de KPis marketing.

    Lire la suite
  • 3 Algorithmes de Machine Learning utiles pour votre business

    Le mot algorithme est désormais présent dans le langage courant. Mais que veut-il bien dire ? Derrière ce simple mot se cache tout un monde, apprentissage non supervisé, data science, réseau de neurones… Et si on prenait le temps de définir les choses ? Dans cet article, vous allez découvrir ou redécouvrir quelques algorithmes de Machine Learning utiles à savoir maîtriser.

    Lire la suite
  • Algorithme de Page Rank

    Connaissez vous l’algorithme de Page Rank ? Au cœur du positionnement Google, découvrons son fonctionnement Vous vous êtes sûrement déjà demandé pourquoi certaines pages internet apparaissent en premier lorsque vous effectuez une requête sur un moteur de recherche. Si vous essayez de chercher le terme « python » dans votre barre de recherche Google, c’est le site […]

    Lire la suite
  • CITY WALKER, l’appli qui vous propose le meilleur itinéraire touristique

    Avez-vous déjà perdu patience en tentant de tracer un itinéraire de voyage ? Il est parfois difficile de concilier l’envie de ne rien rater et d’optimiser son temps de séjour en fonction des visites que l’on souhaite faire. C’est à ce challenge que Danyl et Diego, du Bootcamp Data Analyst de DataScientest ont tenté de répondre avec City Walker. Nous sommes allés à leur rencontre (à distance car 9000 km les séparent ) DataScientest : Bonjour Diego et Danyl, est- ce que vous pouvez nous raconter votre parcours respectif et ce qui vous a mené à la data science?

    Lire la suite
  • Deep Convolutional GAN : la création par convolution

    Les réseaux de neurones sont maintenant omniprésents dans le monde de la data, mais s’il y a bien un concept novateur qui a émergé ces dernières années, ce sont les réseaux GANs. Ces réseaux qui apprennent en s’affrontant sont particulièrement efficaces, et si ce concept est combiné avec l’état de l’art des techniques d’image processing, vous obtenez ce que nous allons aborder dans cet article, les DCGANs ou Deep Convolutional Generative Adversarial Networks.

    Lire la suite
  • Le Machine Learning au service de la cybersécurité pour la détection de spams dans les e-mails

    Il y a quelques semaines, j’ai démarré une formation de Data Scientist chez DataScientest. Dans le cadre de cette formation, j’ai réalisé un projet accompagné de Felix PEYRE et Alexis Teskrat. Ce projet, c’est plus d’une centaine d’heures de travail encadrées par notre responsable de promotion Thomas Boehler qui nous a permis de mettre au point un modèle de détection des spams dans les mails utilisant le NLP. Voici plus en détail notre travail :

    Lire la suite
  • 4 projets Blockchain & Data Science à découvrir

    On peut penser, de par leurs différentes approches de la donnée, que la Blockchain et les Data Sciences sont des disciplines purement indépendantes. Alors que la Blockchain est actuellement en pleine émergence, notamment avec l’engouement mondial autour des crypto-monnaies, les data sciences représentent une technologie déjà bien établie. Cependant, ces deux innovations, qui permettent de révolutionner le monde du travail et le rapport de l’humain à la technologie, ne sont pas tant éloignées que ça. Nous allons le voir plus en détail dans cet article.

    Lire la suite
  • Daniel, peux-tu me parler des environnements virtuels sur Python ?

    Daniel vous a manqué ? Ça tombe bien, à nous aussi ! Aujourd’hui, notre expert en data science qui accompagne les apprenants tout au long de leur formation répond à ces questions : À quoi sert un environnement virtuel et comment en créer un sur Python ?

    Lire la suite
  • Loi des grands nombres et vote démocratique

    Le vote démocratique est une solution à laquelle nous avons souvent recours pour prendre une décision en groupe et qui a été communément admise dans notre société. Son intérêt repose sur la loi des grands nombres, un principe mathématique qui permet d’approcher la probabilité d’un événement par la fréquence de sa réalisation. Que ce soit pour choisir un film, un restaurant ou un lieu de vacances, le vote permet de maximiser le nombre de personnes satisfaites par la décision prise. Mais est-il réellement la meilleure option à prendre lorsque l’objectif est de choisir entre deux propositions : une vraie et une fausse.

    Lire la suite
  • Apache Hive Hadoop : Le SQL au service de la prise de décision

    Le framework open-source de la principale plateforme du Big Data, Hadoop, se révèle idéal pour le stockage et le traitement de quantités massives de données. Cependant, pour l’extraction de données, cette plateforme se révèle souvent complexe, chronophage et coûteuse. C’est pourquoi, la fondation Apache a développé une nouvelle alternative. Il s’agit de Apache Hive.

    Lire la suite