Auteur du futur

  • Les méthodes propres aux projets big data

    La numérisation de la donnée et l’essor du big data ont provoqué un afflux massif d’informations au sein des entreprises. Beaucoup d’informations produites mais aussi beaucoup d’informations à traiter. Pourtant cette masse de données représente un véritable enjeu économique et stratégique pour les entreprises, à condition de savoir bien les traiter et les utiliser en déployant les bonnes méthodes pour ses projets big data.

    Lire la suite
  • Science des données : Définition

    Moore en 1991 définissait la statistique comme science des données. Ainsi, c’est une discipline qui passe par l’utilisation de fonctionnalités issus de différents domaines comme les mathématiques, l’informatique ou les statistiques par exemple.

    Lire la suite
  • GAN et Machine Learning : Mise en pratique avec des visages fictifs

    Quel est le point commun entre ces trois personnes ? Aucune n’existe dans la vie réelle et chacune de ces photos a été générée par ce site. Mais comment ce site peut réussir à générer des personnes aussi photoréalistes et diverses ?

    Lire la suite
  • Comment booster sa productivité Excel grâce à PowerQuery ?

    L’analyse et la préparation des données représente bien souvent près de 80% du travail d’un data analyst ou data scientist. C’est donc un goulet d’étranglement qui ralentit considérablement le travail d’exploitation des données. Heureusement il existe certains outils pour réduire cette activité chronophage ! PowerQuery en est un des plus puissants et nous allons vous le présenter dans cet article.

    Lire la suite
  • RGPD: Définition et impacts sur les entreprises

    Depuis le 25 mai 2018, toute entreprise européenne ou non européenne, si elle commercialise ses produits ou services dans un pays de l’Union européenne, doit s’adapter au règlement général sur la protection des données (RGPD) ou general data protection regulation.

    Lire la suite
  • Les KPIs : Key Performance Indicators

    KPI est un acronyme anglais (Key Performance Indicator) qui peut être traduit par un indicateur clé de performance (ICP). Un KPI donne la possibilité à une entreprise de diriger correctement une campagne marketing par exemple et d’en mesurer l’efficacité grâce à l’utilisation de KPis marketing.

    Lire la suite
  • 3 Algorithmes de Machine Learning utiles pour votre business

    Le mot algorithme est désormais présent dans le langage courant. Mais que veut-il bien dire ? Derrière ce simple mot se cache tout un monde, apprentissage non supervisé, data science, réseau de neurones… Et si on prenait le temps de définir les choses ? Dans cet article, vous allez découvrir ou redécouvrir quelques algorithmes de Machine Learning utiles à savoir maîtriser.

    Lire la suite
  • Algorithme de Page Rank

    Connaissez vous l’algorithme de Page Rank ? Au cœur du positionnement Google, découvrons son fonctionnement Vous vous êtes sûrement déjà demandé pourquoi certaines pages internet apparaissent en premier lorsque vous effectuez une requête sur un moteur de recherche. Si vous essayez de chercher le terme « python » dans votre barre de recherche Google, c’est le site […]

    Lire la suite
  • CITY WALKER, l’appli qui vous propose le meilleur itinéraire touristique

    Avez-vous déjà perdu patience en tentant de tracer un itinéraire de voyage ? Il est parfois difficile de concilier l’envie de ne rien rater et d’optimiser son temps de séjour en fonction des visites que l’on souhaite faire. C’est à ce challenge que Danyl et Diego, du Bootcamp Data Analyst de DataScientest ont tenté de répondre avec City Walker. Nous sommes allés à leur rencontre (à distance car 9000 km les séparent ) DataScientest : Bonjour Diego et Danyl, est- ce que vous pouvez nous raconter votre parcours respectif et ce qui vous a mené à la data science?

    Lire la suite
  • Deep Convolutional GAN : la création par convolution

    Les réseaux de neurones sont maintenant omniprésents dans le monde de la data, mais s’il y a bien un concept novateur qui a émergé ces dernières années, ce sont les réseaux GANs. Ces réseaux qui apprennent en s’affrontant sont particulièrement efficaces, et si ce concept est combiné avec l’état de l’art des techniques d’image processing, vous obtenez ce que nous allons aborder dans cet article, les DCGANs ou Deep Convolutional Generative Adversarial Networks.

    Lire la suite
  • Le Machine Learning au service de la cybersécurité pour la détection de spams dans les e-mails

    Il y a quelques semaines, j’ai démarré une formation de Data Scientist chez DataScientest. Dans le cadre de cette formation, j’ai réalisé un projet accompagné de Felix PEYRE et Alexis Teskrat. Ce projet, c’est plus d’une centaine d’heures de travail encadrées par notre responsable de promotion Thomas Boehler qui nous a permis de mettre au point un modèle de détection des spams dans les mails utilisant le NLP. Voici plus en détail notre travail :

    Lire la suite
  • 4 projets Blockchain & Data Science à découvrir

    On peut penser, de par leurs différentes approches de la donnée, que la Blockchain et les Data Sciences sont des disciplines purement indépendantes. Alors que la Blockchain est actuellement en pleine émergence, notamment avec l’engouement mondial autour des crypto-monnaies, les data sciences représentent une technologie déjà bien établie. Cependant, ces deux innovations, qui permettent de révolutionner le monde du travail et le rapport de l’humain à la technologie, ne sont pas tant éloignées que ça. Nous allons le voir plus en détail dans cet article.

    Lire la suite