-
Le Treemap : Définition, utilisation, et limites
La data visualisation représente une démarche indispensable pour tous les analystes des données : elle permet d’obtenir des informations claires et intelligibles qui peuvent être communiquées facilement à toute sorte de public. Le Treemap est un outil important dans la data visualisation et doit être maîtrisé par les Data Scientists et les Data Analysts.
Lire la suite -
Bases de données open source : Que faut-il savoir ?
Vous cherchez une solution libre, fiable et performante pour stocker vos données ? Les bases de données open source s’imposent aujourd’hui comme un choix incontournable pour allier maîtrise des coûts, flexibilité et autonomie. Dans cet article, découvrez leur fonctionnement, leurs avantages, et les outils les plus adaptés à votre projet.
Lire la suite -
DAX Studio : tout savoir sur l’outil d’analyse de requêtes en langage DAX
Les outils analytiques modernes comme Power BI sont conçus pour délivrer des résultats d’analyse de façon rapide et dynamique. Toutefois, un problème dans le modèle de données ou des calculs trop complexes peuvent ralentir la production du rapport.
Lire la suite -
GitHub : Fonctionnalités et avantages de cet outil de collaboration
La plateforme GitHub permet aux programmeurs informatiques de collaborer librement sur des projets de code. Découvrez tout ce que vous devez savoir sur ce service massivement utilisé dans la Data Science et le Machine Learning, et comment apprendre à l’utiliser.
Lire la suite -
Text Mining : Définition, techniques, cas d’usage
Le Text Mining consiste à utiliser le Machine Learning pour l’analyse de texte. Découvrez tout ce que vous devez savoir : définition, fonctionnement, techniques, avantages, cas d’usage…
Lire la suite -
Les Autoencoders – modèles d’apprentissage non supervisé
Aujourd’hui, nous nous intéressons à une famille de méthodes d’apprentissage non supervisé, les autoencoders. Autoencoder : Définition Les auto encodeurs sont des réseaux de neurones un peu particuliers qui possèdent exactement le même nombre de neurones sur leur couche d’entrée et leur couche de sortie. Le but pour un auto encodeur est d’avoir une sortie […]
Lire la suite -
Bases de données relationnelles : Tout ce qu’il y a à savoir
Les systèmes de gestion des bases de données (SGBD) sont des programmes informatiques qui permettent aux utilisateurs d’interagir avec une base de données. Pour cela, le SGBD doit avoir un modèle qui définit la manière dont les données sont organisées. Le modèle relationnel est une approche d’organisation des données très populaire.
Lire la suite -
Confluence : Tout savoir de cet outil collaboratif de gestion de projet
« Alors que les entreprises produisent de plus en plus de contenu, il est essentiel que les salariés ne perdent pas de temps à retrouver des informations importantes » a déclaré Erika Trautman, chef de produit pour la gestion du travail chez Atlassian.
Lire la suite -
Staging Area : En quoi consiste cette étape du processus ETL ?
La « Staging Area » est une étape importante dans le processus ETL (Extract, Transform, Load) qui consiste à extraire des données à partir de sources de données hétérogènes, à les transformer pour les préparer à l’analyse et à les charger dans un système de destination tel qu’un entrepôt de données (Data Warehouse) ou une base de données.
Lire la suite -
Cypher : le langage pour manipuler des données dans les graphes
Pour l’homme, la compréhension visuelle est souvent plus facile que la compréhension textuelle, car notre cerveau est capable de traiter les informations visuelles plus rapidement et plus efficacement. C’est pour cette raison que nous avons pu voir l’émergence des bases de données graphiques utilisant le langage Cypher au lieu du traditionnel SQL.
Lire la suite -
CRUD : définition, fonctionnement
Étroitement lié à la gestion de données numériques, le CRUD est un acronyme informatique anglais lié au fonctionnement des données stockées. Il englobe quatre opérations de base qui concernent la gestion de la pertinence des données et des applications : Create, Read, Update et Delete.
Lire la suite -
TensorFlow : le framework de Machine Learning de Google
TensorFlow est un framework de Machine Learning créé par Google et disponible en open source. Découvrez tout ce que vous devez savoir à son sujet : histoire, fonctionnement, avantages, formations…
Lire la suite
The newsletter of the future
Get a glimpse of the future straight to your inbox. Subscribe to discover tomorrow’s tech trends, exclusive tips, and offers just for our community.












