La modélisation des données une vue d'ensemble

Vidéo non disponible ! Réessayez plus tard
Cette vidéo fait partie de la formation
Maîtrisez Power BI
Revoir le teaser Je m'abonne
Transcription

Cette leçon fait partie de la formation
59,00€ Je commande

Formation incluse dans l'abonnement Elephorm Je m'abonne à Elephorm

DescriptionProgrammeAvis

Cette leçon fait partie de la formation
59,00€ Je commande

Formation incluse dans l'abonnement Elephorm Je m'abonne à Elephorm

  • Découvrir l'écosystème Power BI 
  • Se connecter, importer et traiter des sources de données hétérogènes avec Power Query M
  • Découvrir le langage DAX
  • Modéliser et préparer ses données
  • Créer et mettre en forme des rapports avec Power BI Desktop
  • Découvrir les services Power BI Online
  • Découvrir comment publier ses rapports sur le Power BI Services

Que vous soyez un expert en données ou un aspirant analyste désireux de maîtriser la plateforme de business intelligence la plus prisée, ce cours est votre tremplin idéal ! Dans cette formation Power BI vous allez : 

Explorer l'écosystème Power BI
Découvrez les composants clés de Power BI, installez les outils nécessaires et préparez votre environnement de travail.

Connecter et façonnez vos données
Apprenez à créer des flux de travail automatisés avec Power Query, explorez les connecteurs de données, les modes de stockage, et plus encore.

Importation et préparation des données
Maîtrisez les meilleures pratiques pour nettoyer, éliminer les doublons et préparer efficacement vos données.

Créer un modèle de données relationnel
Découvrez les subtilités de la modélisation des données, de la cardinalité à l'utilisation de DAX pour des analyses approfondies.

Visualisation des données avec Power BI
Plongez dans les visuels de Power BI, apprenez à les configurer et à les utiliser pour des insights percutants.

Découvrir Power BI Service
Explorez les fonctionnalités avancées de Power BI Service pour publier et partager des rapports, et bien plus.

Ce que vous obtenez :

  • Des projets pratiques et des missions basées sur de véritables scénarios d'entreprise.
  • Une guidance experte 
  • Des compétences prêtes à l'emploi pour exceller dans le domaine de la business intelligence.
Voir plus
Passons à un nouveau chapitre, il s'agit du chapitre modélisation des données. Avant de passer aux choses concrètes, essayons d'avoir une vue d'ensemble et de répondre à quelques questions fondamentales mais intéressantes. Passons à la première question, c'est quoi un modèle ? Un modèle est tout simplement une représentation des données par au moins une table. Mais généralement les modèles sont composés de plus qu'une table et ces tables-là sont liées mutuellement par des relations. Les relations à leur tour garantissent l'intégrité référentielle qui offre une possibilité de navigation entre les tables en préservant une chose très importante, il s'agit de la cohérence ou ce que nous appelons l'intégrité référentielle en requêtant les données. Commençons par le premier modèle, il s'agit du modèle à une table ou one table. Comme le nom l'indique, c'est un modèle qui est composé d'une seule table. Il a comme avantage la simplicité au niveau de la conception mais il a quelques inconvénients et limites, à savoir qu'il est difficile à gérer parce que vu le nombre important des colonnes, il est également déconseillé pour des raisons de performance, surtout au niveau d'importation et des mises à jour et des calculs d'agrégation puisque la quantité des données est massive dans ce cas. Et souvent il dépasse les un million de lignes, ce qui dépasse les capacités d'Excel. Passons maintenant au deuxième modèle, il s'agit du modèle serpent, Snake. C'est un modèle qui est assez simple, donc il a comme avantage la simplicité au niveau de la conception. Il est granulaire en termes d'analyse des données parce que l'analyse se fait d'au moins deux niveaux. Sinon, pour les limites de ce modèle Snake, il ne prend pas en considération les autres angles d'analyse parce que souvent nous analysons les données de point de vue temporel, de point de vue spatial, de point de vue critères bien déterminés, où nous pouvons également faire une combinaison de plusieurs angles pour essayer de cerner le modèle et de sortir le mieux de ce modèle-là. Ce qui n'est pas le cas pour le modèle Snake parce qu'il nous permettra de voir ou d'analyser les données d'un seul angle. Sinon, le modèle Star Schema, c'est un modèle assez classique. Il est utilisé souvent dans le projet BI. Il suppose la création de plusieurs tables, une table de faits ou fact table qui contient un ensemble de données mesurables telles que la quantité, le prix, le coût de revient, ainsi de suite, et les dimensions qui tournent autour de la fact table qui se trouve au centre. Les dimensions nous aident à analyser les données de plusieurs angles. Nous pouvons par exemple analyser les données des chiffres d'affaires par région, par date, par période, que ce soit trimestrielle, semestrielle, mensuelle ou même automataire. Nous pouvons également analyser ce même chiffre d'affaires de point de vue région, par exemple, de point de vue produit, et ainsi de suite. L'avantage de ce modèle-là, c'est qu'il charge plusieurs interactions simultanément avec des tables de mesures. On peut même combiner entre ces dimensions-là ou ces angles-là pour en sortir avec une analyse beaucoup plus complète sur une mesure que nous voulons faire. Sinon, pour les limites de ce modèle en étoile, il ne prend pas en considération les niveaux de granularité comme Snake parce que dans ce cas-là, le niveau des dimensions, c'est un niveau 1. Nous remarquons déjà qu'il y a un seul niveau de table qui est lié à la table centrale, la table de faits. Et il ne prend pas en considération les relations many-to-many. Une relation many-to-many, c'est une relation qui permet de lier deux dimensions. Par exemple, imaginons ce cas-là. Nous avons DimProduct et DimPromotion. DimPromotion, c'est une table qui permet de stocker les promotions de produits. DimProduit, ça permet de stocker les informations concernant les produits. Et nous, probablement, nous voulons développer une autre table à ce niveau-là qui lie DimPromotion à DimProduit pour la simplicité des choses, pour avoir, par exemple, des informations concernant les produits qui n'ont pas subi une promotion. Dans ce cas-là, il n'est pas possible de créer une relation entre DimPromotion et DimProduct dans le cadre de Power BI, dans le cadre des autres outils UTL tels que SQL Server Integration Services, il est possible de le faire. Mais pour le cas de Power BI, il n'est pas possible de le faire. Nous allons voir comment y remédier, comment dépasser cette lacune au niveau de Power BI. Sinon, le modèle en étoile StarSchema, c'est un modèle qui représente les dimensions. Une dimension est un atout informationnel tel que nous venons d'expliquer. Le produit, la date, le lieu, ça constitue des atouts pour mieux analyser les données. Il est possible d'effectuer une combinaison de ces données-là, tout à fait, comme je viens de l'expliquer tout à l'heure. Et puis, il y a les fact tables, ça permet de regrouper les éléments à mesurer, tels que les prix, les coûts, ainsi de suite. Il y a un autre modèle qui est le Snowflake. Le Snowflake, ou le flocon de neige, c'est une combinaison entre les deux modèles précédents, à savoir le Snake et le modèle en étoile. Là, nous pouvons avoir deux niveaux de granularité, par exemple, par rapport au schéma en étoile. Il y a ce premier niveau et ce deuxième niveau, à rapport à la table centrale, la table qui contient les mesures. Ce modèle-là a des avantages, c'est qu'il prend en charge plusieurs interactions simultanément avec la table de mesure, ce qui permet une beaucoup plus de granularité, tout à fait comme le Snake, le modèle Snake que nous venons de voir. Sinon, les limites de ce modèle, c'est la complexité. C'est un modèle complexe par rapport au modèle précédent, à savoir le modèle Star, ou le modèle en étoile. Maintenant, passons à une autre notion, c'est la notion de cardinalité. C'est quoi la cardinalité ? C'est le fait de définir le nombre de correspondances d'une entité donnée par rapport à une autre entité qui existe dans une autre table. Par exemple, une vente correspond à plusieurs produits. Par exemple, un magasin correspond à zéro produit. Dans ce cas-là, le magasin est vide, il ne contient pas de produit, tout simplement. Ou encore, un mari correspond à une femme. Dans ce cas-là, la cardinalité est de 1 à 1. Donc une femme correspond à un homme, ou une femme se marie à un homme, et un homme de sa part également est marié à une femme. Donc la relation dans ce cas-là est de 1 à 1. Passons maintenant à une notion fondamentale que nous utilisons au niveau de la base donnée. Passons maintenant à une autre notion fondamentale, il s'agit de la clé. C'est quoi une clé ? Il y a deux types de clés. Il y a les clés primaires et les clés étrangères. Une clé primaire, c'est une contrainte qui impose la non-nullité et la non-duplication au niveau d'une colonne, au niveau d'une table. C'est-à-dire qu'il n'est pas permis d'entrer des valeurs nulles au niveau d'une clé primaire, et il n'est pas également possible de dupliquer la valeur au niveau de la colonne en question. Et cela pour donner la chance aux données qui résident au niveau de la table d'être distinguées les unes des autres. Et il y a la clé étrangère, c'est une contrainte également, qui peut être nulle, qui peut être également dupliquée, mais qui impose dans un autre sens l'intégrité référentielle entre deux tables en relation, pour que les données soient en cohérence permanente. Au niveau de Power BI, il y a cette notion de relation active et inactive. Il est possible d'activer et de désactiver une relation au niveau du modèle dans un contexte Power BI. Pour détourner quelques lacunes, par exemple dans le cas où nous avons deux tables qui détiennent plusieurs relations en même temps, il n'est pas possible d'avoir plus qu'une relation active entre deux tables, ce qui nous oblige à mettre en état inactive. Nous pouvons activer une relation et nous devons absolument mettre le reste des relations dans ce cas-là en mode inactif. Sinon, c'est un autre cas, là où nous ne pouvons pas créer de relations simultanées, par exemple entre AgeRanges et Sales d'une part et AgeRanges et Customers d'autre part. Il n'est pas possible de créer ce schéma-là et d'établir deux relations en même temps qui sortent de AgeRanges vers Sales et à la fois vers Customers. Par conséquent, nous devons désactiver l'une des relations, soit celle qui part vers Sales, soit celle qui part vers Customers. Là, c'est une troisième situation, c'est un troisième cas de figure où nous ne pouvons pas établir une relation double qui part de DeemPromo, par exemple, vers DeemPromotion et DeemPromo vers DeemProduct. Nous appelons ce genre de relation une relation Money-to-Money. Cette relation-là n'est pas permise dans le cas de Power BI, donc nous devons absolument désactiver l'une des relations pour maintenir le modèle correctement. Sinon, nous passons à une autre notion également importante au niveau de Power BI, c'est comment les données sont filtrées. Nous essayons de simplifier le maximum possible l'action qui est faite au niveau de Power BI pour exprimer ou rendre clair le mécanisme de Power BI, comment il sélectionne les données pour les préparer par la suite à faire des calculs tels que les mesures et les colonnes calculées. Nous partons par exemple d'une table Category qui détient une relation avec la table Product, qui à son tour détient une relation avec la table Sales. Dans ce cas-là, nous pouvons considérer que Category et Product sont des tables d'émotions, alors que Sales est une table de faits. Si nous sélectionnons par exemple Category dans ce cas-là, ce qui se passe c'est qu'il y aura un filtre qui s'applique au niveau de Product dans un premier niveau, pour filtrer seulement les produits qui correspondent à la catégorie A. Et puis il y a un deuxième filtre qui s'applique à la table Sales pour ramener les données qui correspondent aux produits, dont l'identifiant 1 et 5, qui à leur tour correspondent à la catégorie A. Du coup, nous avons seulement les ventes des produits qui correspondent à la catégorie A. C'est de cette manière-là que Power BI filtre les données.

Programme détaillé

Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Nos dernières formations Power BI
  • Pack 2 formations
    Pack de formation Power BI
    Découvrir
    Ce pack s'adresse aux professionnels des données, aux analystes d'affaires, aux étudiants en gestion et informatique, et à toute personne souhaitant maîtriser l'analyse de données avec Power BI.
    9h36 106 leçons
  • Maîtrisez Power BI Services
    Découvrir
    Dans cette deuxième partie se concentre sur Power BI Services pour montrer comment créer et gérer des espaces de travail au sein de Power BI Services et montrer comment collaborer dans le contexte de Power BI Services  
    3h12 32 leçons
  • Apprendre Power BI Desktop
    Découvrir
    Power BI est le nouvel outil de Microsoft dédié à l'analyse de données, et à la Business Intelligence. Vous apprendrez, à partir de sa version Desktop, à vous connecter aux principales sources de données, à les mettre en forme dans un modèle relationnel. Vous pourrez les préparer à vos analyse grâce à une initiation aux fonctions DAX. Il vous restera à concevoir des rapports à l'aide des visualisations, puis à assurer leur publication en ligne.
    4h 48 leçons 5 / 5

éditeur de vidéos pédagogiques

Des supports pédagogiques en vidéo, produits avec les meilleurs experts. Dans nos studios à Paris, Lyon ou Montpellier. Vous souhaitez travailler avec nous ?
image-micro