Comprendre les formats de données dans Power Query : stockage et bonnes pratiques

Dans cette leçon, vous découvrirez l'importance des formats de données dans Power Query et leurs impacts sur le stockage, la manipulation et l'intégration avec Excel et Power BI. Apprenez à distinguer format de stockage et format d'affichage afin d'éviter les erreurs lors de la préparation de vos données.

Détails de la leçon

Description de la leçon

Cette vidéo explicative vous initie en profondeur au sujet des formats de données dans Power Query. L'intervenant commence par rappeler que le format désigne le mode de stockage et non l'affichage (monnaies, dates longues/courtes, devises, etc.). Cela impacte directement la façon dont les données sont interprétées par Excel ou Power BI.


Le formateur passe en revue différents types de colonnes : date, texte, nombre entier, nombre décimal, devise et pourcentage. Il explique l’importance de choisir le format adéquat : par exemple, un code postal doit être enregistré comme texte et non comme nombre, puisque les opérations mathématiques n'ont pas de sens sur ce type de donnée. La distinction entre nombre entier (plus économe en stockage) et nombre décimal (utile pour conserver les décimales) est aussi détaillée, tout comme les subtilités du format devise (qui n'est pas véritablement réservé à l’euro ou au dollar) et du format pourcentage.


Un focus est fait sur les conséquences pratiques de ces choix lors du chargement dans Excel : selon les versions, certaines spécificités peuvent être perdues ou mal interprétées. L’usage du format d’affichage (mise en euro, pourcentage) se fait ensuite, dans Excel, tandis que la logique de stockage se décide dans Power Query, en amont. En somme, comprendre et appliquer ces notions garantit une meilleure fiabilité des analyses et des visualisations, tout en optimisant la taille et la pertinence des fichiers produits.

Objectifs de cette leçon

L’objectif de cette vidéo est d’apprendre à identifier, comprendre et appliquer les formats de données adéquats dans Power Query pour garantir la fiabilité et la pertinence des jeux de données lors de leur exploitation dans Excel ou Power BI.

Prérequis pour cette leçon

Il est recommandé d’avoir des connaissances de base sur Excel et une première expérience avec Power Query. Une compréhension générale des types de données (texte, nombres, dates, etc.) sera utile pour assimiler les concepts exposés.

Métiers concernés

La maîtrise des formats de données dans Power Query est essentielle pour les data analysts, contrôleurs de gestion, consultants en BI, ingénieurs de données et tous les professionnels réalisant des préparations ou analyses de données sur Excel, Power BI, ou des outils décisionnels similaires.

Alternatives et ressources

Outre Power Query, des alternatives comme Alteryx, Tableau Prep, ou encore Google DataPrep peuvent permettre la transformation et la gestion des formats de données avant exploitation sous Excel ou Power BI.

Questions & Réponses

Le format de stockage dans Power Query détermine comment la donnée est réellement enregistrée (type texte, nombre, date), ce qui influence le traitement, la mémoire et la validité des opérations. Le format d’affichage concerne uniquement la représentation visuelle dans Excel (ex. : affichage monétaire ou pourcentage), sans impact sur le contenu stocké.
Enregistrer un code postal comme un nombre peut entraîner des erreurs d’interprétation et de calcul (calcul de moyennes, sommes, etc.), qui n'ont aucun sens pour un identifiant. Il est donc conseillé de stocker ce type de données comme du texte afin de préserver sa signification et éviter des traitements incorrects.
Utiliser le format 'nombre entier' permet d’optimiser la taille des fichiers et la rapidité de traitement car il n’y a pas de décimales à stocker. Ce format est approprié lorsque les données sont toujours entières (ex : quantités) et évite un stockage inutile de décimales à zéro.