Power Query : maîtriser les transformations avancées de données dans Power BI

Dans cette leçon, apprenez à séparer des colonnes, créer des colonnes conditionnelles, effectuer des calculs personnalisés, ainsi qu'à pivoter et regrouper vos données grâce à Power Query dans Power BI. Ce module facilite une préparation optimale de vos sources pour l’analyse et la visualisation des données.

Détails de la leçon

Description de la leçon

Cette vidéo pédagogique vous guide étape par étape dans l'utilisation des fonctionnalités avancées de Power Query, l’outil incontournable d’intégration et de préparation des données intégré à Power BI. Vous découvrirez comment séparer efficacement une colonne composée (tel qu’un champ rassemblant prénom et nom en une seule cellule), à l’aide de différentes méthodes : extraction via délimiteurs ou saisie par exemple interactif.


Le cours poursuit avec la création de colonnes conditionnelles permettant de catégoriser automatiquement vos données selon des règles de prix, démontrant la transformation préalable de types de données et la gestion des formats numériques. Vous apprendrez également à générer des calculs personnalisés sur les colonnes (conversion kilogrammes en grammes), à travers la création de colonnes personnalisées et l’utilisation de la syntaxe adaptée.


La leçon explore également la manipulation de vos jeux de données par les opérations de pivot et dépivot, illustrant la façon de réorganiser et d’agréger les informations pour faciliter la comparaison des ventes d’une année sur l’autre, ou encore rétablir un format orienté base de données. Vous serez initié à la fonctionnalité de regroupement, précieuse pour condenser et optimiser vos jeux de données sur la base de clés multiples.


L’enseignant termine en présentant les outils d’analyse de la fenêtre Affichage, tels que la distribution de colonnes et le profil de données, ainsi qu’une première approche du langage M, qui régit toutes les étapes de transformation dans Power Query. À travers des cas concrets, vous serez en mesure d’automatiser et de personnaliser vos flux de données, pour une exploitation optimale dans Power BI.

Objectifs de cette leçon

L’objectif principal de cette vidéo est de maîtriser les transformations avancées dans Power Query : apprendre à séparer des colonnes, paramétrer des règles conditionnelles, réaliser des calculs personnalisés, pivoter et regrouper des données, et se familiariser avec le langage M afin d’automatiser le processus de nettoyage des données.

Prérequis pour cette leçon

Il est recommandé de disposer de notions fondamentales sur Power BI, de comprendre le principe de tables et colonnes dans Excel, ainsi que de savoir manipuler des fichiers CSV ou Excel. Une initiation préalable à la navigation dans Power Query est un atout.

Métiers concernés

Les outils et techniques présentés sont particulièrement utiles pour les data analysts, data engineers, chefs de projet BI, contrôleurs de gestion, auditeurs, ou toute personne amenée à manipuler de grands volumes de données en vue d’analyses ou de reporting automatisé.

Alternatives et ressources

Pour des fonctionnalités similaires à Power Query, on peut mentionner Alteryx, Talend Data Preparation, les fonctions avancées d’Excel (Power Pivot, Text to Columns), ainsi que Tableau Prep pour la mise en forme et la transformation des données.

Questions & Réponses

Dans Power Query, il est possible de séparer une colonne contenant le prénom et le nom en deux colonnes distinctes en utilisant la fonction d'extraction par délimiteur (par exemple un espace), ou en employant la fonction 'Colonne à partir d'exemple' qui permet de générer automatiquement la formule adaptée à partir d’une saisie manuelle du résultat attendu.
La colonne conditionnelle permet de catégoriser dynamiquement les valeurs en fonction de règles définies, facilitant la segmentation et l’analyse. Elle s'ajoute depuis l’onglet 'Ajouter une colonne' puis 'Colonne conditionnelle', où l’on configure les seuils et les libellés selon la logique métier, par exemple la classification de produits par tranche de prix.
Pour pivoter les données, on sélectionne la colonne à transformer en en-tête de colonnes, puis on agrège les données selon d’autres dimensions (ex. année, client, produit). Le regroupement consiste à sélectionner les colonnes clés, puis à choisir une agrégation (ex. somme) pour condenser plusieurs lignes en une seule par groupe, optimisant ainsi la taille des jeux de données.