Enrichir ses données dans Power Query : création de colonnes et gestion des références

Cette leçon aborde les étapes d'enrichissement de données dans Power Query, en présentant la création de colonnes personnalisées, l'utilisation de la fonctionnalité référence et les bonnes pratiques pour structurer efficacement ses requêtes.

Détails de la leçon

Description de la leçon

Dans cette leçon, nous explorons Power Query au-delà du simple nettoyage de données, pour apprendre à enrichir une table en y ajoutant de nouvelles colonnes à partir de calculs personnalisés. Après avoir utilisé les fonctionnalités des onglets Transformer et Accueil pour nettoyer les données, l'attention se tourne vers l'onglet Ajouter une colonne. L'objectif est de démontrer comment construire une nouvelle colonne, par exemple, calculer un profit ajusté en fonction d'une taxe fictive.

La leçon détaille la démarche professionnelle consistant à réduire la complexité des requêtes en créant une référence plutôt qu'une simple duplication de table. La différence fondamentale entre ces deux options est analysée : la référence crée une dépendance directe et épurée à la source d'origine, ce qui permet un meilleur suivi de l'enchaînement des traitements.

L'apprenante ou l'apprenant découvre ensuite comment réaliser une opération simple de calcul, tel que la soustraction d'une taxe forfaitaire au profit initial, grâce aux outils standards de Power Query. L'intégralité de l'opération est expliquée étape par étape, insistant sur la flexibilité du renommage des colonnes et l'avantage de travailler à partir d'une requête allégée pour plus de clarté.

Cette séquence permet ainsi de comprendre, avec un exemple concret, l'intérêt de séparer l'enrichissement du nettoyage dans Power Query, l'organisation optimale des étapes, et l'utilisation des outils pour structurer des transformations robustes, évolutives et compréhensibles.

Objectifs de cette leçon

Le module vise à apprendre à enrichir une table dans Power Query en créant des colonnes calculées, à comprendre l'intérêt de la référence par rapport à la duplication de requête, et à intégrer des calculs spécifiques (ex. gestion d'une taxe sur un profit) dans vos flux de données.

Prérequis pour cette leçon

Il est recommandé de disposer de connaissances élémentaires en Power Query, de maîtriser les opérations de nettoyage de base (suppression de lignes, transformation de colonnes), et de savoir naviguer entre les différents onglets de l'outil.

Métiers concernés

Les data analysts, contrôleurs de gestion, consultants BI, chefs de projet Data et toute personne impliquée dans le traitement automatisé de données bénéficient directement de ces compétences.

Alternatives et ressources

Des alternatives à Power Query peuvent inclure Tableau Prep, Alteryx, Talend, ou les fonctionnalités de manipulation de données avancées dans Python (pandas) et R.

Questions & Réponses

La duplication crée une nouvelle table indépendante de la table d'origine, alors que la référence établit une liaison dynamique avec la table originale, en héritant de ses modifications et en restant plus légère en termes d'étapes.
L'utilisation de la référence permet de repartir d'une base simplifiée, réduisant la complexité des étapes, et assure que toute modification sur la source principale se répercute automatiquement sur la table de référence.
L'outil 'Standard' de l'onglet 'Ajouter une colonne' permet de réaliser des opérations arithmétiques telles que la soustraction, l'addition, la multiplication ou la division pour créer de nouvelles colonnes calculées.