Création et Personnalisation des Diagrammes Camemberts avec Plotly Express

Les camemberts
Vidéo non disponible ! Réessayez plus tard
Cette vidéo fait partie de la formation
Maîtrisez Python : Analyse et visualisations des données
Revoir le teaser Je m'abonne
3,5
Transcription

Description Programme Avis
3,5

Les objectifs de cette vidéo sont les suivants :

  • Comprendre l'utilisation des diagrammes camembert pour la répartition des données.
  • Apprendre à utiliser la fonction px.pie de Plotly Express.
  • Savoir personnaliser les couleurs et labels dans un diagramme camembert.
  • Maîtriser les fonctions update_traces et update_layout pour une meilleure présentation des données.

Apprenez à visualiser la répartition de vos données à l'aide de diagrammes camembert en utilisant Plotly Express et Python.

Dans ce premier chapitre, nous examinons les différents types de diagrammes, en particulier les diagrammes camembert ou diagrammes de section. Pour analyser et afficher nos données, nous utiliserons le fichier superstore.csv dans un data frame avec Pandas. Nous verrons comment utiliser la fonction px.pie de Plotly Express pour créer des diagrammes camembert.

Les paramètres essentiels incluent values pour définir la colonne à agréger et names pour répartir les données. Nous apprendrons aussi à personnaliser les couleurs via color_discrete_sequence et à modifier les labels pour une meilleure compréhension des visuels.

Pour rendre nos diagrammes plus informatifs, nous utiliserons des fonctions comme update_traces et update_layout afin d'ajuster les positions de texte et supprimer des légendes inutiles.

À la fin de cette leçon, vous serez capable de créer des diagrammes camembert bien structurés et personnalisés en quelques lignes de code.

Voir plus
Questions réponses
Quelle fonction de Plotly Express est utilisée pour créer un diagramme camembert ?
La fonction px.pie de Plotly Express est utilisée pour créer un diagramme camembert.
Comment peut-on personnaliser les couleurs d'un diagramme camembert ?
On personnalise les couleurs via le paramètre color_discrete_sequence en passant une liste de couleurs ou en utilisant des jeux de couleurs prédéfinis de Plotly.
Pourquoi pourrait-on vouloir désactiver la légende dans un diagramme camembert ?
Il est souvent pertinent de désactiver la légende car toutes les informations sont déjà affichées sur les sections du camembert, évitant ainsi les aller-retours visuels inutiles.
Dans ce premier chapitre sur les différents types de diagrammes, nous allons aborder les camemberts ou encore diagrammes de section. Dans chacune de ces vidéos, on fera appel à une première partie import de ressources où on ira récupérer notre fameux fichier superstore.csv de sorte à avoir un data frame disponible, qui nous provient de panda, et de pouvoir faire une analyse de ces données. Ensuite, on aura toujours un code minimal pour chacun de type de diagramme. Ici, on va parler des camemberts ou encore diagrammes à section, je le rappelle, et ce type de diagramme permet de facilement évaluer la répartition de notre échantillon, c'est-à-dire de différents éléments qui le constituent, en fonction d'un critère qu'on aura défini. La fonction dans ce cas à utiliser est la fonction px.py, px étant l'alias de plotly.express, un sous-module de plotly. Le premier paramètre de l'ensemble des fonctions qu'on va utiliser sera toujours celui qui servira à passer notre data frame ou une source de données quelconque. Dans le cas du camembert, le paramètre values va permettre de définir quelle colonne utiliser dans le data frame pour agréger les données, alors que le paramètre names va définir quelle colonne de notre data frame utiliser pour, non pas agréger, mais répartir les données traitées. Le paramètre title, quant à lui, est commun à l'ensemble des types de diagrammes que l'on va voir et permet de définir le titre du diagramme. Alors d'un point de vue fonctionnement, cette fonction px.py va retourner un objet figure qui ne va pas s'afficher à l'aide de la fonction print mais à l'aide de la fonction show, comme on l'avait vu dans la vidéo précédente. Ne pas oublier de passer le rendereur à Colab pour une amélioration du rendu dans Google Collaboratory. Alors un premier exemple qu'on peut voir en deux lignes de code au final, si on oublie l'import, on a directement un diagramme avec l'affichage des rations en pourcentage, le survol en termes de catégorie et de quantité de produits vendus. Si on continue avec un deuxième exemple, on peut aussi évaluer par exemple le nombre de ventes par région considérées dans nos données. Si on considère maintenant la customisation, on va rendre ce truc là, on va déjà pouvoir adapter les couleurs de notre diagramme, de notre camembert. Une première option, ça va être de spécifier une liste de couleurs format hexadésimal à l'aide du paramètre color discrete sequence. Ce paramètre, on pourra le passer dans la fonction py. Sachez que Plotly fournit aussi un ensemble de jeux de couleurs qu'il vous suffira de sélectionner. Ces jeux de couleurs sont disponibles dans la variable px.color.qualitative.swatches et vous avez ci dessous un rendu des jeux de couleurs disponibles. Par exemple, si je décide de sélectionner un de ces jeux de couleurs et que je le passe à mon paramètre color underscore discrete underscore sequence, j'aurai ce type de rendu. Maintenant, on va peut-être vouloir changer les labels. On peut avoir des noms de colonnes qui sont en anglais, mais dans le cadre d'une visualisation de données, préférez plutôt avoir des libelés en français par exemple. Pour changer les libelés des variables à manipuler, on définira la propriété labels, toujours dans la fonction py, en passant sous forme de dictionnaire un jeu de données, clé valeur, clé étant la colonne du data frame manipulée, la valeur étant la valeur que l'on souhaite afficher en remplacement. Ensuite, concernant le formatage des valeurs affichées, on va pouvoir évidemment changer le comportement des éléments plus généraux. Pour cela, on devra non pas utiliser la fonction pxpy, mais la fonction update traces. Cette fonction est aussi globale à l'essentiel des types de diagrammes que l'on va manipuler. Par contre, les paramètres seront contextuels. Ici par exemple, on va pouvoir manipuler les paramètres textposition et textinfo pour changer le rendu de notre camembert et afficher non pas seulement le pourcentage, mais le pourcentage, mais aussi rappeler le nom de la catégorie. Enfin, une bonne pratique dès le moment où on a ramené le label et les pourcentages sur les sections du camembert au final, c'est peut-être de supprimer les infos disponibles au survol. A ce moment là, on réutilisera la fonction update traces en passant les paramètres overtemplate à none et overinfo à skip. Dans le cas d'un camembert, il peut être intéressant de supprimer aussi la légende. Puisque toutes les informations sont déjà disponibles sur le camembert, il n'est pas intéressant de permettre à l'utilisateur de faire un aller-retour visuel entre la légende et le camembert puisque la légende n'apporte aucune information supplémentaire. Ici, on devra utiliser une nouvelle fonction, et c'est la dernière fonction qu'on abordera, la fonction update layout avec le paramètre showLegend à false pour désactiver le choix de la légende. Alors, si on rassemble toutes les informations que je vous ai données dans ces customisations possibles, on arrive à l'exemple final suivant. Vous avez donc ici un camembert où toute l'information est centrée directement dans les différentes sections du camembert, sans légende, sans survol, et avec des informations en français.
4 commentaires
3,5
4 votes
5
4
3
2
1
elephorm-1464076@addviseo.com
Il y a 3 months
Commentaire
Bonne formation mais vraiment dommage de ne pas avoir au moins les liens des supports de cours.
nicolasmichaux1
Il y a 1 year
Commentaire
Bonnne formation mais aucun support de cours
lebris.gilles76
Il y a 2 years
Commentaire
Très bien , mais il manque les supports de cours
antoinem
Il y a 2 years
Commentaire
Bien mais il manque les supports de cours
Nos dernières formations Python
  • Pack 5 formations
    Pack Python : Des bases aux techniques avancées
    Découvrir
    Réputé pour être le langage de programmation le plus populaire au monde, Python est très plébiscité pour ses différentes utilisations.  A travers ce pack de 5 formations, vous apprenez les fondamentaux de la programmation Python, vous maîtrisez les techniques avancées et vous découvrez comment utiliser Python pour le web et pour l’analyse et la visualisation des données. Apprendre à programmer en Python : Apprendre les fondamentaux du langage de programmation Python. Apprendre Python : Qualité de code et maintenance : Maîtriser Python avec une qualité de code et de maintenance optimales. Maîtriser Python : Techniques avancées : Formez-vous aux différentes fonctionnalités avancées de python. Apprendre le web avec Python/ Django : Découvrez la programmation Web : Apprendre les principes fondamentaux de la programmation Web Maîtriser Python : Analyse et visualisations des données : Apprendre à utiliser Python pour l’analyse et la visualisation des données
    22h52 154 leçons
  • Apprendre Python   - Qualité de code et maintenance
    Découvrir
    Maîtriser Python avec une qualité de code et de maintenance optimales
    3h09 23 leçons
  • Maîtriser Python  - Techniques avancées
    Découvrir
  • Apprendre à programmer en Python
    Découvrir
    Apprendre les fondamentaux du langage de programmation Python
    6h33 60 leçons 4,75 / 5
  • Apprendre le Web avec Python/Django - Découvrez la programmation web
    Découvrir
    Apprendre les principes fondamentaux de la programmation Web
    4h38 32 leçons 3,50 / 5