Maîtriser les Diagrammes en Bâton avec Plotly

Les diagrammes en bâton
Vidéo non disponible ! Réessayez plus tard
Cette vidéo fait partie de la formation
Maîtrisez Python : Analyse et visualisations des données
Revoir le teaser Je m'abonne
3,5
Transcription

Description Programme Avis
3,5

Les objectifs de cette vidéo sont :
- Apprendre à créer des diagrammes en bâton avec Plotly
- Maitriser l'utilisation de px.bar et ses paramètres
- Savoir personnaliser et optimiser les diagrammes pour une meilleure lisibilité.

Découvrez comment utiliser la fonction px.bar de Plotly pour créer des diagrammes en bâton et comparer différentes catégories de données.

Dans cette leçon, nous allons explorer la création de diagrammes en bâton grâce à la bibliothèque Plotly, outil puissant de visualisation de données.
Nous commencerons par importer les ressources nécessaires et récupérer les documents sur les ventes du superstore. Ensuite, nous verrons comment utiliser le px.bar pour créer des diagrammes en bâton lisibles et esthétiques.

Les diagrammes en bâton sont particulièrement utiles pour les comparaisons entre catégories, notamment lorsque les sections sont trop nombreuses ou trop proches pour un camembert. Nous verrons comment configurer le DataFrame, définir les axes x et y, et personnaliser les couleurs et le titre du diagramme.

À travers des exemples pratiques, vous apprendrez également à organiser et agréger les données de manière à obtenir des visualisations claires et informatives, y compris des diagrammes à barres cumulées et des diagrammes à bâtons groupés.

Enfin, nous aborderons les fonctions de zoom et de texte pour valoriser encore plus vos graphiques et permettre des analyses détaillées.

Voir plus
Questions réponses
Quelle est la fonction principale utilisée pour créer un diagramme en bâton avec Plotly ?
La fonction principale est px.bar.
Pourquoi utiliser un diagramme en bâton au lieu d'un diagramme en camembert ?
Un diagramme en bâton est préféré lorsque les sections sont trop nombreuses ou trop proches, rendant un camembert illisible.
Comment peut-on ajouter des valeurs aux bâtons pour une meilleure lisibilité ?
On peut ajouter le paramètre text dans la fonction px.bar et spécifier la colonne de DataFrame contenant les valeurs.
Dans cette vidéo, nous allons aborder les diagrammes en bâton. Alors, comme d'habitude, import des ressources, récupération des documents sur les ventes du superstore, et ensuite le code minimal pour établir un diagramme en bâton. Alors, vous utiliserez un diagramme en bâton seulement si vous avez besoin de faire des comparaisons entre des catégories et ou quand les différentes sections sont trop nombreuses ou trop proches pour qu'il soit possible d'utiliser un camembert. La fonction à utiliser dans ce cas est px.bar. Le premier paramètre est toujours le DataFrame. Le paramètre x définit quelle colonne sera utilisée dans le DataFrame en tant que cap6, donc l'axe des x. Le paramètre y définit quelle colonne utilisée dans votre DataFrame en tant que coordonnées, c'est-à-dire l'axe vertical ou l'axe des y. Encore une fois, le paramètre title vous permettra de définir le titre du diagramme. Et encore une fois, la fonction px.bar retourne un objet figure qui affichera un diagramme en bâton quand vous aurez utilisé la fonction shaw. Alors, un petit traitement au départ puisqu'on va devoir faire l'agrégation par nous-mêmes pour pouvoir établir une quantité de produits vendus par ville. Donc, on a récupéré dans notre DataFrame les colonnes ville, région et quantité. On les a regroupées par ville puis par région. On a agrégé ça sur une somme et on a réordonné ça par quantité de sorte à ce que notre diagramme en bâton soit bien réparti. Et le code, finalement, pour établir le diagramme, tient encore une fois en deux lignes. C'est une bonne nouvelle et ressemble à ceci. Alors, vu qu'on a énormément de villes et énormément de quantités, ça peut être compliqué de lire ce diagramme à première vue. N'oubliez pas qu'il y a une fonction de zoom qui est fournie avec Plotly et qui permet, au fur et à mesure, de zoomer et d'établir les valeurs par ville. Sur les customisations, on va revoir l'utilisation de la couleur. Cette fois, non pas d'un point de vue esthétique, mais pour rajouter une troisième variable de comparaison. Typiquement, on va pouvoir comparer cette fois la quantité de produits vendus par ville, mais en ayant une séparation de ces quantités par la région concernée de cet achat. On peut, encore une fois, toujours customiser ces couleurs. Ça ne s'enjoue rien au paramètre color underscore discrete underscore sequence. On va, par contre, ajouter un paramètre color pour spécifier une nouvelle dimension, une nouvelle colonne du DataFrame à considérer. Du coup, cette fois, ça ressemble à ceci. On voit que pour chaque région des États-Unis, on va avoir finalement une à deux villes, voire trois villes qui vont représenter le très gros des ventes. Ça me semble assez logique. Sur la région Est, c'est New York avec 3420 produits vendus environ. Sur la région Ouest, c'est Los Angeles. Sur la région Centre, c'est Houston. Et sur la région Sud, c'est Jacksonville. Alors, un truc qui manque dans le diagramme précédent, c'est le fait d'afficher les valeurs sur les bâtons. C'est surtout utile quand on a beaucoup de valeurs et quand les valeurs sont quand même assez proches, de sorte à pouvoir comparer clairement deux villes entre elles, par exemple. Pour faire cela, on va avoir besoin de rajouter le paramètre texte à la fonction bar et lui spécifier le nom d'une colonne DataFrame, et c'est cette valeur-là qui sera reprise. Nous, ici, nous voulons afficher la quantité, qui correspond à l'axe des ordonnées, et du coup, on va passer la propriété quantity au paramètre texte. Pour limiter le rendu, on prend que les dix premiers éléments, un DataFrame se comportant un petit peu comme une liste de ce côté-là. Nous avons donc ici le top 10 des villes où le plus de produits sont vendus, et nous avons du coup accès aux valeurs exactes. Il y a des cas dans lesquels on aimerait renverser notre diagramme, parfois pour des questions de visibilité, parfois parce que c'est plus agréable à l'œil, tout simplement. Typiquement, ici, c'était encore faisable, mais si on avait eu beaucoup, beaucoup de villes, les libellés de nos villes auraient été décalés, en tout cas, ils auraient subi une opération de rotation, de sorte à ce que ce puisse être lu. On préférera, dans ce cas, plutôt utiliser des diagrammes horizontaux. Pour transformer un diagramme vertical en un diagramme horizontal, on utilisera la propriété orientation, à laquelle on passera la valeur h, h pour horizontal. Je passe maintenant au diagramme à barres cumulées. Les diagrammes à barres cumulées, c'est vachement intéressant quand on souhaite avoir une information sur une somme, mais aussi sur sa répartition en fonction d'une variable bien précise. Typiquement, si on souhaite évaluer les ventes d'une ville, ou plutôt les ventes sur une période de temps par région, ça peut être intéressant d'avoir toutes ces barres stackées, de sorte à avoir une information relative sur la somme des ventes, mais aussi sur leur répartition en termes de régions. Pour faire ceci, on passera le paramètre barreMode à stack dans la fonction barres. Donc ici, comment on a établi ce diagramme ? Un premier calcul à l'aide de Panda, où on a récupéré le mode de livraison, la région et la quantité que l'on a regroupé en régions et en mode de livraison. On a fait une agrégation et on a traité en fonction de la quantité, de sorte à avoir un diagramme bien aligné. Ensuite, nous avons mis en dimension horizontale la région, en verticale la quantité de produits vendus, en texte la quantité, et sur la couleur, nous avons établi le mode de livraison. Nous obtenons le rendu suivant. Pour chacune des régions, nous avons donc accès à la somme des produits vendus, mais nous avons aussi une information intéressante et secondaire sur le mode de livraison utilisé par les clients de l'achat. Parlons maintenant des diagrammes à bâtons groupés. Parfois, il est quand même plus simple de comparer des bâtons côte à côte qu'en les cumulant, et c'est pourquoi il est possible de passer au paramètre bar mode une autre valeur, qui est la valeur groupe. Si on reprend exactement les mêmes données et le même schéma que précédemment, mais que nous passons le mode d'affichage des barres en groupe, nous arrivons au résultat suivant. Un autre effet intéressant ici, c'est que nous perdons l'information sur le total global, mais qu'il est du coup beaucoup plus facile de comparer les modes de livraison entre eux en fonction des régions, mais aussi de comparer les modes de livraison de région à région.
4 commentaires
3,5
4 votes
5
4
3
2
1
elephorm-1464076@addviseo.com
Il y a 3 months
Commentaire
Bonne formation mais vraiment dommage de ne pas avoir au moins les liens des supports de cours.
nicolasmichaux1
Il y a 1 year
Commentaire
Bonnne formation mais aucun support de cours
lebris.gilles76
Il y a 2 years
Commentaire
Très bien , mais il manque les supports de cours
antoinem
Il y a 2 years
Commentaire
Bien mais il manque les supports de cours
Nos dernières formations Python
  • Pack 5 formations
    Pack Python : Des bases aux techniques avancées
    Découvrir
    Réputé pour être le langage de programmation le plus populaire au monde, Python est très plébiscité pour ses différentes utilisations.  A travers ce pack de 5 formations, vous apprenez les fondamentaux de la programmation Python, vous maîtrisez les techniques avancées et vous découvrez comment utiliser Python pour le web et pour l’analyse et la visualisation des données. Apprendre à programmer en Python : Apprendre les fondamentaux du langage de programmation Python. Apprendre Python : Qualité de code et maintenance : Maîtriser Python avec une qualité de code et de maintenance optimales. Maîtriser Python : Techniques avancées : Formez-vous aux différentes fonctionnalités avancées de python. Apprendre le web avec Python/ Django : Découvrez la programmation Web : Apprendre les principes fondamentaux de la programmation Web Maîtriser Python : Analyse et visualisations des données : Apprendre à utiliser Python pour l’analyse et la visualisation des données
    22h52 154 leçons
  • Apprendre Python   - Qualité de code et maintenance
    Découvrir
    Maîtriser Python avec une qualité de code et de maintenance optimales
    3h09 23 leçons
  • Maîtriser Python  - Techniques avancées
    Découvrir
  • Apprendre à programmer en Python
    Découvrir
    Apprendre les fondamentaux du langage de programmation Python
    6h33 60 leçons 4,75 / 5
  • Apprendre le Web avec Python/Django - Découvrez la programmation web
    Découvrir
    Apprendre les principes fondamentaux de la programmation Web
    4h38 32 leçons 3,50 / 5