Les diagrammes en bâton

Vidéo non disponible ! Réessayez plus tard
Cette vidéo fait partie de la formation
Maîtrisez Python : Analyse et visualisations des données
Revoir le teaser Je m'abonne
3,5
Transcription

Description Programme Avis
3,5

Apprendre à utiliser Python pour l’analyse et la visualisation des données.

Si vous souhaitez apprendre à traiter, analyser et visualiser les données avec Python de manière autonome, cette formation est pour vous !

Dans cette formation, vous apprenez à utiliser Google Colaboratory qui est la plateforme SaaS pour utiliser Jupyter sans nécessité d’installation.

Après avoir repris les bases de Jupyter, vous découvrez les bases de Python. Vous apprenez ensuite à charger tous types de données et notamment les fichiers de types Excel, vous apprenez comment nettoyer ce type de fichiers, ainsi que la gestion des valeurs manquantes et les valeurs aberrantes dans vos jeux de données.

Après avoir revu les bases des statistiques, vous apprenez comment gérer des rapports complets pour l’analyse de vos données. 

Enfin, vous passez à la partie visualisation des données, vous apprenez à créer tous types de diagrammes, que ce soit des diagrammes en bâtons, des nuages de points mais également des cartes de chaleurs qui vous donneront des informations très utiles sur le jeu de données à manipuler.

Voir plus
Dans cette vidéo, nous allons aborder les diagrammes en bâton. Alors, comme d'habitude, import des ressources, récupération des documents sur les ventes du superstore, et ensuite le code minimal pour établir un diagramme en bâton. Alors, vous utiliserez un diagramme en bâton seulement si vous avez besoin de faire des comparaisons entre des catégories et ou quand les différentes sections sont trop nombreuses ou trop proches pour qu'il soit possible d'utiliser un camembert. La fonction à utiliser dans ce cas est px.bar. Le premier paramètre est toujours le DataFrame. Le paramètre x définit quelle colonne sera utilisée dans le DataFrame en tant que cap6, donc l'axe des x. Le paramètre y définit quelle colonne utilisée dans votre DataFrame en tant que coordonnées, c'est-à-dire l'axe vertical ou l'axe des y. Encore une fois, le paramètre title vous permettra de définir le titre du diagramme. Et encore une fois, la fonction px.bar retourne un objet figure qui affichera un diagramme en bâton quand vous aurez utilisé la fonction shaw. Alors, un petit traitement au départ puisqu'on va devoir faire l'agrégation par nous-mêmes pour pouvoir établir une quantité de produits vendus par ville. Donc, on a récupéré dans notre DataFrame les colonnes ville, région et quantité. On les a regroupées par ville puis par région. On a agrégé ça sur une somme et on a réordonné ça par quantité de sorte à ce que notre diagramme en bâton soit bien réparti. Et le code, finalement, pour établir le diagramme, tient encore une fois en deux lignes. C'est une bonne nouvelle et ressemble à ceci. Alors, vu qu'on a énormément de villes et énormément de quantités, ça peut être compliqué de lire ce diagramme à première vue. N'oubliez pas qu'il y a une fonction de zoom qui est fournie avec Plotly et qui permet, au fur et à mesure, de zoomer et d'établir les valeurs par ville. Sur les customisations, on va revoir l'utilisation de la couleur. Cette fois, non pas d'un point de vue esthétique, mais pour rajouter une troisième variable de comparaison. Typiquement, on va pouvoir comparer cette fois la quantité de produits vendus par ville, mais en ayant une séparation de ces quantités par la région concernée de cet achat. On peut, encore une fois, toujours customiser ces couleurs. Ça ne s'enjoue rien au paramètre color underscore discrete underscore sequence. On va, par contre, ajouter un paramètre color pour spécifier une nouvelle dimension, une nouvelle colonne du DataFrame à considérer. Du coup, cette fois, ça ressemble à ceci. On voit que pour chaque région des États-Unis, on va avoir finalement une à deux villes, voire trois villes qui vont représenter le très gros des ventes. Ça me semble assez logique. Sur la région Est, c'est New York avec 3420 produits vendus environ. Sur la région Ouest, c'est Los Angeles. Sur la région Centre, c'est Houston. Et sur la région Sud, c'est Jacksonville. Alors, un truc qui manque dans le diagramme précédent, c'est le fait d'afficher les valeurs sur les bâtons. C'est surtout utile quand on a beaucoup de valeurs et quand les valeurs sont quand même assez proches, de sorte à pouvoir comparer clairement deux villes entre elles, par exemple. Pour faire cela, on va avoir besoin de rajouter le paramètre texte à la fonction bar et lui spécifier le nom d'une colonne DataFrame, et c'est cette valeur-là qui sera reprise. Nous, ici, nous voulons afficher la quantité, qui correspond à l'axe des ordonnées, et du coup, on va passer la propriété quantity au paramètre texte. Pour limiter le rendu, on prend que les dix premiers éléments, un DataFrame se comportant un petit peu comme une liste de ce côté-là. Nous avons donc ici le top 10 des villes où le plus de produits sont vendus, et nous avons du coup accès aux valeurs exactes. Il y a des cas dans lesquels on aimerait renverser notre diagramme, parfois pour des questions de visibilité, parfois parce que c'est plus agréable à l'œil, tout simplement. Typiquement, ici, c'était encore faisable, mais si on avait eu beaucoup, beaucoup de villes, les libellés de nos villes auraient été décalés, en tout cas, ils auraient subi une opération de rotation, de sorte à ce que ce puisse être lu. On préférera, dans ce cas, plutôt utiliser des diagrammes horizontaux. Pour transformer un diagramme vertical en un diagramme horizontal, on utilisera la propriété orientation, à laquelle on passera la valeur h, h pour horizontal. Je passe maintenant au diagramme à barres cumulées. Les diagrammes à barres cumulées, c'est vachement intéressant quand on souhaite avoir une information sur une somme, mais aussi sur sa répartition en fonction d'une variable bien précise. Typiquement, si on souhaite évaluer les ventes d'une ville, ou plutôt les ventes sur une période de temps par région, ça peut être intéressant d'avoir toutes ces barres stackées, de sorte à avoir une information relative sur la somme des ventes, mais aussi sur leur répartition en termes de régions. Pour faire ceci, on passera le paramètre barreMode à stack dans la fonction barres. Donc ici, comment on a établi ce diagramme ? Un premier calcul à l'aide de Panda, où on a récupéré le mode de livraison, la région et la quantité que l'on a regroupé en régions et en mode de livraison. On a fait une agrégation et on a traité en fonction de la quantité, de sorte à avoir un diagramme bien aligné. Ensuite, nous avons mis en dimension horizontale la région, en verticale la quantité de produits vendus, en texte la quantité, et sur la couleur, nous avons établi le mode de livraison. Nous obtenons le rendu suivant. Pour chacune des régions, nous avons donc accès à la somme des produits vendus, mais nous avons aussi une information intéressante et secondaire sur le mode de livraison utilisé par les clients de l'achat. Parlons maintenant des diagrammes à bâtons groupés. Parfois, il est quand même plus simple de comparer des bâtons côte à côte qu'en les cumulant, et c'est pourquoi il est possible de passer au paramètre bar mode une autre valeur, qui est la valeur groupe. Si on reprend exactement les mêmes données et le même schéma que précédemment, mais que nous passons le mode d'affichage des barres en groupe, nous arrivons au résultat suivant. Un autre effet intéressant ici, c'est que nous perdons l'information sur le total global, mais qu'il est du coup beaucoup plus facile de comparer les modes de livraison entre eux en fonction des régions, mais aussi de comparer les modes de livraison de région à région.

Programme détaillé de la formation

Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
4 commentaires
3,5
4 votes
5
4
3
2
1
elephorm-1464076@addviseo.com
Il y a 2 months
Commentaire
Bonne formation mais vraiment dommage de ne pas avoir au moins les liens des supports de cours.
nicolasmichaux1
Il y a 1 year
Commentaire
Bonnne formation mais aucun support de cours
lebris.gilles76
Il y a 2 years
Commentaire
Très bien , mais il manque les supports de cours
antoinem
Il y a 2 years
Commentaire
Bien mais il manque les supports de cours
Nos dernières formations Python
  • Pack 5 formations
    Pack Python : Des bases aux techniques avancées
    Découvrir
    Réputé pour être le langage de programmation le plus populaire au monde, Python est très plébiscité pour ses différentes utilisations.  A travers ce pack de 5 formations, vous apprenez les fondamentaux de la programmation Python, vous maîtrisez les techniques avancées et vous découvrez comment utiliser Python pour le web et pour l’analyse et la visualisation des données. Apprendre à programmer en Python : Apprendre les fondamentaux du langage de programmation Python. Apprendre Python : Qualité de code et maintenance : Maîtriser Python avec une qualité de code et de maintenance optimales. Maîtriser Python : Techniques avancées : Formez-vous aux différentes fonctionnalités avancées de python. Apprendre le web avec Python/ Django : Découvrez la programmation Web : Apprendre les principes fondamentaux de la programmation Web Maîtriser Python : Analyse et visualisations des données : Apprendre à utiliser Python pour l’analyse et la visualisation des données
    22h52 154 leçons
  • Apprendre Python   - Qualité de code et maintenance
    Découvrir
    Maîtriser Python avec une qualité de code et de maintenance optimales
    3h09 23 leçons
  • Maîtriser Python  - Techniques avancées
    Découvrir
  • Apprendre à programmer en Python
    Découvrir
    Apprendre les fondamentaux du langage de programmation Python
    6h33 60 leçons 4,75 / 5
  • Apprendre le Web avec Python/Django - Découvrez la programmation web
    Découvrir
    Apprendre les principes fondamentaux de la programmation Web
    4h38 32 leçons 3,50 / 5

éditeur de vidéos pédagogiques

Des supports pédagogiques en vidéo, produits avec les meilleurs experts. Dans nos studios à Paris, Lyon ou Montpellier. Vous souhaitez travailler avec nous ?
image-micro