Les camemberts

Vidéo non disponible ! Réessayez plus tard
Cette vidéo fait partie de la formation
Maîtrisez Python : Analyse et visualisations des données
Revoir le teaser Je m'abonne
3,5
Transcription

Description Programme Avis
3,5

Apprendre à utiliser Python pour l’analyse et la visualisation des données.

Si vous souhaitez apprendre à traiter, analyser et visualiser les données avec Python de manière autonome, cette formation est pour vous !

Dans cette formation, vous apprenez à utiliser Google Colaboratory qui est la plateforme SaaS pour utiliser Jupyter sans nécessité d’installation.

Après avoir repris les bases de Jupyter, vous découvrez les bases de Python. Vous apprenez ensuite à charger tous types de données et notamment les fichiers de types Excel, vous apprenez comment nettoyer ce type de fichiers, ainsi que la gestion des valeurs manquantes et les valeurs aberrantes dans vos jeux de données.

Après avoir revu les bases des statistiques, vous apprenez comment gérer des rapports complets pour l’analyse de vos données. 

Enfin, vous passez à la partie visualisation des données, vous apprenez à créer tous types de diagrammes, que ce soit des diagrammes en bâtons, des nuages de points mais également des cartes de chaleurs qui vous donneront des informations très utiles sur le jeu de données à manipuler.

Voir plus
Dans ce premier chapitre sur les différents types de diagrammes, nous allons aborder les camemberts ou encore diagrammes de section. Dans chacune de ces vidéos, on fera appel à une première partie import de ressources où on ira récupérer notre fameux fichier superstore.csv de sorte à avoir un data frame disponible, qui nous provient de panda, et de pouvoir faire une analyse de ces données. Ensuite, on aura toujours un code minimal pour chacun de type de diagramme. Ici, on va parler des camemberts ou encore diagrammes à section, je le rappelle, et ce type de diagramme permet de facilement évaluer la répartition de notre échantillon, c'est-à-dire de différents éléments qui le constituent, en fonction d'un critère qu'on aura défini. La fonction dans ce cas à utiliser est la fonction px.py, px étant l'alias de plotly.express, un sous-module de plotly. Le premier paramètre de l'ensemble des fonctions qu'on va utiliser sera toujours celui qui servira à passer notre data frame ou une source de données quelconque. Dans le cas du camembert, le paramètre values va permettre de définir quelle colonne utiliser dans le data frame pour agréger les données, alors que le paramètre names va définir quelle colonne de notre data frame utiliser pour, non pas agréger, mais répartir les données traitées. Le paramètre title, quant à lui, est commun à l'ensemble des types de diagrammes que l'on va voir et permet de définir le titre du diagramme. Alors d'un point de vue fonctionnement, cette fonction px.py va retourner un objet figure qui ne va pas s'afficher à l'aide de la fonction print mais à l'aide de la fonction show, comme on l'avait vu dans la vidéo précédente. Ne pas oublier de passer le rendereur à Colab pour une amélioration du rendu dans Google Collaboratory. Alors un premier exemple qu'on peut voir en deux lignes de code au final, si on oublie l'import, on a directement un diagramme avec l'affichage des rations en pourcentage, le survol en termes de catégorie et de quantité de produits vendus. Si on continue avec un deuxième exemple, on peut aussi évaluer par exemple le nombre de ventes par région considérées dans nos données. Si on considère maintenant la customisation, on va rendre ce truc là, on va déjà pouvoir adapter les couleurs de notre diagramme, de notre camembert. Une première option, ça va être de spécifier une liste de couleurs format hexadésimal à l'aide du paramètre color discrete sequence. Ce paramètre, on pourra le passer dans la fonction py. Sachez que Plotly fournit aussi un ensemble de jeux de couleurs qu'il vous suffira de sélectionner. Ces jeux de couleurs sont disponibles dans la variable px.color.qualitative.swatches et vous avez ci dessous un rendu des jeux de couleurs disponibles. Par exemple, si je décide de sélectionner un de ces jeux de couleurs et que je le passe à mon paramètre color underscore discrete underscore sequence, j'aurai ce type de rendu. Maintenant, on va peut-être vouloir changer les labels. On peut avoir des noms de colonnes qui sont en anglais, mais dans le cadre d'une visualisation de données, préférez plutôt avoir des libelés en français par exemple. Pour changer les libelés des variables à manipuler, on définira la propriété labels, toujours dans la fonction py, en passant sous forme de dictionnaire un jeu de données, clé valeur, clé étant la colonne du data frame manipulée, la valeur étant la valeur que l'on souhaite afficher en remplacement. Ensuite, concernant le formatage des valeurs affichées, on va pouvoir évidemment changer le comportement des éléments plus généraux. Pour cela, on devra non pas utiliser la fonction pxpy, mais la fonction update traces. Cette fonction est aussi globale à l'essentiel des types de diagrammes que l'on va manipuler. Par contre, les paramètres seront contextuels. Ici par exemple, on va pouvoir manipuler les paramètres textposition et textinfo pour changer le rendu de notre camembert et afficher non pas seulement le pourcentage, mais le pourcentage, mais aussi rappeler le nom de la catégorie. Enfin, une bonne pratique dès le moment où on a ramené le label et les pourcentages sur les sections du camembert au final, c'est peut-être de supprimer les infos disponibles au survol. A ce moment là, on réutilisera la fonction update traces en passant les paramètres overtemplate à none et overinfo à skip. Dans le cas d'un camembert, il peut être intéressant de supprimer aussi la légende. Puisque toutes les informations sont déjà disponibles sur le camembert, il n'est pas intéressant de permettre à l'utilisateur de faire un aller-retour visuel entre la légende et le camembert puisque la légende n'apporte aucune information supplémentaire. Ici, on devra utiliser une nouvelle fonction, et c'est la dernière fonction qu'on abordera, la fonction update layout avec le paramètre showLegend à false pour désactiver le choix de la légende. Alors, si on rassemble toutes les informations que je vous ai données dans ces customisations possibles, on arrive à l'exemple final suivant. Vous avez donc ici un camembert où toute l'information est centrée directement dans les différentes sections du camembert, sans légende, sans survol, et avec des informations en français.

Programme détaillé de la formation

Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
4 commentaires
3,5
4 votes
5
4
3
2
1
elephorm-1464076@addviseo.com
Il y a 2 months
Commentaire
Bonne formation mais vraiment dommage de ne pas avoir au moins les liens des supports de cours.
nicolasmichaux1
Il y a 1 year
Commentaire
Bonnne formation mais aucun support de cours
lebris.gilles76
Il y a 2 years
Commentaire
Très bien , mais il manque les supports de cours
antoinem
Il y a 2 years
Commentaire
Bien mais il manque les supports de cours
Nos dernières formations Python
  • Pack 5 formations
    Pack Python : Des bases aux techniques avancées
    Découvrir
    Réputé pour être le langage de programmation le plus populaire au monde, Python est très plébiscité pour ses différentes utilisations.  A travers ce pack de 5 formations, vous apprenez les fondamentaux de la programmation Python, vous maîtrisez les techniques avancées et vous découvrez comment utiliser Python pour le web et pour l’analyse et la visualisation des données. Apprendre à programmer en Python : Apprendre les fondamentaux du langage de programmation Python. Apprendre Python : Qualité de code et maintenance : Maîtriser Python avec une qualité de code et de maintenance optimales. Maîtriser Python : Techniques avancées : Formez-vous aux différentes fonctionnalités avancées de python. Apprendre le web avec Python/ Django : Découvrez la programmation Web : Apprendre les principes fondamentaux de la programmation Web Maîtriser Python : Analyse et visualisations des données : Apprendre à utiliser Python pour l’analyse et la visualisation des données
    22h52 154 leçons
  • Apprendre Python   - Qualité de code et maintenance
    Découvrir
    Maîtriser Python avec une qualité de code et de maintenance optimales
    3h09 23 leçons
  • Maîtriser Python  - Techniques avancées
    Découvrir
  • Apprendre à programmer en Python
    Découvrir
    Apprendre les fondamentaux du langage de programmation Python
    6h33 60 leçons 4,75 / 5
  • Apprendre le Web avec Python/Django - Découvrez la programmation web
    Découvrir
    Apprendre les principes fondamentaux de la programmation Web
    4h38 32 leçons 3,50 / 5

éditeur de vidéos pédagogiques

Des supports pédagogiques en vidéo, produits avec les meilleurs experts. Dans nos studios à Paris, Lyon ou Montpellier. Vous souhaitez travailler avec nous ?
image-micro