Analyse des Séries Temporelles avec Plotly.express

Les séries temporelles
Vidéo non disponible ! Réessayez plus tard
Cette vidéo fait partie de la formation
Maîtrisez Python : Analyse et visualisations des données
Revoir le teaser Je m'abonne
3,5
Transcription

Description Programme Avis
3,5

Les objectifs de cette vidéo sont d'enseigner comment analyser des séries temporelles, identifier des tendances saisonnières, utiliser Plotly.express pour visualiser ces données, et améliorer la lisibilité des graphiques.

Dans cette leçon, apprenez à analyser les séries temporelles de vos données de ventes en utilisant Plotly.express pour identifier les tendances et saisonnalités.

Cette vidéo didactique vous guide à travers l'analyse des séries temporelles en utilisant le framework Plotly.express. Vous commencerez par importer les données de votre magasin SuperStore et écrire le code minimal pour générer une série temporelle. La vidéo vous expliquera l'importance de vérifier la saisonnalité dans vos données, en utilisant la fonction px.line. Les paramètres x, y, et title seront explorés en profondeur pour créer des visualisations claires et informatives.

Il est également démontré comment regrouper et trier votre DataFrame par date de commande pour obtenir des graphiques pertinents. À travers des exemples concrets, vous identifierez des pics de ventes et des périodes de saisonnalité comme les mois de mars et septembre-octobre.

La vidéo poursuit avec des techniques avancées pour améliorer vos graphiques, comme l'utilisation de couleurs pour évaluer les ventes par région et l'affichage contrôlé des libellés pour comparer différentes zones géographiques. Vous apprendrez aussi à réduire la “pollution visuelle” de vos graphiques en modifiant le fond du graphique.

Enfin, l'utilisation de l'option LinesPlusMarkers dans la fonction UpdateTraces est expliquée pour distinguer les données réelles des points intermédiaires, en prenant l'exemple des ventes de janvier 2016.

Voir plus
Questions réponses
Quelle est l'utilisation principale de la fonction px.line dans Plotly.express ?
La fonction px.line est utilisée pour créer des graphiques en ligne simples et pour analyser des séries temporelles dans des DataFrames.
Pourquoi est-il important de vérifier la saisonnalité dans les données de ventes ?
Il est important de vérifier la saisonnalité afin d'identifier les périodes récurrentes de hausse ou de baisse des ventes, ce qui permet d'améliorer les stratégies commerciales.
Comment pouvez-vous réduire la 'pollution visuelle' dans vos graphiques ?
Vous pouvez réduire la pollution visuelle en modifiant le fond du graphique, par exemple en l'effaçant complètement pour rendre le graphique plus lisible.
Dans cette vidéo, nous allons aborder les séries temporelles. Encore une fois, nous allons importer les ressources de notre magasin SuperStore et nous allons commencer par établir le code minimal pour une série temporelle. Lorsque vous allez analyser des ventes sur une échelle de temps, une des premières informations à vérifier, c'est s'il n'y a pas de saisonnalité, c'est-à-dire des périodes où vous observez une augmentation ou une diminution significative des ventes. La fonction à utiliser dans ce cas est px.line, px étant, encore une fois, l'alias de Plotly.express. Le paramètre x définit quelles colonnes utiliser dans votre DataFrame en abscisse. Le paramètre y définit quelles colonnes utiliser dans votre DataFrame en ordonnée. Le paramètre title définit le titre du diagramme. Enfin, la fonction px.line retourne un objet figure qui affichera une série temporelle lors de l'exécution de la fonction shaw. Oui, ça ressemble beaucoup à la vidéo précédente, c'est normal, c'est exactement la même fonction et exactement les mêmes paramètres. C'est un des intérêts d'utiliser Plotly.express. Alors, on va devoir encore une fois traiter un petit peu notre DataFrame pour regrouper les ventes, ou plutôt le nombre d'achats, par date de commande, puis nous allons trier ça par date, de sorte à avoir le titre diagramme suivant rendu, encore une fois, en deux lignes de code. Alors ici, on a déjà des informations. Nous avons un pic local ici en mars, ici en septembre, ici en septembre, ici en octobre, et ici en mars. Il y a donc potentiellement une saisonnalité sur les mois de mars et sur la période septembre-octobre, en tout cas en première analyse des ventes de ce jeu de données. Comme nous l'avions fait précédemment, on peut aussi jouer sur les couleurs pour essayer d'évaluer nos données au regard d'une troisième variable. Si vous souhaitez, par exemple, évaluer les ventes réalisées quotidiennement par les différentes régions, on va pouvoir ajouter cette variable en tant que couleur. Ce qui est intéressant ici, c'est qu'en cliquant sur chacun des libellés de la légende, vous aurez la possibilité de mettre en surbrillance une ou plusieurs de ces régions et pouvoir établir une comparaison. Le code reste strictement le même. Il aura fallu juste rajouter « régions » dans la sélection et dans le groupe By de sorte à avoir l'information correspondante dans le data frame manipulé. On note ici le paramètre Color qui est réutilisé. Nous arrivons maintenant à ce résultat-là. Comme je vous le disais, ici, les libellés sont activables et désactivables de sorte à pouvoir faire une comparaison précise, par exemple, entre deux régions. Ou, au contraire, ne garder qu'une seule région en surbrillance. Une des premières améliorations possibles de ce diagramme, c'est de limiter la pollution visuelle. Si, par exemple, on reprend exactement le même diagramme, mais qu'on décide d'effacer complètement le background, c'est-à-dire le fond, on arrive à ce résultat qui est, de mon point de vue, un petit peu plus lisible. Enfin, on va pouvoir afficher des marqueurs de données. On peut être habitué à des lignes, mais on sait très bien que les lignes ne sont que des liaisons virtuelles entre deux lignes de notre data frame, par exemple. Il peut être intéressant pour votre public de savoir quels points de ces lignes correspondent à des points réels, à des jeux de données réels, et quels sont, finalement, les points qui correspondent à des liaisons entre deux points réels. Pour cela, nous utiliserons la fonction UpdateTraces avec le mode et la valeur LinesPlusMarkers. Ça permettra de garder l'affichage des lignes, mais également d'afficher les marques sur les points réels de données. Nous allons ici faire une sélection sur le jeu de données précédent, en ne conservant que le mois de janvier de 2016, en effectuant une query sur ce data frame. Une fois ceci fait, nous rajoutons l'option LinesPlusMarkers au mode de la fonction UpdateTraces, et nous avons le rendu suivant. Comme vous pouvez le voir, ici nous conservons les lignes, et à chaque point va correspondre une ligne ou une donnée réelle de notre data frame.
4 commentaires
3,5
4 votes
5
4
3
2
1
elephorm-1464076@addviseo.com
Il y a 3 months
Commentaire
Bonne formation mais vraiment dommage de ne pas avoir au moins les liens des supports de cours.
nicolasmichaux1
Il y a 1 year
Commentaire
Bonnne formation mais aucun support de cours
lebris.gilles76
Il y a 2 years
Commentaire
Très bien , mais il manque les supports de cours
antoinem
Il y a 2 years
Commentaire
Bien mais il manque les supports de cours
Nos dernières formations Python
  • Pack 5 formations
    Pack Python : Des bases aux techniques avancées
    Découvrir
    Réputé pour être le langage de programmation le plus populaire au monde, Python est très plébiscité pour ses différentes utilisations.  A travers ce pack de 5 formations, vous apprenez les fondamentaux de la programmation Python, vous maîtrisez les techniques avancées et vous découvrez comment utiliser Python pour le web et pour l’analyse et la visualisation des données. Apprendre à programmer en Python : Apprendre les fondamentaux du langage de programmation Python. Apprendre Python : Qualité de code et maintenance : Maîtriser Python avec une qualité de code et de maintenance optimales. Maîtriser Python : Techniques avancées : Formez-vous aux différentes fonctionnalités avancées de python. Apprendre le web avec Python/ Django : Découvrez la programmation Web : Apprendre les principes fondamentaux de la programmation Web Maîtriser Python : Analyse et visualisations des données : Apprendre à utiliser Python pour l’analyse et la visualisation des données
    22h52 154 leçons
  • Apprendre Python   - Qualité de code et maintenance
    Découvrir
    Maîtriser Python avec une qualité de code et de maintenance optimales
    3h09 23 leçons
  • Maîtriser Python  - Techniques avancées
    Découvrir
  • Apprendre à programmer en Python
    Découvrir
    Apprendre les fondamentaux du langage de programmation Python
    6h33 60 leçons 4,75 / 5
  • Apprendre le Web avec Python/Django - Découvrez la programmation web
    Découvrir
    Apprendre les principes fondamentaux de la programmation Web
    4h38 32 leçons 3,50 / 5