Chargement et analyse de fichiers de données dans Google Collaboratory

Connecter Google Colaboratory à Google Drive
Vidéo non disponible ! Réessayez plus tard
Cette vidéo fait partie de la formation
Maîtrisez Python : Analyse et visualisations des données
Revoir le teaser Je m'abonne
3,5
Transcription

Description Programme Avis
3,5

Les objectifs de cette vidéo sont les suivants :

  • Apprendre à connecter Google Collaboratory à Google Drive.
  • Découvrir comment charger et analyser des fichiers CSV, Excel, et JSON.
  • Utiliser la bibliothèque pandas pour lire des fichiers et afficher des DataFrames.

Cette leçon explore le chargement de fichiers et leur analyse dans Google Collaboratory, y compris CSV, Excel, et JSON.

Dans ce chapitre de la formation, nous nous penchons sur les méthodes pour charger et analyser divers fichiers de données. Nous aborderons les fichiers CSV, Excel, JSON et HTML. La première étape consiste à connecter Google Collaboratory à Google Drive, un espace de stockage essenceiel. En utilisant le module Google Collab et sa fonction Drive, nous monterons notre Google Drive à un dossier dans Google Collaboratory. Ce tutoriel couvre en détail le processus d'authentification et d'accès aux fichiers, ainsi que l'utilisation de la bibliothèque pandas pour ouvrir et analyser un fichier CSV. Vous apprendrez à localiser un fichier dans Drive, à définir son chemin, et à utiliser Google Collaboratory pour afficher son contenu sous forme de DataFrame.

Voir plus
Questions réponses
Comment connecter Google Collaboratory à Google Drive?
Vous devez utiliser le module Google Collab et appeler la fonction Drive.mount() pour monter votre Google Drive à un dossier dans votre espace Collaboratory.
Quel module est principalement utilisé pour l'analyse de fichiers dans cette leçon?
Le module 'pandas' est principalement utilisé pour l'analyse des fichiers de données dans cette leçon.
Quelle est la structure de base d'un DataFrame dans pandas?
Un DataFrame dans pandas est une structure de données en tableaux qui permet de manipuler et d'analyser des données sous forme de colonnes.
Dans ce chapitre de la formation, nous allons nous intéresser au chargement des fichiers et à leur analyse de manière générale. Il y a toutes sortes de fichiers qui contiennent de la donnée. Dans ce cours, nous avons fait le choix de traiter les fichiers CSV, les fichiers Excel, les fichiers JSON, et potentiellement essayer d'aller collecter des fichiers HTML. Alors une première chose à faire en préambule de cette partie, ça va être de trouver un moyen d'indiquer à Google Collaboratory où aller chercher ces fameux fichiers de données. Pour ça, nous allons connecter notre Google Collaboratory à Google Drive, qui est un espace de stockage disponible avec le compte Gmail qui vous a permis de vous connecter à Google Collaboratory, et qui va nous donner accès à un espace de stockage et donc aux fichiers que nous allons manipuler tout au long de cette formation. Alors pour faire ça, aucune surprise, nous allons avoir besoin d'un module, le module Google et notamment son sous-module Collab. Et dans ce sous-module Collab, nous allons avoir besoin de la fonction Drive. Une fois que nous avons cette fonction Drive, nous allons pouvoir faire un Drive Mount, qui va finalement connecter notre espace de stockage Google Drive à un dossier disponible dans Google Collaboratory. Alors la première fois qu'on exécute cette cellule, Google Collaboratory va nous demander d'accéder à un lien d'authentification et de fournir un code d'autorisation. Alors là vous vous connectez avec le mail qui vous a servi à créer votre compte, et puis vous pouvez copier-coller ce code directement dans la petite fenêtre qui s'est affichée ici. Ensuite vous appuyez sur Entrée, et c'est ce qui va permettre à Google Drive d'accéder à la connexion de Google Collaboratory à votre espace. Ensuite, nous allons pouvoir, à l'aide de Panda, que j'aborde une première fois ici et qui fera l'objet de la vidéo suivante, nous allons pouvoir ouvrir un premier fichier. J'importe Panda en tant que PD, c'est l'alias classique, je suis désolé pour ça. Et SuperStore va être justement le fichier d'analyse des ventes que je vous proposais de faire en introduction. Donc pd.read.csv. Et ensuite ici, comment on va définir le chemin ? Alors pour définir le chemin, il va falloir connaître la position de ce fichier dans votre Drive. Alors on va passer rapidement sur mon Drive. Et ici sur mon Drive, on va avoir une hiérarchie de documents. Cette hiérarchie de documents, moi à la racine, j'ai un dossier de données, et dans ce dossier de données, j'ai le fichier que je souhaite charger sous vos yeux. Et donc, le chemin exact, ça va être le suivant. myDrive.données.superstore.csv Alors pourquoi myDrive ? Parce que mon Drive ici, la racine, il va être traduit en anglais tout simplement. Alors on exécute la cellule, il ne se passe rien, a priori pas de problème. Maintenant on aimerait bien savoir ce que Panda a fait de ce fichier CSV finalement. Et pour faire ça, on n'a même pas besoin de printer, puisque Google Collaboratory est capable de lire cette structure particulière qui est un DataFrame, un tableau à colonne, un tableur tout simplement, on pourrait dire. Et donc ici, nous avons finalement une première vue du fichier qui va nous occuper tout au long des prochaines vidéos et des prochains points abordés dans cette formation.
4 commentaires
3,5
4 votes
5
4
3
2
1
elephorm-1464076@addviseo.com
Il y a 3 months
Commentaire
Bonne formation mais vraiment dommage de ne pas avoir au moins les liens des supports de cours.
nicolasmichaux1
Il y a 1 year
Commentaire
Bonnne formation mais aucun support de cours
lebris.gilles76
Il y a 2 years
Commentaire
Très bien , mais il manque les supports de cours
antoinem
Il y a 2 years
Commentaire
Bien mais il manque les supports de cours
Nos dernières formations Python
  • Pack 5 formations
    Pack Python : Des bases aux techniques avancées
    Découvrir
    Réputé pour être le langage de programmation le plus populaire au monde, Python est très plébiscité pour ses différentes utilisations.  A travers ce pack de 5 formations, vous apprenez les fondamentaux de la programmation Python, vous maîtrisez les techniques avancées et vous découvrez comment utiliser Python pour le web et pour l’analyse et la visualisation des données. Apprendre à programmer en Python : Apprendre les fondamentaux du langage de programmation Python. Apprendre Python : Qualité de code et maintenance : Maîtriser Python avec une qualité de code et de maintenance optimales. Maîtriser Python : Techniques avancées : Formez-vous aux différentes fonctionnalités avancées de python. Apprendre le web avec Python/ Django : Découvrez la programmation Web : Apprendre les principes fondamentaux de la programmation Web Maîtriser Python : Analyse et visualisations des données : Apprendre à utiliser Python pour l’analyse et la visualisation des données
    22h52 154 leçons
  • Apprendre Python   - Qualité de code et maintenance
    Découvrir
    Maîtriser Python avec une qualité de code et de maintenance optimales
    3h09 23 leçons
  • Maîtriser Python  - Techniques avancées
    Découvrir
  • Apprendre à programmer en Python
    Découvrir
    Apprendre les fondamentaux du langage de programmation Python
    6h33 60 leçons 4,75 / 5
  • Apprendre le Web avec Python/Django - Découvrez la programmation web
    Découvrir
    Apprendre les principes fondamentaux de la programmation Web
    4h38 32 leçons 3,50 / 5