Les Fonctions sur les chaînes de caractères

Vidéo non disponible ! Réessayez plus tard
Cette vidéo fait partie de la formation
Maîtrisez Python : Analyse et visualisations des données
Revoir le teaser Je m'abonne
3,5
Transcription

Description Programme Avis
3,5

Apprendre à utiliser Python pour l’analyse et la visualisation des données.

Si vous souhaitez apprendre à traiter, analyser et visualiser les données avec Python de manière autonome, cette formation est pour vous !

Dans cette formation, vous apprenez à utiliser Google Colaboratory qui est la plateforme SaaS pour utiliser Jupyter sans nécessité d’installation.

Après avoir repris les bases de Jupyter, vous découvrez les bases de Python. Vous apprenez ensuite à charger tous types de données et notamment les fichiers de types Excel, vous apprenez comment nettoyer ce type de fichiers, ainsi que la gestion des valeurs manquantes et les valeurs aberrantes dans vos jeux de données.

Après avoir revu les bases des statistiques, vous apprenez comment gérer des rapports complets pour l’analyse de vos données. 

Enfin, vous passez à la partie visualisation des données, vous apprenez à créer tous types de diagrammes, que ce soit des diagrammes en bâtons, des nuages de points mais également des cartes de chaleurs qui vous donneront des informations très utiles sur le jeu de données à manipuler.

Voir plus
Deuxième vidéo sur les chaînes de caractère, on va aborder en détail quelques fonctions parmi les plus utiles de la librairie Python. Alors, si chaque type de données est livrée avec un ensemble de fonctions en Python, elles vous seront particulièrement utiles ici pour analyser et nettoyer du texte. Dans cette partie de l'information, nous allons aborder quelques-unes des fonctions disponibles les plus utiles pour les chaînes de caractère, à savoir des fonctions graphiques, des fonctions de recherche et des fonctions de transformation. Alors, les fonctions graphiques, ce sont des fonctions qui vont vous transformer l'affichage des chaînes de caractère. Parmi celles-là, deux fonctions qui peuvent être utiles et j'expliquerai pourquoi. La fonction lower qui va permettre de mettre la chaîne de caractère en minuscule et la fonction upper qui va permettre de mettre cette même chaîne de caractère en majuscule. Alors, ces deux fonctions, elles sont surtout utiles pour homogénéiser le contenu d'un retour de formulaire où les répondantes et répondants auraient parfois utilisé oui, oui, oui, non, non, non. Alors, je l'exprime peut-être de façon vocale homogène, mais ces mots ont une orthographe potentiellement différente. C'est d'ailleurs pas le cas ici, mais peu t'importe. Le problème de ça, c'est que pour un être humain, c'est tout à fait compréhensible, mais pour un langage de programmation compiton, ces expressions sont toutes différentes. On peut le voir d'ailleurs ici. Si vous essayez de tester l'égalité exacte entre oui en majuscule et oui avec la première lettre en majuscule, ou oui tout en majuscule avec oui tout en minuscule, piton vous répondra faux. Et s'il vous répondra faux, c'est-à-dire que quand vous allez vouloir calculer la somme des oui et la somme des non, vous aurez des résultats complètement invalides. Et donc, une première façon de nettoyer les résultats d'un formulaire d'enquête, où les gens auront eu la possibilité eux-mêmes de répondre oui ou non dans toutes les orthographes possibles et inimaginables, la première étape, c'est déjà d'homogénéiser, on va dire, la taille des caractères. Deuxième type de fonction, les fonctions de recherche, c'est-à-dire la capacité à être capable de rechercher une expression ou un mot ou une terminaison dans un texte qui peut être indispensable dans les travaux d'analyse. Une première fonction, c'est la fonction startWith, qui, comme son nom l'indique, pour les personnes parmi vous qui parlent un minimum anglais, va permettre de vérifier si un texte commence par une expression que vous aurez définie. Par exemple, et ici on a un exemple concret de ce qui peut être fait, nous allons récupérer un ensemble de réponses à une question, ou bien un sondage sur internet, et nous récupérons un ensemble de oui et de non d'orthographes différentes. Une première étape va être d'homogénéiser d'abord les résultats, par exemple avec la fonction lower, et du coup toutes ces expressions sont en minuscule. Ensuite, nous allons pouvoir compter les oui et les non en se basant sur un postulat très simple. Si l'expression commence par un O, alors c'est un oui, sinon c'est un non. Ici, nous bouclons donc sur les résultats, comme vous pouvez le voir, nous n'avons pas eu besoin de dénumerate, puisque nous n'avons pas besoin de l'index, et nous prenons la valeur et nous effectuons un test dessus avec la fonction startWith. Si effectivement ça commence par un O, alors nous ajoutons un au nombre de oui, oui et non ici étant des compteurs, sinon c'est que c'est un non. A la fin, nous pouvons réutiliser la fonction format vu précédemment pour afficher le nombre de personnes qui ont répondu oui et le nombre de personnes qui ont répondu non. Alors, nous avons l'équivalent de startWith avec endWith. Celle-là, elle sera beaucoup plus utile pour essayer d'évaluer les mots qui ont été écrits dans une forme féminine ou dans une forme plurielle, et essayer de les rassembler. Ça vous sera super utile si un jour vous avez besoin de concevoir, par exemple, des nuages de mots. Vous n'aurez pas du tout envie de considérer que le mot en féminin et le mot en pluriel est un mot différent du mot au masculin simple, par exemple. Vous allez vouloir rassembler tous ces mots dans une seule boîte et les compter en tant que tels, et donc faire grossir le mot dans le nuage de mots d'autant. Ensuite, les fonctions de transformation. Alors, ces fonctions basiques, il y en a beaucoup de fonctions de transformation, nous en avons 2. Elles vont vous permettre de récupérer des informations sur une chaîne de caractère ou, au contraire, de rassembler plusieurs chaînes de caractère pour apporter du sens. Nous avions vu d'ailleurs une première fonction, ou plutôt un premier opérateur de transformation qui est la concaténation, lorsque nous avions utilisé le caractère plus ou le caractère multiplication, par exemple. La fonction split, elle, va vous permettre de redécouper une chaîne de caractère en liste en vous servant d'un caractère appelé séparateur sur lequel va s'effectuer l'opération de séparation. Alors, par défaut, la valeur de ce caractère de séparation, c'est l'espace. Ici, comme vous pouvez le voir dans l'exemple ci-dessous, si je prends la chaîne de caractère, les fonctions sur les chaînes de caractère, et que je lui applique la fonction split, je vais récupérer une liste avec chacun des caractères de séparation. Par contre, si vous souhaitez utiliser un caractère séparateur, typiquement pour séparer une date qui serait là sous forme de string, et récupérer le jour, le mois et l'année, et que le séparateur de cette date, c'est un slash, à ce moment-là, vous pouvez passer au caractère de séparation. Si vous souhaitez utiliser un caractère séparateur, et récupérer le jour, le mois et l'année, et que le séparateur de cette date, c'est un slash, à ce moment-là, vous pouvez passer à la fonction split, le séparateur slash. Ici, deux variantes pour récupérer les différents éléments de la liste. Comme je vous l'ai dit, le résultat de la fonction split, c'est une liste. Mais vous pouvez tout à fait, quand vous connaissez déjà le nombre d'éléments de la liste, assigner directement des variables. C'est ce qui est fait ici. Ici, nous savons que nous allons récupérer trois éléments. Le jour, le mois et l'année. Et nous pouvons tout à fait, ici, en suivant cette façon de faire, cette syntaxe-là, déclarer jour, mois et année, et à ce moment-là, avoir directement les informations que nous demandons dans les bonnes variables. Une autre variante, c'est faire ce qui a été fait au-dessus. C'est-à-dire, déclarer la liste et manipuler la liste comme une liste d'éléments classique. Ce qui est le cas ici. Attention, dans ce cas-là, nous avons manipulé une chaîne de caractères. Et ce qui a été récupéré, que ce soit dans les variables jour, mois et année, ou dans les éléments de la liste, ça reste des chaînes de caractères. Si vous voulez manipuler un nombre de jours en tant que nombre, ou une année en tant que nombre, il faudra évidemment la caster en entier. Le cast de chaînes de caractères en entier se fait à l'aide de la fonction int pour hintiger. Dernière fonction de ce chapitre, la fonction join. La fonction join, c'est très simple. Elle fait le contraire de la fonction split. Elle prend les éléments d'une liste et elle les rassemble en chaînes de caractères. Ce sont donc des fonctions qui sont inverses. Encore une fois, nous pouvons définir ici un séparateur, mais ce n'est pas obligatoire. Si vous ne définissez pas de séparateur, toutes les chaînes vont être collées entre elles sans aucun espace, sans aucun séparateur. C'est ce qui se passe d'ailleurs dans le premier exemple. Vous avez ici jour, mois, année, qui ont été rassemblés ici dans une liste. On voit les crochets ici. Ils ont été remis sous forme de liste. Ils ont été castés sous forme de string, puisque cette fonction join ne fonctionne que sur les chaînes de caractères. Et nous pouvons voir ici notre chaîne de caractères qui est vide. Et cette chaîne de caractères nous sert de séparateur. Alors, puisqu'elle est vide, tout a été concaténé sans aucun espace avec du vide. Et nous voyons la première expression ici. Par contre, si nous voulons finalement recréer l'exemple précédent de notre date de naissance, nous pouvons ajouter le séparateur slash suivi de la même expression join. A ce moment-là, cette date de naissance qui est formatée aura cet exprès-là.

Programme détaillé de la formation

Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
Je commande Je m'abonne
4 commentaires
3,5
4 votes
5
4
3
2
1
elephorm-1464076@addviseo.com
Il y a 2 months
Commentaire
Bonne formation mais vraiment dommage de ne pas avoir au moins les liens des supports de cours.
nicolasmichaux1
Il y a 1 year
Commentaire
Bonnne formation mais aucun support de cours
lebris.gilles76
Il y a 2 years
Commentaire
Très bien , mais il manque les supports de cours
antoinem
Il y a 2 years
Commentaire
Bien mais il manque les supports de cours
Nos dernières formations Python
  • Pack 5 formations
    Pack Python : Des bases aux techniques avancées
    Découvrir
    Réputé pour être le langage de programmation le plus populaire au monde, Python est très plébiscité pour ses différentes utilisations.  A travers ce pack de 5 formations, vous apprenez les fondamentaux de la programmation Python, vous maîtrisez les techniques avancées et vous découvrez comment utiliser Python pour le web et pour l’analyse et la visualisation des données. Apprendre à programmer en Python : Apprendre les fondamentaux du langage de programmation Python. Apprendre Python : Qualité de code et maintenance : Maîtriser Python avec une qualité de code et de maintenance optimales. Maîtriser Python : Techniques avancées : Formez-vous aux différentes fonctionnalités avancées de python. Apprendre le web avec Python/ Django : Découvrez la programmation Web : Apprendre les principes fondamentaux de la programmation Web Maîtriser Python : Analyse et visualisations des données : Apprendre à utiliser Python pour l’analyse et la visualisation des données
    22h52 154 leçons
  • Apprendre Python   - Qualité de code et maintenance
    Découvrir
    Maîtriser Python avec une qualité de code et de maintenance optimales
    3h09 23 leçons
  • Maîtriser Python  - Techniques avancées
    Découvrir
  • Apprendre à programmer en Python
    Découvrir
    Apprendre les fondamentaux du langage de programmation Python
    6h33 60 leçons 4,75 / 5
  • Apprendre le Web avec Python/Django - Découvrez la programmation web
    Découvrir
    Apprendre les principes fondamentaux de la programmation Web
    4h38 32 leçons 3,50 / 5

éditeur de vidéos pédagogiques

Des supports pédagogiques en vidéo, produits avec les meilleurs experts. Dans nos studios à Paris, Lyon ou Montpellier. Vous souhaitez travailler avec nous ?
image-micro