Manipulation des chaînes de caractères en Python

Les Fonctions sur les chaînes de caractères
Vidéo non disponible ! Réessayez plus tard
Cette vidéo fait partie de la formation
Maîtrisez Python : Analyse et visualisations des données
Revoir le teaser Je m'abonne
3,5
Transcription

Description Programme Avis
3,5

Les objectifs de cette vidéo sont :

  • Comprendre les principales fonctions de transformation des chaînes de caractères.
  • Savoir utiliser les fonctions de recherche pour analyser du texte.
  • Apprendre à homogénéiser les chaînes de caractères pour des analyses précises.

Découvrez les fonctions clés pour analyser et transformer des chaînes de caractères en Python.

Dans cette leçon, nous approfondirons les fonctions essentielles pour la manipulation des chaînes de caractères en Python. Nous aborderons notamment les fonctions graphiques comme lower et upper pour homogénéiser le contenu, les fonctions de recherche telles que startWith et endWith pour vérifier le début ou la fin des chaînes, et enfin les fonctions de transformation comme split et join qui permettent de découper et d'assembler des chaînes de caractères. Cette leçon est particulièrement utile pour ceux qui souhaitent analyser et nettoyer du texte, que ce soit dans le cadre d'un sondage, d'une enquête ou de toute autre forme de collecte de données textuelles. Chaque fonction sera illustrée par des exemples concrets pour une meilleure compréhension.

Voir plus
Questions réponses
Pourquoi utiliser les fonctions lower et upper en Python ?
Les fonctions lower et upper sont utilisées pour homogénéiser le contenu d'une chaîne de caractères, ce qui simplifie les comparaisons et les analyses textuelles.
Comment fonctionne la fonction split en Python ?
La fonction split divise une chaîne de caractères en une liste en utilisant un séparateur défini. Par défaut, ce séparateur est l'espace.
Peut-on utiliser un séparateur autre que l'espace avec la fonction split ?
Oui, vous pouvez spécifier n'importe quel caractère comme séparateur dans la fonction split. Par exemple, pour une date sous forme de chaîne, vous pouvez utiliser le slash (/) pour séparer le jour, le mois et l'année.
Deuxième vidéo sur les chaînes de caractère, on va aborder en détail quelques fonctions parmi les plus utiles de la librairie Python. Alors, si chaque type de données est livrée avec un ensemble de fonctions en Python, elles vous seront particulièrement utiles ici pour analyser et nettoyer du texte. Dans cette partie de l'information, nous allons aborder quelques-unes des fonctions disponibles les plus utiles pour les chaînes de caractère, à savoir des fonctions graphiques, des fonctions de recherche et des fonctions de transformation. Alors, les fonctions graphiques, ce sont des fonctions qui vont vous transformer l'affichage des chaînes de caractère. Parmi celles-là, deux fonctions qui peuvent être utiles et j'expliquerai pourquoi. La fonction lower qui va permettre de mettre la chaîne de caractère en minuscule et la fonction upper qui va permettre de mettre cette même chaîne de caractère en majuscule. Alors, ces deux fonctions, elles sont surtout utiles pour homogénéiser le contenu d'un retour de formulaire où les répondantes et répondants auraient parfois utilisé oui, oui, oui, non, non, non. Alors, je l'exprime peut-être de façon vocale homogène, mais ces mots ont une orthographe potentiellement différente. C'est d'ailleurs pas le cas ici, mais peu t'importe. Le problème de ça, c'est que pour un être humain, c'est tout à fait compréhensible, mais pour un langage de programmation compiton, ces expressions sont toutes différentes. On peut le voir d'ailleurs ici. Si vous essayez de tester l'égalité exacte entre oui en majuscule et oui avec la première lettre en majuscule, ou oui tout en majuscule avec oui tout en minuscule, piton vous répondra faux. Et s'il vous répondra faux, c'est-à-dire que quand vous allez vouloir calculer la somme des oui et la somme des non, vous aurez des résultats complètement invalides. Et donc, une première façon de nettoyer les résultats d'un formulaire d'enquête, où les gens auront eu la possibilité eux-mêmes de répondre oui ou non dans toutes les orthographes possibles et inimaginables, la première étape, c'est déjà d'homogénéiser, on va dire, la taille des caractères. Deuxième type de fonction, les fonctions de recherche, c'est-à-dire la capacité à être capable de rechercher une expression ou un mot ou une terminaison dans un texte qui peut être indispensable dans les travaux d'analyse. Une première fonction, c'est la fonction startWith, qui, comme son nom l'indique, pour les personnes parmi vous qui parlent un minimum anglais, va permettre de vérifier si un texte commence par une expression que vous aurez définie. Par exemple, et ici on a un exemple concret de ce qui peut être fait, nous allons récupérer un ensemble de réponses à une question, ou bien un sondage sur internet, et nous récupérons un ensemble de oui et de non d'orthographes différentes. Une première étape va être d'homogénéiser d'abord les résultats, par exemple avec la fonction lower, et du coup toutes ces expressions sont en minuscule. Ensuite, nous allons pouvoir compter les oui et les non en se basant sur un postulat très simple. Si l'expression commence par un O, alors c'est un oui, sinon c'est un non. Ici, nous bouclons donc sur les résultats, comme vous pouvez le voir, nous n'avons pas eu besoin de dénumerate, puisque nous n'avons pas besoin de l'index, et nous prenons la valeur et nous effectuons un test dessus avec la fonction startWith. Si effectivement ça commence par un O, alors nous ajoutons un au nombre de oui, oui et non ici étant des compteurs, sinon c'est que c'est un non. A la fin, nous pouvons réutiliser la fonction format vu précédemment pour afficher le nombre de personnes qui ont répondu oui et le nombre de personnes qui ont répondu non. Alors, nous avons l'équivalent de startWith avec endWith. Celle-là, elle sera beaucoup plus utile pour essayer d'évaluer les mots qui ont été écrits dans une forme féminine ou dans une forme plurielle, et essayer de les rassembler. Ça vous sera super utile si un jour vous avez besoin de concevoir, par exemple, des nuages de mots. Vous n'aurez pas du tout envie de considérer que le mot en féminin et le mot en pluriel est un mot différent du mot au masculin simple, par exemple. Vous allez vouloir rassembler tous ces mots dans une seule boîte et les compter en tant que tels, et donc faire grossir le mot dans le nuage de mots d'autant. Ensuite, les fonctions de transformation. Alors, ces fonctions basiques, il y en a beaucoup de fonctions de transformation, nous en avons 2. Elles vont vous permettre de récupérer des informations sur une chaîne de caractère ou, au contraire, de rassembler plusieurs chaînes de caractère pour apporter du sens. Nous avions vu d'ailleurs une première fonction, ou plutôt un premier opérateur de transformation qui est la concaténation, lorsque nous avions utilisé le caractère plus ou le caractère multiplication, par exemple. La fonction split, elle, va vous permettre de redécouper une chaîne de caractère en liste en vous servant d'un caractère appelé séparateur sur lequel va s'effectuer l'opération de séparation. Alors, par défaut, la valeur de ce caractère de séparation, c'est l'espace. Ici, comme vous pouvez le voir dans l'exemple ci-dessous, si je prends la chaîne de caractère, les fonctions sur les chaînes de caractère, et que je lui applique la fonction split, je vais récupérer une liste avec chacun des caractères de séparation. Par contre, si vous souhaitez utiliser un caractère séparateur, typiquement pour séparer une date qui serait là sous forme de string, et récupérer le jour, le mois et l'année, et que le séparateur de cette date, c'est un slash, à ce moment-là, vous pouvez passer au caractère de séparation. Si vous souhaitez utiliser un caractère séparateur, et récupérer le jour, le mois et l'année, et que le séparateur de cette date, c'est un slash, à ce moment-là, vous pouvez passer à la fonction split, le séparateur slash. Ici, deux variantes pour récupérer les différents éléments de la liste. Comme je vous l'ai dit, le résultat de la fonction split, c'est une liste. Mais vous pouvez tout à fait, quand vous connaissez déjà le nombre d'éléments de la liste, assigner directement des variables. C'est ce qui est fait ici. Ici, nous savons que nous allons récupérer trois éléments. Le jour, le mois et l'année. Et nous pouvons tout à fait, ici, en suivant cette façon de faire, cette syntaxe-là, déclarer jour, mois et année, et à ce moment-là, avoir directement les informations que nous demandons dans les bonnes variables. Une autre variante, c'est faire ce qui a été fait au-dessus. C'est-à-dire, déclarer la liste et manipuler la liste comme une liste d'éléments classique. Ce qui est le cas ici. Attention, dans ce cas-là, nous avons manipulé une chaîne de caractères. Et ce qui a été récupéré, que ce soit dans les variables jour, mois et année, ou dans les éléments de la liste, ça reste des chaînes de caractères. Si vous voulez manipuler un nombre de jours en tant que nombre, ou une année en tant que nombre, il faudra évidemment la caster en entier. Le cast de chaînes de caractères en entier se fait à l'aide de la fonction int pour hintiger. Dernière fonction de ce chapitre, la fonction join. La fonction join, c'est très simple. Elle fait le contraire de la fonction split. Elle prend les éléments d'une liste et elle les rassemble en chaînes de caractères. Ce sont donc des fonctions qui sont inverses. Encore une fois, nous pouvons définir ici un séparateur, mais ce n'est pas obligatoire. Si vous ne définissez pas de séparateur, toutes les chaînes vont être collées entre elles sans aucun espace, sans aucun séparateur. C'est ce qui se passe d'ailleurs dans le premier exemple. Vous avez ici jour, mois, année, qui ont été rassemblés ici dans une liste. On voit les crochets ici. Ils ont été remis sous forme de liste. Ils ont été castés sous forme de string, puisque cette fonction join ne fonctionne que sur les chaînes de caractères. Et nous pouvons voir ici notre chaîne de caractères qui est vide. Et cette chaîne de caractères nous sert de séparateur. Alors, puisqu'elle est vide, tout a été concaténé sans aucun espace avec du vide. Et nous voyons la première expression ici. Par contre, si nous voulons finalement recréer l'exemple précédent de notre date de naissance, nous pouvons ajouter le séparateur slash suivi de la même expression join. A ce moment-là, cette date de naissance qui est formatée aura cet exprès-là.
4 commentaires
3,5
4 votes
5
4
3
2
1
elephorm-1464076@addviseo.com
Il y a 3 months
Commentaire
Bonne formation mais vraiment dommage de ne pas avoir au moins les liens des supports de cours.
nicolasmichaux1
Il y a 1 year
Commentaire
Bonnne formation mais aucun support de cours
lebris.gilles76
Il y a 2 years
Commentaire
Très bien , mais il manque les supports de cours
antoinem
Il y a 2 years
Commentaire
Bien mais il manque les supports de cours
Nos dernières formations Python
  • Pack 5 formations
    Pack Python : Des bases aux techniques avancées
    Découvrir
    Réputé pour être le langage de programmation le plus populaire au monde, Python est très plébiscité pour ses différentes utilisations.  A travers ce pack de 5 formations, vous apprenez les fondamentaux de la programmation Python, vous maîtrisez les techniques avancées et vous découvrez comment utiliser Python pour le web et pour l’analyse et la visualisation des données. Apprendre à programmer en Python : Apprendre les fondamentaux du langage de programmation Python. Apprendre Python : Qualité de code et maintenance : Maîtriser Python avec une qualité de code et de maintenance optimales. Maîtriser Python : Techniques avancées : Formez-vous aux différentes fonctionnalités avancées de python. Apprendre le web avec Python/ Django : Découvrez la programmation Web : Apprendre les principes fondamentaux de la programmation Web Maîtriser Python : Analyse et visualisations des données : Apprendre à utiliser Python pour l’analyse et la visualisation des données
    22h52 154 leçons
  • Apprendre Python   - Qualité de code et maintenance
    Découvrir
    Maîtriser Python avec une qualité de code et de maintenance optimales
    3h09 23 leçons
  • Maîtriser Python  - Techniques avancées
    Découvrir
  • Apprendre à programmer en Python
    Découvrir
    Apprendre les fondamentaux du langage de programmation Python
    6h33 60 leçons 4,75 / 5
  • Apprendre le Web avec Python/Django - Découvrez la programmation web
    Découvrir
    Apprendre les principes fondamentaux de la programmation Web
    4h38 32 leçons 3,50 / 5