Gestion des Valeurs Manquantes dans les Données

La gestion des valeurs manquantes
Vidéo non disponible ! Réessayez plus tard
Cette vidéo fait partie de la formation
Maîtrisez Python : Analyse et visualisations des données
Revoir le teaser Je m'abonne
3,6
Transcription


99,00€ Je commande

Formation incluse dans l'abonnement Elephorm Je m'abonne à Elephorm

DescriptionProgrammeAvis
3,6

99,00€ Je commande

Formation incluse dans l'abonnement Elephorm Je m'abonne à Elephorm

Les objectifs de cette vidéo sont de vous fournir des méthodes pour identifier les valeurs manquantes dans vos données, évaluer leur impact sur votre analyse, et appliquer des techniques de rectification adéquates.

Apprenez à gérer les valeurs manquantes dans vos jeux de données et découvrez les meilleures pratiques pour le nettoyage de données.

Dans cette leçon, nous abordons une problématique commune en analyse de données : la gestion des valeurs manquantes. Les données peuvent être incomplètes pour diverses raisons : absence de la personne en charge de la collecte, bug informatique, erreurs de manipulation, etc. Une analyse rigoureuse nécessite d’évaluer le nombre de valeurs manquantes et de décider si elles doivent être supprimées, modifiées, ou laissées telles quelles.

Nous utiliserons un exemple concret avec un jeu de données issu de la chaîne de magasins Superstore. Nous verrons comment évaluer la proportion de valeurs manquantes et les effets possibles de leur suppression sur les indices statistiques. Nous explorerons aussi les stratégies de modification, telle que le remplacement des codes postaux manquants par des valeurs fiables trouvées en ligne ou dans le dataset lui-même.

Voir plus
Questions réponses
Pourquoi les jeux de données présentent-ils souvent des valeurs manquantes ?
Les valeurs manquantes peuvent être dues à l'absence du collecteur de données, des bugs informatiques, des erreurs de manipulation ou des champs invalides remplacés par des vides.
Quels sont les facteurs à considérer avant de supprimer des valeurs manquantes ?
Il faut évaluer la proportion de valeurs manquantes, l'impact de leur suppression sur les indices statistiques et si une non-valeur peut être considérée comme une valeur en soi.
Comment peut-on remplacer une valeur manquante, par exemple un code postal, dans un dataset ?
On peut rechercher sur Internet le code postal correspondant à la ville manquante ou utiliser des valeurs préexistantes dans le dataset pour compléter les informations manquantes.
5 commentaires
3,6
5 votes
5
4
3
2
1
améliefiale
Il y a 1 semaine
Bonne formation, mais il manque les supports de cours
elephorm-1464076@addviseo.com
Il y a 10 mois
Bonne formation mais vraiment dommage de ne pas avoir au moins les liens des supports de cours.
nicolasmichaux1
Il y a 2 ans
Bonnne formation mais aucun support de cours
lebris.gilles76
Il y a 3 ans
Très bien , mais il manque les supports de cours
antoinem
Il y a 3 ans
Bien mais il manque les supports de cours