Détails de la leçon
Description de la leçon
Dans cette leçon, nous abordons un cas pratique issu du module 3 de la formation autour du traitement de fichiers de données, en utilisant le contexte d'un fichier de la SNCF concernant ses programmes de formation. L'objectif principal est de découvrir comment exploiter Claude IA pour nettoyer un tableau Excel composé d'une soixantaine de lignes comportant diverses erreurs : coquilles, fautes de format, doublons, lignes vides et autres anomalies.
L'approche consiste à rédiger un prompt spécifique à l'intention de Claude. Celui-ci devra corriger toutes les erreurs évidentes (syntaxe, format, calculs manifestement erronés) et produire la liste précise des corrections effectuées. En outre, Claude signalera dans le chat les incohérences ou anomalies moins manifestes, laissant le soin à l'utilisateur de les corriger manuellement. Ce processus est illustré pas à pas : ouverture du fichier, formulation du prompt, contrôle des retours de Claude concernant les corrections et la gestion différenciée selon la gravité des problèmes détectés.
Ce module démontre la puissance de l’intelligence artificielle pour automatiser le nettoyage initial de données tout en conservant le contrôle sur des anomalies plus subtiles ou contextuelles. En mettant en œuvre cette méthode, les apprenants acquièrent des compétences transférables pour traiter d'autres fichiers et utiliser efficacement Claude ou d'autres IA pour améliorer la qualité des bases de données.
Objectifs de cette leçon
Les objectifs sont d'apprendre à :
- Rédiger un prompt adapté pour confier le nettoyage de données à Claude IA.
- Automatiser la correction des erreurs les plus évidentes dans un tableau Excel.
- Savoir distinguer entre correction automatique et audit d'anomalies plus subtiles.
- Comprendre les pratiques d'utilisation de l'IA pour améliorer la qualité des bases de données.
Prérequis pour cette leçon
Une connaissance de base d'Excel et des manipulations de tableaux est recommandée. Une familiarité élémentaire avec le fonctionnement de Claude ou d'autres IA génératives est utile, ainsi qu’une compréhension des enjeux liés à la qualité de la donnée.
Métiers concernés
Ce sujet concerne les analystes de données, responsables de la formation, gestionnaires RH, data managers, consultants en transformation digitale et toute personne chargée de la qualité des données dans une organisation.
Alternatives et ressources
Pour le nettoyage de données, d’autres solutions existent :
- Google Sheets avec ses propres scripts/propositions d’IA
- Power Query intégré à Excel
- Outils open source tels que OpenRefine ou Python (pandas)
- Autres assistants IA comme ChatGPT ou Bard pour des tâches similaires