Introduction à HDFS
Objectifs
Les objectifs de cette vidéo sont de :
- Comprendre le rôle d’HDFS dans l’écosystème Hadoop.
- Appréhender l’architecture maître-esclave de HDFS.
- Explorer les mécanismes de tolérance aux pannes d’HDFS.
Résumé
HDFS, ou Hadoop Distributed File System, est conçu pour stocker et lire des fichiers de grand volume en utilisant une architecture distribuée maître-esclave.
Description
Nous allons maintenant examiner en détail ce qu'est HDFS et son utilité. HDFS, pour Hadoop Distributed File System, est le système de fichiers distribués d'Hadoop. Il permet de stocker et de lire des fichiers de grande taille. Basé sur une architecture maître-esclave, chaque cluster comporte un mNode et plusieurs dataNodes. HDFS découpe les fichiers à stocker en plusieurs parties de plus petite taille, par défaut de 128 mégaoctets. Cette caractéristique permet de gérer des fichiers de grande taille avec efficacité. En outre, HDFS est tolérant aux pannes, car il réplique les données sur différentes machines du cluster. Cela garantit une haute disponibilité et une fiabilité accrue de l'accès aux données.