Modules complémentaires d'Hadoop
Objectifs
Les objectifs de cette vidéo sont de:
- Présenter les composants complémentaires d'Hadoop.
- Expliquer les fonctionnalités de chaque outil.
- Illustrer leur intégration dans un environnement big data.
Résumé
Apprenez les composants additionnels d'Hadoop tels que HBase, Hive, et Spark qui enrichissent ses capacités de traitement des données.
Description
Dans cette leçon, nous explorons divers composants additionnels d'Hadoop qui complètent ses trois modules principaux. HBase est une base de données distribuée conçue pour gérer des tables de grande taille avec un stockage structuré orienté colonne. Hive permet d'exécuter des requêtes en utilisant HiveQL, un langage proche du SQL. Pig, semblable à Hive, utilise un langage propre pour le traitement des données. ZooKeeper assure la coordination des services au sein d'un cluster, tandis que Scoop facilite l'importation et l'exportation de données entre Hadoop et des bases de données relationnelles. Oozie est une solution de workflow pour la gestion des tâches de traitement. Enfin, Spark offre des capacités de calcul distribuées avancées, alternatives à MapReduce.