Introduction à MapReduce

Présenter MapReduce
Vidéo non disponible ! Réessayez plus tard
Cette vidéo fait partie de la formation
Apprendre les fondamentaux d'Hadoop
Revoir le teaser Je m'abonne
3,0
Transcription

69,00€ Je commande

Formation incluse dans l'abonnement Elephorm Je m'abonne à Elephorm

DescriptionProgrammeAvis
3,0
69,00€ Je commande

Formation incluse dans l'abonnement Elephorm Je m'abonne à Elephorm

Les objectifs de cette vidéo sont de :

  • Familiariser les spectateurs avec le paradigme MapReduce;
  • Expliquer le fonctionnement des fonctions Map et Reduce;
  • Montrer les avantages de la parallélisation des traitements à l'aide de MapReduce.

Découvrez le paradigme de programmation parallèle avec MapReduce, qui structure les données en paires clés-valeurs et permet des traitements parallèles efficaces.

MapReduce est un cadre de programmation parallèle innovant qui structure les données sous forme de paires clés-valeurs. Apprenez comment la fonction Map transforme des données en listes de paires clés-valeurs et comment la fonction Reduce agrège ces paires pour obtenir des résultats tels qu'une moyenne ou une somme. Les opérations Map et Reduce sont naturellement conçues pour s'exécuter en parallèle, ce qui en fait un outil puissant pour traiter des volumes importants de données. Grâce à sa simplicité et sa flexibilité, MapReduce est utilisé dans de nombreux contextes de big data, offrant des solutions efficaces pour l'analyse et le traitement des informations à grande échelle.

Voir plus
Questions réponses
Qu'est-ce que la fonction Map dans MapReduce ?
La fonction Map prend en entrée des données et les transforme en une liste de paires clés-valeurs.
À quoi sert la fonction Reduce dans MapReduce ?
La fonction Reduce prend en entrée une liste de paires clés et tableaux de valeurs, et effectue une opération d'agrégation comme une somme ou moyenne.
Pourquoi MapReduce est-il adapté aux traitements en parallèle ?
MapReduce est adapté aux traitements en parallèle car les fonctions Map et Reduce sont indépendantes et peuvent être exécutées simultanément sur différentes parties des données.
1 commentaire
3,0
1 vote
5
4
3
2
1
F0BCE18F-B4CF-4428-B3BF-711FC7AA03D6@cyberlibris.studi.fr
Il y a 1 year
Commentaire
super