Introduction aux Problèmes en Big Data
Objectifs
Les objectifs de cette vidéo sont de comprendre les problèmes fondamentaux du Big Data, d'explorer les concepts de vélocité, volume, et variété, et d'évaluer les stratégies de scalabilité.
Résumé
Le Big Data désigne l'ensemble des données volumineuses produites par les technologies modernes. Cette leçon explore les concepts de vélocité, volume, et variété, ainsi que les solutions de scalabilité verticale et horizontale.
Description
Cette leçon offre une mise en contexte sur les problèmes rencontrés en Big Data. Le Big Data représente un ensemble volumineux de données produites par les nouvelles technologies, nécessitant des outils spécifiques pour leur valorisation. À travers cette leçon, nous examinons la quantité de données produites annuellement qui, en 2021, atteignait environ 70 zeta-octets.
Nous plongeons également dans les trois V du Big Data : la vélocité (la rapidité de génération des données), le volume (quantité de données), et la variété (types et sources diverses de données). Face aux lacunes des bases de données relationnelles traditionnelles, nous explorons deux types de scalabilité : la scalabilité verticale (ajout de puissance à une machine unique) et la scalabilité horizontale (ajout de machines supplémentaires à un cluster).