Cours : Big Data Framework & Enseignante
Section :: 3-GL
Nedra Ibrahim
Technologies
Année universitaire : 2024/2025 Section: GL-3
Tp 5 : Interrogation de Big Data avec Hive
Exercice 1 :
1. Lancer hive en utilisant la commande
$ hive
2. Créer une nouvelle base de données TP4 puis l’utiliser. (vérifier la création dans HDFS)
3. Afficher la liste des bases de données existantes.
4. Créer une table livres dont le schéma est le suivant : (id INT, title STRING, publishDate
STRING)
5. Charger les données à partir du fichier [Link] dans la table livres;
6. Afficher les enregistrements dont l’id est 2.
7. Créer un nouveau répertoire data sous le répertoire /hadoop dans HDFS.
Charger le fichier [Link] dans le nouveau répertoire data.
8. Créer une table externe ventes dans l’emplacement HDFS suivant ‘/hadoop/data’;
La table ventes contient 3 colonnes : (id INT, buyer STRING, purchaseDate STRING)
9. Afficher toutes les lignes de la table ventes.
10. Charger le fichier [Link] dans le répertoire /hadoop/data
Afficher toutes les lignes de la table ventes et vérifier l’ajout des nouvelles lignes.
11. Créer la table vente_livres avec le schéma suivant (id INT, title STRING, buyer STRING,
purchaseDate STRING)
12. Remplir la table vente_livres en utilisant une jointure selon la colonne id entre les tables : livres
et ventes.
13. Afficher 10 enregistrements de la table vente_livres
1
Cours : Big Data Framework & Enseignante
Section :: 3-GL
Nedra Ibrahim
Technologies
Année universitaire : 2024/2025 Section: GL-3
14. Afficher la liste des tables existantes.
15. Supprimer la table vente_livres
Exercice 2 :
1. Créer une table partitionnée media.
Le schéma de la table media est le suivant : (id int, title string, releaseDate string, type string).
La colonne type serait la colonne de partition. Charger les données à partir de 3 fichiers locaux
dans trois partitions :
Partition book => media/[Link]
Partition cd => media/[Link]
Partition dvd => media/[Link]
2. Afficher les enregistrements de type cd
3. Afficher les enregistrements de type dvd
4. Afficher les enregistrements de type book
5. Afficher toutes les partions de la table media
6. Ouvrir un nouveau terminal et afficher la structure des répertoires de partition sous HDFS