TP1 Hadoop

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

150 vues2 pages

TP1 Hadoop

Transféré par

Manel Hkimi

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

TP1 - Initiation a Hadoop et MapReduce

Ce TP, vous permet de faire vos premiers pas avec Hadoop. Pour ceci il faut preparer l'environnement
logiciel necessaire. Le plus simple c'est de telecharger et de se connecter a une machine virtuelle dans
laquelle Hadoop, ainsi qu'un grand nombre d'outils de son ecosysteme, sont preinstalles. Pour ceci, il
est recommande de telecharger la machine virtuelle « Hadoop Training Virtual Machine » tournant
sous Ubuntu. Pour utiliser cette machine, il est recommande d'installer « Virtual Box » qui est un
logiciel de virtualisation disponible en tant qu'hote sur plusieurs systemes d'exploitation, notamment
Windows, Linux 32 et 64 bits et Mac OS. Une fois Virtual Box installe, ouvrez-le et im jportez le
fichier HadoopTraining. ova et suivez les instructions qui apparaissent. A la fin de cette etape,
vous pourrez demarrer la machine virtuelle et travailler. Vous aurez notamment besoin d'ouvrir un
terminal pour ecrire les differentes commandes vous permettant d'executer le travail demande. Avant
d'ecrire toute commande hadoop, il faut d'abord lancer les differents services en tapant :
startCDH.sh.
En cas de problème lors du lancement du safemode, lancer l’instruction
hdfs dfsadmin -safemode leave
Pour stopper ces services, il faut taper la commande stopCDH. sh.
En effet, toutes les commandes interagissant avec le systeme Hadoop commencent par hadoop fs ou
hdfs dfs. Ensuite, les options rajoutees sont tres largement inspirees des commandes Unix standard.
Le tableau suivant resume les commandes les plus utilisees dans Hadoop.
Commande Resultat
hadoop fs -ls Lister le contenu d'un dossier
hadoop fs -mkdir <nomdossier> Creer un dossier dans HDFS

hadoop fs -put < Path[Filename]> <nomrep> Charger un fichier du local (repertoire

ex:hadoop fs –put /home/hadoop/Desktop/file.txt Linux) a HDFS
hadoop fs -get < Path[Filename]> <nomrep> Exporter un ou plusieurs fichiers de
ex: hadoop fs –get file.txt /home/hadoop/Desktop/ HDFS au local
hadoop fs -cat <Path[Filename]> Afficher le contenu d'un fichier
hadoop fs -tail <Path[Filename]> Afficher les dernieres lignes d'un
fichier
hadoop fs -rm <Path[Filename]> Supprimer un fichier dans HDFS
Hadoop fs -touchz <Path[Filename]> Creer un fichier vide dans HDFS
Hadoop fs -mv < Path[Filename]> <rep> Deplacer le fichier sous le repertoire
Hadoop fs –rm testtp.txt DirNK rep
hadoop fs -mv DirNK/test2tp.txt DirYS

1
Partie I : Manipulation de commandes HDFS
Dans cette partie nous nous interessons a la manipulation des commandes de base HDFS. Dans ce
contexte, il faut bien faire la distinction entre votre compte Linux ordinaire et le compte que vous avez
sur HDFS. Les commandes hdfs dfs -cmde . . . s'adressent a ce dernier. Les commandes
Unix habituelles s'adressent au premier.

Essayer les manipulations suivantes :

1. Afficher ce qu'il y a a la racine HDFS en tapant : hdfs dfs -ls /. Vous pouvez descendre
inspecter les dossiers que vous voyez. Il n'y a pas de commande equivalente a cd, parce qu'il n'y a
pas de notion de dossier courant dans HDFS, donc a chaque fois, il faut remettre le chemin
complet.
2. Afficher les fichiers des sous-dossiers avec leurs tailles en tapant : hdfs dfs -ls -R -h
/tmp
3. Creer un repertoire fichiers dans votre espace HDFS.
4. Creer un fichier appele bonjour.txt dans votre compte Linux.
5. Ecrire le mot «bonjour» dans bonjour.txt a l'aide de nano ou vi.
6. Copier ce fichier sur HDFS et verifier le resultat en tapant la commande hdfs dfs -ls.
7. Afficher le contenu du fichier bonjour.txt.
8. Supprimer ce fichier de HDFS et verifier le resultat.
9. Remettre a nouveau ce fichier par hdfs dfs -copyFromLocal bonjour.txt. Cette
commande est similaire a hdfs dfs -put.
10. Deplacer bonjour.txt sous le repertoire Fichiers en tapant hdfs dfs -mv bonjour.txt
fichiers. Verifier que le deplacement a bien ete fait.
11. Copier le fichier bonjour.txt dans un nouveau fichier salut.txt dans le meme repertoire.
Verifier que la copie a bien ete faite.
12. Afficher le nombre de sous-dossiers, fichiers et octets occupes en tapant : hdfs dfs –count
hdfs dfs -count DirNK
13. On se propose maintenant de telecharger un fichier dont l'URL est la suivante : http: // www.
textfiles .com/ etext/FICTION/dracula. txt
a. Téléchargez le fichier dracula.txt dans votre compte.
b. Copiez ce fichier vers HDFS et verifiez sa presence.
c. Supprimez le fichier de votre compte local ainsi que de HDFS
14. Voici une autre maniere de faire sans stocker le fichier dans votre compte : wget -O -
http://www.textfiles.com/etext/FICTION/dracula.txt | hdfs dfs -put
- drac.txt
15. Vérifier le fichier a été enregistré dans hdfs : hdfs dfs –ls
16. Lister les blocs du fichier drac.txt en tapant hdfs fsck /user/hadoop/drac.txt -
files -blocks.

Vous aimerez peut-être aussi

TP1 Hadoop
Pas encore d'évaluation
TP1 Hadoop
4 pages
Initiation à Hadoop et MapReduce
Pas encore d'évaluation
Initiation à Hadoop et MapReduce
5 pages
TP2 Hadoop 22 23
Pas encore d'évaluation
TP2 Hadoop 22 23
3 pages
TP1 - HDFS VF
Pas encore d'évaluation
TP1 - HDFS VF
9 pages
Hadoop
Pas encore d'évaluation
Hadoop
6 pages
Commandes HDFS pour la gestion des données
Pas encore d'évaluation
Commandes HDFS pour la gestion des données
9 pages
Commandes Hadoop
Pas encore d'évaluation
Commandes Hadoop
10 pages
Lab 01 - Hadoop FS Ver2
Pas encore d'évaluation
Lab 01 - Hadoop FS Ver2
25 pages
TP BigData 02
Pas encore d'évaluation
TP BigData 02
3 pages
TP: Commandes Shell Hadoop avec Docker
Pas encore d'évaluation
TP: Commandes Shell Hadoop avec Docker
6 pages
Manipulation de Hadoop : HDFS et MapReduce
Pas encore d'évaluation
Manipulation de Hadoop : HDFS et MapReduce
5 pages
RapportControle Taha HILAL BIK
Pas encore d'évaluation
RapportControle Taha HILAL BIK
14 pages
Commandes HDFS pour Big Data 2023-2024
Pas encore d'évaluation
Commandes HDFS pour Big Data 2023-2024
2 pages
Capture D'écran . 2024-05-07 À 21.46.40
Pas encore d'évaluation
Capture D'écran . 2024-05-07 À 21.46.40
7 pages
Mickaelbaron-Hadoopinstallation Part8
Pas encore d'évaluation
Mickaelbaron-Hadoopinstallation Part8
2 pages
Atelier HDFS
Pas encore d'évaluation
Atelier HDFS
5 pages
Atelier HDFS
Pas encore d'évaluation
Atelier HDFS
6 pages
Bigdata Hdfs-Partie4
Pas encore d'évaluation
Bigdata Hdfs-Partie4
11 pages
TP5Bigdata INDIA 2023 2024
Pas encore d'évaluation
TP5Bigdata INDIA 2023 2024
5 pages
DS-2-Big Data Et Cloud
Pas encore d'évaluation
DS-2-Big Data Et Cloud
2 pages
Commandes HDFS pour GL-3
Pas encore d'évaluation
Commandes HDFS pour GL-3
3 pages
Ch3 Big Data Hdfs Map Reduce
Pas encore d'évaluation
Ch3 Big Data Hdfs Map Reduce
52 pages
Atelier Big Data : Traitement Batch avec Hadoop
Pas encore d'évaluation
Atelier Big Data : Traitement Batch avec Hadoop
11 pages
Commandes Shell Essentielles pour HDFS
Pas encore d'évaluation
Commandes Shell Essentielles pour HDFS
2 pages
TP - BigData - 02 - مستندات Google
Pas encore d'évaluation
TP - BigData - 02 - مستندات Google
3 pages
Commandes Hadoop
Pas encore d'évaluation
Commandes Hadoop
5 pages
Hadoop Install
Pas encore d'évaluation
Hadoop Install
6 pages
Rapport de Projet Big Data
Pas encore d'évaluation
Rapport de Projet Big Data
25 pages
TP2 - HDFS - Etudiants (Copy)
Pas encore d'évaluation
TP2 - HDFS - Etudiants (Copy)
4 pages
Big Data tp1
Pas encore d'évaluation
Big Data tp1
6 pages
TP Big Data : Hadoop et MapReduce
Pas encore d'évaluation
TP Big Data : Hadoop et MapReduce
15 pages
TP1 Hadoop-Initiation 2023
Pas encore d'évaluation
TP1 Hadoop-Initiation 2023
4 pages
Script Shell Hadoop
Pas encore d'évaluation
Script Shell Hadoop
3 pages
TP Hadoop: Déploiement et MapReduce
Pas encore d'évaluation
TP Hadoop: Déploiement et MapReduce
10 pages
TP3 - BD - 2024
Pas encore d'évaluation
TP3 - BD - 2024
5 pages
TP1 Initiation À Hadoop
Pas encore d'évaluation
TP1 Initiation À Hadoop
4 pages
Guide d'Installation Hadoop sous Linux
Pas encore d'évaluation
Guide d'Installation Hadoop sous Linux
17 pages
MapReduce et HDFS : Guide Pratique
Pas encore d'évaluation
MapReduce et HDFS : Guide Pratique
2 pages
Mickaelbaron-Hadoopinstallation Part4
Pas encore d'évaluation
Mickaelbaron-Hadoopinstallation Part4
2 pages
Installation et Configuration de Hadoop
Pas encore d'évaluation
Installation et Configuration de Hadoop
17 pages
Initier Hadoop pour Big Data
Pas encore d'évaluation
Initier Hadoop pour Big Data
7 pages
Correction Atelier HDFS
Pas encore d'évaluation
Correction Atelier HDFS
14 pages
Installer et configurer Hadoop sur Ubuntu
Pas encore d'évaluation
Installer et configurer Hadoop sur Ubuntu
11 pages
TP N°1 - Installation Via Paquets
100% (1)
TP N°1 - Installation Via Paquets
6 pages
CBD TP
Pas encore d'évaluation
CBD TP
6 pages
TP2 Hadoop : HDFS et MapReduce
Pas encore d'évaluation
TP2 Hadoop : HDFS et MapReduce
24 pages
Gestion de Données Avec HDFS
Pas encore d'évaluation
Gestion de Données Avec HDFS
7 pages
Correction Atelier 1 HDFS
Pas encore d'évaluation
Correction Atelier 1 HDFS
11 pages
TP 1 Hadoop
Pas encore d'évaluation
TP 1 Hadoop
16 pages
TP1 BigDataAnalytics Initiation Hadoop
Pas encore d'évaluation
TP1 BigDataAnalytics Initiation Hadoop
9 pages
TP HDFS Hadoop Spark Docker
Pas encore d'évaluation
TP HDFS Hadoop Spark Docker
4 pages
SP 01
Pas encore d'évaluation
SP 01
18 pages
Mickaelbaron-Hadoopinstallation Part7
Pas encore d'évaluation
Mickaelbaron-Hadoopinstallation Part7
2 pages
TP BD Hadoop
Pas encore d'évaluation
TP BD Hadoop
7 pages
TP6Bigdata INDIA 2023 2024
Pas encore d'évaluation
TP6Bigdata INDIA 2023 2024
4 pages
tp1 IRS
100% (1)
tp1 IRS
7 pages
Lab 01
Pas encore d'évaluation
Lab 01
10 pages
Atelier3-KafkaLocal Said Ali Abdi
Pas encore d'évaluation
Atelier3-KafkaLocal Said Ali Abdi
24 pages
Première Page HTML
Pas encore d'évaluation
Première Page HTML
2 pages
TD Controle Qualite Et Metriques Logicielles - 012609
Pas encore d'évaluation
TD Controle Qualite Et Metriques Logicielles - 012609
4 pages
Évolution des Objets Techniques : Cycle de Vie et Innovations
Pas encore d'évaluation
Évolution des Objets Techniques : Cycle de Vie et Innovations
1 page
TP2 Dom
Pas encore d'évaluation
TP2 Dom
3 pages
Programmation Evenentiel Csharp
Pas encore d'évaluation
Programmation Evenentiel Csharp
28 pages
"Installez LaTeX pour des Docs Pro"
Pas encore d'évaluation
"Installez LaTeX pour des Docs Pro"
14 pages
Struct-Cours9 - Dîner Des Philosophes Monitor
Pas encore d'évaluation
Struct-Cours9 - Dîner Des Philosophes Monitor
29 pages
Système de Gestion Des Factures
Pas encore d'évaluation
Système de Gestion Des Factures
33 pages
RRepeteur Wavlink
100% (1)
RRepeteur Wavlink
21 pages
Seance 3
Pas encore d'évaluation
Seance 3
11 pages
Mémoire Dom FT Parfait, voici-WPS Office
Pas encore d'évaluation
Mémoire Dom FT Parfait, voici-WPS Office
23 pages
Rapport JSP Servlat Apprendre La Progammation Avec JSP
Pas encore d'évaluation
Rapport JSP Servlat Apprendre La Progammation Avec JSP
14 pages
Introduction aux systèmes Unix/Linux
Pas encore d'évaluation
Introduction aux systèmes Unix/Linux
23 pages
Cryptographie et sécurité des réseaux
Pas encore d'évaluation
Cryptographie et sécurité des réseaux
16 pages
Cahier de Charges
Pas encore d'évaluation
Cahier de Charges
5 pages
TP Matplotlib: Tracer et Analyser
100% (1)
TP Matplotlib: Tracer et Analyser
15 pages
Algorithmique & Programmation 1
Pas encore d'évaluation
Algorithmique & Programmation 1
24 pages
Optimisation Excel : Noms, TCD, Graphiques
Pas encore d'évaluation
Optimisation Excel : Noms, TCD, Graphiques
2 pages
Exercices de Layouts Android
Pas encore d'évaluation
Exercices de Layouts Android
6 pages
Gestion de Projet Professionnelle
Pas encore d'évaluation
Gestion de Projet Professionnelle
37 pages
Thème: Conception Et Réalisation D'une Application de Gestion de Paie Des Enseignants
Pas encore d'évaluation
Thème: Conception Et Réalisation D'une Application de Gestion de Paie Des Enseignants
48 pages
Gestion Et Evaluation Des Projests Informatiques 1
Pas encore d'évaluation
Gestion Et Evaluation Des Projests Informatiques 1
112 pages
Rapport SI - 240615 - 141131
Pas encore d'évaluation
Rapport SI - 240615 - 141131
45 pages
QCM Linux: Administration et Sauvegarde
Pas encore d'évaluation
QCM Linux: Administration et Sauvegarde
6 pages
Programmation Dynamique MPCI Banfora 1
Pas encore d'évaluation
Programmation Dynamique MPCI Banfora 1
111 pages
CV de Salomon Makambo Mukulutu
Pas encore d'évaluation
CV de Salomon Makambo Mukulutu
2 pages
Notes de Cours de Recherche Operationnel
Pas encore d'évaluation
Notes de Cours de Recherche Operationnel
32 pages
La Mise en Page 1bac
Pas encore d'évaluation
La Mise en Page 1bac
3 pages
Modelisation Des Donnees MCD
Pas encore d'évaluation
Modelisation Des Donnees MCD
21 pages
Programme Windows Server 2022 Administration Niveau 1
Pas encore d'évaluation
Programme Windows Server 2022 Administration Niveau 1
2 pages