Mapper WordCount en Scala

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

22 vues3 pages

Mapper WordCount en Scala

Transféré par

nouharakrouki822

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

Word Count

MAPREDUCE – LE MAPPER

HADID | BIG DATA | Date

Le reducer. Le code du mapper de WordCount se trouve ci-après. Il gère les tâches
suivantes :

1: import [Link];
2: import [Link];
3: import [Link];
4: import [Link];
5:
6: public class WordCountReducer extends
Reducer<Text, IntWritable, Text, IntWritable> {
7:
8: @Override
9: public void reduce(Text key,
Iterable<IntWritable> values, Context context) throws
IOException, InterruptedException {
10:
11: int wordCount = 0;
12:
13: for (IntWritable value : values) {
14: wordCount = wordCount + [Link]();
15: }
16:
17: [Link](key, new IntWritable(wordCount));
18:
19: }
20:}

Le code du mapper de WordCount gère les tâches suivantes :

Lignes 1 à 4 : importation des classes Java nécessaires au fonctionnement du reducer.

Lignes 6 à 20 : définition de la classe WordCountReducer qui sera appelée par le

driver (cf. ligne 26 du driver).

Ligne 9 : indication du type des données en entrée du reducer. Il s’agit d’une liste de
couples (key, value), key étant de type Text (c’est un mot issu des œuvres de
Shakespeare, par exemple "the") et value étant une liste (Iterable) de valeurs de type
IntWritable (il s’agit d’une liste des 1 émis par les mappers à chaque occurrence de
"the").

Ligne 11 : mise à zéro du compteur des différentes occurrences d’un mot.

Lignes 13 à 15 : ces lignes sont le cœur du reducer.

PAGE 1
Ligne 13 : les différentes occurrences (cf. boucle for) du mot passé dans key sont
comptées (ligne 14). Plutôt que d’ajouter 1 à la variable wordCount, on ajoute
[Link]() ce qui revient exactement au même dans le cas de l’exemple de
WordCount.

Ligne 17 : une fois que toute la liste de comptage a été parcourue, le mapper écrit le
mot (key) et le résultat du comptage (wordCount) dans l’objet context. Comme la
variable wordCount est initialement définie comme variable du type Java int (cf. ligne
11) elle doit être convertie au type Hadoop IntWritable (cf. ligne 17, new
IntWritable(wordCount)) avant de pouvoir être écrite.

PAGE 2

Vous aimerez peut-être aussi

Tp4 Hadoop-Programmation Map-Reduce: Partie 1: Wordcount en Java
Pas encore d'évaluation
Tp4 Hadoop-Programmation Map-Reduce: Partie 1: Wordcount en Java
3 pages
Programme WordCount avec MapReduce
Pas encore d'évaluation
Programme WordCount avec MapReduce
4 pages
Driver WordCount en Java pour Hadoop
100% (1)
Driver WordCount en Java pour Hadoop
3 pages
Compte de mots avec Hadoop et Java
Pas encore d'évaluation
Compte de mots avec Hadoop et Java
5 pages
Atelier3 Map Reduce Sur La Plate Forme Cloudera
Pas encore d'évaluation
Atelier3 Map Reduce Sur La Plate Forme Cloudera
9 pages
TP2 - Hadoop MapReduce 2023
Pas encore d'évaluation
TP2 - Hadoop MapReduce 2023
11 pages
Etape Mapreduce
Pas encore d'évaluation
Etape Mapreduce
6 pages
Introduction au modèle MapReduce
Pas encore d'évaluation
Introduction au modèle MapReduce
5 pages
TP N°2 - Exemple Word Count Avec Hadoop
Pas encore d'évaluation
TP N°2 - Exemple Word Count Avec Hadoop
12 pages
Cours 03 MapReduce
Pas encore d'évaluation
Cours 03 MapReduce
36 pages
Atelier 2
Pas encore d'évaluation
Atelier 2
3 pages
Guide Hadoop MapReduce WordCount
Pas encore d'évaluation
Guide Hadoop MapReduce WordCount
4 pages
TP Hadoop: MapReduce et Python
Pas encore d'évaluation
TP Hadoop: MapReduce et Python
5 pages
Atelier 2 Map Reduce
Pas encore d'évaluation
Atelier 2 Map Reduce
4 pages
TP Hadoop: MapReduce et YARN en Java
100% (1)
TP Hadoop: MapReduce et YARN en Java
5 pages
Introduction à MapReduce et Hadoop
Pas encore d'évaluation
Introduction à MapReduce et Hadoop
9 pages
TP2 MapReduce
Pas encore d'évaluation
TP2 MapReduce
7 pages
Lab 3
Pas encore d'évaluation
Lab 3
3 pages
Chapitre 1 - Application Word Count
Pas encore d'évaluation
Chapitre 1 - Application Word Count
7 pages
Atelier 5 Word Count Avec MapReduce
Pas encore d'évaluation
Atelier 5 Word Count Avec MapReduce
22 pages
Introduction à Hadoop MapReduce
Pas encore d'évaluation
Introduction à Hadoop MapReduce
28 pages
Introduction à Map-Reduce et TP Hadoop
Pas encore d'évaluation
Introduction à Map-Reduce et TP Hadoop
7 pages
TP3 Map Reduce
Pas encore d'évaluation
TP3 Map Reduce
25 pages
Introduction au Big Data et MapReduce
Pas encore d'évaluation
Introduction au Big Data et MapReduce
47 pages
Abderrahman Eladlani - TPs - Hadoop
Pas encore d'évaluation
Abderrahman Eladlani - TPs - Hadoop
1 page
HDFS Boufares TP2
Pas encore d'évaluation
HDFS Boufares TP2
8 pages
TP1 MR - Initiation
Pas encore d'évaluation
TP1 MR - Initiation
4 pages
CH 4 MapReduce
Pas encore d'évaluation
CH 4 MapReduce
18 pages
Travaux Pratique N 1 - 3
Pas encore d'évaluation
Travaux Pratique N 1 - 3
4 pages
Hdfs Mapreduce
Pas encore d'évaluation
Hdfs Mapreduce
43 pages
Hadoop MP Industrie 4
Pas encore d'évaluation
Hadoop MP Industrie 4
18 pages
LCD m2 Fiil tp06
Pas encore d'évaluation
LCD m2 Fiil tp06
2 pages
TP2 MapReduce 02 2024
Pas encore d'évaluation
TP2 MapReduce 02 2024
8 pages
TP3 Progrmmation Hadoop - MapReduce Sous Cloudera
Pas encore d'évaluation
TP3 Progrmmation Hadoop - MapReduce Sous Cloudera
6 pages
TP Big Data : Compteur de Mots Hadoop
Pas encore d'évaluation
TP Big Data : Compteur de Mots Hadoop
8 pages
Introduction à MapReduce et MongoDB
Pas encore d'évaluation
Introduction à MapReduce et MongoDB
20 pages
MapReduce avec Python pour WordCount
Pas encore d'évaluation
MapReduce avec Python pour WordCount
12 pages
Mbds Big Data Hadoop 2019 2020 Cours 2
Pas encore d'évaluation
Mbds Big Data Hadoop 2019 2020 Cours 2
45 pages
Introduction à Hadoop et Big Data
Pas encore d'évaluation
Introduction à Hadoop et Big Data
56 pages
Exécution de MapReduce avec Hadoop
Pas encore d'évaluation
Exécution de MapReduce avec Hadoop
5 pages
Lab 3
Pas encore d'évaluation
Lab 3
15 pages
Introduction à MapReduce avec Hadoop
Pas encore d'évaluation
Introduction à MapReduce avec Hadoop
16 pages
Diapo3 Big Data
Pas encore d'évaluation
Diapo3 Big Data
37 pages
Traitement Du Big Data: TP3 Le Modèle de Programmation Map Reduce
Pas encore d'évaluation
Traitement Du Big Data: TP3 Le Modèle de Programmation Map Reduce
25 pages
Atelier2 Mapreduce
Pas encore d'évaluation
Atelier2 Mapreduce
3 pages
Cours 04 MapReduce MultiJobs
Pas encore d'évaluation
Cours 04 MapReduce MultiJobs
12 pages
Examen Big Data : Corrigé et Solutions
Pas encore d'évaluation
Examen Big Data : Corrigé et Solutions
4 pages
Analyse de MapReduce, Cassandra et Spark
Pas encore d'évaluation
Analyse de MapReduce, Cassandra et Spark
4 pages
Introduction à MapReduce et Big Data
Pas encore d'évaluation
Introduction à MapReduce et Big Data
65 pages
TD Big Data: Installation Hadoop & MapReduce
Pas encore d'évaluation
TD Big Data: Installation Hadoop & MapReduce
6 pages
Ige356 - Grpe Ii
Pas encore d'évaluation
Ige356 - Grpe Ii
3 pages
TP3 - BD - 2024
Pas encore d'évaluation
TP3 - BD - 2024
5 pages
Bigdata3 - MR
Pas encore d'évaluation
Bigdata3 - MR
34 pages
Cours Hadoop
Pas encore d'évaluation
Cours Hadoop
56 pages
Introduction à MapReduce pour Big Data
Pas encore d'évaluation
Introduction à MapReduce pour Big Data
73 pages
Introduction à Hadoop et MapReduce
Pas encore d'évaluation
Introduction à Hadoop et MapReduce
6 pages
Programmation Hadoop : Guide du Driver Java
100% (1)
Programmation Hadoop : Guide du Driver Java
11 pages