0% ont trouvé ce document utile (0 vote)

85 vues34 pages

Présentation: Redis/Consul Apache Tez

Le document présente trois technologies clés : Apache Tez, Consul et Redis, qui optimisent les systèmes distribués. Apache Tez améliore l'exécution des workflows Big Data, Consul gère la découverte de services et la configuration dynamique, tandis que Redis offre des performances rapides pour la mise en cache et la messagerie. L'intégration de ces technologies améliore la scalabilité et la performance des applications modernes.

Transféré par

soufianezouhairbusiness

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

85 vues34 pages

Présentation: Redis/Consul Apache Tez

Transféré par

soufianezouhairbusiness

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

MS BD2C

Présentation
REDIS/CONSUL
APACHE TEZ
MR CHIBA ZOUHAIR

Réalisé par :
Ayman ZOUINI - Soufiane ZOUHAIR - Saad BOUKHERYS
PLAN Apache Tez

Consul

Redis

Conclusion
Apache Tez
Introduction
Apache Tez est un moteur d'exécution Big Data
conçu pour gérer des workflows de données
complexes organisés sous forme de graphes
orientés acycliques (DAG). En tant que
successeur de MapReduce, il offre une
optimisation accrue de l'exécution des tâches
dans les environnements Hadoop. Son objectif
principal est de réduire les latences tout en
améliorant les performances des traitements de
grandes quantités de données.
Apache Tez vs MapReduce
Modèle de workflow Optimisation
MapReduce : Étapes fixes MapReduce : Statique, pas
(Map → Reduce). d'optimisation dynamique.
Apache Tez : Workflows Apache Tez : Optimisation
flexibles avec DAGs. dynamique en temps réel.

Gestion des données Flexibilité

MapReduce : I/O MapReduce : Tâches
intermédiaire sur disque. linéaires.
Apache Tez : Données en Apache Tez : Workflows
mémoire. multi-étapes.
Composants clés
DAGs : Graphique des workflows avec nœuds et
arêtes.
Task Containers : Exécution isolée des tâches
1
individuelles.
ResourceManager : Gestion centralisée des
ressources via YARN.
Fonctionnalités clés
Flexibilité des DAGs : Workflows complexes
avec dépendances explicites.
Gestion des ressources : Exploite YARN
pour optimiser l'utilisation des ressources.
Tolérance aux pannes : Redémarrage des
tâches échouées.
Applications principales

01 03
02 04
Analyse de données Hive et Pig
Environnements
Remplacement de Machine learning Accélération des requêtes critiques
MapReduce pour un SQL et transformations de
Pipelines pour préparation et Traitement des données
traitement rapide. données.
entraînement de modèles. sensibles dans divers
Exemple : Détection de Exemple : Analyse des achats
Exemple : Systèmes de secteurs.
fraudes financières. dans le e-commerce
recommandation. Exemple : Recherche
épidémiologique
TP : Traitement de
Données Textuelles et CSV
Soumettre la tâche :
tez jar $TEZ_EXAMPLES/[Link]
[Link] -input /data/[Link]
-output /data/[Link]
But : Compter les lignes de /data/[Link] et
sauvegarder le résultat dans /data/[Link].

Vérifier le résultat :
hadoop fs -cat /data/[Link]
TP : Traitement de
Données Textuelles et CSV
Ajouter [Link] à HDFS pour traitement :
hadoop fs -put [Link] /data/[Link]

Créer un Flux de Travail Tez :

Input: csv_input
Processor: filter_employees
Output: filtered_employees
csv_input:
InputFormat: [Link]
InputPath: /data/[Link]
filter_employees:
ProcessorClass: [Link]
filter_age > 30
TP : Traitement de
Données Textuelles et CSV
Soumettre le flux de travail :
tez jar my_tez_app.jar my_dag.yaml

Vérifier l’État :
tez status

Afficher les résultats :

hadoop fs -cat /data/filtered_employees.csv
Consul
Fonctionnalités
principales
DNS et Service Discovery : Découverte
automatique des services via DNS/API,
avec vérifications de santé.
KV Store : Stockage distribué pour
configurations et métadonnées, avec
notifications en temps réel.
Service Mesh : Communication sécurisée
avec chiffrement, routage avancé et
observabilité.
Architecture

Agents : Clients Protocoles :

(tâches locales) gRPC, Raft
et serveurs (consensus), Serf
(maintien de (communication
l’état global, entre agents).
consensus Raft).
Intégration avec d’autres outils

Docker
Kubernetes
Enregistrement automatique
Découverte de services et
des conteneurs, découverte
gestion via service mesh.
via DNS, health checks.
Cas d’utilisation
CI/CD : Synchronisation des configurations dans
les déploiements.
1 Microservices : Gestion des communications
sécurisées.
Multi-cloud : Unification de la découverte de
services.
TP : Consul By Hashicorp
Lance un agent Consul localement :
#consul agent –dev

Enregistre un service dans Consul :

#curl -X PUT -d ' { "ID":"web","Name":"web","Tags":
["http"],"Adresse":"localhost","Port":8080}'
[Link]

Liste tous les services enregistrés :

#curl [Link]

Crée une clé-valeur dans Consul :

#curl -X PUT -d "my-value" [Link]
TP : Consul By Hashicorp
Récupère la valeur d'une clé :
#curl [Link]

Liste des services dans Consul :

#consul catalog services

Affiche les membres du cluster Consul :

#consul members

Affiche des informations sur l'agent Consul :

#consul info
TP : Consul By Hashicorp
Enregistre la valeur "value123" sous la clé "myapp/config" :
#consul kv put myapp/config "value123"

Récupère la valeur associée à la clé "myapp/config" :

#consul kv get myapp/config

Affiche l'état de santé des services dans Consul :

#consul health state
Redis
Introduction
Redis est une base de données en
mémoire rapide, adaptée à des cas
comme la mise en cache, la gestion de
sessions et la messagerie en temps réel.
Elle est flexible et offre des performances
exceptionnelles grâce à son stockage en
mémoire.
Fonctionnalités principales
Types de données
String, List, Set, Hash, Sorted Set.

Persistance
Modes RDB et AOF pour sauvegarder les
données.

Pub/Sub et Transactions
Communication asynchrone et exécution
atomique avec Lua.

Eviction de clés
Politiques comme LRU pour gérer la mémoire.
Architecture et Haute
Disponibilité
Modèle client-serveur : Gestion centralisée
des connexions avec une forte performance.
Réplication et haute disponibilité :
Utilisation de Redis Sentinel pour la
surveillance et la bascule automatique en
cas de panne, et Redis Cluster pour la
répartition des données et la scalabilité.
Sécurité et Optimisation

Sécurité : Optimisation :
Compression des
Authentification
données pour
par mot de passe maximiser l'utilisation
et protection des de la mémoire, gestion
communications de charges élevées, et
surveillance des
via TLS.
performances avec
RedisInsight.
Cas d'utilisation

File d'attente
Mise en cache Gestion des
pour gérer des Classements et
pour améliorer sessions
workflows et recommandation
la latence des utilisateur avec systèmes de s basés sur des
applications. expiration messagerie en ensembles triés.
configurable. temps réel.
Limites et Évolutions
Limites : Consommation de mémoire élevée
et défis dans la gestion des données
massives avec Redis Cluster.
Évolutions : Modules comme RediSearch,
RedisJSON, RedisAI pour étendre les
fonctionnalités. Redis-as-a-Service est
également populaire sur le cloud.
TP : Installation Redis
Installation de [Link] et [Link] via :
[Link]
[Link]

Installation d'Ubuntu WSL.

Installation de Redis via :

[Link]
TP : Fonction counter

Le code de la fonction d’incrementation a chaque fois on se

connecte a redis.
TP : Fonction counter

Nous avons utilisé l'outil « Postman » pour vérifier la performance

de cette fonction et, comme vous pouvez le voir, elle a réussi.
TP : La fonction Set Key Value
Vérification des paramètres :
Si clé ou valeur manquante,
erreur 400.
Interaction avec Redis :
[Link](key, value) pour
enregistrer la paire.
Gestion des réponses :
Succès → confirmation,
erreur → réponse 500 et log.
TP : La fonction Get Key Value
Extraction de la clé : La clé est
obtenue via [Link].
Récupération de la valeur
depuis Redis : [Link](key)
pour récupérer la valeur. Si non
trouvée, erreur 404.
Réponse en cas de succès : La
valeur est renvoyée si la clé
existe.
Gestion des erreurs : Erreur
Redis → log et réponse 500.
Conclusion
Conclusion
Les technologies Apache Tez, Consul et Redis sont
essentielles pour optimiser les systèmes distribués. Tez
améliore l'exécution des workflows Big Data, Consul gère
la découverte de services et la configuration dynamique,
tandis que Redis offre des performances rapides pour la
mise en cache et la messagerie. Leur intégration améliore
la scalabilité et la performance des applications
modernes.
MERCI POUR
VOTRE ATTENTION

Vous aimerez peut-être aussi

Apache Tez Theorique
Pas encore d'évaluation
Apache Tez Theorique
3 pages
Rapport Nodejs
Pas encore d'évaluation
Rapport Nodejs
22 pages
M1 Poly Olap Francais
0% (1)
M1 Poly Olap Francais
20 pages
TP 3 - C++
Pas encore d'évaluation
TP 3 - C++
1 page
Chapitre 5. Problème de Satisfaction de Contraintes (CSP)
Pas encore d'évaluation
Chapitre 5. Problème de Satisfaction de Contraintes (CSP)
10 pages
KNIME
Pas encore d'évaluation
KNIME
20 pages
Concours ENSAMR INDIA 21-22 (Tous Les Sujets)
Pas encore d'évaluation
Concours ENSAMR INDIA 21-22 (Tous Les Sujets)
20 pages
24 Matrices Et Applications Lineaires - 2017 - 2018
Pas encore d'évaluation
24 Matrices Et Applications Lineaires - 2017 - 2018
7 pages
Les Reseaux Informatiques Smi S5
Pas encore d'évaluation
Les Reseaux Informatiques Smi S5
104 pages
Examencours 2ST Math5
Pas encore d'évaluation
Examencours 2ST Math5
12 pages
TP4 Java : Classes Point et TestPoint
100% (1)
TP4 Java : Classes Point et TestPoint
2 pages
Analyse de la complexité en Python
Pas encore d'évaluation
Analyse de la complexité en Python
22 pages
Examen Algorithmique 2 - UIZ 2020-2021
Pas encore d'évaluation
Examen Algorithmique 2 - UIZ 2020-2021
4 pages
Correction TD 2
Pas encore d'évaluation
Correction TD 2
4 pages
TP #4 - Convolution Et Application Des Filtres
Pas encore d'évaluation
TP #4 - Convolution Et Application Des Filtres
3 pages
Données Semi-Structurées: Technologie XML
Pas encore d'évaluation
Données Semi-Structurées: Technologie XML
85 pages
Théorie des graphes : Problèmes et solutions
Pas encore d'évaluation
Théorie des graphes : Problèmes et solutions
4 pages
Chapitre4 Equations Différentielles-2
Pas encore d'évaluation
Chapitre4 Equations Différentielles-2
13 pages
Java : Exceptions et Threads en Pratique
Pas encore d'évaluation
Java : Exceptions et Threads en Pratique
2 pages
Détection de Contours : Méthodes et Applications
Pas encore d'évaluation
Détection de Contours : Méthodes et Applications
44 pages
La Prédiction Du Prix Des Voitures D'occasion Au Maroc
Pas encore d'évaluation
La Prédiction Du Prix Des Voitures D'occasion Au Maroc
40 pages
Tp5 PDF
Pas encore d'évaluation
Tp5 PDF
2 pages
Limites Classiques des Fonctions
Pas encore d'évaluation
Limites Classiques des Fonctions
1 page
Cours de Probabilité MR LAKHAL Elhasan
0% (1)
Cours de Probabilité MR LAKHAL Elhasan
128 pages
Exam Session 1
Pas encore d'évaluation
Exam Session 1
2 pages
Plateforme AMINE et Théorie des GC
100% (2)
Plateforme AMINE et Théorie des GC
134 pages
Correction de La Série Numéro 02
Pas encore d'évaluation
Correction de La Série Numéro 02
18 pages
TD2: Étude de Cas: Application de Gestion de Location de Voitures
100% (1)
TD2: Étude de Cas: Application de Gestion de Location de Voitures
2 pages
TD Si3
Pas encore d'évaluation
TD Si3
4 pages
Examen Data Warehousing Avance
Pas encore d'évaluation
Examen Data Warehousing Avance
2 pages
TD1-Cas Utilisation - Correction
Pas encore d'évaluation
TD1-Cas Utilisation - Correction
2 pages
GRH Avec SQL Server+Visual Studio+DevExpress
Pas encore d'évaluation
GRH Avec SQL Server+Visual Studio+DevExpress
11 pages
Determinisation Avec Epsilon
Pas encore d'évaluation
Determinisation Avec Epsilon
16 pages
Polycopié de TP-MDC 22-23
Pas encore d'évaluation
Polycopié de TP-MDC 22-23
30 pages
Chapitre 3-Algèbre Relationnel
Pas encore d'évaluation
Chapitre 3-Algèbre Relationnel
19 pages
Modélisation Entrepôt Santé Groland
Pas encore d'évaluation
Modélisation Entrepôt Santé Groland
2 pages
TD4 PDF
Pas encore d'évaluation
TD4 PDF
4 pages
Exercices Corrigés sur Piles et Files
Pas encore d'évaluation
Exercices Corrigés sur Piles et Files
5 pages
A Poly BDR 2010
Pas encore d'évaluation
A Poly BDR 2010
36 pages
Serie 2 An Num Correction 2016
100% (1)
Serie 2 An Num Correction 2016
14 pages
Chapitre-5: Les Fonctions & Les Procédures
Pas encore d'évaluation
Chapitre-5: Les Fonctions & Les Procédures
19 pages
EPI TD4 Correction
Pas encore d'évaluation
EPI TD4 Correction
4 pages
Exercices de Motifs Fréquents SIOD
100% (1)
Exercices de Motifs Fréquents SIOD
2 pages
Base de Données Cours Complet
Pas encore d'évaluation
Base de Données Cours Complet
80 pages
Introduction au recuit simulé en optimisation
Pas encore d'évaluation
Introduction au recuit simulé en optimisation
15 pages
Introduction à la Logique
Pas encore d'évaluation
Introduction à la Logique
7 pages
Correction DS POO
Pas encore d'évaluation
Correction DS POO
4 pages
001 - Série - TP - N - 01 - Tableaux À Une Dimension (Vecteurs - Solution)
Pas encore d'évaluation
001 - Série - TP - N - 01 - Tableaux À Une Dimension (Vecteurs - Solution)
42 pages
Quiz sur la Normalisation des Données
100% (1)
Quiz sur la Normalisation des Données
7 pages
DS Dba Glsi
Pas encore d'évaluation
DS Dba Glsi
1 page
4 Exercices UML Développer Des Modèles Et Diagrammes D'analyse PDF
Pas encore d'évaluation
4 Exercices UML Développer Des Modèles Et Diagrammes D'analyse PDF
4 pages
TD 1 Poo 2022
Pas encore d'évaluation
TD 1 Poo 2022
5 pages
E CRM
Pas encore d'évaluation
E CRM
46 pages
Corrigé Examen Bases de Données L2
Pas encore d'évaluation
Corrigé Examen Bases de Données L2
12 pages
TP1 Redis
Pas encore d'évaluation
TP1 Redis
27 pages
Apache Tez : Optimisation du Big Data en Entreprise
Pas encore d'évaluation
Apache Tez : Optimisation du Big Data en Entreprise
40 pages
TP Redis
Pas encore d'évaluation
TP Redis
4 pages
Rapport PI
Pas encore d'évaluation
Rapport PI
32 pages
IoT Big Data Analytics Session1
Pas encore d'évaluation
IoT Big Data Analytics Session1
19 pages
Solution de Collecte et Analyse de Données
Pas encore d'évaluation
Solution de Collecte et Analyse de Données
5 pages
Audit technique des systèmes SAP Trelleborg
Pas encore d'évaluation
Audit technique des systèmes SAP Trelleborg
22 pages
Systèmes d'Information Décisionnels
Pas encore d'évaluation
Systèmes d'Information Décisionnels
16 pages
FE03
Pas encore d'évaluation
FE03
2 pages
Formation MS Access pour Débutants
Pas encore d'évaluation
Formation MS Access pour Débutants
3 pages
Introduction aux ERP pour MBDS
Pas encore d'évaluation
Introduction aux ERP pour MBDS
50 pages
Introduction à Hadoop pour Big Data
Pas encore d'évaluation
Introduction à Hadoop pour Big Data
61 pages
Structures de Données en C V3
Pas encore d'évaluation
Structures de Données en C V3
57 pages
Rapport Projet Web Ordinateurs
Pas encore d'évaluation
Rapport Projet Web Ordinateurs
32 pages
4.7.4 - Go Live Readiness Review and Signoff - FR
Pas encore d'évaluation
4.7.4 - Go Live Readiness Review and Signoff - FR
8 pages
3 SysML
Pas encore d'évaluation
3 SysML
19 pages
Orsenna WhatsUp Formation
Pas encore d'évaluation
Orsenna WhatsUp Formation
14 pages
Maint 2 Telcn
Pas encore d'évaluation
Maint 2 Telcn
69 pages
Rapport de Stage Satcon TrueNAS
Pas encore d'évaluation
Rapport de Stage Satcon TrueNAS
34 pages
Création et gestion de SPFILE Oracle
Pas encore d'évaluation
Création et gestion de SPFILE Oracle
9 pages
E-logistique et Traçabilité E-commerce
Pas encore d'évaluation
E-logistique et Traçabilité E-commerce
85 pages
Ift-3000 E17 51158
Pas encore d'évaluation
Ift-3000 E17 51158
10 pages
Commandes Unix : Exercices et Corrigés
Pas encore d'évaluation
Commandes Unix : Exercices et Corrigés
6 pages
Installation et utilisation du MASTER
Pas encore d'évaluation
Installation et utilisation du MASTER
10 pages
Role Et Fonctionnalité
100% (1)
Role Et Fonctionnalité
9 pages
Modélisation SysML des systèmes complexes
100% (1)
Modélisation SysML des systèmes complexes
31 pages
Software Achitecture MicroService Architecture
Pas encore d'évaluation
Software Achitecture MicroService Architecture
58 pages
Contrat-cadre de services Cloud SaaS
Pas encore d'évaluation
Contrat-cadre de services Cloud SaaS
9 pages
Configuration RAID et LVM sous Linux
Pas encore d'évaluation
Configuration RAID et LVM sous Linux
19 pages
Analyse d'Impact sur la Protection des Données
Pas encore d'évaluation
Analyse d'Impact sur la Protection des Données
22 pages
Guide SQL Server 2000 pour Initiés
100% (1)
Guide SQL Server 2000 pour Initiés
67 pages
Problèmes et solutions des bases de données
Pas encore d'évaluation
Problèmes et solutions des bases de données
5 pages
Optimisation SI et ITIL: Concepts Clés
100% (1)
Optimisation SI et ITIL: Concepts Clés
41 pages
1 - Presentation Du Module
Pas encore d'évaluation
1 - Presentation Du Module
7 pages
Chap04 La Gestion Des Fichiers Resume
Pas encore d'évaluation
Chap04 La Gestion Des Fichiers Resume
4 pages
Cours Complet sur Oracle SQL
Pas encore d'évaluation
Cours Complet sur Oracle SQL
188 pages