0% ont trouvé ce document utile (0 vote)

169 vues5 pages

Filtre Bloom - Cours

Le document décrit le fonctionnement du filtre de Bloom, une structure de données qui permet de limiter les requêtes inutiles vers une base de données en stockant des éléments de manière probabiliste dans une table de hachage. Le filtre de Bloom peut donner des faux positifs mais pas de faux négatifs.

Transféré par

Ouattara rebecca

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

169 vues5 pages

Filtre Bloom - Cours

Transféré par

Ouattara rebecca

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Exemple d'application: Le filtre de Bloom

. Les tables de hachage sont utiles dans bien des cas. Si le

nombre de cles a stocker est tres grand (comme, par
exemple dans la cas d’une base de donnees) alors la taille
de la table est telle qu’il est necessaire de la stocker sur le
disque.

. L’inconvenient a cela est que si on doit de nombreuses

fois tester l’existence d’un element dans la table cela peut
devenir tres lourd en terme de temps d'acces.

. Le filtre de Bloom permet d'eviter des appels inutiles a

une tres grande base de donnees en verifiant tout de suite
qu'un element recherchee n'y est pas present.

. Le filtre n'etant pas parfait, la recherche inutile aura

toutefois lieu dans certains cas, mais une grande partie sera
neanmoins evitee (faux positif).

. Cette methode est utilisee par exemple par Google dans

leur base de donnees distribuees.
Principe de fonctionnement du Filtre de Bloom

. Le filtre de Bloom est une structure de donnees qui a pour

but de limiter les requetes inutiles : pour tester la presence
d’un element dans la base de donnees (disque) on interroge
l’oracle (le Filtre de Bloom) avant d’interroger la base de
donnees.

. L’objectif est de concevoir un oracle qui reponde

rarement oui lorsque l’element n’est pas dans la table.

. Le type d’oracle que nous allons implanter est lui-meme

une table de hachage : il s’agit du filtre de Bloom.

. L’idee est la suivante : On cree une table B de booleens.

On dispose pour les elements que nous avons a ranger d’un
certain nombre k de fonctions de hachage hi,0≤i≤k−1.

. Pour chaque element e a ajouter a B, au lieu de se

contenter de mettre a vrai la case B(h(e)) comme on le ferait
classiquement, on va mettre a vrai les k cases B(hi(e)).

. Le principe etant que la probabilite que deux elements

differentes aient les memes k valeurs pour leurs fonctions
de hachage, soit faible.
. Par exemple, supposons que nous souhaitions entrer
l'element “machin” dans la table B de taille 24 et que nous
disposons de quatre fonctions de hachage avec :
h0("machin")=2
h1("machin")=12
h2("machin")=3
h3("machin")=20

L’etat de la table B apres l’insertion sera de:

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

0 0 1 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0
Une case à 1=vrai et faux si la case est à 0.

. Pour savoir si un élément n’est pas présent il suffit qu’une

au moins des k cases de la table B correspondant aux
valeurs des k fonctions de hachage soit positionné a faux.

. Pour savoir si un élément est présent, on s’assurera que les

k cases de la table B correspondant aux valeurs des k
fonctions de hachage sont positionnées a vrai.

. Mais dans ce cas il peut y avoir « collision », c’est a dire

qu’il existe (avec une certaine probabilite) une cle
differente pour laquelle les k cases de la table B
correspondant aux valeurs des k fonctions de hachage
soient positionnees a vrai aussi :
C’est ce qu’on appelle : « un faux positif »
Estimation des faux positifs

.Le filtre de Bloom ne fournit aucun faux negatifs, mais

seulement des faux positifs.

. Pour compenser ce probleme, nous pouvons creer le filtre

de façon a minimiser le nombre de faux positifs via les trois
parametres suivants :
n = La taille du vecteur de booléen
m = Le nombre d'éléments stockés dans la base de données
k = Le nombre de fonction de hachage

. Considerons une position j dans le filtre de Bloom :

– La probabilite qu'une fonction de hachage fasse passer
la valeur de j de 0 a 1 est de 1/n.
– Par consequent, la probabilite que la valeur de j ne
change pas est donc de:
(1-1/n)

. Apres avoir rempli le vecteur booleen, avec m elements

et k fonctions de hachage, la probabilite de ne pas
changer j est de :
(1-1/n)km

. Cette equation peut se reduire en considerant l'egalite

approximative suivante:
(1-1/n)n = 1/e = e-1
. L'equation precedente peut se reduire alors :
(1-1/n)km = e-km/n

. Au final, la probabilite d'avoir des faux positifs equivaut

a la probabilite d'avoir toutes les positions du vecteur
booleen a 1 pour les k fonctions de hachage. On obtient
ainsi la formule finale suivante:

Pfaux_positif=(1−e-km/n)k

Exemple

Si nous souhaitons mettre en place un filtre de Bloom pour

une base de donnee stockee sur disque avec le risque d'une
fausse consultation estimee p=0.1, (une chance sur 10
d'avoir un faux positif), alors il faut choisir les parametres
n, k et m tel que :

(1−e-km/n)k <= 0,1

Vous aimerez peut-être aussi

Exercices sur les Tables de Hachage
Pas encore d'évaluation
Exercices sur les Tables de Hachage
5 pages
Structures de Données Avancées
Pas encore d'évaluation
Structures de Données Avancées
15 pages
Cours Apprentissage Renforcement
100% (1)
Cours Apprentissage Renforcement
2 pages
Résolution des Équations de Récurrence
Pas encore d'évaluation
Résolution des Équations de Récurrence
20 pages
TD N3 Asd1
Pas encore d'évaluation
TD N3 Asd1
1 page
Examen de Cryptographie : Solutions et Exercices
Pas encore d'évaluation
Examen de Cryptographie : Solutions et Exercices
4 pages
Cours Crypto Esatic
Pas encore d'évaluation
Cours Crypto Esatic
26 pages
Serie 1 2
Pas encore d'évaluation
Serie 1 2
3 pages
Chiffrement Symétrique : Flot et Blocs
100% (1)
Chiffrement Symétrique : Flot et Blocs
96 pages
Optimisation du Chiffrement RSA
Pas encore d'évaluation
Optimisation du Chiffrement RSA
39 pages
Introduction à la Complexité Algorithmique
Pas encore d'évaluation
Introduction à la Complexité Algorithmique
18 pages
TD - Construction D'une Fonction de Hachage
100% (2)
TD - Construction D'une Fonction de Hachage
4 pages
Introduction à la Cryptanalyse Avancée
Pas encore d'évaluation
Introduction à la Cryptanalyse Avancée
34 pages
OCL pour Systèmes de Gestion
Pas encore d'évaluation
OCL pour Systèmes de Gestion
2 pages
FR - Le Chiffrement Par Décalage
Pas encore d'évaluation
FR - Le Chiffrement Par Décalage
6 pages
Base de Données Cours Complet
Pas encore d'évaluation
Base de Données Cours Complet
80 pages
Série TD #2: Exercice 1
Pas encore d'évaluation
Série TD #2: Exercice 1
2 pages
Chapitre III - Cryptoanalyse
Pas encore d'évaluation
Chapitre III - Cryptoanalyse
41 pages
Aac - CC (m1 Ia) - Corrigé
100% (1)
Aac - CC (m1 Ia) - Corrigé
2 pages
1-Initiation Aux Réseaux Commutés
Pas encore d'évaluation
1-Initiation Aux Réseaux Commutés
16 pages
Data Security SDSI 2022 2023
Pas encore d'évaluation
Data Security SDSI 2022 2023
80 pages
TD TP Pile
Pas encore d'évaluation
TD TP Pile
1 page
Primitives Crypto
Pas encore d'évaluation
Primitives Crypto
35 pages
Devoir de Synthèse en Sécurité des Réseaux
100% (1)
Devoir de Synthèse en Sécurité des Réseaux
6 pages
Expose
Pas encore d'évaluation
Expose
24 pages
Securite Cryptographie Document
Pas encore d'évaluation
Securite Cryptographie Document
45 pages
Cryptographie et C : Guide Pratique
Pas encore d'évaluation
Cryptographie et C : Guide Pratique
25 pages
Corrections Exercices Cryptographie
Pas encore d'évaluation
Corrections Exercices Cryptographie
59 pages
Segmentation Clients avec K-Means et CAH
Pas encore d'évaluation
Segmentation Clients avec K-Means et CAH
3 pages
Examen de Sécurité des Données 2022
Pas encore d'évaluation
Examen de Sécurité des Données 2022
2 pages
Chapitre 8 Complexité v20 21
Pas encore d'évaluation
Chapitre 8 Complexité v20 21
9 pages
Algorithme d'enregistrement de données clients
Pas encore d'évaluation
Algorithme d'enregistrement de données clients
1 page
Introduction à la cryptographie
Pas encore d'évaluation
Introduction à la cryptographie
101 pages
Examen Programmation C BAC1 ESI
Pas encore d'évaluation
Examen Programmation C BAC1 ESI
1 page
Modélisation de la Programmation Linéaire
Pas encore d'évaluation
Modélisation de la Programmation Linéaire
15 pages
Chiffrement symétrique et méthodes AES
Pas encore d'évaluation
Chiffrement symétrique et méthodes AES
3 pages
Partie II POO - Leçon 8 - Les Listes Et Les Tuples
Pas encore d'évaluation
Partie II POO - Leçon 8 - Les Listes Et Les Tuples
6 pages
Corrigé d'examen en algorithmique avancée
100% (1)
Corrigé d'examen en algorithmique avancée
4 pages
Cryptographie : Systèmes Symétriques et Asymétriques
Pas encore d'évaluation
Cryptographie : Systèmes Symétriques et Asymétriques
10 pages
Cryptographie Classique et Déchiffrement
100% (1)
Cryptographie Classique et Déchiffrement
44 pages
Examen de Programmation en C
Pas encore d'évaluation
Examen de Programmation en C
4 pages
Algorithmes et Concepts Informatiques
Pas encore d'évaluation
Algorithmes et Concepts Informatiques
8 pages
Exercices sur les Protocoles VPN et IPsec
Pas encore d'évaluation
Exercices sur les Protocoles VPN et IPsec
5 pages
Exclusion Mutuelle - Algorithme de Maekawa
Pas encore d'évaluation
Exclusion Mutuelle - Algorithme de Maekawa
9 pages
04 Arbres
Pas encore d'évaluation
04 Arbres
11 pages
Mod Probab I Liste
Pas encore d'évaluation
Mod Probab I Liste
28 pages
Exercices Cryptographie
Pas encore d'évaluation
Exercices Cryptographie
2 pages
Modèle Relationnel et Normalisation
Pas encore d'évaluation
Modèle Relationnel et Normalisation
13 pages
Cours5tti Pascal
Pas encore d'évaluation
Cours5tti Pascal
254 pages
Travaux Dirigés Cryptographie
Pas encore d'évaluation
Travaux Dirigés Cryptographie
2 pages
Corrigé TD2
Pas encore d'évaluation
Corrigé TD2
5 pages
Exercices sur la couche Liaison de Données
Pas encore d'évaluation
Exercices sur la couche Liaison de Données
2 pages
Complexité des Algorithmes et Tri de Tableaux
Pas encore d'évaluation
Complexité des Algorithmes et Tri de Tableaux
12 pages
Algorithmes de recherche : hachage et tries
Pas encore d'évaluation
Algorithmes de recherche : hachage et tries
39 pages
Introduction aux tables de hachage
Pas encore d'évaluation
Introduction aux tables de hachage
33 pages
TD Hachage
Pas encore d'évaluation
TD Hachage
6 pages
Tables de Hachage : Accès et Collisions
Pas encore d'évaluation
Tables de Hachage : Accès et Collisions
88 pages
Introduction aux Tables de Hachage
Pas encore d'évaluation
Introduction aux Tables de Hachage
29 pages
Algorithmie - Les Filtres de Bloom
Pas encore d'évaluation
Algorithmie - Les Filtres de Bloom
10 pages
Table de Hachage
Pas encore d'évaluation
Table de Hachage
4 pages
Projet Graphes Licence Informatique 2023
Pas encore d'évaluation
Projet Graphes Licence Informatique 2023
1 page
Cours Analyse Syntaxique Semantique
Pas encore d'évaluation
Cours Analyse Syntaxique Semantique
146 pages
Projet Graphes Licence Informatique 2023
Pas encore d'évaluation
Projet Graphes Licence Informatique 2023
1 page
Coloration et ordonnancement des tâches
Pas encore d'évaluation
Coloration et ordonnancement des tâches
2 pages
Calcul des plus courts chemins en graphes
Pas encore d'évaluation
Calcul des plus courts chemins en graphes
1 page
Arbre couvrant minimal : Algorithmes et cas pratiques
Pas encore d'évaluation
Arbre couvrant minimal : Algorithmes et cas pratiques
1 page
Installation Serveurs DNS et DHCP Linux
Pas encore d'évaluation
Installation Serveurs DNS et DHCP Linux
17 pages
Projet professionnel en data science
Pas encore d'évaluation
Projet professionnel en data science
2 pages
Modélisation UML pour divers systèmes
100% (1)
Modélisation UML pour divers systèmes
3 pages
Conception de Bases de Données
Pas encore d'évaluation
Conception de Bases de Données
64 pages
Guide sur le Framework Ionic Mobile
Pas encore d'évaluation
Guide sur le Framework Ionic Mobile
13 pages
Mise en place d'un serveur RADIUS
Pas encore d'évaluation
Mise en place d'un serveur RADIUS
13 pages
Zaho - Laissez-Les Kouma Lyrics & Traduction
Pas encore d'évaluation
Zaho - Laissez-Les Kouma Lyrics & Traduction
6 pages
Zaho - Lune de Miel Lyrics & Traduction
Pas encore d'évaluation
Zaho - Lune de Miel Lyrics & Traduction
2 pages
Zaho - Maintenant Ou Jamais Lyrics & Traduction
Pas encore d'évaluation
Zaho - Maintenant Ou Jamais Lyrics & Traduction
3 pages
LI08-Des Moulins Aux Eoliennes
Pas encore d'évaluation
LI08-Des Moulins Aux Eoliennes
2 pages
Rohmer 2004 Le Goût de La Beauté
100% (2)
Rohmer 2004 Le Goût de La Beauté
315 pages
Réactif Limitant : Définition et Calcul
Pas encore d'évaluation
Réactif Limitant : Définition et Calcul
1 page
Tesla : Génie de l'électricité
Pas encore d'évaluation
Tesla : Génie de l'électricité
12 pages
Digital RH
Pas encore d'évaluation
Digital RH
6 pages
Nouveautés de la Facturation Électronique
Pas encore d'évaluation
Nouveautés de la Facturation Électronique
37 pages
Contrôle de Statistique Décisionnelle 2017-2018
Pas encore d'évaluation
Contrôle de Statistique Décisionnelle 2017-2018
2 pages
Céphalopodes - Fiche TP de Mme MERIOUA
Pas encore d'évaluation
Céphalopodes - Fiche TP de Mme MERIOUA
2 pages
2 - DTD
Pas encore d'évaluation
2 - DTD
39 pages
Phytochemical Study of Lantana Species
Pas encore d'évaluation
Phytochemical Study of Lantana Species
404 pages
Liste de Lutte Ouvrière en Occitanie
Pas encore d'évaluation
Liste de Lutte Ouvrière en Occitanie
2 pages
Rapport d'Activités 2019 Énergie Sénégal
Pas encore d'évaluation
Rapport d'Activités 2019 Énergie Sénégal
56 pages
Nom Prénom Act 4 Loi de Gravitation
Pas encore d'évaluation
Nom Prénom Act 4 Loi de Gravitation
3 pages
Manuel d'utilisation Chariots AUSA C300H/C350H
Pas encore d'évaluation
Manuel d'utilisation Chariots AUSA C300H/C350H
116 pages
Introduction à l'Algorithmique
Pas encore d'évaluation
Introduction à l'Algorithmique
133 pages
Rédaction d'une interview pour lycéens
100% (1)
Rédaction d'une interview pour lycéens
2 pages
Ecrire La Suite Et La Fin D'une Histoire
Pas encore d'évaluation
Ecrire La Suite Et La Fin D'une Histoire
3 pages
Prise en main de la caméra à main
Pas encore d'évaluation
Prise en main de la caméra à main
5 pages
Cours Jalal
Pas encore d'évaluation
Cours Jalal
10 pages
Introduction aux Espaces Probabilisés
Pas encore d'évaluation
Introduction aux Espaces Probabilisés
25 pages
Pathologies Toiture - Terrasse2 PDF
Pas encore d'évaluation
Pathologies Toiture - Terrasse2 PDF
61 pages
Profil numérique de LALAYE Tao Oladélé
Pas encore d'évaluation
Profil numérique de LALAYE Tao Oladélé
5 pages
Examen Algorithme 2 - A - 2013 - S1
Pas encore d'évaluation
Examen Algorithme 2 - A - 2013 - S1
2 pages
Chap 2 (Reaction Et Contre Reaction)
Pas encore d'évaluation
Chap 2 (Reaction Et Contre Reaction)
22 pages
Optimisation H∞ des générateurs synchrones
Pas encore d'évaluation
Optimisation H∞ des générateurs synchrones
11 pages
Modélisation des Systèmes Asservis en Physique
Pas encore d'évaluation
Modélisation des Systèmes Asservis en Physique
13 pages
EB7 Fiche Supplementaire
Pas encore d'évaluation
EB7 Fiche Supplementaire
2 pages
Régression linéaire et moindres carrés
100% (1)
Régression linéaire et moindres carrés
9 pages
Cours Dessin 1f2 - Prof VF 2024vf
100% (1)
Cours Dessin 1f2 - Prof VF 2024vf
170 pages
Analyse Stockage Énergie Solaire
Pas encore d'évaluation
Analyse Stockage Énergie Solaire
186 pages