UNIVERSITE DE KINSHASA
FACULTE DES LETTRES ET SCIENCES HUMAINES
Département et d’anglais et informatique des
affaires
« MISE EN PLACE D’UN OUTIL D’AIDE À LA PRISE DE
DÉCISION BASE SUR LE DA-TAWAREHOUSE ET L’ARBRE
DE DÉCISION POUR LA PRÉDICTION D’OFFRES EN
FONCTION DU PROFIL DES CLIENTS DANS UNE
ENTREPRISE DE TÉLÉCOMMUNICATION »
CAS DE VODACOM CONGO
Présentée par
NTOKUSI INANA FLORE
Gradué en Anglais et Informatique des Affaires
Mémoire présenté et défendu en vue de l’obtention de
Titre de Licencié en Anglais et Informatique des
Affaires.
Option : Conception des systèmes d’Information
Directeur : KAFUNDA KATALAY Pierre
Professeur
Co-Directeur : MAFUTA MUNGOMBO Jean-Claude
Professeur
i
EPIGRAPHE
« La science restera toujours la satisfaction du
plus haut désir de notre nature, la curiosité ; elle
fournira à l’homme le seul moyen qu’il ait d’améliorer
son sort »
Renan
Ernest
ii
iii
DEDICACES
A mes parents, à mes frères et sœurs
iv
REMERCIEMENTS
Ce travail de fin d’études qui sanctionne notre licence en Anglais et
Informatique des Affaires. C’est le fruit d’un parcours et d’une formation reçue à l’UNIKIN.
Il nous est impérieux de devoir remercier de prime à bord L’ETERNEL
DIEU « omnipotent le tout puissant, omniscient qui sait tous » pour nous avoir assisté du
début jusqu’à la fin de ce cycle de licence, ainsi que tout âme qui a contribué d’une manière
ou d’une autre parfaire notre connaissance.
C’est ainsi que nous voudrions nous acquitter d’un noble devoir, celui
d’exprimer d’un cœur sincère, notre gratitude envers toutes les autorités académiques et le
corps professoral de l’université de Kinshasa pour cette noble tâche qu’ils ont accomplie en
nous dotant d’une formation solide.
Le vampirisme de l’égoïsme ne doit pas nous faire échapper notre dette a
l’égard de notre cher professeur, KAFUNDA KATALAY Pierre directeur de ce travail qui, en
sus d’être un modèle pour nous et malgré ses multiples occupations, a bien voulu mettre sa
connaissance scientifique a notre entière disposition. Dans le même sens, nous tenons à
remercier le professeur MAFUTA MUNGOMBO CLAUDE, pour avoir accepté la
codirection de ce travail.
Il est important de remercier mes parents qui ont financièrement et moralement
contribué pour la réussite d’une vie estudiantine, de ce fait ma gratitude s’adresse à notre père
ODON NTOKUSI et notre mère ALBERTINE MUSAWA.
A nos frères et sœurs, cousins et cousines que nous citons Dieu NTOKUSI,
ANGE FERDINAND NTOKUSI, Jacquie BASONAKA, Faustin MUTEBA, Yowa muyika,
m’zee boloko, Reagan MUTEBA, Jonathan NTOKUSI, Davina matondo qu’ils puissent se
féliciter de l’investissement productif, qu’ils sachent qu’ils sont pour nous l’image de
l’éternité, l’ombre de l’infini, et enfin qu’ils soient comblés de toute notre gratitude.
Nous ne saurons enfin, quitter cette page sans remercier tous nos compagnons
avec qui nous partageons toutes les vicissitudes de la vie, trouvent à travers ces lignes
l’expression de nos relations d’amitiés : Jossy MASIKA, Grace BIYAMA, Virginie
ATUMANISA, Lorène YENGI, , Francine GALAMA, Abreuz NKUANGA, JP ASHA, ,
Gustave NZUZI.
Enfin nous sollicitons et demandons l’indulgence de ceux dont leurs noms ne
sont pas cités, de ne pas tenir rigueur. Nous sommes également de cœur avec eux, qu’ils
trouvent sur nos écrits l’expression de ma gratitude.
v
LISTE DES FIGURES
Figure 1: Architecture Générale d'un système décisionnel..................................................................12
Figure 2: Caractéristiques et fonctions de l'entrepôt de données........................................................20
Figure 3: L'architecture de base de l'entrepôt de données Kimball.......................................................23
Figure 4: Explication de l'architecture d'entreposage de données de base de Bill Inmon............26
Figure 5: Modèle en étoile.................................................................................................................31
Figure 6: Modèle en flocon de neige..................................................................................................32
Figure 7: Modèle en constellation.....................................................................................................33
Figure 8: calcul final..............................................................................................................................41
Figure 9: Processus général de fonctionnement de Power BI..............................................................62
Figure 10:Données dans un fichier Excel.............................................................................................67
Figure 11:: Interface Graphique de SQL server R2 2008...................................................................67
Figure 12:: importation de données dans SQL server...........................................................................68
Figure 13: résultat de l'importation......................................................................................................68
Figure 14:Interface de Visual studio 2008............................................................................................69
Figure 15: Vue de source de données..................................................................................................69
Figure 16: Modèle en etoile.................................................................................................................71
Figure 17: diagramme..........................................................................................................................72
vi
LISTE DES TABLEUX
Table 1: Parallélisme entre les données décisionnelles et opérationnelles..........................................14
Table 2:Tableau dimension personne physique....................................................................................65
Table 3:Tableau dimension Socio-professionnelle...............................................................................65
Table 4: Tableau dimension personne morale......................................................................................65
Table 5: Tableau dimension service.....................................................................................................66
Table 6: Description de la table de fait Evaluation..............................................................................66
1
INTRODUCTION GENERALE
1. Contexte et motivation
Dans un environnement hautement concurrentiel et en constante évolution,
la prise de décision efficace est essentielle pour toutes les entreprises et en particulier
dans le secteur de télécommunications. L’industrie des télécommunications est en
constante évolution avec une concurrence féroce et une demande croissante des clients
pour des services personnalisés de haute qualité. C’est dans ce contexte que les
entreprises de télécommunication telle que Vodacom cherche à maximiser la
satisfaction des clients tout en maintenant une rentabilité durable.
La capacité de proposer des offres personnalisées en temps réel est devenue
un élément crucial pour atteindre ses objectifs. Ce présent mémoire vise à introduire
un projet permettant à mettre en place un outil d’aide à la prise de décision baser sur
datawarehouse et l’utilisation d’arbres de décisions pour la prédiction des offres en
fonction du profil des clients chez Vodacom Congo pour lui aider dans l’amélioration
de la personnalisation des offres tout en créant un système qui permettra à vodacom de
comprendre les besoins individuels de chaque client et de proposer des offres qui
correspondent précisément à leurs besoins et à leurs comportements.
La pertinence de ce projet est évidente compte tenu de l’importance
croissante de la personnalisation des services dans l’industrie de télécommunications.
La portée de ce projet comprendra la mise en place d’un outil datawarehouse pour
intégrer les données des clients pertinentes, la création d’un modèle d’arbre de
décision pour la prédiction d’offres et l’intégration de cet outil dans les systèmes
existants de l’entreprise vodacom Congo.
2. PROBLEMATIQUE
Dans le monde des affaires actuel, les entreprises qui font face à une
concurrence grandiose sont celles qui œuvres dans le domaine de télécommunications
vue qu’elles offrent tous les mêmes produits et services aux mêmes consommateurs.
D’où pour maintenir ces clientèles, elles doivent proposées des offres qui répondent
aux profils et besoins des leurs clients.
Alors que l’entreprise Vodacom, malgré sa notoriété et leadership, fait face
à des certains problèmes d’adaptation des offres aux profils des clients à travers ces
propositions et exhibitions de ces produits et services. Ce qui affecte indéniablement la
psychologie de ces certains clients causant même le retrait des certains clients.
2
D’où la problématique de ce mémoire est donc de mettre en place un outil
d’aide à la prise de décision basé sur le datawarehouse et l’arbre de décision afin
d’aider l’entreprise Vodacom de proposer des offres adapter aux profils des clients et
d’essayer la prédiction du résultat de ces offres pour lui permettre d’optimiser sa
performance commerciale, ces ressources tout fidélisant ces clients.
De ce qui précède, quelques questions ont été soulever qui sont de savoir :
- Que faire pour permettre à Vodacom de pouvoir regrouper et résumer un
maximum d’informations pertinentes sous une forme pour analyser les masses
des données importantes de ces multitudes des clients ?
- Par quel moyen peut-il disposer des synthèses des données tout en permettant la
visualisation et interprétation en fonction de profil spécifique ?
- Quels types d’algorithmes d’arbres des décisions seront-ils le plus adaptés aux
données que dispose Vodacom Congo ?
3. HYPOTHESE
La compagnie Vodacom Congo est classé parmi les grandes entreprises de
télécommunication avec un nombre important des abonnées (Clients) dont plus de 21
millions d’abonnés aujourd’hui et que chaque client dispose d’une suite des
informations personnelles sur lesquelles nous pouvons en déduire leur profil. Alors
sans un bon ensemble des systèmes d’informations informatiques efficace et rapide,
elle peut très vite être dépassé et ne plus fonctionner avec une qualité de service
satisfaisant afin de bien répondre aux besoins et la fidélisation de sa clientèle.
A cet effet, nous proposons de mettre en place un système décisionnel basé
sur Data warehouse afin d’intégrer toutes les informations nécessaires de ces clients
sous une forme pour analyser, accompagné des tableaux de bord comme moyens de
visualisations mais aussi des algorithmes capables de montrer l’avenir des projections
et anticipations de propositions de ces offres à ces clients.
Nous supposons qu’une mise en place d’un outil d’aide à la prise de
décision basé sur data warehouse et arbre de décision pour la prédiction des offres en
fonction du profil des clients sera une stratégie clé pour améliorer sa performance et
faire face à la compétitivité pour augmenter la satisfaction de ces clients et optimiser
ses opérations commerciales.
4. OBJECTIF DU TRAVAIL
Ce mémoire a comme objectif une mise en place d’un outil d’aide à la prise
de décision basé sur le datawarehouse et l’arbre de décision pour la prédiction des
offres en fonction de profil des clients dans une entreprise de télécommunication cas
de Vodacom Congo par lequel un module datawarehouse permettra de collecter,
stocker et analyser les données des clients de vodacom, ainsi qu’un modèle d’arbre de
3
décision avec des algorithmes adapter démontrant une vision du future en prédisant
des offres en fonction du profil de chaque client.
5. CHOIX ET INTERET DU SUJET
5.1. Choix du sujet
Le choix de notre sujet a été motivé par le souci de changer le problème
rencontrer mais aussi d’approfondir notre connaissance sur l’étape de la mise en place
d’un système décisionnel tout en conciliant les théories apprissent tout au long de
notre cursus académique à la pratique.
Ceci étant, notre travail revêt un triple intérêt, à savoir : scientifique,
institutionnel et personnel.
5.2. Intérêt du sujet
Notre travail a un triple intérêt à savoir :
- Du point de vue scientifique : nous ne faisons pas ce travail pour seulement
l’obtention de diplôme de Licence mais pour qu’il soit une source d’inspiration
et documentation pour d’autres chercheurs qui viendront après nous ou ceux qui
voudront bien approfondir davantage cette étude.
- Du point de vue institutionnel : ce travail offrira à l’entreprise Vodacom Congo
un système décisionnel basé sur le Data Warehouse et arbre des décisions pour
la prédiction d’offres en fonction de profil des clients adéquat et adapter
capable de synthètiser, analyser et personnaliser et prédire les offres en fonction
de ces clients qui présente plusieurs avantages et intérêts significatifs :
1. Personnalisation des offres : l’utilisation d’un datawarehouse et d’arbres de
décision permettra à vodacom de personnaliser les offres pour chaque client
en fonction de son profil, de ses besoins et de son comportement.
2. Réduction du churn : en anticipant les besoins des clients et en leur
proposant des offres adaptées, vodacom peut réduire le taux de
désabonnement (churn) en fidélisant davantage de clients.
3. Optimisation des ressources : l‘analyse des données clients permet
d’optimiser l’allocation des ressources, en concentrant les efforts marketing
sur les segments de clients les plus susceptibles de souscrire à de nouvelles
offres.
4. Prise de décision éclairée : un outil basé sur un datawarehouse et des arbres
de décision peut aider les decideurs de vodacom à prendre des décisions
éclairées en se basant sur des données objectives plutôt que sur des
suppositions.
4
5. Analyse de tendances : En collectant et en analysant en continu les données
des clients, vodacom peut identifier les tendances emergentes et adapter ses
offres en conséquence pour rester concurrentiel sur le marché.
6. Rentabilité accrue : En proposant des offres plus pertinentes, vodacom peut
augmenter ses revenus tout en réduisant les couts lies à la promotion
d’offres non adaptées.
7. Conformité règlementaire : Un outil d’aide à la prise de décision base sur les
données peut aider à garantir la conformité aux règlementations en matière
de protection des données en s’assurant que les données clients sont traitées
de manière appropriée et sécurisée.
8. Innovation concurrentielle : Vodacom peut se démarquer de la concurrence
en offrant des solutions personnalisées a ses clients, ce qui peut attirer ces
nouveaux clients et renforcer la réputation ce entreprise.
9. Evolution constante : En utilisant un datawarehouse, vodacom peut stocker
et analyser des données à long terme, ce qui permet une évolution constante
de l’outil d’aide à la prise de décision pour répondre aux besoins changeants
du marché et des clients.
- Enfin du point de vue personnel : cette réalisation est la résultante de notre
formation universitaire jusque-là du fait qu’elle nous a permis de connaitre,
comprendre et d’approfondir d’avantage les notions ayant trait avec notre filière
d’études.
6. METHODES ET TECHNIQUES UTILISEES
6.1. Méthodes utilisées
Pour la réalisation de notre travail, nous avons utilisés :
La méthode structuro-fonctionnelle : à partir de laquelle nous avons analysé
la structure et le fonctionnement de l’entreprise Vodacom Congo ;
La modélisation dimensionnelle : C’est une méthode de conception logique
qui vise à présenter les données sous une forme standardisée intuitive et qui
permet des accès hautement performants. Elle aboutit à présenter les données
non plus sous forme de tables mais de cube centré sur une activité.
La méthode l’apprentissage par arbre de décision : c’est une méthode basée
sur l’utilisations d’un arbre de décision comme modèle prédictif.
6.2. Techniques utilisées
Dans le cadre de notre travail, nous avons fait recours aux techniques
suivantes :
5
Documentaire : qui nous a permis de consulter certains documents de
l’entreprise Vodacom Congo, les ouvrages, thèses, les mémoires, les travaux de
fin cycle, les revues ainsi que les articles supposés contenir les informations
recherchées ;
Interview : Cette technique nous a servi à nous entretenir avec quelques acteurs
de l’entreprise Vodacome Congo pour recueillir des informations en rapport
avec notre travail.
7. DELIMITATION DU SUJET
Tout travail scientifique doit être délimité dans le temps et dans l’espace.
7.1. Dans le temps
Pour notre étude, nous nous sommes limités à une période allant du mois
de Janvier 2023 au mois de Fevrier 2024.
7.2. Dans l’espace
En ce qui concerne l’espace, c’est l’entreprise Vodacom Congo qui est
retenue pour notre travail.
8. PLAN DU TRAVAIL
Notre travail est constitué des quatre chapitres, outre l’introduction et la
conclusion générale.
- Dans le premier chapitre, nous avons abordé la généralité sur le système
décisionnel ;
- Dans le deuxième chapitre nous avons parlés de data warehouse l’outil au cœur
du système décisionnel qui a pour vocation l’aide à la prise de décision en
présentant une vue synthétisée des données de toute l’entreprise grâce à ses
caractéristiques qui est orienté sujet, intégré, historisé et non volatiles et arbre de
décision qui permet de créer des modèles capables de prédire l’avenir ;
- Dans le troisième chapitre nous avons présentés l’entreprise Vodacom Congo;
- En fin dans le dernier, la conception et implémentation du Data warehouse où
nous avons détaillés toutes les étapes avec illustrations les technologies et les
logiciels que nous avons utilisés pour réaliser ce projet ensuite nous sommes
passés à la phase de mise en œuvre.
6
CHAPITRE I. GENERALITES SUR LE SYSTEME DECISIONNEL
I.1. INTRODUCTION
Le système décisionnel, également connu sous le nom de système d’aide à
la prise de décision est un ensemble organisé de processus, de technologies et de
ressources visant à soutenir à prendre de décision optimale au sein d’une entreprise.
Il repose sur la collecte, le stockage, l’analyse et la présentation de données
et d’informations pertinentes pour aider les décideurs à évaluer les options, à
comprendre les implications et à choisir la meilleure action à entreprendre.
Ce système intègre des outils technologiques spécialisés, tels que les
entrepôts de données, les outils d’analyses de données, les tableaux de bord, les
rapports et les modèles prédictifs.
Il vise à améliorer la qualité des décisions en fournissant des informations
précises et en temps utile. L’objectif est d’optimiser les performances
organisationnelles, d’identifier les tendances, les schémas, les opportunités et de réagir
de manière efficace aux changements du marché et aux défis commerciaux.
Le système décisionnel repose souvent sur une démarche itérative qui inclut
la collecte des données pertinentes, leur traitement, leur analyse, la génération de
rapports et de visualisations, ainsi que leur interprétation pour aboutir à des décisions a
des décisions éclairées.
Le système décisionnel s’agit d’un élément crucial pour les entreprises et
les organisations modernes, car il permet de transformer les données brutes en
connaissances exploitables pour orienter les choix stratégiques et opérationnels.
I.2. HISTORIQUE1
L’historique du système décisionnel remonte aux années 1960, lorsque les
premiers ordinateurs ont été utilisés pour collecter et analyser des données dans le but
de prendre des décisions commerciales plus éclairées. A l’époque, les entreprises
utilisaient principalement des systèmes du traitement des transactions, qui étaient axés
sur le stockage et le traitement des données opérationnelles.
Dans les années 1970, les entreprises ont commencé à prendre conscience
de la valeur des données pour la prise de décision et ont commencé à développer des
systèmes d’information décisionnels (SID). Ces systèmes permettaient de consolider et
d’analyser les données provenant de plusieurs sources et de générer des rapports et des
tableaux de bord pour soutenir la prise de décision.
1
www.wekipedia.com/-système-decisionnelle , consulté le 01/10/2023
7
Au fil des décennies, les progrès technologiques ont permis le
développement de systèmes décisionnels plus sophistiqués. Dans les années 90, les
bases de données relationnelles ont été introduites, ce qui a permis une meilleure
gestion des données. Les années 90 ont été marquées par l’émergence de la business
intelligence (BI), qui a permis aux entreprises d’exploiter les données de manière plus
approfondie grâce à l’utilisation d’outils d’analyse avancés.
Au cours des années 2000 et 2010, avec l’explosion des données
numériques et l’avènement du big data, les entreprises ont dû faire face à des volumes
de données de plus en plus importants. Cela a conduit au développement de
technologies telles que les entrepôts de données (datawarehouse) et les systèmes de
traitement analytique en ligne (OAP), qui permettent de stocker et d’analyser
efficacement ces grandes quantités de données.
Aujourd’hui, les systèmes ont évolué pour inclure des fonctionnalités
avancées telles que l’apprentissage automatique (machine Learning) et l’intelligence
artificielle (IA). Ces technologies permettent d’exploiter les données de manière
encore plus précise et prédictive, aidant ainsi les entreprises à prendre des décisions
plus éclairées et plus stratégiques.
En résumé, l’histoire du système décisionnel remonte aux années 1960, et il
a connu de nombreuses évolutions au fil des décennies pour répondre aux besoins
croissants des entreprises en matière de collecte, d’analyser et d’interprétation des
données pour la prise de décision.
1.3. DEFINITION DU SYSTEME DECISIONNEL
Le terme générique qui englobe les applications, infrastructure, les outils
et les meilleures pratiques permettant l’accès et l’analyse de l’information enfin
d’améliorer et d’optimiser les décisions et les performances.2
Système décisionnel est définie compris comme l’ensemble de moyens,
d’outils et des méthodes qui permettent de collecter, consolider, modéliser et restituer
les données immatérielles d’une entreprise en vue d’offrir une aide à la décision et de
permettre aux responsables de la stratégie d’entreprise d’avoir une vue d’ensemble de
l’activité traitée.3
Un système d’information décisionnel (SID) est un système dédié avant
tout à des fins décisionnelles. Ce type de système s’adresse aux dirigeants ou chefs
d’entreprises, et repose sur l’utilisation de l’informatique décisionnelle. En effet, le
2
KUYUNSA Alain et NOKELE Jacques, Notes de cours de Business Intelligence, L1 informatiques, UTBC,
2020-2021, p5
3
KAFUNDA KATALAYI, Notes de cours de Business Intelligence, AIA, FLASH, UNIKIN, 2020-2021, p3
8
système d’information décisionnel (SID) désigne l’ensemble des moyens, outils et
méthodes qui permettent à l’entreprise de collecter, renforcer, stocker, agréger et
restituer les données importantes afin de fournir une véritable aide à la décision. Les
données traitées proviennent de diverses sources, mais sont agrégées dans un entrepôt
ce qui permet aux responsables d’avoir une présentation synthétique et lisible de toute
l’entreprise.
Les systèmes décisionnels peuvent être illustrés en cinq étapes et permettent
de répondre aux questions suivantes :
Que s’est-il passé ? (Tableaux de bord)
Pourquoi cela s’est-il passé ? (Analyse)
Que va-t-il se passer ? (Prédiction)
Que se passe-t-il en ce moment ? ou Qu’est-il en train de se passer ? (Aide
opérationnelle)
Que devrait-il se passer ? ou Que faire ? (Entrepôt actif)
Pour faire très simple, l’informatique décisionnelle recouvre tous les
moyens informatiques destinés à améliorer la prise de décision des décideurs d’une
organisation. Cette définition suscite des nouvelles questions :
Qu’est-ce qu’un décideur ?
Qu’est-ce qui peut permettre d’améliorer la prise de décision ?
1.3.1 Définition de décideur et quelque concept lié.
Décideur
Le décideur est l’individu qui a le pouvoir de décision, en anglais
"decision-maker ». Généralement, dans une organisation, le décideur peut être le
responsable d’une fonction de cette organisation.
Décision
Dans le Petit Robert, la décision est définie par « la fin de la délibération
dans un acte volontaire de faire ou de ne pas faire une chose ».
Prendre une décision signifie concevoir et s’engager à une stratégie d’allocation
irrévocable de ressources de décision.4
4
HOLT cité par Meguireche Azzeddine : Conception et implémentation d'un système décisionnel TAOUAB-
Bousaâda, Mémoire présenté pour l’obtention du diplôme de Master Académique, UNIVERSITE MOHAMED
BOUDIAF - M’SILA, 2019-2020, P14
9
Une décision c’est le résultat d’un processus mental qui choisit une parmi
plusieurs alternatives mutuellement exclusives.
Une décision est prise pour résoudre un problème qui se pose à
l’organisation ou à l’individu. Elle peut résulter d’une réponse à une modification de
l’environnement ou bien pour saisir une opportunité.
Selon, le but d'une décision est de résoudre un problème qui se pose à
l'organisation ou à l'individu.
Les sciences cognitives ont perçu la décision comme étant bien plus qu’un
choix, elle a été traitée comme un processus de résolution de problèmes.
Les Phases de la décision
La représentation du processus décisionnel a été réalisée sous la forme de
différents modèles (modèles), émis par divers professionnels.
Le modèle le plus connu est celui émis par H.A SIMON, il distingue quatre phases
qu'un gestionnaire doit suivre pour prendre une décision :
- L’information ou le renseignement
Le décideur se met en quête d'informations relatives aux questions qui le préoccupent
comme par exemple, « Quelles sont les solutions possibles ? ».
- La conception
Dans un deuxième temps, le décideur construit des solutions, imagine des
scénarios, ce qui peut l'amener à rechercher de l'information supplémentaire pour la
résolution des différents problèmes.
- Le choix
Ensuite, le décideur choisit entre les différentes actions dont il a été capable
de construire et d'identifier pendant la phase de conception.
- L’évaluation des choix précédents
Après le choix, et dans la mesure où la décision s'intègre dans un processus
dynamique ; Une rétroaction (feed-back) intelligente permet de corriger bien des
erreurs sur le déroulement d'un processus décisionnel.
10
1.3.2 Les facteurs d’amélioration de la prise de décision
Généralement, on présente les trois facteurs de prise de décision comme étant :
La connaissance et l’analyse du passé ;
La représentation du présent ;
L’anticipation du futur.
Les informations permettant d’appréhender ces facteurs peuvent être de deux natures
différentes :
Les informations quantitatives : ce sont toutes les données chiffrées telles que
les montants, quantités, pourcentages, délais, etc ;
Les informations qualitatives : ce sont toutes les informations non quantifiables
telles qu’un commentaire accompagnant un rapport, des mécontentements, un
sentiment, une directive, une nouvelle procédure, etc.
Ces facteurs n’ont pas le même sens suivant le type de décideur. Leurs
horizons fonctionnels et temporels sont trop différents pour être traités de manière
uniforme.
Il est à noter que vous pouvez avoir confiance en chacune des décisions que
vous prenez, dès l’instant que vous avez :
- La certitude que vos données sont fiables, à jour et complètes ;
- Les capacités de comprendre l’origine d’un succès ou d’une défaillance ;
- Les moyens d’évaluer les plans d’action et les politiques mises en œuvre suite
à une décision.
Dès lors, la mise en place d’outils décisionnels doit permettre de répondre
progressivement à ces trois attentes :
- Améliorer l’accès et la qualité des données ;
- Gagner en finesse d’analyse et de compréhension de données ;
- Gérer les performances de l’organisation et de ses politiques.
1.4 FONCTION DU SYSTÈME DECESIONNEL
Le système d’information décisionnel (SID) a pour fonction de contribuer à
la collecte, à l’intégration, à la diffusion et à la présentation des volumes de données
11
essentielles de l’entreprise ainsi qu’à l’administration du système en question en vue
de répondre aux questions décisionnelles.5
1.5 ARCHITECTURE DE SYSTÈMES DÉCISIONNELS6
L'architecture générale d'un système décisionnel se décompose en trois
processus : extraction et intégration, organisation et interrogation.
Le processus d'extraction et intégration, situé les sources de données et
l'entrepôt est responsable de l'identification des données dans les diverses sources
internes et externes ;
Dans l'extraction de l'information et de la préparation et de la
transformation (nettoyage, filtrage, etc..) des données à l'intérieur de l'entrepôt, nous
trouvons le processus d'organisation. Il est responsable de la structuration des données
par rapport à leur niveau de granularité (agrégats).
Ces différents outils permettent de réaliser l'analyse des données, pour les
différents utilisateurs de l'entreprise.
5
KUYUNSA Alain et NOKELE Jacques, opcit, p10
6
KAFUNDA KATALAY Pierre, Notes de cours de l’Informatique Décisionnelle, L2 AIA, FLASH, 2021-2022, p9
12
Zone de Construction (Back Room) Outils Frontaux (Front Room)
Catalogue des
Métadonnées
Systèmes Source
Outils de
génération d’état
Service des requêtes
et Navigation
-Extraction
SQL Server
DATA WAREHOUSE
-Transformation
Outils bureautique
-Chargement Zone de d’accès aux données
Préparation
DATA MART
MS Access
Des données
Modèle d’application et
Data Mining
Serveur OLAP
Fichier texte/Excel
Système opérationnel/en aval
Contenant que des Données
agrégées
Serveurs de présentation Les Clients du Data Warehouse
Fichier texte/Html
Figure 1: Architecture Générale d'un système décisionnel
13
1.6 LES FONCTIONNALITÉS PROPOSÉES PAR UN SYSTÈME DÉCISIONNEL
Les besoins des utilisateurs peuvent être regroupés en quatre catégories :
Simuler, Analyser les données, Produire des états de gestion, Suivre et Contrôler. Face
à ces besoins, les systèmes décisionnels proposent les fonctionnalités suivantes :
a) Simuler
Gestion de modèles de calcul (calcul automatique d’ensemble de données
complexe en fonction : de paramètres entrés par l’utilisateur et de règles de
gestion) exemple d’utilisation : Elaboration de business plan.
Elaboration collaborative ; exemple d’utilisation : élaboration budgétaire.
b) Analyser les données
Fonctionnalités OLAP (Etablissement d’analyses dynamiques
multidimensionnelles avec possibilité de trier, filtrer, zoomer à l’intérieur des
données), exemple d’utilisation : détermination des causes expliquant l’évolution
d’une donnée de synthèse (chiffre d’affaires).
Fonctionnalités avancées de datamining. Ensemble de techniques statistiques
sophistiquées permettant de faire apparaitre des corrélations, des tendances et des
prévisions. Exemple d’utilisation : production d’état de gestion à la demande.
c) Produire des états de gestion
Fonctionnalité de reporting. Requêteurs permettant de produire de façon simple
et rapide des tableaux de données incorporant des calculs plus ou moins
sophistiqués. Exemple d’utilisation : production d’état de gestion à la demande.
d) Suivre et contrôler
Elaboration de tableaux de bords. Production et diffusion automatique à
fréquence régulière de tableaux de bord regroupant des données hétérogènes.
Exemple d’utilisation : production de tableaux de bord graphique à destination
de responsables opérationnels (Responsables commerciaux)
Emission d’alerte. Génération conditionnelle de messages sur différents
supports (Email, Sms…) plus ou moins complexes en fonction de configuration
de données.
Il est rare que l’ensemble de ces fonctionnalités soient mises en place dans
une entreprise. Les mises en œuvre sont en outre souvent réalisées par domaine
fonctionnel (les ventes, achats…). Par ailleurs il n’existe pas, de produit couvrant
l’ensemble de ces fonctionnalités. Chaque progiciel, en fonction de son origine et du
positionnement que souhaite lui donner son éditeur, est plus ou moins avancé sur l’un
ou l’autre thème.
14
Il est donc crucial de déterminer précisément ses besoins présents, et futurs,
ainsi que les contraintes liées à son organisation ou à son activité avant de choisir une
solution.
1.6.1 Comparaison du système décisionnel et système opérationnel
Table 1: Parallélisme entre les données décisionnelles et opérationnelles
Données décisionnelles Données opérationnelles
Orientées activité (thème, sujet), Orientées application, détaillées, précises au
condensées, représentent des données moment de l’accès
historiques
Pas de mise à jour interactive de la part Mise à jour interactive possible de la part des
des utilisateurs utilisateurs
Utilisées par l’ensemble des analystes, Accédées de façon unitaire par une personne à la
gérées par sous- ensemble fois
Exigence différente, haute disponibilité Haute disponibilité en continu
ponctuelle
Peuvent être redondantes Uniques (pas de redondance en théorie)
Grande quantité de données utilisée par les Petite quantité de données utilisées par un
traitements traitement
Cycle de vie différent Réalisation des opérations au jour le jour
Faible probabilité d’accès Forte probabilité d’accès
Utilisée de façon aléatoire Utilisées de façon répétitive
1.6 LES APPORTS DES SYSTÈMES DÉCISIONNELS7
- L’information décisionnelle au service du développement de l’entreprise
Dans l’entreprise, l’information, quelle que soit sa source d’origine
constitue une ressource vitale incontestable. L’information décisionnelle désigne le
résultat des données traitées après collecte par les outils informatiques, mais restituées
sous forme d’informations exploitables. Une telle information fournit une vision
d’ensemble claire et fiable au dirigeant et l’aide dans le pilotage de son projet
décisionnel. Les outils de Pilotage Pro concourent à l’atteinte de tels objectifs.
En effet, avec les outils de Pilotage Pro, le chef d’entreprise peut contrôler
et améliorer aisément ses performances au quotidien et garantir la pérennité de ses
activités.
7
MUDUDA MUANDA, Op.cit, p9
15
Depuis quelques années, le réseau d’experts de Pilotage Pro développe des
solutions d’accompagnement efficaces qui visent à doter les décideurs des outils et
indicateurs de performance pouvant faciliter les remontées rapides et en temps réel
d’informations capitales sur l’entreprise.
- Le système d’information décisionnel accompagne le dirigeant dans le
pilotage de l’activité
Les systèmes décisionnels ou OLAP (on-line analytical processing) visent à
aider le dirigeant dans la mise en œuvre du management de l’entreprise, notamment en
matière d’analyse, de contrôle et de pilotage de l’activité, voire des projets
décisionnels afin d’atteindre les objectifs fixés. Cependant, pour réaliser un système
d’information décisionnel, l’entreprise doit au préalable mettre en place un entrepôt
de données ou un data warehouse afin de concentrer et stocker des données. Cela
permettra ainsi aux applications décisionnelles de conférer une source d’information
commune et homogène aux données stockées. Rappelons que le data warehouse
représente un ensemble de données massives appelées big data issues de sources
hétérogènes, mais classées, intégrées et exploitées à des fins décisionnelles.
En effet, c’est grâce aux potentialités de la Business intelligence ou de
l’informatique décisionnelle que les données fournies par le système d’information
sont rapidement traitées et utilisées pour offrir une aide à la décision au dirigeant.
Techniquement, les données collectées sont restructurées, enrichies,
intégrées, puis organisées de façon cohérente pour être finalement restituées aux
utilisateurs (présentation) de façon simplifiée et compréhensible. Ainsi, les
responsables peuvent accéder et consulter régulièrement les informations via des outils
de pilotage et de gestion : le reporting et les tableaux de bord décisionnels. Ces
outils facilitent l’analyse et l’exploration des informations et aident à la prise de
décision. Concrètement, un système d’information décisionnel aide le dirigeant dans le
processus de définition des stratégies et de pilotage des actions appropriées grâce à
une prévision, une planification et un suivi de l’activité.
- Tous les décideurs et cadres peuvent disposer des informations pertinentes,
effectuer une analyse de leur organisation et prendre des décisions adaptées.
Ainsi, grâce à ces outils de prévision et d’anticipation par excellence, tous
les décideurs et cadres peuvent disposer des informations pertinentes, effectuer
une analyse de leur organisation et prendre des décisions adaptées pour la mise en
œuvre des actions. De plus, Pilotage Pro accompagne les dirigeants dans le processus
de sélection des indicateurs de qualité à travers la mise en place d’un système
d’information efficace et intuitif.
16
Les apports des systèmes décisionnels sont néanmoins réels. Ils peuvent
être classés en deux catégories :
L’amélioration de l’efficacité de la communication et de la distribution des
informations de pilotage ;
L’amélioration du pilotage des entreprises résultant de meilleures décisions,
prises plus rapidement.
Conclusion partielle
17
Dans ce premier chapitre, nous avons abordé une généralité sur le système
décisionnel par laquelle nous avons montré la place qu’il occupe dans les entreprises à l’ère
actuel par le fait, qu’il nous permet d’exploiter les données volumineuses, stockées, Afin
d’extraire des connaissances et de recueillir des informations stratégiques susceptibles à être
exploitées par les gestionnaires (décideurs) pour améliorer la performance de l’entreprise
grâce à ces différents outils proposés.
Les systèmes des décisions sont devenus parmi les premiers métiers des
entreprises afin d'avoir une information précise et d'assurer sa gestion efficace car n’est pas
décidé, c’est la mort de l’entreprise. C’est pourquoi le système décisionnel a eu beaucoup
d’attention récemment, et ses applications concrètes se multiplient dans tous les métiers. Le
chapitre suivant permettra de présenter le Data Warehouse comme l’outil au cœur du système
Décisionnel
18
CHAPITRE II. DATA WAREHOUSE ET ARBRE DE DECISION
SECTION 1. DATA WAREHOUSE
1.1. INTRODUCTION
L’objectif de l’informatique décisionnelle est de définir des méthodes et des
outils permettront à une entreprise de mettre en place son projet décisionnel. Ces outils
facilitent l’accès aux données globales de l’entreprise.
Pour cela, il est nécessaire de mettre en place des techniques décisionnelles
capable de traiter de gros volume de données. Il s’agit de l’entreposage de données
« Data Warehouse et Data Mart » qui fait l’objet de ce chapitre.
L’entreposage de données est une base de données intermédiaire permet de
stocker les informations provenant des sources externes, des applications de
productions, d’internet…, ces données sont alimentées par le biais des outils
informatique appelés ETL « Extract, Transform, Load » et qui sont structurées de
manière historisés, intégrés, datés, et non volatiles dans l’entrepôt de données.
Une fois que le Data Warehouse est créé, on peut mettre en place de
reporting et d’analyse pour différents services, en suite on va construire par service un
mini Data Warehouse qui contiendra uniquement les données qui sont utilisées au sein
du service, ce mini Data Warehouse est appelé Data Mart. Ce dernier vise une
problématique précise avec un nombre d’utilisateur plus restreint, répondant chacun à
une nécessité claire identifiée et définie.
Les dirigeants veulent également analyser les données mise à leur
disposition et visualiser les informations (indicateurs) par rapport aux différents axes
d’analyse, ce qui nécessite de s’appuyer sur une information pré-packagée et fortement
structurée. Les outils OLAP répondent à ces besoins.
Les outils de Data mining vont plus loin et permettent aux utilisateurs
métier d’extraire la connaissance de ses données grâce à ses différentes techniques. Il a
pour objet de générer des informations riches à partir des données de l’entreprise et de
découvrir des modèles implicites dans les données.
19
1.2. DEFINITION
Le Data Warehouse est une collection de données orientées sujet, intégrées
non volatiles et historisées, organisées pour le support d’un processus d’aide à la
décision.8
1.2. CARACTERISTIQUE D’UN DATA WAREHOUSE
Voici les quatre caractéristiques d'un entrepôt de données :
Orienté sujet : Un entrepôt de données utilise un thème et fournit des
informations sur un sujet spécifique au lieu des opérations en cours d'une
entreprise. En d'autres termes, le processus d'entreposage de données est mieux
équipé pour traiter un thème spécifique. Des exemples de thèmes ou de sujets
incluent les ventes, les distributions, le marketing, etc ;
Intégré : L'intégration est définie comme l'établissement d'une connexion entre
une grande quantité de données provenant de plusieurs bases de données ou
sources. Cependant, il est également essentiel que les données soient stockées
dans l'entrepôt de données de manière unifiée. Le processus d'entreposage de
données intègre des données provenant de plusieurs sources, telles qu'un
ordinateur central, des bases de données relationnelles, des fichiers plats, etc.
En outre, il permet de maintenir des codes, des mesures d'attributs, des
conventions de dénomination et des formats cohérents ;
Variante temporelle : La variation temporelle dans un DW est plus étendue
que dans d'autres systèmes d'exploitation. Les données stockées dans un
entrepôt de données sont rappelées avec une période de temps spécifique et
fournissent des informations d'un point de vue historique ;
Non volatile : Dans l'entrepôt de données non volatile, les données sont
permanentes, c'est-à-dire que lorsque de nouvelles données sont insérées, les
données précédentes ne sont pas remplacées, omises ou supprimées. Dans cet
entrepôt de données, les données sont en lecture seule et ne sont actualisées qu'à
certains intervalles. Les deux opérations de données effectuées dans l'entrepôt
de données sont l'accès aux données et le chargement des données.
8
KAFUNDA KATALAYI, Business Intelligence, page 21, UNIKIN.
20
Figure 2: Caractéristiques et fonctions de l'entrepôt de données
1.3. BUT D’UN DATA WAREHOUSE9
Le but ultime d’un data warehouse est de corréler toutes les informations
qu’il contient afin de fournir au décideur un schéma ou une connaissance plus ou
moins détaillée de la problématique soumise. Car « les données ne naissent pas
pertinentes, elles le deviennent... ». Mais un data warehouse aussi bien pensé soit-il,
n’est rien sans de bon outil de recherche. Un entrepôt de donnée peut contenir
plusieurs téraoctets de donnée. Il faut donc des outils spécialisés dans la recherche
d’information dans cet environnement. Cet outil, ou cet ensemble d’outils est appelé
datamining.
1.4. OBJECTIFS DU DATA WAREHOUSE
L’atout principal d’une entreprise réside dans les informations qu’elle
possède. Les informations se présentent généralement sous deux formes : les systèmes
opérationnels qui enregistrent les données et le Data Warehouse. En bref, les systèmes
opérationnels représentent l’emplacement de saisie des données, et l’entrepôt de
données l’emplacement de restitution.
Les objectifs fondamentaux du Data Warehouse sont :
Rendre accessibles les informations de l’entreprise : le contenu de l’entrepôt
doit être compréhensible et l’utilisateur doit pouvoir y naviguer facilement et
avec rapidité. Ces exigences n’ont ni frontières, ni limites. Des données
compréhensibles sont pertinentes et clairement définies. Par données
navigables, on n’entend que l’utilisateur identifie immédiatement à l’écran le
but de ses recherches et accède au résultat en un clic ;
Rendre cohérente les informations d’une l’entreprise : les informations
provenant d’une branche de l’entreprise peuvent être mise en corrélation avec
9
DAVID MAISONS, Data warehouse et datamining, CONSERVATOIRE REGIONNAL DES ART ET
METIERS CENTRE DE VERSAILLES, 2006, p10
21
celles d’une autre branche. Si deux unités de mesure portent le même nom, elles
doivent alors signifier la même chose. A l’inverse, deux unités ne signifiant pas
la même chose doivent être définie différemment. Une information cohérente
suppose une information de grande qualité. Cela veut dire que l’information est
prise en compte et qu’elle est complète ;
Constituer une source d’information souple et adaptable : l’entrepôt de
données est conçu dans la perspective de notifications perpétuelle, l’arrivé de
question nouvelles ne doit bouleverser ni les données existantes ni les
technologies. La conception de Data Mart distincts composant un entrepôt de
données doit être répartie et incrémentielle.
Représenter un bastion sécurisé qui protège la capitale information :
l’entrepôt de données ne contrôle pas seulement l’accès aux données, mais il
offre à ses gestionnaires une bonne visibilité des utilisations.
Constituer la base décisionnelle de l’entreprise : l’entrepôt de données recèle
en son sein les informations propres à faciliter la prise de décisions.
1.5. LES DIFFERENTES ZONES
Le staging area
Le staging area est une zone temporaire qui permet le stockage des données
extraites des systèmes sources. C'est dans le staging area que vont s’effectuer les
différentes transformations : Le nettoyage des données, le merge, la standardisation, la
déduplication... des données. Les données dans le staging area sont détruites une fois
le chargement réalisé.
Le Datawarehouse
Les données du staging area sont transférées vers le data warehouse. Il est
important de noter que le métadata (fichier contenant les méta-données) est aussi
stocké dans le data warehouse. Le Data warehouse est centrale et devrait être contenir
toutes les données de l'entreprise.
La zone présentation
La zone de présentation est l’interface visible du datawarehouse par les utilisateurs.
C’est ici qu’ils pourront exécuter leurs requêtes afin d’accéder aux données, analyser
et visualiser les informations produites du datawarehouse.
22
1.6. DIFFERENCE ENTRE ENTREPÔT DE DONNÉES ET BASE DE
DONNÉES
Les principales différences entre l'entrepôt de données et la base de données
sont résumées dans le tableau ci-dessous :
Tableau 1: Différence entre entrepôt de données et base de données
Base de données Entreposage De Données
L'entrepôt de données sert de système
Une base de données est une fusion de
d'information contenant des données historiques et
données connexes.
commutatives d'une ou plusieurs sources.
Une base de données est utilisée pour Un entrepôt de données est utilisé pour analyser
enregistrer les données. les données.
Une base de données est une collection de L'entrepôt de données est la collecte de données
données orientée application. axée sur le sujet.
Une base de données utilise le traitement L'entrepôt de données utilise le traitement
transactionnel en ligne (OLTP). analytique en ligne (OLAP).
Les tables de base de données et les
Les tables et les jointures de l'entrepôt de données
jointures sont normalisées, donc plus
sont dénormalisées, donc plus simples.
compliquées.
Les techniques de modélisation ER sont Les techniques de modélisation des données sont
utilisées pour la conception. utilisées pour la conception.
1.7. LES DEUX APPROCHE D'ENTREPÔT DE DONNÉES : KIMBALL
CONTRE INMON
Les deux méthodologies de conception d'entrepôt de données ont leurs
propres avantages et inconvénients.
a) La méthodologie Kimball
Initié par Ralph Kimball, le modèle de données Kimball suit une approche
ascendante pour entrepôt de données conception d'architecture dans laquelle les
magasins de données sont d'abord formés en fonction des besoins de l'entreprise.
Les principales sources de données sont ensuite évaluées, et un outil
d'extraction, de transformation et de chargement (ETL) est utilisé pour extraire des
données de plusieurs sources et les charger dans une zone intermédiaire du serveur de
base de données relationnelle. Une fois les données téléchargées dans la zone de
23
transfert de l'entrepôt de données, la phase suivante comprend le chargement des
données dans un modèle d'entrepôt de données dimensionnel qui est dénormalisé par
nature. Ce modèle partitionne les données dans la table de faits, qui est constituée de
données transactionnelles numériques ou de table de dimension, qui est l'information
de référence qui prend en charge les faits.
Le schéma en étoile est l'élément fondamental du modèle d'entrepôt de
données dimensionnel. La combinaison d'une table de faits avec plusieurs tables
dimensionnelles est souvent appelée schéma en étoile. La modélisation dimensionnelle
Kimball permet aux utilisateurs de construire plusieurs schémas en étoile pour
répondre à divers besoins de reporting. L'avantage du schéma en étoile est que les
petites requêtes de table dimensionnelle s'exécutent instantanément.
Pour intégrer les données, l'approche Kimball du cycle de vie de l'entrepôt
de données suggère l'idée de dimensions de données conformes. Il existe sous la forme
d'une table de dimension de base partagée entre différentes tables de faits (telles que le
client et le produit) au sein d'un entrepôt de données ou sous la forme des mêmes
tables de dimension dans divers magasins de données Kimball. Cela garantit qu'un seul
élément de données est utilisé de manière similaire dans tous les faits.
Un outil de conception important dans la méthodologie d'entrepôt de
données de Ralph Kimball est la matrice de bus d'entreprise ou l'architecture de bus
Kimball qui enregistre verticalement les faits et horizontalement les dimensions
conformes. La matrice de Kimball, qui fait partie de l'architecture de bus, montre
comment les schémas en étoile sont construits. Il est utilisé par les équipes de gestion
d'entreprise comme entrée pour hiérarchiser la ligne de la matrice de Kimball qui doit
être mise en œuvre en premier.
L'approche Kimball du cycle de vie de l'entrepôt de données est également
basée sur des faits conformes, c'est-à-dire des magasins de données qui sont mis en
œuvre séparément avec une architecture robuste.
Figure 3: L'architecture de base de l'entrepôt de données Kimball
24
- Avantages de la méthodologie Kimball
Certains des principaux avantages du concept d'entreposage de données
Kimball incluent :
La modélisation dimensionnelle Kimball est rapide à construire car aucune
normalisation n'est impliquée, ce qui signifie une exécution rapide de la phase
initiale de la entreposage de données procédé de design ;
Un avantage du schéma en étoile est que la plupart des opérateurs de données
peuvent facilement le comprendre en raison de sa structure dénormalisée, ce qui
simplifie les requêtes et l'analyse ;
L'empreinte du système d'entrepôt de données est insignifiante car elle se
concentre sur des domaines d'activité et des processus individuels plutôt que sur
l'ensemble de l'entreprise. Ainsi, il prend moins de place dans la base de
données, simplifiant la gestion du système ;
Il permet une récupération rapide des données à partir de l'entrepôt de données,
car les données sont séparées en tables de faits et dimensions. Par exemple, la
table de faits et de dimensions pour le secteur de l'assurance inclurait les
transactions de polices et les transactions de sinistres ;
Une petite équipe de concepteurs et de planificateurs est suffisante pour la
gestion de l'entrepôt de données, car les systèmes de source de données sont
stables et l'entrepôt de données est orienté processus. De plus, l'optimisation des
requêtes est simple, prévisible et contrôlable ;
Structure dimensionnelle conforme pour le cadre de qualité des données.
L'approche Kimball du cycle de vie de l'entrepôt de données est également
appelée approche de style de vie dimensionnelle commerciale, car elle permet
aux outils d'intelligence d'affaires d'approfondir plusieurs schémas en étoile et
génère des informations fiables.
- Inconvénients de la méthodologie Kimball
Certains des inconvénients du concept de conception de Kimball Data
Warehousing incluent :
Les données ne sont pas entièrement intégrées avant le reporting ; l'idée d'une «
source unique de vérité est perdue ;
Des irrégularités peuvent se produire lorsque les données sont mises à jour dans
l'architecture Kimball DW. En effet, dans la technique de dénormalisation, des
données redondantes sont ajoutées aux tables de la base de données ;
Dans l'architecture Kimball DW, des problèmes de performances peuvent
survenir en raison de l'ajout de colonnes dans la table de faits, car ces tables
25
sont assez détaillées. L'ajout de nouvelles colonnes peut étendre les dimensions
de la table de faits, affectant ses performances. En outre, le modèle d'entrepôt
de données dimensionnel devient difficile à modifier en cas de modification des
besoins de l'entreprise ;
Comme le modèle Kimball est orienté processus métier, au lieu de se concentrer
sur l'entreprise dans son ensemble, il ne peut pas gérer toutes les exigences de
reporting BI ;
Le processus d'incorporation de grandes quantités de données héritées dans
l'entrepôt de données est complexe.
b) La méthode Inmon
Bill Inmon, le père de l'entreposage de données, a proposé le concept de
développement d'un entrepôt de données qui identifie les principaux domaines et
entités avec lesquels l'entreprise travaille, tels que les clients, les produits, les
fournisseurs, etc. La définition de Bill Inmon d'un entrepôt de données est qu'il s'agit
d'une "collection de données orientée sujet, non volatile, intégrée et variant dans le
temps à l'appui des décisions de la direction".
Le modèle crée ensuite un modèle logique complet pour chaque entité
principale. Par exemple, un modèle logique est construit pour les produits avec tous les
attributs associés à cette entité. Ce modèle logique pourrait inclure dix entités diverses
sous-produits, y compris tous les détails, tels que les moteurs commerciaux, les
aspects, les relations, les dépendances et les affiliations.
La Approche de conception de Bill Inmon utilise la forme normalisée pour
construire la structure de l'entité, évitant autant que possible la redondance des
données. Cela permet d'identifier clairement les besoins commerciaux et d'éviter toute
irrégularité de mise à jour des données. De plus, l'avantage de cette approche
descendante dans la conception de bases de données est qu'elle est robuste aux
changements commerciaux et qu'elle contient une perspective dimensionnelle des
données dans le magasin de données.
Ensuite, le modèle physique est construit, qui suit la structure normalisée.
Ce modèle Bill Inmon crée une source unique de vérité pour l'ensemble de l'entreprise.
Le chargement des données devient moins complexe en raison de la structure
normalisée du modèle. Cependant, l'utilisation de cette disposition pour l'interrogation
est difficile car elle comprend de nombreux tableaux et liens.
Cette méthodologie d'entrepôt de données Inmon propose de construire des
magasins de données séparément pour chaque division, comme la finance, le
26
marketing, les ventes, etc. Toutes les données entrant dans l'entrepôt de données sont
intégrées. L'entrepôt de données agit comme une source de données unique pour divers
magasins de données afin de garantir l'intégrité et la cohérence dans l'ensemble de
l'entreprise.
Figure 4: Explication de l'architecture d'entreposage de données de base de Bill Inmon
- Avantages de la méthode Inmon
L'approche de conception de Bill Inmon offre les avantages suivants :
L'entrepôt de données agit comme une source de vérité unifiée pour l'ensemble
de l'entreprise, où toutes les données sont intégrées ;
Cette approche a une très faible redondance des données. Ainsi, il y a moins de
possibilité d'irrégularités de mise à jour des données, ce qui rend le processus
d'entrepôt de données basé sur le concept ETL plus simple et moins susceptible
d'échouer ;
Cela simplifie les processus métier, car le modèle logique représente des objets
métier détaillés ;
Cette approche offre une plus grande flexibilité, car il est plus facile de mettre à
jour l'entrepôt de données en cas de changement dans les exigences de
l'entreprise ou les données sources ;
Il peut gérer diverses exigences de reporting à l'échelle de l'entreprise.
- Inconvénients de la méthode Inmon
Les inconvénients possibles de cette approche sont les suivants :
La complexité augmente à mesure que plusieurs tables sont ajoutées au modèle
de données avec le temps ;
27
Des ressources qualifiées dans la modélisation de données d'entrepôt de
données sont nécessaires, ce qui peut être coûteux et difficile à trouver ;
L'installation préliminaire et la livraison prennent beaucoup de temps ;
Une opération de processus ETL supplémentaire est requise car les magasins de
données sont créés après la création de l'entrepôt de données ;
Cette approche nécessite des experts pour gérer efficacement un entrepôt de
données.
1.8. LA MODÉLISATION DIMENSIONNELLE
La modélisation dimensionnelle est le nom d’une méthode de conception
logique souvent associée aux Entrepôt de données. Elle se diffère de la modélisation
entité/relation.
a) Modélisation Entité/Relation : est une discipline qui permet d’éclairer les
relations microscopiques entre les données. Dans sa forme la plus artistique,
elle permet de supprimer toute redondance de données. Ceci apporte de
nombreux avantages au niveau du traitement des transactions, qui deviennent
alors très simples et déterministes.
b) Modélisation dimensionnelle : est une méthode de conception logique qui
vise à présenter les données sous une forme standardisée intuitive et qui
permet des accès hautement performants. Elle adhère totalement à la
dimensionnalité ainsi qu’à une discipline qui exploite le modèle relationnel en
le limitant sérieusement. Chaque modèle dimensionnel se compose d’une table
contenant une clé multiple, table des faits, et d’un ensemble de tables plus
petite nommées, tables dimensionnelles. Chacune de ces dernières possède
une clé primaire unique, qui correspond exactement à l’un des composants de
la clé multiple de la table des faits. Dans la mesure où elle possède une clé
primaire multiple reliée à au moins deux clés externes, la table des faits
exprime toujours une relation n,n (plusieurs-à-plusieurs).
a) Relation entre la Modélisation Dimensionnelle et la Modélisation
Entité/Relation
Pour mieux appréhender la relation qui existe entre la modélisation
dimensionnelle et la modélisation entité/relation, il faut comprendre qu’un seul
schéma entité/relation se décompose en plusieurs schémas de table des faits.
La modélisation dimensionnelle ne se met pas à son avantage en
représentant sur un même schéma plusieurs processus qui ne coexistent jamais au sein
d’une série de données et à un moment donné. Ce qui le rend indûment complexe.
Ainsi, la conversion d’un schéma entité/relation en une série de schémas décisionnels
28
consiste à scinder le premier en autant de sous-schémas qu’il y a de processus métier
puis de les modéliser l’un après l’autre. La deuxième étape consiste à sélectionner les
relations n,n (plusieurs-à-plusieurs) contenant des faits numériques et additifs (autres
que les clés) et d’en faire autant de table des faits.
La troisième étape consiste à dénormalisés toutes les autres tables en table
non séquentielle dotées de clés uniques qui les relient directement aux tables des faits.
Elles deviennent ainsi des tables dimensionnelles. S’il arrive qu’une table
dimensionnelle soit reliée à plusieurs tables des faits, nous représentons cette table
dimensionnelle dans les deux schémas et dirons des tables dimensionnelles qu’elles
sont conformes d’un modèle à l’autre.
b) Avantages de la modélisation dimensionnelle
Le modèle dimensionnel possède un grand nombre d’avantages dont le
modèle entité/relation est dépourvu.
Premièrement, le modèle dimensionnel est une structure prévisible et
standardisée. Les générateurs d’états, outils de requête et interfaces utilisateurs
peuvent reposer fortement sur le modèle dimensionnel pour faire en sorte que les
interfaces utilisateurs soient plus compréhensibles et que le traitement soit optimisé.
La deuxième force du modèle dimensionnel est que la structure prévisible
du schéma en étoile réside aux changements de comportement inattendus de
l’utilisateur. Toutes les dimensions sont équivalentes.
Le troisième avantage du modèle dimensionnel réside dans le fait qu’il est
extensible à loisir pour accueillir des données et des besoins d’analyse non prévus au
départ. Ainsi, il est possible d’accomplir :
Ajouter des faits nouveaux non prévus initialement ;
Ajouter des dimensions totalement nouvelles ;
Ajouter des attributs dimensionnels nouveaux non prévus initialement ;
Décomposer les enregistrements d’une dimension existante en un niveau de
détail plus fin à partir d’une date déterminée.
c) Les objets d’un schéma de Data Warehouse
a. Table de dimension
Une dimension est une table qui contient les axes d’analyse (les dimensions)
selon lesquels on veut étudier des données observables (les faits) qui, soumises à une
analyse multidimensionnelle, donnent aux utilisateurs des renseignements nécessaires
à la prise de décision.
29
On appelle donc « dimension » un axe d’analyse. Il peut s’agir des clients ou
des produits d’une entreprise, d’une période de temps comme un exercice financier,
des activités menées au sein d’une société, etc.
Les caractéristiques d’une table de dimension sont : Contenir les détails sur les
faits ;
Contenir les informations descriptives des valeurs numériques de la table de
faits ;
Contenir un plus grand nombre de colonnes, vu que les données dans la table de
dimensions sont normalisées ;
Contenir en général beaucoup moins d’enregistrement qu’une table de faits ;
Ses attributs sont souvent utilisés comme « Ligne » et « Colonne » dans un
rapport ou résultat de requête. Par exemple, les attributs textuels d’un rapport
proviennent souvent d’une dimension.
b. Table de fait
Une table de fait est une table qui contient les données observables (les faits)
que l’on possède sur un sujet et que l’on veut étudier, selon divers axes d’analyse (les
dimensions). Les « faits », dans un entrepôt de données, sont normalement
numériques, puisque d’ordre quantitatif. Il peut s’agir du montant de recettes des
ventes, du nombre d’unités vendues d’un produit, etc.
Les caractéristiques d’une table de fait sont :
Contenir les valeurs numériques de ce qu’on désire mesurer ;
Contenir les clés associées aux dimensions. Il s’agit des clés étrangères dans la
table de faits ;
Contenir en général un petit nombre de colonnes ;
Contenir plus d’enregistrements qu’une table de dimension ;
Son nom est le nom de l’opération que l’on souhaite gérer ;
Ses informations sont liées aux tables dimensions.
Tableau 2: Tableau comparative de table de faits et table de dimensions.
Table de faits Table de dimensions
Clé primaire La table de faits contient une clé primaire Chaque table de dimension
qui est une concaténation de clés primaires contient sa clé primaire.
de toutes les tables de dimensions.
Signification La table de faits contient les mesures avec La table de dimensions contient
des attributs d’une table de dimensions les attributs avec lesquels la
table de faits calcule la métrique.
30
Taille de la La table de faits se développe La table de dimensions se
table verticalement développe horizontalement
Attributs et La table de faits contient moins d’attributs La table de dimensions contient
records et plus d’enregistrements plus d’attributs et moins
d’enregistrements
Création La table de faits peut être créée Les tables de dimensions doivent
uniquement lorsque les tables de être créées en premier
dimensions sont complétées
Schéma Un schéma contient moins de tables de Un schéma contient plus de
faits tables de dimensions
Les attributs La table de faits peut contenir des données La table de dimensions contient
au format numérique et au format textuel toujours des attributs au format
textuel
c. Indicateur : constitue la mesure d’un fait.
d. Mesure : est une observation quantitative.
1.9. Schémas d’un data warehouse
Un schéma est un ensemble d’objets de la base de données tels que les
tables, des vues, des vues matérialisées, des index et des synonymes. La conception du
schéma d’un Data Warehouse est guidée par le modèle des données source et par les
besoins utilisateurs.
L’idée fondamentale de la modélisation dimensionnelle est que presque
tous les types de données peuvent être représentés dans un cube de données, dont les
cellules contiennent des valeurs mesurées et les angles les dimensions naturelles de
données. Nos conceptions peuvent comporter plus de trois dimensions, techniquement,
il faudrait donc parler d’hypercube, bien que les termes cube de données aient été
adopté par le métier
A. Le Schéma en Etoile
Le schéma en étoile peut être le type le plus simple de schéma de Data
Warehouse, il est dit en étoile parce que son diagramme entité/relation ressemble à une
étoile, avec des branches partant d’une table centrale. Un schéma en étoile est
caractérisé par une ou plusieurs tables de faits, très volumineuses, qui contiennent les
informations essentielles du Data Warehouse et par un certain nombre de tables de
dimension, beaucoup plus petites, qui contiennent chacune des informations sur les
entrées associées à un attribut particulier de la table de faits. Une interrogation en
31
étoile est une jointure entre une table de faits et un certain nombre de table de
dimensions. Chaque table de dimension est jointe à la table de faits à l’aide d’une
jointure de clé primaire à clé étrangère, mais les tables de dimension ne sont pas
jointes entre elles.
Les schémas en étoile présentent les avantages suivants : ils fournissent une
correspondance directe et intuitive entre les entités fonctionnelles analysées par les
utilisateurs et la conception du schéma. Ils sont pris en charge par un grand nombre
d’outils décisionnels. La manière la plus naturelle de modéliser un Data Warehouse est
la représenter par un schéma en étoile dans lequel une jointure unique établit la
relation entre la table de faits et chaque table de dimension. Un schéma en étoile
optimise les performances en contribuant à simplifier les interrogations et à raccourcir
les temps de réponse.
Les schémas en étoile présentent néanmoins quelques limites. La table
centrale peut devenir très volumineuse, sa taille maximale étant déterminée par le
produit des nombres de lignes des tables de dimension. En outre, les tables de
dimension ne sont plus normalisées. Elles sont donc plus volumineuses et plus
difficiles à tenir à jour car elles contiennent beaucoup de données dupliquées.
Table de
Table de dimension 3
dimension 1
Table de fait
Table de
Table de
dimension 4
dimension 2
Figure 5: Modèle en étoile.
B. Le Schéma en Flocon
Les schémas en flocons normalisent les dimensions pour éliminer les
redondances. Autrement dit, les données de dimension sont stockées dans plusieurs
tables et non dans une seule table de grande table. Cette structure de schéma
consomme mois d’espace disque, mais comme elle utilise davantage de tables de
32
dimension, elle nécessite un plus grand nombre de jointures de clé secondaire. Les
interrogations sont par conséquent plus complexes et moins performantes.
Le principal avantage du schéma en flocons est une amélioration des
performances des interrogations due à des besoins réduits en espace de stockage sur
disque et la petite taille des tables de dimension à joindre. Le principal inconvénient de
ce schéma est le travail de maintenance supplémentaire imposé par le nôtre accru de
tables de dimension. Les schémas en flocons ne sont pas utiles lorsque les tables de
dimension sont de petite taille. En revanche, une entreprise qui utilise des tables de
dimension de plusieurs millions de lignes peut obtenir un gain de performances
considérable en appliquant ce type de schéma.
Table de
Table de dimension 3
dimension 1
Table de fait
Table de
Table de
dimension 4
dimension 2
Table de
dimension 5
Figure 6: Modèle en flocon de neige.
C. Le Schéma en constellation
Dans un schéma en constellation, plusieurs modèles dimensionnels se
partagent les mêmes dimensions, c’est-à-dire les tables de faits ont des tables de
dimensions en commun.
33
Table de
Table de dimension 3
dimension 1
Table de fait 1
Table de
Table de
dimension 4
dimension 2
Table de fait 2
Figure 7: Modèle en constellation.
1.10. CONSTRUCTION DU DATA WAREHOUSE
Supposons que votre entreprise ait décidée de construire un Data
Warehouse. Vous avez défini les besoins et la portée de votre application et vous avez
créé un projet conceptuel. Vous devez ensuite traduire vos besoins en une solution
système. Pour ce faire, vous créez la conception logique et la conception physique du
Data Warehouse.
1. La Conception logique
Une conception logique est conceptuelle et abstraite. A ce stade, il n’est pas
nécessaire de s’intéresser aux détails de l’implémentation physique. Il suffit de définir
les types d’informations correspondant à vos besoins. L’une des techniques utilisées
pour modéliser vos besoins logiques en matière d’informations est la modélisation
entité/relation (ER). La modélisation ER consiste à identifier les données importantes
(entités), leurs propriétés (attributs) et les liens entre entités et attributs (relations).
Dans le cadre de la modélisation, une entité représente une tranche d’informations.
Dans les bases de données relationnelles, une entité correspond souvent à une table, un
attribut est un composant d’une entité qui permet de définir l’unicité de cette entité.
Dans les bases de données relationnelles, un attribut correspond à une
colonne. Pour garantir la cohérence des données, vous devez utiliser des identifiant
uniques. Un identifiant unique est ajouté aux tables pour permettre de distinguer les
éléments qui apparaissent à différents endroits. En pratique, il s’agit habituellement
d’une clé primaire. La technique de modélisation entité/relation est traditionnellement
34
associée à des modèles très normalisés comme les applications OLTP. Elle est
néanmoins utile pour la conception de Data Warehouse, sous la forme d’une
modélisation multidimensionnelle. Dans le cadre d’une telle modélisation, vous
identifiez les informations qui appartiennent à une table de faits centrale et celles qui
appartiennent à une table de dimension associées.
Vous identifiez les sujets ou champs de données, vous définissez les
relations entre ces sujets et vous nommez les attributs correspondant à chaque sujet.
Votre conception logique doit inclure : un ensemble d’entités et d’attributs
correspondant à des faits et des tables de décision, un modèle de transformation des
données opérationnelles source en informations orientées sujet dans le schéma de Data
Warehouse cible.
2. La Conception Physique
Au cours du processus de conception physique, vous convertissez les
données collectées pendant la phase de la conception logique en une description de la
structure physique de la base de données. Les principaux aspects qui orientent les
décisions relatives à la conception physique sont les performances des interrogations et
la maintenance de la base de données. Le processus de conception physique consiste à
convertir les schémas prévus en structures de base données réelles. A ce stade, vous
devez associer :
Les entités à des tables ;
Les relatons à des contraintes de clé étrangère ;
Les attributs à des colonnes ;
Les identifiants uniques à des contraintes de clé primaire ;
Les identifiants uniques à des contraintes de clé unique.
1.11. ALIMENTATION DU DATA WAREHOUSE PAR LES OUTILS ETL
1. Les opérations ETL
La majorité des systèmes d’information d’entreprise sont de nature
hétérogène car le ou les systèmes d’informations de l’entreprise s’élaborent le plus
souvent sur de longues périodes. Bien que la standardisation des échanges entre les
divers outils informatiques avance à grand pas, la disparité des formats des données en
circulation est toujours une réalité. C’est le principal obstacle technologique aux
échanges d’informations.
Avant d’être utilisables, les données de l’entreprise doivent être mises en
forme, nettoyées et consolidées. Les outils ETL (Extract, Transform, Load) permettent
35
d’automatiser ces traitements et de gérer les flux de données qui alimentent le (ou les)
entrepôt (s).
Les outils ETL font référence à plusieurs opérations qui s’articulent autour
de trois axes majeurs :
Extraction ;
Transport ;
Chargement et transformation.
a) Extraction : ce terme désigne l’extraction de données des systèmes source en vue
d’une insertion dans un entrepôt (Data Warehouse). Le processus d’extraction est
une des taches ETL les plus consommatrices de temps car, outre la complexité des
différents systèmes source, la détermination exacte des données à extraire est
difficile. De plus, ce processus est répétitif, parfois dans des intervalles de temps
très rapprochés. La définition du processus d’extraction revient à choisir une
méthode d’extraction des données source, un processus de transport et un
processus de mise à jour de l’entrepôt (Data Warehouse).
- Extraction logique incrémentale : lors d’une extraction logique complète, les
données sont extraites en totalité d’un système source. Pour réaliser cette opération,
nous avons plusieurs techniques :
Un export complet d’une table ou d’un ensemble de tables ;
Une extraction de données par programmation PL/SQL, SQL, Python…
- Extraction logique incrémentale : lors d’une extraction logique incrémentale, seules
les données modifiées entre un événement particulier (la dernière extraction par
exemple) et l’instant t seront traitées. Le système source doit donc fournir un moyen
d’identification les données modifiées depuis la dernière extraction.
- Extraction physique : les données sont physiquement extraites du système source par
l’un des modes suivants :
Extraction à partir d’un système source actif : le processus d’extraction vient
directement extraire les données du système source.
Extraction à partir d’un système source inactif : les données sont extraites par ce
système source par l’un des formats suivants :
- Format de fichier standard en mode texte ;
- Format de fichier de journalisation et fichier archive de journalisation (ce format
est spécifique à Oracle et SQL Server).
b) Transport : c’est l’opération qui réalise le déplacement des données du système source vers le
système cible. Par exemple, le transport s’effectue :
36
d’un système source vers l’entrepôt ou vers une zone de préparation (zone
intermédiaire de stockage) ;
d’une zone de préparation vers l’entrepôt ;
de l’entrepôt vers un Data mart, etc.
c) Transformation et Chargement : toutes les données ne sont pas utilisables telles
qu’elles. Elles méritent d’être vérifiées, reformatées, nettoyées afin d’éliminer les
valeurs aberrantes et les doublons, consolidées. La transformation de données consiste
à:
constitution des historiques ;
homogénéisation des nomenclatures des différentes sources ;
intégration de données externes ;
Filtrage, agrégation, mise à la granularité ;
Nettoyage, suppression d’erreurs.
Quant au chargement de données, il consiste à insérer les données dans le
Data Warehouse, elles sont ensuite disponibles pour les différents outils d’analyse et
de présentation que son le Data mining, l’analyse multidimensionnelle OLAP, les
analyses géographiques, les raquetteurs et autres reportings.
SECTION 2 : ARBRE DE DECISON
2.1. Définition
Un arbre de décision est un moyen de classer visuellement et logiquement
les informations et de prendre des décisions. Cette méthode permet grâce à un simple
système de calcul de trouver quel est le choix le plus viable.
Un arbre de décision est un schéma représentant les résultats possibles d'une
série de choix interconnectés. Il permet à une personne ou une organisation d'évaluer
différentes actions possibles en fonction de leur coût, leur probabilité et leurs
bénéfices.
En d’autre terme , l’arbre de décision est une des méthodes de prise de
décision les plus efficaces. Elle permet non seulement de présenter visuellement des
informations mais aussi de les hiérarchiser. C’est un outil qui facilite grandement nos
décisions et limite le sentiment de surcharge informationnelle.
Chaque réponse possible est prise en compte et permet de se diriger vers un
des fils du nœud. De proche en proche, on descend dans l’arbre jusqu’à tomber sur une
37
feuille. La feuille représente la réponse qu’apporte l’arbre au cas que l’on vient de
tester.
Très souvent on considère qu’un nœud pose une question sur une variable,
la valeur de cette variable permet de savoir sur quels fils descendre. Pour les variables
énumérées il est parfois possible d’avoir un fils par valeur, on peut aussi décider que
plusieurs variables différentes mènent au même sous arbre. Pour les variables
continues il n’est pas imaginable de créer un nœud qui aurait potentiellement un
nombre de fils infini, on doit discrétiser le domaine continu (arrondis, approximation),
donc décider de segmenter le domaine en sous-ensembles. Plus l’arbre est simple, et
plus il semble techniquement rapide à utiliser.
En fait, il est plus intéressant d’obtenir un arbre qui est adapté aux
probabilités des variables à tester. La plupart du temps un arbre équilibré sera un bon
résultat. Si un sous arbre ne peut mener qu’`a une solution unique, alors tout ce sous-
arbre peut être réduit à sa simple conclusion, cela simplifie le traitement et ne change
rien au résultat final.
En outre, un algorithme “arbre de décision” estime un concept cible par une
représentation d’arbre, où chaque noeud interne correspond à un attribut, et chaque
nœud terminal (ou feuille) correspond à une classe.
2.2. Principe général des arbres de décision
Décomposition du problème de classification en une suite de tests
correspondant à une partition de l’espace des données en sous-régions homogènes en
termes de classe.
On distingue plusieurs parties sur l’arbre de décision :
a) La racine
C’est de là que part toute notre réflexion. La racine c’est la décision à
laquelle on fait face. C’est la question principale à laquelle on cherche à répondre.
b) Les branches porteuses (feuille)
Les branches porteuses représentent nos principaux choix. Ce sont nos
grandes options.
c) Les sous-branches
Les sous-branches sont des extensions de branches. Ce sont des sous-choix
si vous voulez.
38
2.3. Comment construire un arbre de décision
Dans cette partie, nous allons décrire comment construire un arbre de
décision du début jusqu’à la fin.
1) Etape 1 : Définissez votre problématique
La première étape de l’arbre de décision est de définir votre problématique.
Pour rappel c’est la racine de votre décision, c’est de là que tout part.
Pour définir votre problématique, demandez-vous quelle décision vous
devez prendre et formulez-la par une question.
Pour ce cas pratique, nous allons imaginer que nous voulons monter une
entreprise en parallèle de notre travail mais que nous ne savons pas encore laquelle. On
va donc se poser la question suivante :
“Quel business je devrais choisir de monter ?”
Figure 8 : Définition de la problématique
2) Etape 2 : Définissez vos branches porteuses
Une fois que vous avez formulé votre décision par une question, vous devez
lister les différents choix auxquels vous êtes confrontés. Ces choix constitueront vos
branches porteuses.
Pour la décision Quel business je devrais choisir de monter ?” on pourrait
par exemple avoir les choix suivants :
Site ecommerce ;
Agence marketing ;
Business de formation.
Figure 9 : formulation de décision
39
Etape 3 : Définissez des sous-branches
Si votre choix est simple et que vous n’avez besoin que des branches
porteuses pour faire votre choix, vous pouvez passer directement à l’étape 4.
Si en revanche votre choix est plus complexe et comporte plusieurs sous-
choix (voir des sous-sous choix) listez les dans l’étape 3. Pour ce cas d’étude, on va
admettre que pour chaque type de business, on a des sous-idées de business et qu’on
ne sait pas laquelle choisir.
Pour le site ecommerce, on hésite entre plusieurs produits à vendre :
Produits de sport ;
Produits de jardin ;
Bijoux ;
Pour l’agence marketing, on hésite entre plusieurs services :
Services SEO ;
Community Management ;
Création de campagnes d’acquisition ;
Et pour le business de formation, on ne sait pas quel type de formation vendre :
Formation SEO ;
Formation de développement personnel ;
Formations de fitness.
On va représenter toutes ces données dans l’arbre de décision suivant :
Figure 9: Définition de sous Arbre
40
3) Etape 4 : Choisissez votre/vos critères discriminants
Pour l’étape 4 vous devez choisir un ou plusieurs critères discriminants.
Un critère discriminant est un élément que vous utilisez pour départager vos
choix. Par exemple si vous hésitez entre plusieurs plats au restaurant, un critère
discriminant serait le prix. C’est ce que vous utilisez pour faire votre choix.
- Demandez-vous ici quel(s) critère(s) vous pouvez utiliser pour départager vos
choix ?
- Qu’est-ce qui est important pour vous et qu’est-ce que vous jugez nécessaire
d’intégrer dans votre processus de décision ?
Choisissez de préférences 2 critères discriminants. Ces critères doivent être
quantifiables de façon à pouvoir ensuite faire un calcul.
Pour quantifier un critère vous pouvez utiliser un prix, une note, un
pourcentage un chiffre d’affaires, un score…
Ici on va utiliser 2 facteurs discriminants :
Notre probabilité de succès, c’est-à-dire le pourcentage de chance que l’on
pense avoir pour réussir ce business. Pas besoin que le pourcentage soit précis,
une estimation approximative suffit. Si par exemple on remarque que beaucoup
de nos proches et amis de nos proches viennent nous voir pour des conseils de
fitness, on peut se dire que l’on a de bonnes chances de trouver des clients si on
décidait d’ouvrir un business de formation de fitness. On peut donc estimer
approximativement que nos chances de réussite sont de 70% ;.
Profit attendu : Le deuxième facteur discriminant que l’on peut utiliser c’est le
profit que l’on pense pouvoir dégager la 1 ère année avec ce business. Pour
déterminer ce chiffre on peut faire une rapide étude de marché, calculer la
marge moyenne pour chaque business, considérer la somme que l’on est prêt à
investir pour faire fonctionner notre entreprise… Pour obtenir ces données il se
peut que l’on ait besoin de faire quelques recherches. Encore une fois, inutile
que ces chiffres soient exacts. Il faut juste essayer de se rapprocher au plus de la
réalité.
En plus de ces 2 critères discriminants, on aurait pu éventuellement intégrer :
Notre intérêt pour le business c’est-à-dire attribuer une note entre 0 et 5 selon
l’intérêt que l’on porte au business (0 étant une idée de business qui ne nous
intéresse pas du tout et 5 une idée qui nous passionne) ;
41
Le temps requis pour développer ce business : On pourrait aussi estimer le
temps que cela nous prendrait chaque semaine pour s’occuper de ce business en
lui attribuant aussi une note entre 0 et 5 (5 étant un business qui nous prend très
peu de temps et 0 étant un business qui accaparent beaucoup de notre temps).
Pour cet exercice, on ne va choisir que 2 critères pour ne pas complexifier
le calcul. Il peut être intéressant d’en ajouter plus mais sachez que plus vous ajoutez de
critères, plus vous rendez le calcul difficile. 1 ou 2 critères suffisent la plupart du
temps.
4) Etape 5 : Faites les calculs
Une fois que vous avez choisi vos critères discriminants, il vous suffit de
procéder au calcul final. Généralement une simple multiplication suffit.
Donc ici on fera le calcul suivant :
(% de probabilité de réussite) x (profit que je pense pouvoir dégager la 1ère
année)
Figure 8: calcul final
5) Etape 6 : Prenez votre décision
Pour prendre votre décision, il vous suffit de repérer le plus grand résultat
pour savoir quoi choisir.
42
D’après les scores obtenus et les critères que l’on a pris en compte, il
faudrait donc plutôt qu’on lance une agence marketing de campagnes d’acquisition
payantes. C’est l’option qui nous offre le meilleur profit potentiel tout en considérant
nos chances de réussite.
2.4. Outils de création d’arbre de décision
Pour créer votre arbre de décision, vous pouvez bien entendu le dessiner sur
une feuille mais il existe des outils qui vous permettent de les créer très simplement.
Voici 2 outils d’entre eux (gratuits) :
Mindmeister
Canva
Pour conclure l’arbre de décision est un moyen puissant de prendre des décisions
quand on fait face à un gros volume d’informations et que nos choix sont à plusieurs
niveaux.
Pour l’appliquer il suffit de suivre 6 étapes simples :
Etape1 : Définition de la problématique (Quelle est votre décision ?) ;
Etape2 : Définition des branches porteuses (Quels sont vos choix ?) ;
Etape3 : Définition des sous-branches (Quels sont vos sous-choix ?) ;
Etape4 : Choix du/des critères discriminant(s) (Quels sont le ou les critères
important(s) à choisir pour différencier vos choix ?) ;
43
Etape 5 : Calculs (Calculez le score de vos choix en utilisant vos critères)
Etape 6 : Prise de décision (Basez-vous sur les scores pour déterminer quel est
le meilleur choix).
2.5. Construction d’un arbre de décision à partir d’un jeu d’apprentissage
Les arbres de décision sont construits à partir d’un jeu d’apprentissage, un
jeu d’apprentissage est une matrice, où les lignes représentent les exemples et les
colonnes représentent les caractéristiques des exemples, la dernière colonne est
réservée aux classes associées aux exemples. L’algorithme de construction a aussi
besoin d’un tableau d’index qui constitue la liste de référence des attributs à traiter.
L’objectif est de produire des groupes d’individus les plus homogènes
possibles du point de vue de la variable à prédire. Il est d’usage de représenter la
distribution empirique de l’attribut à prédire sur chaque sommet (nœud) de l’arbre.
En outre, la construction d’un arbre de décision se fait en utilisant un
algorithme récursif.
En premier lieu toutes les données d’apprentissage sont contenues dans un
seul nœud. Ici l’arbre n’a qu’un seul noeud. A chaque processus ou étapes, les
différentes données contenues dans un seul noeud sont séparée en plusieurs branches,
selon quelques critères mis en place (condition donnée) ou soit laissés pour former un
seul noeud terminal.
Sur ce, nous avons deux critères :
Le critère d’arrêt, pour décider si un nœud est terminal ou pas,
Le critère de séparation, pour créer le test qui va réaliser la séparation.
Parlons-en pour le critère d’arrêt. Ce dernier a pour but de limiter la taille
de l’arbre, à la fois pour des problèmes de mémoire et pour assurer la généralisation en
évitant une spécialisation trop grande de l’arbre. On peut se baser sur un critère de
précision (quand une certaine proportion d’une certaine classe est atteinte dans un
nœud) ou d’effectif (on n’essaye plus de séparer au-dessous d’un certain nombre
d’instances dans le nœud).
Comme déjà le mot l’indique, le rôle du critère de séparation est de séparer
un ensemble de données en plusieurs sous-ensembles, de façon intéressante pour la
classification. Le principe est de sélectionner la variable la plus discriminante pour la
grandeur à prédire et d’effectuer un test sur celle-ci pour construire les sous-
ensembles.
44
2.5.1. Critères de choix de la variable de séparation
a) Présentation
Commençons par noter Y la variable `à pré dire, les variables décrivant les
données. Le problème est de trouver une variable sur laquelle réaliser la séparation. La
méthode de sélection est assez simple : pour chaque variable possible, le
partitionnement va être réalisé et évalué par un indicateur de qualité.
b) Information
L’information est une notion naturelle pour évaluer l’utilité d’une variable à
prédire. Nous irons chercher quelle variable nous apporte le plus d’information sur la
variable à prédire.
De ce fait nous avons besoin de définir l’entropie de Shannon qui est une notion
introduite par Shannon en 1948 lors de ses recherches concernant la théorie de
l’information qui sert de base à énormément de méthodes du datamining.
L’entropie est nulle lorsque nous connaissons toutes les valeurs produites par X et de
ce fait elle est souvent décrite comme une mesure du désordre.
c) Etapes de l’algorithme de construction d’arbre de décision
L’algorithme de construction d’arbre de décision se divise en 3 étapes qui
sont :
- La première étape qui consiste à vérifier si on doit faire un nœud terminal pour
représenter les exemples du jeu d’apprentissage. Pour faire un nœud terminal, on
doit respecter une des conditions suivantes : Tous les exemples du jeu
d’apprentissage appartiennent à la même classe ou tous les attributs ont été
utilisés pour les nœuds précédents. Cette étape permet d’arrêter l’expansion de la
branche de l’arbre ;
- La deuxième consiste à trouver l’attribut pour représenter le nœud de l’arbre. Les
algorithmes de construction d’arbre de décision utilisent une mesure de
segmentation par rapport aux attributs à traiter. Nous allons voir en détail les
différentes techniques plus tard ;
- La troisième étape consiste à éclater le jeu d’apprentissages pour créer les
branches du nœud, chacune des branches du nœud prend une des différentes
valeurs que l’attribut du nœud peut prendre. Pour chacune des branches qu’on
aura créées, il faut recommencer le processus en prenant les exemples
correspondants à la branche.
45
Note : La deuxième et la troisième étape se produisent lorsqu’on ne respecte pas les
critères de la première.
d) Structure générique des algorithmes dans les arbres de décision
- Principe général
La construction de l’arbre de décision est top-down (approche descendante).
- Operateurs majeurs :
Débuter à la racine : c’est-à-dire pas d’attributs à tester à ce niveau ;
Descendre dans l’arbre en passant par les noeuds de test ;
La feuille atteinte à la fin permet de classer l’instance testée.
Très souvent on considère qu’un nœud pose une question sur une variable,
la valeur de cette variable permet de savoir sur quels fils descendre. Pour les variables
énumérées il est parfois possible d’avoir un fils par valeur, on peut aussi décider que
plusieurs variables différentes mènent au même sous arbre.
Pour les variables continues il n’est pas imaginable de créer un nœud qui
aurait potentiellement un nombre de fils infini ; on doit discrétiser le domaine continu
(arrondis, approximation), donc décider de segmenter le domaine en sous-ensembles.
Plus l’arbre est simple ; et plus il semble techniquement rapide à utiliser.
En fait, il est plus intéressant d’obtenir un arbre qui est adapté aux
probabilités des variables à tester.
Pour ce faire, il y a des algorithmes conçus pour générer des arbres de
décision à partir des données. Nous en dirons plus dans le point qui suit.
2.5.2. Algorithmes de construction d’arbre de décision
Il existe plusieurs algorithmes de construction d’arbre, les plus populaires
sont ID3, C4.5, CART et CHAID. Nous n’allons pas donc donner une description
exhaustive de ces algorithmes mais une brève exposition de solutions retenues.
a. Algorithme ID3
L’algorithme ID3 fut proposé par Quinlan en 197 9 afin de générer des
arbres de décisions à partir de données. Imaginons que nous ayons à notre disposition
un ensemble d’enregistrements. Tous les enregistrements ont la même structure, à
savoir un certain nombre de paires attribut ou valeur. L’un de ses attributs représente la
catégorie de l’enregistrement. Le problème consiste à construire un arbre de décision
qui sur base de réponses à des questions posées sur des attributs non cibles peut
46
prédire correctement la valeur de l’attribut cible. Souvent l’attribut cible prend
seulement les valeurs vrai, faux ou échec, succès.
Dans ID3 on place une variable au niveau de noeud et chaque branche
correspond à une valeur de ladite variable.
L’algorithme d’ID3 utilise l’entropie de Shannon pour réaliser la séparation
des nœuds. Chaque modalité possible pour la variable donnée de séparation mène à
une nouvelle branche différente.
Note. L’Entropie est un indicateur qui mesure l’hétérogénéité d’une population
repartie en classe. Hétérogénéité par rapport à la taille de chaque classe. L’entropie
vaut 1, si la population est purement hétérogène et elle est nulle si la population est
parfaitement homogène.
Il est à noter que l’utilisation de cette entropie au niveau de l’arbre de
décision ne peut pas du tout être possible en la considérant dans sa formulation la plus
pure mais il faut plutôt prendre en compte le gain d’entropie calculé au niveau de
chaque variable.
Principes
Les principales idées sur lesquels repose ID3 sont les suivantes :
– Dans l’arbre de décision chaque nœud correspond à un attribut non cible et
chaque arc à une valeur possible de cet attribut. Une feuille de l’arbre donne la
valeur escomptée de l’attribut cible pour l’enregistrement testé décrit par le
chemin de la racine de l’arbre de décision jusqu’à la feuille. (Définition d’un
arbre de décision) ;
– Dans l’arbre de décision, à chaque nœud doit être associé l’attribut non cible
qui apporte le plus d’information par rapport aux autres attributs non encore
utilisés dans le chemin depuis la racine. (Critère d’un bon arbre de décision).
47
L’entropie est utilisée pour mesurer la quantité d’information apportée par
un nœud. (Cette notion a été introduite par Claude Shannon lors de ses recherches
concernant la théorie de l’information qui sert de base à énormément de méthodes du
datamining.)
Algorithme ID 3 : Algorithme Entrées : ensemble d’attributs A; échantillon E; classe c
Début
Initialiser à l’arbre vide;
Si tous les exemples de E ont la même classe c
Alors étiqueter la racine par c;
Sinon si l’ensemble des attributs A est vide Alors étiqueter la racine par la classe
majoritaire dans E;
Si non soit a le meilleur attribut choisi dans A;
Étiqueter la racine par a;
Pour toute valeur v de a Construire une branche étiquetée par v;
Soit Eav l’ensemble des exemples tels que e(a) = v; ajouter l’arbre construit par ID3
(A-{a}, Eav, c);
Fin pour Fin sinon
Fin sinon
Retourner racine;
Fin
Cet algorithme a une bonne adaptation aux échantillons de petite taille et est
peu sensible au paramétrage.
b. Algorithme C4.5
Fut proposé par Quinlan en 1993 Comme l’ID.3, l’algorithme de C4.5 (qui
n’est autre qu’une version évoluée de celui-là), utilise l’entropie de Shannon pour
réaliser la séparation des nœuds.
Compte tenu des limites de l’ID3, lesquelles limites se justifiant par le fait
pour lui de traiter des données qualitatives étant catégorielles (exemple les mois, les
jours de la semaine, les femmes, les hommes, etc.) en ne les prenant pas en charge,
l’idée de construire l’algorithme C4.5 est venue au constructeur. Voici à quoi
ressemble cette résolution du problème de ID3 par C4.5 : il tient compte des variables
quantitatives c’est-à-dire va au-delà des simples variables qualitatives catégorielles.
Ainsi, pour la variable quantitative on ne place pas la variable seulement,
mais plutôt un test effectué sur la variable qui n’est autre qu’une condition logique
(vrai ou faux).
48
a. CART (Classification and Regression Trees)
Proposé par Breimanet al. en 1984, CART est utilisé pour l’analyse de
régression ou classification d’ensembles grands et complexes de données multi-
variables.
L’algorithme CART construit l’arbre en utilisant des partitions récursives.
Lors de l’apprentissage, un premier arbre est créé en utilisant l’ensemble des données
d’entraînement. L’algorithme cherche de manière récursive, les relations entre les
variables pour obtenir une séquence optimale de divisions binaires, ce qui aboutit ainsi
à un arbre très étendu. Ensuite l’arbre est réduit en tenant compte du principe de coût
minimal de l’erreur.
Pour CART, on utilise le critère d’index Gini comme critère de
séparation. Avec le critère Gini, on peut seulement avoir 2 branches par nœud. Si un
attribut a n valeurs, alors il y a 2n-1-1 possibilités de regroupement. Il faut donc
calculer l’index Gini pour chacun des regroupements possibles des valeurs de cet
attribut. Les modalités sont regroupées en deux groupes de façon à obtenir des arbres
binaires et il offre de bonnes performances en général, sans paramètres à régler.
L’indice de Gini mesure aussi comme l’entropie ; la différence c’est au
niveau de la plage de valeur ici.
Synthèses des divers algorithmes d’induction
ID3 (Inductive DecisionTree, Quinlan1979) :
- arbres «de discrimination» (i.e.variables uniquement qualitatives) ;
- critère d’hétérogénéité= entropie
C4.5 (Quinlan1993) :
Amélioration ID3, permettant notamment arbres «de régression» (gestion des variables
continues) et valeurs manquantes.
- critère d’hétérogénéité= entropie
CART (Classification And Regression Tree, Breimanet al. 1984) :
– critère d’hétérogénéité= Indice de Gini.
2.5.3. Caractéristiques et avantages des arbres de décision
La caractéristique principale est la lisibilité du modèle de prédiction que
l’arbre de décision fourni, et de faire comprendre ses résultats afin d’emporter
l’adhésion des décideurs.
49
Cet arbre de décision a également la capacité de sélectionner
automatiquement les variables discriminantes dans un fichier de données contenant un
très grand nombre de variables potentiellement intéressantes. En ce sens, constitue
aussi une technique exploratoire privilégiée pour appréhender de gros fichiers de
données.
En plus, les arbres de décision présentent d’autres avantages qui sont :
- C’est une méthode non-paramétrique ;
- Les processus de construction et de décision sont assez simples ;
- Il est facile à comprendre et à exécuter ;
- Le nombre de tests est limité par le nombre d’attributs ;
- Facilité à manipuler des données « symboliques» ;
- OK avec variables d’amplitudes très différentes ;
- Interprétabilité ;
- Classification très efficace.
Sans oublier les désavantages que peut avoir ces méthodes.
Inconvénients
- Sensibilité au bruit et points aberrants.
50
Conclusion partielle
Un data warehouse a pour vocation unel’aide à la prise de décision en présentant
une vue synthétisée de données de toute l’entreprise. C’est dans cette optique que son
architecture est penchée. Il est orienté sujet, intégré, historisé et non volatiles.
Trois grands courant de penser se confronte quant à son architecture. Les datamarts dépendant
et indépendant. Le troisième mixant les deux. Alimenter le data warehouse est la difficulté
technique majeure et la plus coûteuse
Un arbre de décision est un moyen de classer visuellement et logiquement les
informations et de prendre des décisions. Cette méthode permet grâce à un simple système de
calcul de trouver quel est le choix le plus viable.
Un arbre de décision est un schéma représentant les résultats possibles d'une série
de choix interconnectés. Il permet à une personne ou une organisation d'évaluer différentes
actions possibles en fonction de leur coût, leur probabilité et leurs bénéfices
51
CHAPITRE III. PRESENTATION DE LA SOCIETE VODACOM/CONGO
3.1. Cadres historiques et géographique
a. Cadre historique
La société VODACOM/CONGO est une société Sud-Africaine créée par
Monsieur ALAN KNOLT-CRAIG (CHEF EXECUTIF OFFICER DE VODACOM
GROUP PTY LTD), ALAN KNOTT a eu la vision de garrocher le réseau de
téléphonie cellulaire en Afrique du Sud pendant qu’il torturait ou bossait encore chez
TELEKOM Company.
La société VODACOM est implantée en République Démocratique du
Congo depuis l’année 2001 et est fonctionnel depuis le 1er Mai 2002. VODACOM est
une abréviation de VOICE DATA COMMUNICATION ; il est désigné en RDC sous
le sigle de VODACOM.
En premier lieu, le réseau VODACOM fut officiellement garroché en
République Sud-Africaine, le 1 juin 1994, alors que le système GSM (Global System
Mobile) a réellement pris son envol quand VODACOM a introduit le système de la
carte prépayée en novembre 1996.
Les filiales de VODACOM international Holding sont :
VODACOM le Sotho ;
VODACOM/CONGO ;
VODACOM TANZANIE.VODACOM GROUP (PTY) LTD;
VODACOM International holding (PTY) LTD;
VODACOM SERVICE PROVIDER COMPAGNY(PTY).
En effet la société VODACOM /CONGO est issue d’une « joint- venture »
entre la société VODACOM International Holding et CWN (congolese wireless
Network).
Après l’accord de partenariat signé avec la CWN, le 24 octobre 2001 c’est
VODACOM International LTD est venu s’implanter en RDC. C’est en fait cet accord
de partenariat qui a débouché sur la création de VODACOM/CONGO, le 26 novembre
2001.
Le premier pourvoyeur de la téléphonie cellulaire GSM en RDC est the
congolese wireless Network (CWN). Mais, vu que ce groupe était limité en moyens il
apparaissait clairement aux yeux des consommateurs de ses services et en plus son
52
service allait se détériorer. Pour l’Etat congolais, la fameuse définition d’une
couverture totale du territoire national était loin d’être atteint ; en plus le taux général
d’utilisateurs par rapport à la population était très écarté, soit 100milles téléphones
portables pour 60millions d’habitants.
Avec sa soixantaine de millions d’habitants la RDC représente toujours un
marché potentiel du côté de VODACOM international LTD. Par ailleurs l’objectif
d’une « couverture totale du territoire » national qui est un slogan chez VODACOM
(couverture totale jamais auparavant) s’est révèle être un atout pour cette entreprise qui
était en train de naitre et qui aujourd’hui a atteint presque sa maturité ; avant nous
avons connus la société VODACOM/CONGO avec une marque de couleur bleue mais
actuellement elle a une marque de couleur rouge qui a été imposé par VODAFONE
par ce qu’ils sont en contra VODACOM malgré le changement de couleur, elle reste la
même société avec un nouveau slogan « A toi de jouer ».
La croissance figurante du nombre d’abonnés, plus de trois millions
d’abonnés en moins des 6 ans d’exploitation, cette jeune société est l’un de plus grands
contribuables de contribution substantielle au budget de l’Etat à travers la fiscalité et la
parafiscalité.
b. Cadre géographique
La société VODACOM Congo a 4 grands sièges en RDC d’où nous citons :
VODACOM PLACE (connue sous le nom de VODAPLACE par les
habituées) se trouve dans sur la commune de la Gombe, le long du boulevard du
30 juin, en face de la Direction générale des Migrations ;
VODACOM CORPORATE PARK MOBILE, situé sur le boulevard du 30
juin, en face de cimetière de la Gombe au deuxième étage de l’immeuble de la
société « MOBIL » ;
VODACOM HOUSE (Département des opérations) appelé aussi Vodahouse,
se trouve sur l’avenue de la justice dans la commune de la Gombe et a coté des
bureaux de la commune ;
VODACOM SQUARE (Direction commerciale) appelé aussi Vodasquare
situé sur l’avenue colonel LUKUSA dans la commune de la Gombe à côté de
station COBIL (ex : garage IVECO).
Le réseau VODACOM couvre presque toutes les provinces et villes de la
République Démocratique du Congo. En dehors de la RDC, VODACOM CONGO est
présent en Asie, en Afrique, en Amérique du Nord, en Amérique du Sud, et en Europe.
53
3.2. MISSIONS ET CADRE JURIDIQUE
a. Les missions
La présente mission ou souci de la société VODACOM est d’« être le 1er
numéro des télécommunication en RDC ». En venant s’implanter en RDC,
VODACOM International LTD est exploiter et entretenir un réseau de
télécommunication aux fins de fournir des services des services de télécommunication
sur des commerciales viables et stratégique.
Pour VODACOM le téléphone ne doit pas être l’apanage des quelques
habitants certaines villes particulières. Tous congolais sont égaux et doivent avoir droit
aux mêmes traitements, l’accès aux mêmes services et à travers le pays.
b. Cadre juridique
Cette jeune société était créée comme une société des personnes à
responsabilité limitée mais actuellement c’est une société Anonyme. Il est régi par les
statuts de VODACOM International LTD et the Congo Wireless Network (CWN) le
24 octobre 2001.
Au terme de cet accord de partenariat les parts d’action est VODACOM
International LTD et son partenaire CWN sont ventilées de la manière suivante : le
premier qui est une filiale de VODACOM Group de la RSA, a une part d’actions
évaluée à 51% alors que CWN prend les 49% restants VODACOM CONGO A pour
Capital ou chiffres d’affaires 76,5 millions $ US.
3.3. STRUCTURE, FONCTIONNEMENTS ET ORGANIGRAMME
VODACOM CONGO, tel que toute autre société Anonyme, a une structure
qui a à sa tête une assemblée générale composée de 8 membres suivie d’autres
structures opérationnelles énumérées dans les lignes qui suivent :
2. Direction générale
La direction générale de VODACOM CONGO est assurée par le Directeur
général et son adjoint. La direction générale constitue le head office. Cette direction est
aussi communément appelée « Managing Directeur ». La direction a la lourde charge
de présider, de coordonner, de concevoir et diriger également la politique commerciale
et financière de la société.
54
2. Direction financière
VODACOM Congo a quatre divisions dans cette direction dans le souci
d’atteindre ses objectifs financiers, ces divisions ont un devoir à accomplir, parce
qu’ici la direction s’occupe du recouvrement de recettes et de l’exécution de toutes les
dépenses, du mouvement des fonds que la société réalise à travers les entrées par la
vente des produits.
Inversement elle s’occupe de la sortie des fonds qui est concédée par
rémunération, l’achat des matériels, le sponsoring, etc…
3. Direction des opérations
Cette direction est communément appelée « Direction Technique ». Elle
prend soin de tous les aspects techniques de la société en commençant par l’antenne
centrale : la planification du réseau, la supervision et le monitoring du réseau, la
gestion des défaillances, la gestion des configurations et administration du réseau.
4. Direction des ressources humaines
Le directeur de ressources humaines s’occupe de l’évolution du rendement
en encouragent ou en prenant des mesures correctives en cas de nécessité. Son rôle est
de s’assurer qu’il n’existe aucune barrière qui puisse empêcher à l’employé
d’accomplir ses tâches, de fournir des ressources nécessaires pour le bon déroulement
du travail et s’assurer que l’employé a reçu une bonne formation.
5. Direction de la facturation, de l’informatique et de Technologie.
Cette direction est communément appelée « Billing and IT », constitue une
interface entre les consommateurs finaux (qui sont sur le plan interne, les différentes
directions et services de la société et sur le plan externe, ses clients).
6. Direction juridique et contrats
Le « Legal Regulator » s’occupe de tous les aspects juridiques de Vodacom
et de la règlementation par rapport au texte juridique et aux lois en vigueur en RDC,
également de la négociation des contrats de la société et traite de certains litiges qui
peuvent y découler des transactions Vodacom avec les clients, les autres partenaires et
les entreprises installés en RDC.
55
7. Direction commerciale ou Marketing
Le département commercial s’occupe des ventes, de la gestion de la
clientèle, de la promotion des produits que la société injecte sur le marché en élaborant
des stratégies pouvant stimuler la consommation des abonnés. C’est lui qui gère les
différents contrats établis entre la société et ses abonnés. Ce département constitue
l’image de marque de VODACOM CONGO.
8. Direction de client (Customer)
Il traite des problèmes liés au réseau et autres problèmes des abonnés
VODACOM, tels que le renouvellement SIM, la vente et la distribution des produits
dans les shops etc.
3.4. LES DIFFERENTS PRODUITS ET SERVICES PROPOSEES PAR VODACOM
Comme toute entreprise commerciale, ses produits et services font son image et
Vodacom commercialise et fait la promotion d'un certain nombre de ses produits et services
en recouvrant à une politique de prix et de distribution qui tient compte à la fois de la qualité
et la spécificité de ses produits.
c. Les produits de Vodacom
Les téléphones : la société Vodacom Congo malgré qu’elle n’est ni un fabricant des
téléphones mobiles, ni fixe, mais elle procède à la commercialisation de ces produits
dans ses différents points devente ou shop ;
Les cartes SIM : elle est l'identité du client ou abonné. Tout abonné est enregistré au
réseau grâce à son numéro. Vodacom en distingue deux types des cartes SIM :
Waldeck SIM et Palice SIM ;
Les cartes prépayées : ce sont de petites cartes en papier contenant un code, lequel
permet de recharger son compte. C'est le mode de paiement anticipatif du service de
communication.
Les deux derniers produits de Vodacom sont les plus importants, car ils
permettent à l'entreprise de gagner beaucoup d'argent pour son fonctionnement. Ces différents
produits sont catégorisés en trois classes : Vodacom Prépayé, Business class (abonnement) et
Vodka cabine (cabines publiques).
56
d. Les services principaux de Vodacom
L’entreprise Vodacom met à la disposition de sa clientèle un certain nombre de
services payables appelé généralement « service à valeur ajoutée ». Et parmi lesquels nous
pouvons citer :
Le service M-PESA : ce service consiste à envoyer, recevoir et conserver de l'argent
dans son téléphone et qu'on peut le récupérer dans un shop Vodacom le plus proche ou
dans tout autre lieu qui dispose du service M-PESA ;
Le service JS8 Planète Jeune : ce service offre de multiples avantages du réseau
Vodacom. Avec ce service, il y a plus de possibilités d'activer des différents forfaits.
Ces derniers sont activés selon les moyens de l'abonné.
Le service abonnement en mode facturation : ce service permet de limiter sa
consommation mensuelle des unités convenant parfaitement aux besoins de
l'utilisateur ;
Le service abonnement Reflex : l'abonnement reflex permet de souscrire pour un
montant fixe chaque mois et d'avoir la flexibilité de recharger chaque fois le compte
qu'il souhaite. La souscription est de même que celle du service d'abonnement en
mode facturation.
Le service Tout Terrain : ce service permet d'économiser ses unités jusqu'à 60% sur
des appels de Vodacom-Vodacom et voir même l'international ;
Tout appel sur tout terrain coute 9 Unités/minutes i' Il est un service conçu
pour faciliter la vie sans toutefois activer ;
Tout terrain permet de faire des appels vers tous les réseaux locaux et
internationaux Zone A à seulement 9 Unités/minutes.
Le service Papa Bonheur : ce service consiste à faire le sponsoring des appels, SMS
et internet de cinq personnes de notre choix. Il sera juste question d'insérer les cinq
numéros via le menu interactif *1111# de personnes que nous désirons sponsoriser ;
Le service EXEAT : ce service aide les finalistes des examens d'État de recevoir dès
que possible leurs résultats à partir de leurs portables via le réseau Vodacom ;
Le service E-Recharge : c'est un service permettant de recharger son compte par voie
électronique, entre le flash ou recharge via M-PESA.
57
a) Tableau récapitulatif des différentes offres proposées par Vodacom
JS8
Privilège Club Privilège Le club Privilège est un groupe d'abonnés VIP avec Vodacom octroie
des avantages Télécoms et non télécoms afin de faciliter leur vie de tous
les jours
Privilège Forfaits Privilège est un Profil exceptionnel réservé aux Clients VIP proposant
Appels une large gamme d'offres et d'avantages conçus pour répondre à leurs
besoins
Ce Profil garantit un maximum de confort grâce à ses offres combinant
la voix, l'Internet, les SMS, et bien d'autres avantages tels que :
Privilège Appels Forfaits Angola
vers Forfaits Angola pour les abonnés du Kongo Central
l'International Forfaits Angola pour les abonnés de toutes les régions de la RDC
Forfaits Privilège International Zone A
Forfaits Privilège International Zone B
Forfaits Privilège International Zone C
Pays de la zone C
Alaska, Arabie Saoudite, Argentine, Bahreïn, Egypte, Emirats Arabes
Unis, Hawaii, Ile Maurice, Laos, Liban, Macao, Népal, Paraguay,
Philippines, Swaziland, Turquie, Uruguay, Venezuela.
Forfaits Privilège SMS
Forfaits Privilège internet
Tout Terrain Tout Terrain vous permet d'effectuer des appels vers tous les réseaux locaux à seulement 9,5
unités/minute. Avec Tout Terrain, sentez-vous libre d'appeler qui vous voulez quand vous
voulez, où que vous soyez. Tout terrain vous donne l'avantage d'être le tarif le plus simple et
facile à utiliser. Vous n'avez pas besoin d'activer les forfaits
Offres Juste Pour Toi Des offres « taillées sur mesure » et adaptées à vos besoins de
prépayés communication (Internet, Appels et SMS)
Ces offres vous sont proposées suivant votre comportement de
consommation, en observant ces principaux critères :
La somme de vos recharges sur les 30 derniers jours
La fréquence de vos recharges sur les 30 derniers jours
Selon vos activités, vous rencontrerez :
Un forfait internet (journalier, hebdomadaire, mensuel)
Un forfaire appel Vodacom- Vodacom (journalier, hebdomadaire,
mensuel)
Un appel Vodacom - autre réseau
Un forfait SMS (Vodacom – Vodacom ou Vodacom - autre réseau)
Un forfait 3 en 1 (Appel, SMS et Internet)
Un forfait Mikili (pour vos appels vers l'international) de Zone A, B ou C
Abonnement Réflexe Bénéficiez des avantages de notre abonnement Reflex!
L'abonnement reflex vous permet de souscrire pour un montant fixe
chaque mois et d'avoir la flexibilité de recharger votre compte chaque
fois que vous le souhaitez.
Comment souscrire ?
Faites tout simplement votre demande auprès de notre direction
commerciale ou un Vodashop
Vous serez alors invité à remplir un contrat où vous préciserez la
58
limite de consommation que vous souhaitez avoir.
Les informations que vous nous avez fournies dans ce contrat
seront ensuite analysées
Si ces informations sont confirmées, vous payez une prudence
correspondante à 2 mois du montant de l'abonnement pour
lequel vous avez souscrit et votre abonnement sera ensuite activé
Abonnement en Votre téléphone vous sert beaucoup dans le cadre de vos affaires !
mode facturation Alors souscrivez à notre abonnement en mode facturation. Qui vous
permet de choisir la limite de consommation mensuelle convenant
parfaitement à vos besoins.
Internet 4G La 4G , technologie qui offre des possibilités illimitées et des bénéfices
inégalés dans l'amélioration du quotidien de nombreux utilisateurs de
smartphones, tablettes et autres terminaux, est désormais à portée de
main pour fluidifier les communications, densifier les échanges et
tonifier l'activité économique du pays. Destinée à tout le monde, les
jeunes, les femmes, les banques, les opérateurs miniers, les PME/PMI,
les Organisations Non Gouvernementales, les institutions, ... la 4G de
Vodacom Congo apporte aujourd'hui satisfaction aux exigences de
toutes ces catégories d'abonnés.
Plus concrètement, la 4G de Vodacom permet l'accélération sensible des
téléchargements, l'accessibilité à la demande des vidéos et de la
musique, l'exploration des jeux en ligne et des performances de
connectivité accrues pour toutes les applications métiers. Votre
expérience en communication franchit un cap majeur dans la gestion et
la maîtrise de votre connectivité : votre façon de partager, de découvrir,
de vous divertir, d'étudier, de travailler, de prendre de soin de vous et
d'aimer ne sera plus jamais la même.
NETBOX La NetBox vous permet de bénéficier d'un accès Internet haut débit à un
prix abordable
La Vodacom NETBOX est un support de connexion Internet à large
bande qui permet de fournir de la connectivité sans fil et par câble au
besoin. Elle utilise la technologie WiBB (Wireless Broadband) avec des
capacités de téléchargement allant jusqu'à 80 Mbps.
La Vodacom NETBOX est conçue pour les petites et moyennes
entreprises ainsi que pour les besoins domestiques.
International Voyager avec Restez joignable pendant vos déplacements à travers le monde grâce au
son numéro roaming international !
Vous pouvez vous déplacer avec votre numéro Vodacom partout dans le
monde et continuer à émettre ou recevoir vos appels tranquillement en
activant le roaming international.
Communiqué Des forfaits qui vous font rêver!
vers Activez les forfaits MIKILI et bénéficiez du meilleur tarif pour
l'international communiquer en international !
59
b) Le circuit de distribution des produits Vodacom
L'un des aspects le plus visible des activités de Vodacom est présent sur
l'ensemble du territoire de la République Démocratique du Congo. Dans chacun des centres
ou Vodacom est implanté, selon les données propres au milieu, Vodacom alterne le circuit
court ainsi que le circuit long.
Le circuit court représente la structure de distribution à un niveau, il comporte un
seul intermédiaire qui va à son tour au consommateur final. Cet intermédiaire peut être un
grossiste, un agent commercial ou une société de service.
Dans tous les cas, le circuit court peut être schématisé de la manière suivante :
Vodacom ;
Détaillant ;
Consommateur.
D'une manière générale ; compte tenu du volume important de la clientèle ;
notamment dans les différents centres urbains ou elle est implantée, spécialement dans la ville
de Kinshasa, mais cela est vrai avec les nuances des autres villes du pays Vodacom utilise un
circuit comprenant plusieurs intermédiaires constitués essentiellement des grossistes qui
achètent à l'entreprise à un prix réduit et qui vendent par la suite aux revendeurs qui, à leur
tour, revendeurs aux consommateurs.
Il est a noté que l'implantation des différents vodashops dans les zones de grande
consommation permet non seulement de vendre des cellulaires mais également de faire
connaitre le produit à travers des actions promotionnelles.
e. LES DIFFERENTS CLIENTS DE VODACOM
D’une manière générale, les clients de l’entreprise Vodacom peuvent être
classifier de la manière suivante :
Catégories a) Personnes Physique (Particuliers)
b) Personnes morales (organisations)
c) Familles
Sexe a) Hommes
b) Femmes
Tranche d’âge 18-25 ans
26-35 ans
36 ans ou plus
Socio-professionnelle Fonctionnaire
Sans emploi
Elèves
Étudiants
60
Conclusion Partielle
Dans ce chapitre nous avons présentés l’entreprise Vodacom SA en passant par
revue toutes ces activités, organisation et fonctionnement qui nous a permis de bien cerner le
problème pour l’élaboration d’un outil pouvant bien mener les indicateurs de décisions. Aussi
nous avons collecté les informations nécessaires et indispensables pour développer notre
projet décisionnel.
Dans le chapitre suivant, nous allons essayé de mettre en place un Data warehouse
et un arbre de décision par rapport aux différentes informations récoltées dans ce chapitre.
61
CHAPITRE IV : CONCEPTION ET IMPLEMENTATION DE L’OUTIL
DECISIONNEL
Dans ce chapitre consacré à l’implémentation de notre système décisionnel, nous
allons abordés deux sections. La première est consacrée à la présentation des outils qui seront
utilisés et la seconde met en pratique le système y compris son interprétation.
Section 1. Présentation des outils
Pour la réalisation de notre système, nous avons utilisés deux outils dont l’outil
power BI et l’arbre de décision classique.
a. Power BI
Power BI est une suite d’outils permettant d’analyser des données et de partager
des informations. Quelle que soit la nature de données, Power BI permet de se connecter
facilement à des sources de données, de visualiser les informations importantes et de les
partager.
Power BI Desktop est un service d’analyse commercial de Microsoft . Son objectif
est de fournir des visualisations interactives et des fonctionnalités de business
intelligence avec une interface assez simple pour que les utilisateurs finaux puissent créer
leurs propres rapports et tableaux de bord.
Voici quelques fonctionnalités qu’offre power BI :
Collecte de données : Power BI peut se connecter à diverses sources de données des
entreprises de télécommunications, telles que les bases de données internes, les
fichiers Excel, les services web, les API, etc. Il permet de collecter et de rassembler les
données provenant de différentes sources pour l'analyse ultérieure ;
Transformation et modélisation des données : Power BI offre des fonctionnalités de
transformation des données pour nettoyer, filtrer, agréger et combiner les données
provenant de différentes sources. Il permet également de créer un modèle de données
qui organise et structure les données en fonction des besoins d'analyse ;
Création de tableaux de bord interactifs : Power BI permet de créer des tableaux de
bord interactifs et visuellement attrayants. Les entreprises de télécommunications
peuvent créer des visualisations telles que des graphiques, des tableaux croisés
dynamiques, des cartes géographiques, des indicateurs clés de performance (KPI) pour
suivre et analyser les métriques clés liées aux offres, aux clients, aux ventes, etc ;
Analyse avancée et exploration des données : Power BI offre des fonctionnalités
d'analyse avancée, telles que les calculs de mesure, les filtres dynamiques, les
segments, les hiérarchies, etc. Les utilisateurs peuvent explorer les données en
profondeur, effectuer des analyses ad hoc et obtenir des informations approfondies sur
les tendances, les modèles et les relations dans les données des entreprises de
télécommunications ;
62
Publication et partage des rapports : Power BI permet de publier les rapports et les
tableaux de bord sur le service Power BI en ligne. Cela permet aux utilisateurs
autorisés d'accéder aux rapports via un navigateur web ou l'application Power BI, de
les partager avec des collègues et de collaborer sur les analyses.
Power BI offre également des fonctionnalités avancées telles que l'intégration
d'analyses prédictives, la création de tableaux de bord en temps réel, la création de rapports
mobiles, etc., ce qui peut être utile pour les entreprises de télécommunications dans leurs
activités d'analyse de données.
Figure 9: Processus général de fonctionnement de Power BI
b. Arbres de décision classiques
Les arbres de décision sont des modèles d'apprentissage automatique qui utilisent
des règles de décision pour diviser les données en sous-groupes homogènes. Ils sont
largement utilisés pour la prédiction des offres en fonction de diverses caractéristiques des
clients, telles que l'historique des achats, les préférences, les habitudes d'utilisation, etc.
Les arbres de décision sont des modèles d'apprentissage automatique qui utilisent
une approche basée sur des règles de décision pour résoudre des problèmes de classification et
de régression. Ils sont largement utilisés dans de nombreux domaines, y compris les
télécommunications dans notre cas pour prédire les offres en fonction des caractéristiques des
clients.
Voici un aperçu sur fonctionnement de la technique des arbres de décision :
1. Construction de l'arbre : L'algorithme d'apprentissage construit l'arbre de décision
en sélectionnant de manière itérative les meilleures caractéristiques pour diviser les
données en sous-groupes homogènes. L'objectif est de maximiser la pureté des
groupes résultants en termes de classe ou de valeur cible (par exemple, les offres) ;
2. Division des nœuds : À chaque étape de la construction de l'arbre, l'algorithme choisit
la caractéristique qui permet de diviser les données de manière optimale. Différentes
mesures de pureté, telles que l'indice de Gini ou l'entropie, peuvent être utilisées pour
évaluer la qualité de la division ;
63
3. Feuilles de décision : L'arbre se développe jusqu'à ce qu'une condition d'arrêt soit
satisfaite, telle qu'atteindre une profondeur maximale, un nombre minimum
d'observations dans les nœuds ou une pureté suffisante. Les feuilles de l'arbre
représentent les décisions finales ou les prédictions ;
4. Prédiction et interprétation : Une fois que l'arbre est construit, il peut être utilisé
pour prédire les offres en fonction des caractéristiques des clients. Chaque chemin de
la racine à une feuille représente une série de règles de décision qui conduisent à une
prédiction spécifique.
Les arbres de décision présentent plusieurs avantages, notamment :
Interprétabilité : Les arbres de décision fournissent une représentation graphique
facilement interprétable des décisions prises par le modèle.
Traitement de caractéristiques mixtes : Les arbres de décision peuvent gérer à la
fois des variables continues et catégorielles sans nécessiter de transformations
supplémentaires.
Gestion des données manquantes : Les arbres de décision peuvent gérer les valeurs
manquantes dans les caractéristiques en utilisant des stratégies spécifiques lors de la
construction de l'arbre.
Section 2 : Implémentation du système
Dans cette section consacrée au à la mise en œuvre de notre système décisionnel
qui constitue notre apport dans le domaine scientifique et la proposition d’une solution à
l’entreprise Vodacom Congo seront illustré par quelques étapes décrites ci-bas.
a. Présentation de formulaire d’identification de l’Abonné
Le formulaire d’identification de l’Abonné est un document et le moyen qu’utilise
l’entreprise Vodacom Congo pour effectuer des enregistrements légaux pour identifier tous
ses abonnés au moment de la souscription au service de téléphonie en mode facturation ou
prépayé. L’identification des abonnés étant donc une obligation légale.
Formulaire d’identification de l’Abonné
64
Grâce à ce formulaire contenant les informations des bases qui permet de
d’identifier les abonnés (clients), nous avons pu tirer des informations nécessaires qui ont
permis de modéliser le schéma de notre future data warehouse.
b. Modélisation dimensionnelle
1. Dimension
a. Dimension Temps
La dimension temps est « la seule dimension qui figure systématiquement dans tout entrepôt
de données, car en pratique tout entrepôt de données est une série temporelle. Le temps est le
plus souvent la première dimension dans le classement sous-jacent de la base de données ».
Tableau de dimension Temps
Désignation Détail
Pk_Date Clé primaire de la dimension Temps
Trimestre_X Un trimestre encours
Annee_exercice Nom de l’année d’exercice comptable
b. Dimension Catégorie client
La dimension Catégorie client décrit les catégories des abonnées de l’entreprise
Vodacom Congo.
Tableau dimension Catégorie client
Désignation Détail
Pk_cat Clé primaire de la dimension catégorie client
Libelle_cat Nom de catégorie de client
Fk_personnePy Clé étrangère de la table Personne physique
Fk_PersonneMo Clé étrangère de la table personne morale
c. Dimension personne physique
Cette dimension décrit les informations importantes qui identifie les personnes physiques.
Tableau dimension personne physique
Désignation Détail
Pk_personnePy Clé primaire de la dimension personne physique
Num_app Numero d’appel
Nom_Cli Nom
PostN_Cli Post-nom
Prenom_Cli Prenom
Addr_Cli Adresse physique
Ville_Cli Ville
Nat_Cli Nationalité
DataNaiss_Cli Data naissance
LieuNaiss_Cli Lieu de naissance
65
Carte_Cli Type carte d’indenté
NumCarte_Cli Numero carte d’identité
Table 2:Tableau dimension personne physique
d. Dimension Catégorie Socio-professionnelle
La dimension Catégorie client décrit les catégories des abonnées de l’entreprise
Vodacom Congo.
Tableau dimension Socio-professionnelle
Désignation Détail
Pk_catProf Clé primaire de la dimension catégorie professionnelle
Libelle_cat Nom de catégorie de professionnelle
Table 3:Tableau dimension Socio-professionnelle
e. Dimension personne morale
Cette dimension décrit les informations importantes qui identifie les personnes morales.
Tableau dimension personne morale
Désignation Détail
Pk_personneMr Clé primaire de la dimension personne_morale
Num_App Numero d’appel
Rais_Soc Raison sociale
Rccm RCCM
Perso_Jurid Personnalite juridique
Addr_Phy Adresse physique
Addr_Elec Adresse electronique
Nom_Mand Nom_mandataire
Table 4: Tableau dimension personne morale
f. Dimension produit_vodacom
La dimension Catégorie services décrit les services offerts par de l’entreprise
Vodacom Congo.
Tableau dimension service
Désignation Détail
Pk_produit Clé primaire de la dimension service
Mpese Le service M-PESA.
JS8 Le service JS8 Planète Jeune
Abon_fact Le service abonnement en mode facturation
Abon_ref Le service abonnement Reflex
ToutTerrain Le service Tout Terrain
Papa_Bonh Le service Papa bonheur
EXATAT Le service EXEAT
E_Recharge Le service E-Recharge
Info_Divers Vodacom info et Divertissement
66
Games Vodacom Games
MasterQuiz Master Quiz
Vadaeduc Vodacom éducation
BestofBest Best of the best
MyMuze MyMuze
Miss_Vod miss vodacom
Mum_Bab Mum&baby
Table 5: Tableau dimension service
g. Fait Evaluation
Le fait référence aux indicateurs peuvent vous aider à évaluer la performance de
vos offres et à prendre des décisions éclairées pour améliorer votre stratégie commerciale.
Tableau de la table de fait Evaluation
Désignation Détail
Fk_temps Clé étrangère de la dimension temps
Fk_cat_client Clé étrangère de la dimension categorie
Fk_produit Clé étrangère de la dimension produit
Fk_service Clé étrangère de la dimension service
Fk_ catProf Clé étrangère de la dimension catégorie
socioprofessionnelle
Anciennete Nombre d’ancienneté d’abonées
Historique des achats prod Historique des achats des produits par un client
Historique des achats serv Historique des achats des service par un client
Table 6: Tableau de la table de fait Evaluation
67
2. Présentation de données
Dans cette partie, nous avons commencé notre étude en analysant le fichier
Excel des différents Abonnés de Vodacom que nous avons récolté durant notre
enquête.
Voici donc l’extrait :
Figure 10:Données dans un fichier Excel
IV.3. SCRIPTS DE GENERATION DE LA BD
Pour ce qui concerne notre script de la Base de Données. Nous
allons utiliser SQL Server 2008 R2, voici son interface de démarrage.
Figure 11:: Interface Graphique de SQL server R2 2008
68
L’importation de données sous SQL server
Après la création de notre base de données, maintenant passons
à l’importation de données qui se trouvent dans un fichier Excel dans SQL
Server R2 2008.
Figure 12:: importation de données dans SQL server
Cette image montre la réussite avec succès de l’importation de
données qui était sans un fichier Excel via SQL Management.
Voici le résultat de notre importation de données.
Figure 13: résultat de l'importation
69
Après l’importation de données de la base des données, nous
avons ouvrir notre outil SQL Server Business Intelligence Développement
Studio pour la conception de différents Abonnées de Vodacom. voici
comment se présente l’interface de SQL Server Business Intelligence
Développement Studio (Visual Studio 2008).
Figure 14:Interface de Visual studio 2008
Dans cette partie, on va créer une source de données après une
vue de source de données et enfin structure d’exploitation de données. Et
voici la table de fait qu’il génère après toute opération faite :
Figure 15: Vue de source de données
70
71
Présentation du modèle
Après avoir analyser notre le problème, voici le schéma de la base de
données :
Figure17 : Schéma de la base de données
72
PRESENTATION DE SOURCES DE DONNEES
Cette vue de la source de données est un modèle pour lequel prend vie notre
structure du cube OLAP de notre magasin de données.
Figure18:une source de données
PRESENTATION DE MODELE EN ETOILE
ANALYSE DE QUELQUES CAS
Nous avons fait ici quelques analyses comme vous le verrez représenté sur les
figures ci-dessous :
Figure 16: Modèle en etoile
73
Figure 17: diagramme
Interprétation :
Selon nos analyses présentées ici, nous pouvons bien le voir qu’il y a plus des
femmes clientes qui ont plus d’offres, par rapport à un nombre inférieur des hommes. Pour les
forfaits appels, la grande majorité ont le forfait Js8 privilège, suivi du forfait tout terrain. Pour
le forfait internet, c’est le type 4G qui est plus utilisé, suivi du forfait internet Juste pour toi.
En prenant en compte l’aspect duré d’appels, la majorité d’appels prennent plus d’une minute,
d’autres prennent trois minutes et ainsi de suite. La tranche d’Age des abonnés le plus
dominant est celui de 32 à 39 ans, suivi de celui de 18 à 25, qui sont la majorité des jeunes.
74
ARBRE DE DECISION
Voici les différents arbres de décisions générés par Microsoft Visual Studio :
Note : Après les interprétations de diagrammes circulaires en montrant aussi la
tendance avec les histogrammes, voici maintenant l’arbre de décision générer
par B.I :
Figure 21 : Arbre de décision par rapport aux forfaits d’appels
75
Figure 22: Arbre de décision par rapport aux données
Conclusion partielle
Le but de ce dernier chapitre était de montre comment nous sommes parvenus
à prendre une décision optimale, comment nous avions fait pour avoir l’arbre de décision
ainsi que les différents diagrammes circulaires que nous avons présentés ci-haut.
Ce présent chapitre va permettre à tous les décideurs de prendre vraiment de
décision optimale que nous allons parler de la prédiction donc comment l’entreprise
Vodacom peut prédire ces offres qui serons adaptés a ses clients.
76
CONCLUSION GENERALE ET PERSPECTIVE
Dans un environnement hautement concurrentiel et en constante évolution, la prise
de décision efficace est essentielle pour toutes les entreprises et en particulier dans le
secteur de télécommunications. L’industrie des télécommunications est en constante
évolution avec une concurrence féroce et une demande croissante des clients pour des
services personnalisés de haute qualité. C’est dans ce contexte que les entreprises de
télécommunication telle que Vodacom cherche à maximiser la satisfaction des clients tout
en maintenant une rentabilité durable. C’est dans ce souci que nous avons consacré notre
travail de fin de cycle sur La mise en place d’un outil d’aide à la prise de décision base sur
le datawarehouse et l’arbre de décision pour la prédiction d’offres en fonction du profil
des clients dans une entreprise de télécommunication tel que Vodacom. Cet outil est
bénéfique pour tous les clients, car il permet à ces derniers de bénéficier de service de
qualité proposer par l’entreprise, et à l’entreprise de de prendre de décision importante
enfin maximiser et satisfaire ses Abonnées. Pour nous, ce présent travail nous a été aussi
très profitable parce qu’il nous a aidé non seulement à ressortir les acquis des
enseignements reçus pendant ces cinq années passées à l’université mais aussi de
compléter nos connaissances par la lecture et la recherche scientifique.
Le présent travail réparti en quatre chapitres plus l’introduction et la conclusion,
nous avons, dans le premier chapitre, nous avons abordé une généralité sur le système
décisionnel par laquelle nous montré la place qu’il occupe dans les entreprises à l’ère
actuel par le fait, qu’il nous permet d’exploiter les données volumineuses stockées Afin
d’extraire des connaissances et de recueillir des informations stratégiques susceptibles à
être exploitées par les gestionnaires (décideurs) pour améliorer la performance de
l’entreprise grâce à ces différents outils proposés
. Le deuxième chapitre a été consacré au data warehouse et arbre de decision. Au
chapitre trois, nous avons présentés l’entreprise Vodacom SA en passant par revue toutes
ces activités, organisation et fonctionnement qui nous a permis de bien cerner le problème
pour l’élaboration d’un outil pouvant bien mener les indicateurs de décisions. Aussi nous
avons collecté les informations nécessaires et indispensables pour développer notre projet
décisionnel. Et au dernier chapitre nommé conception et implémentation de l’outil
décisionnel, nous avons montré comment nous sommes parvenus à prendre une décision
optimale, comment nous avions fait pour avoir l’arbre de décision ainsi que les différents
diagrammes circulaires que nous avons présentés ci-haut.
En guise de conclusion, nous ne pouvons pas achever toute la recherche dans une
courte période comme celle-ci que nous avons utilisé pour un travail de fin du second
cycle. Pour que ce travail puisse s'achever correctement, nous devons avoir un temps bien
reparti. Nous souhaiterions ainsi que d'autres chercheurs qui vont suivre ou aborder le
même champ d'étude d'apporter des pistes nouvelles.
Nous ne prétendons pas avoir tout épuisé ni même avoir dit le dernier mot sur
ce domaine. Toutes vos remarques et recommandations sont les bienvenues.
77
BIBLIOGRAPHIE
i. OUVRAGES
1. DAVID MAISONS, « Data warehouse et datamining », CONSERVATOIRE
REGIONNAL DES ART ET METIERS CENTRE DE VERSAILLES, Versailles, 2006.
2. HOLTZMAN S., «Intelligent Decision Systems», Addison Wesley, Alger, 1989.
ii. NOTES DE COURS
3. KAFUNDA KATALAY, « Note de cours de système décisionnel », UNIKIN, L2
AIA/Conception, 2020-2021
4. KUNYUSA Alain et NOKKELE Jacques, « Note de cours l’informatique
décisionnelle », L1 Informatiques, UTBC, 2022-2023
iii. MÉMOIRES ET TRAVAUX SCIENTIFIQUES
5. BOULDJENET Sofiane, « Une plate-forme pour l’aide à la décision
organisationnelle », Mémoire de master a Institut National de formation en
Informatique (I.N.I) Oued-Smar Alger, 2006.
6. MUDUDA MUANDA, « le système décisionnel qui sera mise en place sera basé sur
un Data Warehouse sein du Groupe d’Etudes et d’Interventions (G.E.I sprl) »,
Mémoire de fin d’études, inédit, Unikin, 2018-2019.
7. Rechoum MASSINISSA NABIL et BENALI Mohamed OUSSAMA, « Conception
et la réalisation, d’un système décisionnel pour une entreprise d’expertise et
d’assurance », Mémoire présenté pour l’obtention du diplôme de Master en
Informatique, Universté de SAAD DAHLAB-BLIDA 1, 2020
iv. SITE WEB
8. http://www.systèmedécisionnel.pdf, consulté le 30/10/2023
9. www.datawarehouse.net , consulté le 10/10/2023
10. www.powerbi.net , consulté le 10/10/2023
11. www.wékipedia-arbre –de-decision , consulté le 02/10/2023
78
TABLE DES MATIERES
EPIGRAPHE.........................................................................................................................................i
DEDICACES........................................................................................................................................ii
REMERCIEMENTS...........................................................................................................................iii
LISTE DES FIGURES........................................................................................................................iv
LISTE DES TABLEUX.......................................................................................................................v
INTRODUCTION GENERALE.........................................................................................................1
1. Contexte et motivation...............................................................................................................1
2. PROBLEMATIQUE..................................................................................................................1
3. HYPOTHESE.............................................................................................................................2
4. OBJECTIF DU TRAVAIL.........................................................................................................2
5. CHOIX ET INTERET DU SUJET.............................................................................................3
5.1. Choix du sujet...................................................................................................................3
5.2. Intérêt du sujet..................................................................................................................3
6. METHODES ET TECHNIQUES UTILISEES..........................................................................4
6.1. Méthodes utilisées.............................................................................................................4
6.2. Techniques utilisées..........................................................................................................4
7. DELIMITATION DU SUJET.................................................................................................5
7.1. Dans le temps....................................................................................................................5
7.2. Dans l’espace.....................................................................................................................5
8. PLAN DU TRAVAIL...............................................................................................................5
CHAPITRE I. GENERALITES SUR LE SYSTEME DECISIONNEL..........................................6
I.1. INTRODUCTION.......................................................................................................................6
I.2. HISTORIQUE..............................................................................................................................6
1.3. DEFINITION DU SYSTEME DECISIONNEL..........................................................................7
1.3.1 Définition de décideur et quelque concept lié........................................................................8
1.3.2 Les facteurs d’amélioration de la prise de décision..............................................................10
1.4 FONCTION DU SYSTÈME DECESIONNEL..........................................................................11
1.5 ARCHITECTURE DE SYSTÈMES DÉCISIONNELS.............................................................11
1.6 LES FONCTIONNALITÉS PROPOSÉES PAR UN SYSTÈME DÉCISIONNEL...................13
1.6.1 Comparaison du système décisionnel et système opérationnel............................................14
1.6 LES APPORTS DES SYSTÈMES DÉCISIONNELS................................................................14
79
Conclusion partielle..........................................................................................................................17
CHAPITRE II. DATA WAREHOUSE ET ARBRE DE DECISION.............................................18
SECTION 1. DATA WAREHOUSE...............................................................................................18
1.1. INTRODUCTION............................................................................................................18
1.2. DEFINITION........................................................................................................................19
1.2. CARACTERISTIQUE D’UN DATA WAREHOUSE.....................................................19
1.3. BUT D’UN DATA WAREHOUSE.................................................................................20
1.4. OBJECTIFS DU DATA WAREHOUSE.........................................................................20
1.5. LES DIFFERENTES ZONES..........................................................................................21
1.6. DIFFERENCE ENTRE ENTREPÔT DE DONNÉES ET BASE DE DONNÉES...........22
1.7. LES DEUX APPROCHE D'ENTREPÔT DE DONNÉES : KIMBALL CONTRE
INMON........................................................................................................................................22
a) La méthodologie Kimball...................................................................................................22
b) La méthode Inmon..............................................................................................................25
1.8. LA MODÉLISATION DIMENSIONNELLE..................................................................27
a) Relation entre la Modélisation Dimensionnelle et la Modélisation Entité/Relation..........27
b) Avantages de la modélisation dimensionnelle.....................................................................28
c) Les objets d’un schéma de Data Warehouse....................................................................28
a. Table de dimension.............................................................................................................28
b. Table de fait........................................................................................................................29
c. Indicateur : constitue la mesure d’un fait............................................................................30
d. Mesure : est une observation quantitative............................................................................30
1.9. Schémas d’un data warehouse..........................................................................................30
A. Le Schéma en Etoile............................................................................................................30
B. Le Schéma en Flocon..........................................................................................................31
C. Le Schéma en constellation.................................................................................................32
1.10. CONSTRUCTION DU DATA WAREHOUSE...........................................................33
1. La Conception logique.............................................................................................................33
2. La Conception Physique..........................................................................................................34
1.11. ALIMENTATION DU DATA WAREHOUSE PAR LES OUTILS ETL....................34
1. Les opérations ETL..................................................................................................................34
a) La racine..............................................................................................................................37
b) Les branches porteuses (feuille)...........................................................................................37
c) Les sous-branches................................................................................................................37
2.3. Comment construire un arbre de décision................................................................................38
80
1) Etape 1 : Définissez votre problématique.............................................................................38
2) Etape 2 : Définissez vos branches porteuses.........................................................................38
Etape 3 : Définissez des sous-branches........................................................................................39
3) Etape 4 : Choisissez votre/vos critères discriminants............................................................40
4) Etape 5 : Faites les calculs...................................................................................................41
5) Etape 6 : Prenez votre décision.............................................................................................41
2.4. Outils de création d’arbre de décision.......................................................................................42
2.5. Construction d’un arbre de décision à partir d’un jeu d’apprentissage....................................43
2.5.1. Critères de choix de la variable de séparation................................................................44
2.5.2. Algorithmes de construction d’arbre de décision...........................................................45
2.5.3. Caractéristiques et avantages des arbres de décision.....................................................48
Conclusion partielle......................................................................................................................50
CHAPITRE III. PRESENTATION DE LA SOCIETE VODACOM/CONGO.............................51
3.1. Cadres historiques et géographique...........................................................................................51
a. Cadre historique....................................................................................................................51
b. Cadre géographique..............................................................................................................52
3.2. MISSIONS ET CADRE JURIDIQUE.......................................................................................53
a. Les missions..........................................................................................................................53
b. Cadre juridique....................................................................................................................53
3.3. STRUCTURE, FONCTIONNEMENTS ET ORGANIGRAMME............................................53
3.4. LES DIFFERENTS PRODUITS ET SERVICES PROPOSEES PAR VODACOM.................55
c. Les produits de Vodacom......................................................................................................55
d. Les services principaux de Vodacom....................................................................................56
Club Privilège.......................................................................................................................................57
Privilège Forfaits Appels......................................................................................................................57
Privilège Appels vers l'International.....................................................................................................57
Forfaits Angola pour les abonnés du Kongo Central........................................................................57
Forfaits Angola pour les abonnés de toutes les régions de la RDC...................................................57
Juste Pour Toi.......................................................................................................................................57
Réflexe.................................................................................................................................................57
Bénéficiez des avantages de notre abonnement Reflex!...................................................................57
Comment souscrire ?....................................................................................................................57
Abonnement en mode facturation.........................................................................................................58
Votre téléphone vous sert beaucoup dans le cadre de vos affaires !.................................................58
La NetBox vous permet de bénéficier d'un accès Internet haut débit à un prix abordable....................58
81
Voyager avec son numéro....................................................................................................................58
Restez joignable pendant vos déplacements à travers le monde grâce au roaming international !....58
Communiqué vers l'international..........................................................................................................58
Des forfaits qui vous font rêver!.......................................................................................................58
e. LES DIFFERENTS CLIENTS DE VODACOM....................................................................59
Conclusion Partielle.........................................................................................................................60
CHAPITRE IV : CONCEPTION ET IMPLEMENTATION DE L’OUTIL DECISIONNEL....61
Section 1. Présentation des outils....................................................................................................61
a. Power BI...............................................................................................................................61
b. Arbres de décision classiques.............................................................................................62
Section 2 : Implémentation du système.........................................................................................63
a. Présentation de formulaire d’identification de l’Abonné......................................................63
b. Modélisation dimensionnelle................................................................................................64
2. Présentation de données.....................................................................................................67
L’importation de données sous SQL server..............................................................................68
Présentation du modèle..................................................................................................................70
Conclusion partielle.............................................................................................................74
CONCLUSION GENERALE ET PERSPECTIVE.........................................................................75
BIBLIOGRAPHIE.............................................................................................................................76
TABLE DES MATIERES.................................................................................................................77