FORMATION
DATA ANALYST
Session février 2022
Partie 1
1
Déroulement
Durée de la formation : 8 semaines
Déroulement des séances :
• Mercredi à partir de 17h30
• Dimanche à partir de 10h
Quelques pauses (quand même !)
Tour de table
3
Introduction
◦ Problématiques des entreprises
◦ Les solutions possibles
◦ L’infrastructure décisionnelle
◦ Avantages et applications
◦ Déclinaison métiers
Data Warehouse
◦ Définitions
◦ Caractéristiques
◦ Généralités
◦ Intégration de données
◦ Stockage de données
◦ Modèle dimensionnel
4
Introduction
5
Augmentation de la concurrence;
Un environnement incertain et complexe;
La crise économique, financière et sanitaire !!
?
« la mise au point d'une stratégie SI, susceptible de
mieux atteindre les objectifs des entreprises »
6
Quels outils donner au décideur ?
7
Ne veulent plus seulement savoir :
◦ « Combien de clients ont acheté tel produit pendant telle
période ? »
Mais des nouvelles questions métiers :
◦ clientèle :
– « Quel est leur profil ?»
– « Quels autres produits les intéresseront ?»
– « Quand seront-ils intéressés ?»
– « Comment les conserver ou les faire revenir ?»
◦ marketing, actions commerciales :
– « Où placer ce produit dans les rayons ?»
– « Comment cibler plus précisément le mailing concernant ce
produit ?»
8
Une grande masse de données archivée:
◦ Distribuée
◦ Hétérogène
◦ Très Détaillée
A traiter :
◦ Collecter
◦ Analyser
◦ Visualiser
Pour une utilisation par :
◦ Des experts et des analystes
– NON informaticiens
– NON statisticiens
9
•Les requêtes complexes et lourdes dégradent les performances des systèmes
transactionnels,
•Les données sont réparties entre données actuelles et données archivées,
rendant la vue historique des données très difficile, voir impossible,
10
• Moyens pour répondre à ces questions:
◦ Data Warehouse : un système d’information
centralisé, dédié aux applications décisionnelles.
◦ Data Mining : un processus de prospection de
données offrant un ensembles de techniques
(modèles et algorithmes) pour la prédiction, la
génération de liens, de patrons et de concepts.
• En Aval des bases de production
◦ (i.e. bases opérationnelles, production)
• En Amont des prises de décisions
◦ basé sur des indicateurs (Key Business Indicators
(KBI))
11
Les données sont–elles prêtes
(bien organisées, intégrèes, Données
clean, homogènes, …) pour
en extraire de nouvelles 2
connaissances pour la prise 1
de décision ? Ok?
Data
◦ Si oui : on fait appel au Data warehousing
Mining pour une analyse directe. Oui
◦ Sinon : Il faut tout d‘abord 3
organiser les données puis faire
Data mining
appel au Data Mining pour la prise
de décision.
C’est le BI (Business
Intelligence) ou l’informatique 4
décisionnelle Prise de décision
12
Exemple Données non prêtes à être traiter :
Le Business Intelligence (BI) :
les moyens, les outils et les méthodes permettant de fournir des
informations précises et utiles aux décideurs appropriés dans les
délais nécessaires pour soutenir la prise de décision efficace.
Exemple 1: Quel est le montant à mettre dans un distributeur de billet
bancaire pendant la période de fin d’année?
Exemple 2: Que faire en cas de panne dans un véhicule autonome?
OLAP:
•Accès rapide aux Data, KPI,
Bases opérationnelles : Data Warehouse (entrepôt de
Dashboards, Scorecards
• Orientées services : Ventes, données) :
• Analyse multi-D
comptabilité, Marketing .. • Orientées sujets (analyse).
• Prédiction, simulation
• Volatile • Historisées
Data Mart : •Reporting (Crystal, MS
• OLTP • Non-volatiles • snapshot de DW Reporting)
Production • Bases Multidimentionnel
System • Historisées
• Non-volatiles
CRM
System Product
Data
O Flux
Financial
Mart L Décisionnel
System A
Extr act
Load P
ETL Seles
Data
f iles Mart
Data Mining:
• Prédiction/prospection.
• Extraction de connaissances
(SAS Mining, SQLserver
Mining)
15
Architecture d’un système décisionnel
Données
externes
Chaine
décisionnelle
8
Acteurs de système de décision
Potentiel de support Prise de
décision
Utilisateurs
de décision
Décideurs
Techniques de
visualisation
Data mining
Découverte de
connaissances
Analystes
Exploration de données
(Statistiques, requêtes, …)
Data Warehouse
(OLAP, ….)
Concepteur
Sources de données DBA
(Papier, Fichiers, Fournisseurs d’information, SGBD, …)
17
- Data Analyst
- Data Scientist
- Data Engineer
Mieux connaître le client
◦ pour mieux le servir
◦ pour augmenter sa satisfaction
◦ pour augmenter sa fidélité (+ coûteux d’acquérir un client
que le conserver)
La connaissance du client est encore plus utile :
◦ les produits se ressemblent entre établissements
– le prix n’est pas toujours déterminant
– ce sont surtout le service et la relation avec le client qui f ont
la différence
19
• Marketing
◦ Marketing direct : population à cibler (âge, sexe,
profession, habitation, région, …).
20
• Secteur bancaire
◦ Déterminer les profils client.
◦ Utilisation du score de risque pour proposer le
montant de crédit le plus adapté à chaque client.
◦ Aide à la décision de paiement.
◦ Déterminer le meilleur taux de réponse des
campagnes marketing.
◦ Découverte de segments de clientèle.
◦ Adaptation de la communication marketing à chaque
segment de clientèle.
◦ Choix du meilleur canal de distribution.
◦ Identification des clients susceptibles de partir à la
concurrence.
21
• Assurance
◦ Sur des produits obligatoires (automobile,
habitation):
– soit prendre un client à un concurrent.
– soit faire monter en gamme un client que l’on
détient déjà.
– D’où les sujets dominants :
– Attrition.
– ventes croisées (cross-selling).
– montées en gamme (up-selling).
– Besoin de décisionnel dû à :
– concurrence des nouveaux entrants (bancassurance).
22
• Econométrie
◦ prédiction de trafic autoroutier.
• Ressources Humaines
◦ adéquation activité / personnel.
• Santé
◦ épidémiologie (VIH, Amiante, ...).
• Logistique
◦ adéquation demande / production.
• Commerce
◦ ciblage de clientèle.
◦ aménagement des rayons (2 produits en corrélation).
• e-commerce
◦ personnalisation des pages d’un site web en fonction du profil de
chaque internaute.
◦ optimisation de la navigation sur un site web.
23
• Gestion et analyse des marchés :
◦ Grande distribution : profils des consommateurs,
modèle d ’achat, effet des périodes de solde ou de
publicité, panier de la ménagère.
• Détection de fraudes :
◦ Banques,
◦ Télécommunications.
• Gestion de stocks :
◦ quand commander un produit,
◦ quelle quantité demander, …
• Analyse financière :
◦ maximiser l’investissement de portefeuilles d’actions.
24
Data Warehouse
25