0% ont trouvé ce document utile (0 vote)
55 vues25 pages

Formation Data Analyst: Session Février 2022

Transféré par

holinesstchitembo
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
55 vues25 pages

Formation Data Analyst: Session Février 2022

Transféré par

holinesstchitembo
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

FORMATION

DATA ANALYST
Session février 2022

Partie 1

1
Déroulement

 Durée de la formation : 8 semaines

 Déroulement des séances :


• Mercredi à partir de 17h30
• Dimanche à partir de 10h
 Quelques pauses (quand même !)

 Tour de table
3
 Introduction
◦ Problématiques des entreprises
◦ Les solutions possibles
◦ L’infrastructure décisionnelle
◦ Avantages et applications
◦ Déclinaison métiers
 Data Warehouse
◦ Définitions
◦ Caractéristiques
◦ Généralités
◦ Intégration de données
◦ Stockage de données
◦ Modèle dimensionnel

4
Introduction

5
 Augmentation de la concurrence;
 Un environnement incertain et complexe;
 La crise économique, financière et sanitaire !!

?
« la mise au point d'une stratégie SI, susceptible de
mieux atteindre les objectifs des entreprises »

6
Quels outils donner au décideur ?
7
 Ne veulent plus seulement savoir :
◦ « Combien de clients ont acheté tel produit pendant telle
période ? »
 Mais des nouvelles questions métiers :
◦ clientèle :
– « Quel est leur profil ?»
– « Quels autres produits les intéresseront ?»
– « Quand seront-ils intéressés ?»
– « Comment les conserver ou les faire revenir ?»
◦ marketing, actions commerciales :
– « Où placer ce produit dans les rayons ?»
– « Comment cibler plus précisément le mailing concernant ce
produit ?»

8
 Une grande masse de données archivée:
◦ Distribuée
◦ Hétérogène
◦ Très Détaillée
 A traiter :
◦ Collecter
◦ Analyser
◦ Visualiser
 Pour une utilisation par :
◦ Des experts et des analystes
– NON informaticiens
– NON statisticiens

9
•Les requêtes complexes et lourdes dégradent les performances des systèmes
transactionnels,

•Les données sont réparties entre données actuelles et données archivées,


rendant la vue historique des données très difficile, voir impossible,

10
• Moyens pour répondre à ces questions:
◦ Data Warehouse : un système d’information
centralisé, dédié aux applications décisionnelles.
◦ Data Mining : un processus de prospection de
données offrant un ensembles de techniques
(modèles et algorithmes) pour la prédiction, la
génération de liens, de patrons et de concepts.
• En Aval des bases de production
◦ (i.e. bases opérationnelles, production)
• En Amont des prises de décisions
◦ basé sur des indicateurs (Key Business Indicators
(KBI))

11
 Les données sont–elles prêtes
(bien organisées, intégrèes, Données
clean, homogènes, …) pour
en extraire de nouvelles 2
connaissances pour la prise 1

de décision ? Ok?
Data
◦ Si oui : on fait appel au Data warehousing
Mining pour une analyse directe. Oui
◦ Sinon : Il faut tout d‘abord 3

organiser les données puis faire


Data mining
appel au Data Mining pour la prise
de décision.
 C’est le BI (Business
Intelligence) ou l’informatique 4

décisionnelle Prise de décision

12
 Exemple Données non prêtes à être traiter :
 Le Business Intelligence (BI) :

 les moyens, les outils et les méthodes permettant de fournir des


informations précises et utiles aux décideurs appropriés dans les
délais nécessaires pour soutenir la prise de décision efficace.

 Exemple 1: Quel est le montant à mettre dans un distributeur de billet


bancaire pendant la période de fin d’année?

 Exemple 2: Que faire en cas de panne dans un véhicule autonome?


OLAP:
•Accès rapide aux Data, KPI,
Bases opérationnelles : Data Warehouse (entrepôt de
Dashboards, Scorecards
• Orientées services : Ventes, données) :
• Analyse multi-D
comptabilité, Marketing .. • Orientées sujets (analyse).
• Prédiction, simulation
• Volatile • Historisées
Data Mart : •Reporting (Crystal, MS
• OLTP • Non-volatiles • snapshot de DW Reporting)
Production • Bases Multidimentionnel
System • Historisées
• Non-volatiles

CRM
System Product
Data
O Flux

Financial
Mart L Décisionnel

System A
Extr act
Load P
ETL Seles
Data
f iles Mart

Data Mining:
• Prédiction/prospection.
• Extraction de connaissances
(SAS Mining, SQLserver
Mining)
15
Architecture d’un système décisionnel

Données
externes
Chaine
décisionnelle

8
 Acteurs de système de décision
Potentiel de support Prise de
décision
Utilisateurs
de décision
Décideurs
Techniques de
visualisation

Data mining
Découverte de
connaissances
Analystes
Exploration de données
(Statistiques, requêtes, …)

Data Warehouse

(OLAP, ….)
Concepteur
Sources de données DBA
(Papier, Fichiers, Fournisseurs d’information, SGBD, …)

17
- Data Analyst

- Data Scientist

- Data Engineer
 Mieux connaître le client
◦ pour mieux le servir
◦ pour augmenter sa satisfaction
◦ pour augmenter sa fidélité (+ coûteux d’acquérir un client
que le conserver)
 La connaissance du client est encore plus utile :
◦ les produits se ressemblent entre établissements
– le prix n’est pas toujours déterminant
– ce sont surtout le service et la relation avec le client qui f ont
la différence

19
• Marketing
◦ Marketing direct : population à cibler (âge, sexe,
profession, habitation, région, …).

20
• Secteur bancaire
◦ Déterminer les profils client.
◦ Utilisation du score de risque pour proposer le
montant de crédit le plus adapté à chaque client.
◦ Aide à la décision de paiement.
◦ Déterminer le meilleur taux de réponse des
campagnes marketing.
◦ Découverte de segments de clientèle.
◦ Adaptation de la communication marketing à chaque
segment de clientèle.
◦ Choix du meilleur canal de distribution.
◦ Identification des clients susceptibles de partir à la
concurrence.

21
• Assurance
◦ Sur des produits obligatoires (automobile,
habitation):
– soit prendre un client à un concurrent.
– soit faire monter en gamme un client que l’on
détient déjà.
– D’où les sujets dominants :
– Attrition.
– ventes croisées (cross-selling).
– montées en gamme (up-selling).
– Besoin de décisionnel dû à :
– concurrence des nouveaux entrants (bancassurance).

22
• Econométrie
◦ prédiction de trafic autoroutier.
• Ressources Humaines
◦ adéquation activité / personnel.
• Santé
◦ épidémiologie (VIH, Amiante, ...).
• Logistique
◦ adéquation demande / production.
• Commerce
◦ ciblage de clientèle.
◦ aménagement des rayons (2 produits en corrélation).
• e-commerce
◦ personnalisation des pages d’un site web en fonction du profil de
chaque internaute.
◦ optimisation de la navigation sur un site web.

23
• Gestion et analyse des marchés :
◦ Grande distribution : profils des consommateurs,
modèle d ’achat, effet des périodes de solde ou de
publicité, panier de la ménagère.
• Détection de fraudes :
◦ Banques,
◦ Télécommunications.
• Gestion de stocks :
◦ quand commander un produit,
◦ quelle quantité demander, …
• Analyse financière :
◦ maximiser l’investissement de portefeuilles d’actions.

24
Data Warehouse

25

Vous aimerez peut-être aussi