TP 02

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

157 vues2 pages

TP 02

Transféré par

walidbourmel44

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats DOCX, PDF, TXT ou lisez en ligne sur Scribd

TP02 - Data Preprocessing

Le but de ce TP est de familiariser les étudiants avec les étapes essentielles du prétraitement des
données dans le cadre de l'analyse de données et de la construction de modèles de machine learning.

1-Trouver les variables manquantes

1.1-Lisez l'ensemble de données titanic_survival.csv et affichez les premières lignes de l'ensemble de
données pour observer sa structure.
 Utilisez pandas.read_csv() pour charger les données.
 Utilisez head() pour visualiser les premières lignes.

1.2-Quelle est la taille de ce dataset, les caractéristiques et la variable cible ? Y a-t-il des données
manquantes ?

1.3-Compter le nombre de valeurs dans la colonne age possédant des valeurs manquantes :
 Assigner à la variable age la colonne des âges du dataframe titanic_survival
 Utiliser [Link]() sur la variable age pour créer une Series de valeurs True et False
 Utiliser la Series résultante pour sélectionner seulement les éléments de la colonne age qui sont
nuls et assigner le résultat à la variable missing_values
 Assigner le nombre de valeurs manquantes de missing_values à la variable
missing_values_count (fonction len())
 Afficher missing_values_count pour voir le nombre de valeurs manquantes de la colonne age.

1.4-Faire de même avec la colonne 'cabin' avec l’instruction isnull().sum()

1.5-Compter les valeurs manquantes pour chaque colonne.
1.6-Discuter l’importance de gérer les données manquantes et les différents moyens de le faire.

2- Gérer les variables manquantes

2.1 Supprimer les lignes contenant des valeurs manquantes dans la colonne 'embarked'.
2.2 Supprimer la colonne 'cabin' du dataset.
2.3 Imputer les valeurs manquantes:
 Imputation des variables numériques : Remplacer les valeurs manquantes de la colonne 'age' par
la moyenne des âges.
 Imputation des variables catégoriques : Remplacer les valeurs manquantes de la colonne
'embarked' par la valeur la plus fréquente (mode). (Utilisez la stratégie 'most_frequent')

3- Gérer les variables catégoriques

3.1 En considérant la variable 'embarked' comme indépendante, appliquez l'encodage nécessaire (par
exemple, LabelEncoder ou OneHotEncoder) pour remplacer la colonne 'embarked' d'origine dans le
DataFrame Titanic par les nouvelles colonnes encodées. Écrivez le code nécessaire pour effectuer cette
opération et expliquez pourquoi l'encodage choisi est important pour cette variable.

3.2 En considérant la variable sex comme dépendante, appliquez l'encodage nécessaire à cette colonne
pour qu'elle puisse être utilisée dans un modèle de machine learning.

Vous aimerez peut-être aussi

TP2 Prétraitement Des Données Ipynb - Colab
Pas encore d'évaluation
TP2 Prétraitement Des Données Ipynb - Colab
10 pages
TP 4 Analyse Exploratoire de Données AED
Pas encore d'évaluation
TP 4 Analyse Exploratoire de Données AED
5 pages
Préparation Des Données-Chapitre2
Pas encore d'évaluation
Préparation Des Données-Chapitre2
27 pages
TP-K-Means Clustering: Exemple de Resultat Trouve Pour K 2
Pas encore d'évaluation
TP-K-Means Clustering: Exemple de Resultat Trouve Pour K 2
1 page
Examen Apprentissage - Profond
Pas encore d'évaluation
Examen Apprentissage - Profond
3 pages
Thèse Complète Elong
Pas encore d'évaluation
Thèse Complète Elong
120 pages
Apprentissage Supervisé Avec Python: Objectifs
Pas encore d'évaluation
Apprentissage Supervisé Avec Python: Objectifs
4 pages
Support de TP 1 V1
Pas encore d'évaluation
Support de TP 1 V1
6 pages
Chapitre 2
Pas encore d'évaluation
Chapitre 2
16 pages
Sondages électoraux au Maroc : Base de données
Pas encore d'évaluation
Sondages électoraux au Maroc : Base de données
2 pages
tp2 ML
Pas encore d'évaluation
tp2 ML
7 pages
TP Naive Bayes
Pas encore d'évaluation
TP Naive Bayes
3 pages
TP 9 ML
Pas encore d'évaluation
TP 9 ML
9 pages
Python Avancé : Conditions et Boucles
Pas encore d'évaluation
Python Avancé : Conditions et Boucles
16 pages
Apprentissage et Reconnaissance de Formes
Pas encore d'évaluation
Apprentissage et Reconnaissance de Formes
37 pages
TD1 Apriori
100% (1)
TD1 Apriori
2 pages
Optimisation des Algorithmes
Pas encore d'évaluation
Optimisation des Algorithmes
38 pages
TP 2 Clustering
Pas encore d'évaluation
TP 2 Clustering
2 pages
TP4 ML
Pas encore d'évaluation
TP4 ML
3 pages
Examen 2 de Python
Pas encore d'évaluation
Examen 2 de Python
2 pages
1-Revision - Notions de Base
Pas encore d'évaluation
1-Revision - Notions de Base
18 pages
Corrigétype
Pas encore d'évaluation
Corrigétype
4 pages
Pretraitement Des Donnees
Pas encore d'évaluation
Pretraitement Des Donnees
6 pages
Algorithmes de Recherche pour Résolution de Problèmes
Pas encore d'évaluation
Algorithmes de Recherche pour Résolution de Problèmes
15 pages
Tp8 K-meansHaoop
Pas encore d'évaluation
Tp8 K-meansHaoop
11 pages
Filtre Grep Sed Awk
100% (1)
Filtre Grep Sed Awk
26 pages
Recherche Heuristique Recherche Graphe
Pas encore d'évaluation
Recherche Heuristique Recherche Graphe
5 pages
Introduction au Text Mining
Pas encore d'évaluation
Introduction au Text Mining
5 pages
Exercices Avec Solution
Pas encore d'évaluation
Exercices Avec Solution
42 pages
Chapitre 3 - Concepts de Basescsds
Pas encore d'évaluation
Chapitre 3 - Concepts de Basescsds
13 pages
TD IA Embarquée: Apprentissage Auto
Pas encore d'évaluation
TD IA Embarquée: Apprentissage Auto
6 pages
Cours Complet
Pas encore d'évaluation
Cours Complet
290 pages
TD N°1 Apprentissage M1-IA 2022-2023 CORR
Pas encore d'évaluation
TD N°1 Apprentissage M1-IA 2022-2023 CORR
7 pages
TP: Arbres de Décision en ML
Pas encore d'évaluation
TP: Arbres de Décision en ML
6 pages
Apprentissage Supervise
Pas encore d'évaluation
Apprentissage Supervise
52 pages
Chapter 3 - DeepLearning
Pas encore d'évaluation
Chapter 3 - DeepLearning
76 pages
Cours DL - Part5 (Prof)
Pas encore d'évaluation
Cours DL - Part5 (Prof)
78 pages
Corrigé Examen Fouille de Données Avancée
Pas encore d'évaluation
Corrigé Examen Fouille de Données Avancée
2 pages
Classification Par Arbre de Décision ID3 C4.5 EXC
Pas encore d'évaluation
Classification Par Arbre de Décision ID3 C4.5 EXC
103 pages
Output 4
Pas encore d'évaluation
Output 4
3 pages
Chapitre7 TAS
Pas encore d'évaluation
Chapitre7 TAS
29 pages
Méthodes de Classification en Apprentissage Supervisé
Pas encore d'évaluation
Méthodes de Classification en Apprentissage Supervisé
63 pages
Chap4-Ingénierie Des Donnéesnov2023
Pas encore d'évaluation
Chap4-Ingénierie Des Donnéesnov2023
53 pages
Manipulation des données avec R
Pas encore d'évaluation
Manipulation des données avec R
5 pages
TP SVM
Pas encore d'évaluation
TP SVM
6 pages
Heuristiques
Pas encore d'évaluation
Heuristiques
13 pages
File D Attente
Pas encore d'évaluation
File D Attente
43 pages
Tutoriel Protégé 5.2: Création d'Ontologie
Pas encore d'évaluation
Tutoriel Protégé 5.2: Création d'Ontologie
1 page
2 Programmation Python 2 - Numpy Et Matplotlib
Pas encore d'évaluation
2 Programmation Python 2 - Numpy Et Matplotlib
12 pages
Serie 1
Pas encore d'évaluation
Serie 1
5 pages
Introduction au Machine Learning
Pas encore d'évaluation
Introduction au Machine Learning
15 pages
Le Prétraitement Des Données Expliqué Simplement
Pas encore d'évaluation
Le Prétraitement Des Données Expliqué Simplement
7 pages
TP Python TP1
Pas encore d'évaluation
TP Python TP1
5 pages
Plan de Cours de Programmation Orientée Objet Avec Python
Pas encore d'évaluation
Plan de Cours de Programmation Orientée Objet Avec Python
6 pages
Réduction du bruit en traitement d'images
Pas encore d'évaluation
Réduction du bruit en traitement d'images
99 pages
Structures Arborescentes en Info
Pas encore d'évaluation
Structures Arborescentes en Info
12 pages
Performances des Processeurs MIPS
Pas encore d'évaluation
Performances des Processeurs MIPS
1 page
QCM Ia
Pas encore d'évaluation
QCM Ia
9 pages
Support TP DataPreprocessing
100% (1)
Support TP DataPreprocessing
2 pages
TP3 Fouille de Données 2025
Pas encore d'évaluation
TP3 Fouille de Données 2025
3 pages
Rapport Pfe Scrim Dgaigui-Version Finale
Pas encore d'évaluation
Rapport Pfe Scrim Dgaigui-Version Finale
77 pages
Structure et fonctions des mitochondries
Pas encore d'évaluation
Structure et fonctions des mitochondries
35 pages
Chapitre 2 - Extraction
100% (1)
Chapitre 2 - Extraction
77 pages
Bugs Majeurs Ou Crashs
Pas encore d'évaluation
Bugs Majeurs Ou Crashs
2 pages
Convexité des Fonctions : Concepts et Applications
Pas encore d'évaluation
Convexité des Fonctions : Concepts et Applications
17 pages
Chimie Atomique pour Lycéens
Pas encore d'évaluation
Chimie Atomique pour Lycéens
90 pages
Bulletin 8ème Eb
Pas encore d'évaluation
Bulletin 8ème Eb
1 page
Robot Structural Analysis-L'élément Câble PDF
Pas encore d'évaluation
Robot Structural Analysis-L'élément Câble PDF
4 pages
Simulation du Path Loss et Shadowing
100% (1)
Simulation du Path Loss et Shadowing
6 pages
Cours d'Algorithmique et Programmation
100% (1)
Cours d'Algorithmique et Programmation
126 pages
Glossaire Des Verbes d&#039 Action
100% (1)
Glossaire Des Verbes d&#039 Action
2 pages
Chimie Minérale pour Étudiants L2
Pas encore d'évaluation
Chimie Minérale pour Étudiants L2
84 pages
Controle 1 3AC 20192020 Blaise GRB
Pas encore d'évaluation
Controle 1 3AC 20192020 Blaise GRB
4 pages
Pdf2star TheseFinaleEntiere BAPTISTE 2018 05 02
Pas encore d'évaluation
Pdf2star TheseFinaleEntiere BAPTISTE 2018 05 02
148 pages
Modèle et Bilan des Machines Asynchrones
Pas encore d'évaluation
Modèle et Bilan des Machines Asynchrones
2 pages
1 Fractions Cours vs2024
Pas encore d'évaluation
1 Fractions Cours vs2024
5 pages
Calcul Barrages-Poids
Pas encore d'évaluation
Calcul Barrages-Poids
14 pages
2 Equations Cours
Pas encore d'évaluation
2 Equations Cours
2 pages
Lien - 02 - Annexe 1 Planification Annuelle Des Contenus Mathematiques cp1
Pas encore d'évaluation
Lien - 02 - Annexe 1 Planification Annuelle Des Contenus Mathematiques cp1
9 pages
Série 4 Algorithmes de Tris Classiques en Python
Pas encore d'évaluation
Série 4 Algorithmes de Tris Classiques en Python
1 page
4 - ch3 Cosinus
Pas encore d'évaluation
4 - ch3 Cosinus
2 pages
Gestion du Temps dans Systèmes Distribués
Pas encore d'évaluation
Gestion du Temps dans Systèmes Distribués
25 pages
Baccalauréat Métropole 2021 : Épreuves Spécialité
Pas encore d'évaluation
Baccalauréat Métropole 2021 : Épreuves Spécialité
8 pages
Emploi du Temps Universitaire 2023-2024
Pas encore d'évaluation
Emploi du Temps Universitaire 2023-2024
2 pages
Etude Et Realisation D Un Hacheur de Tracking Du Point de Puissance Maximale MPPT A Contre Reaction de Tension PDF
Pas encore d'évaluation
Etude Et Realisation D Un Hacheur de Tracking Du Point de Puissance Maximale MPPT A Contre Reaction de Tension PDF
133 pages
Étude Physique du Tir "Panenka"
Pas encore d'évaluation
Étude Physique du Tir "Panenka"
2 pages
Bac Congo-Brazzaville 2023 Série A
Pas encore d'évaluation
Bac Congo-Brazzaville 2023 Série A
3 pages
TP Scie 2022
Pas encore d'évaluation
TP Scie 2022
4 pages
CH6 Diagrammes Ellingham
Pas encore d'évaluation
CH6 Diagrammes Ellingham
14 pages
Ansys Calcul
100% (1)
Ansys Calcul
144 pages