0% ont trouvé ce document utile (0 vote)
1K vues7 pages

Correction TP Python Panda

Le document décrit les étapes pour traiter un jeu de données avec Pandas en Python. Il montre comment importer des données depuis un fichier CSV, effectuer des opérations de nettoyage, calculer des statistiques descriptives et croiser des variables qualitatives.

Transféré par

Walid Ben Amor
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
1K vues7 pages

Correction TP Python Panda

Le document décrit les étapes pour traiter un jeu de données avec Pandas en Python. Il montre comment importer des données depuis un fichier CSV, effectuer des opérations de nettoyage, calculer des statistiques descriptives et croiser des variables qualitatives.

Transféré par

Walid Ben Amor
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Tp2 :

1- Lancer IDLE Python, créer un nouveau fichier TP2.py puis coller le code ci-
dessous :

# Importation des modules :


import pandas as pd
import numpy as np
# Creation de l’objet dataframe :
raw_data = {'Nom': ['Cherif', 'Mansour', 'Tijeni', 'Jridi', 'Amri'],
'Prenom': ['Seif', 'Jasem', ".", 'Marwa', 'Isam'],
'Sexe':['G','G','.','F','G'],
'age': [12, 12, 16, 14, 13],
'Controle': [4, 14, 11, ".", "."],
'Synthese': ["15,25", "14,75", 17, 12, 10],
'Observation':['Bien','Bien','Bien','Passable','Passable']}
df = pd.DataFrame(raw_data, columns = ['Nom', 'Prenom', 'Sexe', 'age', 'Controle',
'Synthese', 'Observation'])
# Creation du fichier CSV :
df.to_csv('note.csv')
# Lecture du fichier CSV
df = pd.read_csv('note.csv', sep=",")
# Affichage du contenu du fichier note.csv
print(df)

1
2 - Maintenant, vous allez ouvrir le fichier note.csv qui se trouve dans le même emplacement
du fichier TP2.py et puis :

 Copier son contenu puis le coller dans un nouveau classeur Excel


 Convertir cette colonne en tableau à l’aide de la commande convertir du menu
données
 Supprimer la première colonne
 Enregistrer le classeur Excel avec le nom note et le format CSV avec séparateurs ;
dans le même emplacement du fichier note.csv pour écraser ce dernier

2
3 - Remplacer le contenu du fichier TP2.py par ce dernier :

# Importation des modules :


import pandas as pd
import numpy as np
# Lecture du fichier CSV
df = pd.read_csv('note.csv', sep=" ;")
# Affichage du contenu du fichier note.csv
print(df)

4- Affichage de quelques informations diverses :

# informations diverses
print("Le nombre de lignes et colonnes : ")
print(df.shape)
print("Le nombre de valeurs par colonne : ")
print(df.count())
print("Les informations generale du tableau : ")
print(df.info())
print("Afficher les entetes des colonnes par deux facons differentes : ")
print(list(df.columns))
print(list(df))

3
5 - Affichage des statistiques :

# resume basique
print("Affichage des statistiques descriptives univaries")
print(df.describe())
print("Affichage des statistiques descriptives avec deux chiffres decimales")
print(df.describe().round(2))

4
6 - Traitement des données quantitatives :
Remarque : Il est possible de sélectionner les variables soit via les crochets [], soit par un point .. Les
fonctions ci-dessous permettent de décrire une variable quantitative (ici "Sexe").

# Quantitative :
print("Informations quantitative sur la colonne Age : ")
print(df.age.describe())
print(df["age"].describe())
print("La moyenne des Ages")
print(df.age.mean())
print("echantillonnage sur les tranches d'ages : ")
print(df.age.quantile([.01, .3, .9, .99]))

7 - Traitement des données qualitatives :


5
Pour les variables qualitatives, il y a plusieurs façons de faire pour obtenir la table d'occurrences
(ou des effectifs), ainsi que la table des proportions des modalités.

# Qualitatives :
print("Informations qualitative sur la colonne Sexe : ")
print(df.Sexe.describe())
print("Liste des valeurs d'une colonne : ")
print(df.Sexe.unique())
print("Compter le nombre de chaque valeur : ")
print(df.Sexe.value_counts())
print("Afficher les valeurs sous forme de tableau : ")
print(pd.crosstab(df.Sexe, "freq"))
print("Afficher les valeurs en porcentage sous forme de tableau : ")
print(pd.crosstab(df.Sexe, "freq", normalize=True))

8 - Traitement de données qualitatives - qualitative


# Traitement de donnees qualitatives - qualitatives :
print("Affichage des observations par sexes :")

6
print(pd.crosstab(df.Sexe, df.Observation))
print("Affichage des observations par sexes avec les totaux :")
print(pd.crosstab(df.Sexe, df.Observation, margins=True))
print("Affichage des observations par sexes en pourcentages :")
print(pd.crosstab(df.Sexe, df.Observation, normalize = True))

Vous aimerez peut-être aussi