0% ont trouvé ce document utile (0 vote)
1K vues2 pages

Exercices Data Science Complet

Le document présente une série d'exercices de programmation en Python, classés par niveaux de difficulté : débutant, intermédiaire et difficile. Les tâches incluent la manipulation de données avec des bibliothèques comme pandas, NumPy et matplotlib, ainsi que des concepts de machine learning. Chaque niveau propose des exercices pratiques pour renforcer les compétences en analyse de données et en apprentissage automatique.

Transféré par

Ameth Fall
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
1K vues2 pages

Exercices Data Science Complet

Le document présente une série d'exercices de programmation en Python, classés par niveaux de difficulté : débutant, intermédiaire et difficile. Les tâches incluent la manipulation de données avec des bibliothèques comme pandas, NumPy et matplotlib, ainsi que des concepts de machine learning. Chaque niveau propose des exercices pratiques pour renforcer les compétences en analyse de données et en apprentissage automatique.

Transféré par

Ameth Fall
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Débutant

1. Créer une liste contenant les carrés des nombres de 1 à 10, puis extraire les nombres pairs.

2. Convertir une liste en tuple et vérifier si un élément spécifique existe dans ce tuple.

3. Créer un dictionnaire qui mappe des noms d'étudiants à leurs notes, puis calculer la moyenne

des notes.

4. Écrire une fonction qui prend un ensemble de nombres et retourne les éléments uniques d'une

liste donnée.

5. Charger un fichier CSV avec pandas et afficher les 5 premières lignes.

6. Calculer la moyenne et la médiane d'une colonne dans un DataFrame pandas.

7. Visualiser une distribution de données à l'aide de matplotlib (histogramme).

8. Écrire une fonction pour normaliser une liste de nombres entre 0 et 1.

9. Importer un fichier JSON dans pandas et afficher ses colonnes.

10. Créer une série pandas et extraire toutes les valeurs supérieures à une moyenne calculée.

Intermédiaire
1. Utiliser NumPy pour créer une matrice 3x3 remplie de valeurs aléatoires, puis calculer la somme

des lignes.

2. Charger un ensemble de données sklearn (comme iris) et afficher les statistiques descriptives.

3. Implémenter une régression linéaire simple avec scikit-learn pour prédire des valeurs.

4. Effectuer une analyse des composants principaux (PCA) pour réduire les dimensions d'un jeu de

données.

5. Utiliser seaborn pour créer un diagramme en boîte (boxplot) d'une colonne d'un DataFrame.

6. Écrire une fonction qui détecte et remplace les valeurs manquantes dans un DataFrame pandas.

7. Appliquer un modèle de clustering K-Means sur un jeu de données artificiel et visualiser les

clusters.

8. Implémenter une fonction pour normaliser chaque colonne numérique dans un DataFrame.

9. Utiliser matplotlib pour créer un graphique en lignes montrant la tendance d'une série temporelle.
10. Charger un fichier Excel contenant plusieurs feuilles et fusionner les données dans un seul

DataFrame.

Difficile
1. Créer un pipeline complet de machine learning pour prédire les prix de maisons (avec nettoyage,

transformations et validation).

2. Implémenter un modèle de séries temporelles pour prédire les ventes mensuelles d'un produit en

utilisant ARIMA ou LSTM.

3. Construire un réseau de neurones simple pour classer des images en utilisant TensorFlow ou

PyTorch.

Vous aimerez peut-être aussi