Débutant
1. Créer une liste contenant les carrés des nombres de 1 à 10, puis extraire les nombres pairs.
2. Convertir une liste en tuple et vérifier si un élément spécifique existe dans ce tuple.
3. Créer un dictionnaire qui mappe des noms d'étudiants à leurs notes, puis calculer la moyenne
des notes.
4. Écrire une fonction qui prend un ensemble de nombres et retourne les éléments uniques d'une
liste donnée.
5. Charger un fichier CSV avec pandas et afficher les 5 premières lignes.
6. Calculer la moyenne et la médiane d'une colonne dans un DataFrame pandas.
7. Visualiser une distribution de données à l'aide de matplotlib (histogramme).
8. Écrire une fonction pour normaliser une liste de nombres entre 0 et 1.
9. Importer un fichier JSON dans pandas et afficher ses colonnes.
10. Créer une série pandas et extraire toutes les valeurs supérieures à une moyenne calculée.
Intermédiaire
1. Utiliser NumPy pour créer une matrice 3x3 remplie de valeurs aléatoires, puis calculer la somme
des lignes.
2. Charger un ensemble de données sklearn (comme iris) et afficher les statistiques descriptives.
3. Implémenter une régression linéaire simple avec scikit-learn pour prédire des valeurs.
4. Effectuer une analyse des composants principaux (PCA) pour réduire les dimensions d'un jeu de
données.
5. Utiliser seaborn pour créer un diagramme en boîte (boxplot) d'une colonne d'un DataFrame.
6. Écrire une fonction qui détecte et remplace les valeurs manquantes dans un DataFrame pandas.
7. Appliquer un modèle de clustering K-Means sur un jeu de données artificiel et visualiser les
clusters.
8. Implémenter une fonction pour normaliser chaque colonne numérique dans un DataFrame.
9. Utiliser matplotlib pour créer un graphique en lignes montrant la tendance d'une série temporelle.
10. Charger un fichier Excel contenant plusieurs feuilles et fusionner les données dans un seul
DataFrame.
Difficile
1. Créer un pipeline complet de machine learning pour prédire les prix de maisons (avec nettoyage,
transformations et validation).
2. Implémenter un modèle de séries temporelles pour prédire les ventes mensuelles d'un produit en
utilisant ARIMA ou LSTM.
3. Construire un réseau de neurones simple pour classer des images en utilisant TensorFlow ou
PyTorch.