Students Exam Scores Analysis - Ipynb

Python document for students

Uploaded by

priyankanpriya03

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

18 views4 pages

Students Exam Scores Analysis - Ipynb

Python document for students

Uploaded by

priyankanpriya03

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 4

{"metadata":{"kernelspec":{"display_name":"Python

3","language":"python","name":"python3"},"language_info":{"codemirror_mode":
{"name":"ipython","version":3},"file_extension":".py","mimetype":"text/x-
python","name":"python","nbconvert_exporter":"python","pygments_lexer":"ipython3","
version":"3.12.3"},"kaggle":{"accelerator":"none","dataSources":
[{"sourceId":5399169,"sourceType":"datasetVersion","datasetId":3128523}],"dockerIma
geVersionId":30761,"isInternetEnabled":false,"language":"python","sourceType":"note
book","isGpuEnabled":false}},"nbformat_minor":4,"nbformat":4,"cells":
[{"cell_type":"markdown","source":"# Understand the Data\n","metadata":{}},
{"cell_type":"markdown","source":"## Import libraries","metadata":{}},
{"cell_type":"code","source":"# type: ignore\nimport numpy as np \nimport pandas
as pd\nimport matplotlib.pyplot as plt\nimport seaborn as sns\nimport warnings\
nwarnings.filterwarnings('ignore')","metadata":{},"outputs":
[],"execution_count":null},{"cell_type":"markdown","source":"## Input
Data","metadata":{}},{"cell_type":"code","source":"df =
pd.read_csv(\"./Expanded_data_with_more_features.csv\", encoding=
'unicode_escape')\ndf.head(2)","metadata":{},"outputs":[],"execution_count":null},
{"cell_type":"code","source":"df.shape","metadata":{},"outputs":
[],"execution_count":null},{"cell_type":"code","source":"df.size","metadata":
{},"outputs":[],"execution_count":null},
{"cell_type":"code","source":"df.info()","metadata":{},"outputs":
[],"execution_count":null},
{"cell_type":"code","source":"df.describe(include='all').T","metadata":
{},"outputs":[],"execution_count":null},
{"cell_type":"code","source":"df.columns","metadata":{},"outputs":
[],"execution_count":null},{"cell_type":"markdown","source":"`Data Dictionary`\n\n|
Column Name | Description
|\
n|----------------------|----------------------------------------------------------
-------------------|\n| **Gender** | Gender of the student (male/female)
|\n| **EthnicGroup** | Ethnic group of the student (neither Christian nor
Jewish) |\n| **ParentEduc** | Parent(s)
education background (from some_highschool to master's degree) |\n|
**LunchType** | School lunch type (standard or free/reduced)
|\n| **TestPrep** | Test preparation course followed (completed or none)
|\n| **ParentMaritalStatus** | Parent(s) marital status
(married/single/widowed/divorced) |\n| **PracticeSport** | How
often the student practices sport (never/sometimes/regularly) |\n|
**IsFirstChild** | If the child is the first in the family (yes/no)
|\n| **NrSiblings** | Number of siblings the student has (0 to 7)
|\n| **TransportMeans** | Means of transport to school (schoolbus/private)
|\n| **WklyStudyHours** | Weekly self-study hours (less than 5 hrs; between 5
and 10 hrs; more than 10 hrs) |\n| **MathScore** | Math test score (0-100)
|\n| **ReadingScore** | Reading test score (0-100)
|\n| **WritingScore** | Writing test score (0-100)
|\n","metadata":{}},{"cell_type":"markdown","source":"# Data Cleaning","metadata":
{}},{"cell_type":"code","source":"df.columns","metadata":{},"outputs":
[],"execution_count":null},
{"cell_type":"code","source":"df.isnull().sum()","metadata":{},"outputs":
[],"execution_count":null},{"cell_type":"code","source":"df.fillna({\n
'EthnicGroup': 'Unknown',\n 'ParentEduc': 'No Edu info',\n
'ParentMaritalStatus': 'No info',\n \n}, inplace=True)","metadata":{},"outputs":
[],"execution_count":null},{"cell_type":"code","source":"df.drop(columns=['Unnamed:
0'], inplace=True)","metadata":{},"outputs":[],"execution_count":null},
{"cell_type":"code","source":"df","metadata":{},"outputs":
[],"execution_count":null},{"cell_type":"code","source":"df.info()","metadata":
{},"outputs":[],"execution_count":null},
{"cell_type":"code","source":"df[df['WklyStudyHours']=='05-Oct']","metadata":
{},"outputs":[],"execution_count":null},{"cell_type":"markdown","source":"## Add
new Col","metadata":{}},{"cell_type":"code","source":"# percentage col \
ndf['Percentage']= ( (df['WritingScore'] + df['MathScore'] +
df['ReadingScore'])/300 ) * 100\ndf['Percentage'] = df['Percentage'].apply(lambda
x: '{:,.2f}'.format(x))\ndf['Percentage'] =
df['Percentage'].astype('float16')","metadata":{},"outputs":
[],"execution_count":null},{"cell_type":"code","source":"# grade col\ndef
grade(score):\n \n if score >= 80.0:\n return 'A'\n elif score >=
60.0:\n return 'B'\n elif score >= 40.0:\n return 'C'\n elif
score >= 30.0:\n return 'D'\n else:\n return 'F'\n","metadata":
{},"outputs":[],"execution_count":null},{"cell_type":"code","source":"df['Grade'] =
df['Percentage'].apply(grade)","metadata":{},"outputs":[],"execution_count":null},
{"cell_type":"code","source":"df","metadata":{},"outputs":
[],"execution_count":null},{"cell_type":"code","source":"# for future reference\n\
ndef all_mean_score_set():\n return {'MathScore':'mean', 'ReadingScore':
'mean','WritingScore':'mean'}","metadata":{},"outputs":[],"execution_count":null},
{"cell_type":"markdown","source":"# EDA","metadata":{}},
{"cell_type":"markdown","source":"## Gender","metadata":{}},
{"cell_type":"code","source":"gender_count = df['Gender'].value_counts()\
nplt.pie(gender_count, labels=gender_count.index, autopct=lambda p : '{:.1f}%
({:,.1f})'.format(p,p * sum(gender_count)/100))\nplt.title('Gender Distribution')\
nplt.show()","metadata":{},"outputs":[],"execution_count":null},
{"cell_type":"code","source":"ax = sns.countplot(data=df, x='Gender', hue='Grade',
palette='viridis')\n\nfor container in ax.containers:\n
plt.bar_label(container)\n\nplt.title('Male & Female Grade') \
nplt.show()","metadata":{},"outputs":[],"execution_count":null},
{"cell_type":"markdown","source":"<div class=\"alert alert-block alert-info\">\
n<b>Info : </b> Both males and females have nearly equal
participation.\n</div>","metadata":{}},{"cell_type":"markdown","source":"## Parent
Education vs Score","metadata":{}},{"cell_type":"code","source":"par_edu =
df.groupby(['ParentEduc', ]).agg({'MathScore':'mean', \n
'ReadingScore': 'mean',\n
'WritingScore':'mean'})\n\npar_edu","metadata":{},"outputs":
[],"execution_count":null},{"cell_type":"code","source":"df.groupby(['ParentEduc'])
[['MathScore', 'ReadingScore', 'WritingScore']].agg(np.mean) \\\
n .style.background_gradient(cmap='RdPu')","metadata":{},"outputs":
[],"execution_count":null},{"cell_type":"code","source":"# Does parental education
have an affect on different genders?\ndf.groupby(['Gender', 'ParentEduc'])
[['MathScore', 'ReadingScore', 'WritingScore']].agg(np.mean)\\\n
.style.background_gradient(cmap='RdPu')","metadata":{},"outputs":
[],"execution_count":null},
{"cell_type":"code","source":"sns.clustermap(data=par_edu, cmap='viridis',
annot=True) \nplt.title('Relationship b/w student Score and Parent Education ',
size=19)\nplt.show()","metadata":{},"outputs":[],"execution_count":null},
{"cell_type":"markdown","source":"<div class=\"alert alert-block alert-info\">\
n<b>Info : </b>Children of parents who have a master's degree are more likely to
have better scores.\n</div>","metadata":{}},{"cell_type":"markdown","source":"##
Parent Marital Status vs Score","metadata":{}},
{"cell_type":"code","source":"par_mar =
df.groupby(['ParentMaritalStatus', ]).agg({'MathScore':'mean', \n
'ReadingScore': 'mean',\n
'WritingScore':'mean'})\n\
npar_mar.style.background_gradient(cmap='RdPu')","metadata":{},"outputs":
[],"execution_count":null},
{"cell_type":"code","source":"sns.clustermap(data=par_mar, cmap='viridis',
annot=True)\nplt.title('Relationship b/w student Score and Parent Marital Status ',
size=19)\nplt.show()","metadata":{},"outputs":[],"execution_count":null},
{"cell_type":"markdown","source":"<div class=\"alert alert-block alert-info\">\
n<b>Info : </b>There is no significant difference in children's scores due to their
parents' marital status.\n</div>","metadata":{}},
{"cell_type":"markdown","source":"## All Scores","metadata":{}},
{"cell_type":"code","source":"# df[df[\"ReadingScore\"] < 10].count()\nfig =
plt.figure(figsize=(20, 5))\n\nfor index, one in
enumerate([\"MathScore\", \"ReadingScore\", \"WritingScore\"]):\n
fig.add_subplot(1, 3, index + 1)\n sns.boxplot(x=df[one])","metadata":
{},"outputs":[],"execution_count":null},{"cell_type":"code","source":"#math\
nsns.catplot(data=df, kind='boxen', x='MathScore', palette='Set2')\nplt.title('Math
Boxen plot')\nfor x in [20, 40, 60, 80, 100]:\n plt.axvline(x=x, color='black',
linestyle='--', linewidth=0.7)\n \n#reading\nsns.catplot(data=df, kind='boxen',
x='ReadingScore', palette='Set1')\nplt.title('Reading Boxen plot')\nfor x in [20,
40, 60, 80, 100]:\n plt.axvline(x=x, color='black', linestyle='--',
linewidth=0.7)\n \n \n#writing\nsns.catplot(data=df, kind='boxen',
x='WritingScore', palette='Set3')\nplt.title('Writing Boxen plot')\nfor x in [20,
40, 60, 80, 100]:\n plt.axvline(x=x, color='black', linestyle='--',
linewidth=0.7)\n\n\nplt.show()","metadata":{},"outputs":[],"execution_count":null},
{"cell_type":"markdown","source":"## Ethnic group vs Score","metadata":{}},
{"cell_type":"code","source":"group_counts = df['EthnicGroup'].value_counts()\
nlabels = group_counts.index\n\nplt.pie(group_counts, labels=labels,
autopct='%1.1f%%')\nplt.title('Ethnic Groups')\nplt.show()","metadata":
{},"outputs":[],"execution_count":null},
{"cell_type":"code","source":"df.columns","metadata":{},"outputs":
[],"execution_count":null},{"cell_type":"markdown","source":"## Sport vs
Score","metadata":{}},{"cell_type":"code","source":"sport =
df.groupby(['PracticeSport']).agg({'MathScore':'mean', \n
'ReadingScore': 'mean',\n
'WritingScore':'mean'})\n\
nsport.style.background_gradient(cmap='RdPu')","metadata":{},"outputs":
[],"execution_count":null},{"cell_type":"code","source":"sns.clustermap(data=sport,
annot=True)\nplt.show()","metadata":{},"outputs":[],"execution_count":null},
{"cell_type":"markdown","source":"## Test Practice vs Score","metadata":{}},
{"cell_type":"code","source":"df.groupby(['PracticeSport']).agg(all_mean_score_set(
)) \\\n .style.background_gradient(cmap='RdPu')","metadata":{},"outputs":
[],"execution_count":null},
{"cell_type":"code","source":"df.groupby(['PracticeSport',
'TestPrep']).agg(all_mean_score_set()) \\\
n .style.background_gradient(cmap='RdPu')","metadata":{},"outputs":
[],"execution_count":null},{"cell_type":"markdown","source":"## Lunch vs
Score","metadata":{}},{"cell_type":"code","source":"df.groupby(['LunchType',
'Gender']).agg(all_mean_score_set()) \\\
n .style.background_gradient(cmap='RdPu')","metadata":{},"outputs":
[],"execution_count":null},{"cell_type":"markdown","source":"## First Child ? vs
Score","metadata":{}},
{"cell_type":"code","source":"df.groupby(['IsFirstChild']).agg(all_mean_score_set()
) \\\n .style.background_gradient(cmap='RdPu')","metadata":{},"outputs":
[],"execution_count":null},{"cell_type":"markdown","source":"## siblings vs
Score","metadata":{}},
{"cell_type":"code","source":"df['NrSiblings'].value_counts().plot(kind='bar')\
nplt.title('Nr of Siblings')\nplt.show()","metadata":{},"outputs":
[],"execution_count":null},
{"cell_type":"code","source":"df.groupby(['NrSiblings']).agg(all_mean_score_set())
\\\n .style.background_gradient(cmap='RdPu')","metadata":{},"outputs":
[],"execution_count":null},{"cell_type":"markdown","source":"## Transportation vs
Score","metadata":{}},
{"cell_type":"code","source":"df.groupby(['TransportMeans']).agg(all_mean_score_set
()) \\\n .style.background_gradient(cmap='RdPu')","metadata":{},"outputs":
[],"execution_count":null},
{"cell_type":"code","source":"df.groupby(['TransportMeans',
'TestPrep']).agg(all_mean_score_set()) \\\
n .style.background_gradient(cmap='RdPu')\n","metadata":{},"outputs":
[],"execution_count":null},
{"cell_type":"code","source":"df.groupby(['TransportMeans',
'PracticeSport']).agg(all_mean_score_set()) \\\
n .style.background_gradient(cmap='RdPu')\n","metadata":{},"outputs":
[],"execution_count":null},
{"cell_type":"code","source":"df.groupby(['TransportMeans',
'WklyStudyHours']).agg(all_mean_score_set()) \\\
n .style.background_gradient(cmap='RdPu')","metadata":{},"outputs":
[],"execution_count":null},{"cell_type":"markdown","source":"## weekly study hr vs
Score","metadata":{}},{"cell_type":"code","source":"df.groupby(['WklyStudyHours',
'TestPrep']).agg(all_mean_score_set()) \\\
n .style.background_gradient(cmap='RdPu')","metadata":{},"outputs":
[],"execution_count":null},{"cell_type":"code","source":"# Determine if there is
linearity between the target variable and the categorical features. This indicates
if linear regression is a good predictive model.\ntarget = 'MathScore'\n\n#
Identify categorical features\ncategorical_features =
df.select_dtypes(include=['object']).columns\n\n# Create box plots\nfor feature in
categorical_features:\n plt.figure(figsize=(10, 6))\n sns.boxplot(x=feature,
y=target, data=df)\n plt.title(f'Box Plot of {target} by {feature}')\n
plt.xlabel(target)\n plt.ylabel(feature)\n plt.show()","metadata":
{},"outputs":[],"execution_count":null}]}

Student Performance in Exams
No ratings yet
Student Performance in Exams
71 pages
00 - Lesson - Data Science Workflow - Jupyter Notebook
No ratings yet
00 - Lesson - Data Science Workflow - Jupyter Notebook
6 pages
Student Analysis
No ratings yet
Student Analysis
16 pages
Analyzing Student Performance in Exams Using Python
No ratings yet
Analyzing Student Performance in Exams Using Python
11 pages
DSBDA Prac2
No ratings yet
DSBDA Prac2
2 pages
Codealpha Studentseda
No ratings yet
Codealpha Studentseda
2 pages
Assignment 4
No ratings yet
Assignment 4
5 pages
Data Preprocessing - Ipynb - Colaboratory
No ratings yet
Data Preprocessing - Ipynb - Colaboratory
7 pages
Python Case Study
No ratings yet
Python Case Study
7 pages
Student Grade Prediction
No ratings yet
Student Grade Prediction
9 pages
Students Performance Analysis
No ratings yet
Students Performance Analysis
12 pages
Student Dropout
No ratings yet
Student Dropout
38 pages
00 - Project - Your First Data Science Project - Jupyter Notebook
No ratings yet
00 - Project - Your First Data Science Project - Jupyter Notebook
8 pages
Student Performance Analysis and Prediction
No ratings yet
Student Performance Analysis and Prediction
19 pages
Data Manipulation With Python Pandas 1700003764
No ratings yet
Data Manipulation With Python Pandas 1700003764
10 pages
Assignment 2
No ratings yet
Assignment 2
4 pages
Student Performance Analysis
No ratings yet
Student Performance Analysis
22 pages
Open Lab 2
No ratings yet
Open Lab 2
15 pages
PMA Experiment 1
No ratings yet
PMA Experiment 1
9 pages
Experiment 2
No ratings yet
Experiment 2
5 pages
List of Practical Ip065 Xii Session 2025 CKC Academy
No ratings yet
List of Practical Ip065 Xii Session 2025 CKC Academy
19 pages
DW 14
No ratings yet
DW 14
14 pages
Student Performance Analysis
No ratings yet
Student Performance Analysis
28 pages
Predictive+Modelling+-+Logistic+Regression+-+Student+Version-New2.3.ipynb - Colaboratory
No ratings yet
Predictive+Modelling+-+Logistic+Regression+-+Student+Version-New2.3.ipynb - Colaboratory
12 pages
2 Data Wranglin 2 Acadamic P
No ratings yet
2 Data Wranglin 2 Acadamic P
12 pages
Machine Learning Project: Problem 1
67% (3)
Machine Learning Project: Problem 1
26 pages
Jamboree
No ratings yet
Jamboree
10 pages
FDS Practical 2
No ratings yet
FDS Practical 2
8 pages
ML Project - Ipynb
No ratings yet
ML Project - Ipynb
324 pages
Day-4 DS Practicals
No ratings yet
Day-4 DS Practicals
5 pages
CMSC320 Final Project
No ratings yet
CMSC320 Final Project
20 pages
Student Performance Analysis
No ratings yet
Student Performance Analysis
28 pages
01 Sample
No ratings yet
01 Sample
3 pages
Lambda Functions & Alternative Methods in Python
No ratings yet
Lambda Functions & Alternative Methods in Python
8 pages
Graduation Rate
No ratings yet
Graduation Rate
24 pages
Analyse Econometrique Avec Stata 12 2
No ratings yet
Analyse Econometrique Avec Stata 12 2
414 pages
Absenteeism Module
No ratings yet
Absenteeism Module
2 pages
List of Practical Ip065 Xii Session 2025 CKC Academy
No ratings yet
List of Practical Ip065 Xii Session 2025 CKC Academy
19 pages
Personalized Learning
No ratings yet
Personalized Learning
13 pages
Project Paarth
No ratings yet
Project Paarth
21 pages
Ca School Summary Statistics Deepseek
No ratings yet
Ca School Summary Statistics Deepseek
8 pages
1935510219+edwin Thungari Macpal+Experiment1
No ratings yet
1935510219+edwin Thungari Macpal+Experiment1
8 pages
First 4
No ratings yet
First 4
11 pages
Modelling and Simmulation Assignment - Ipynb - Colab
No ratings yet
Modelling and Simmulation Assignment - Ipynb - Colab
7 pages
Import Import As Import As: #Default To CSV
No ratings yet
Import Import As Import As: #Default To CSV
6 pages
Practical No-2
No ratings yet
Practical No-2
4 pages
StarterNotebook - Jupyter Notebook
No ratings yet
StarterNotebook - Jupyter Notebook
12 pages
Practical Examination Sample Paper
No ratings yet
Practical Examination Sample Paper
4 pages
Experiment 1
No ratings yet
Experiment 1
5 pages
IBA Practical Set A 14th Dec
No ratings yet
IBA Practical Set A 14th Dec
3 pages
UCI Machine Learning Repository - Student Performance Data Set
No ratings yet
UCI Machine Learning Repository - Student Performance Data Set
3 pages
Student Notebook HR Analysis
No ratings yet
Student Notebook HR Analysis
11 pages
DALab Part-B BCU&BU
No ratings yet
DALab Part-B BCU&BU
12 pages
COM2007 CaseStudy Sample
No ratings yet
COM2007 CaseStudy Sample
44 pages
Machine Learning Project Report
No ratings yet
Machine Learning Project Report
65 pages
Case study-ML-SI No 2
No ratings yet
Case study-ML-SI No 2
13 pages
Tech Asmt1 Caroline Taylor First Try xlsx1
No ratings yet
Tech Asmt1 Caroline Taylor First Try xlsx1
18 pages
Assessment Test
No ratings yet
Assessment Test
22 pages
Tutorial 2 QB & QP
No ratings yet
Tutorial 2 QB & QP
4 pages
50 Java Concepts Every Developer Should Know
From Everand
50 Java Concepts Every Developer Should Know
Hernando Abella
No ratings yet
Monthly Profit Loss Statement Template TemplateLab
No ratings yet
Monthly Profit Loss Statement Template TemplateLab
2 pages
Art History-19 Century Birth of "Isms": - Neoclassisim - Romanticism - Realism - Impressionism - Post-Impressionism
No ratings yet
Art History-19 Century Birth of "Isms": - Neoclassisim - Romanticism - Realism - Impressionism - Post-Impressionism
40 pages
Amit
No ratings yet
Amit
46 pages
Quotation Letter
No ratings yet
Quotation Letter
2 pages
Is 15105
No ratings yet
Is 15105
60 pages
GRASSMARLIN User Guide
100% (1)
GRASSMARLIN User Guide
55 pages
Pasupati Two Pages 2
No ratings yet
Pasupati Two Pages 2
2 pages
22 Ombudsman Presentation
No ratings yet
22 Ombudsman Presentation
29 pages
ACC CENTCOM HH60PaveHawk AIB NarrativeReport
No ratings yet
ACC CENTCOM HH60PaveHawk AIB NarrativeReport
37 pages
Article Review Personal Financial Planning Attitude
No ratings yet
Article Review Personal Financial Planning Attitude
7 pages
Jagadam - Google Search
No ratings yet
Jagadam - Google Search
2 pages
1 JUANA COMPLEX I HOMEOWNERS ASSOCIATION v. FIL-ESTATE LAND, GR No. 152272 Class Suit
No ratings yet
1 JUANA COMPLEX I HOMEOWNERS ASSOCIATION v. FIL-ESTATE LAND, GR No. 152272 Class Suit
6 pages
Administration of Estates
No ratings yet
Administration of Estates
52 pages
Present Continuous Laboratory Activities
No ratings yet
Present Continuous Laboratory Activities
3 pages
PIG Paper: Dress Code in Herricks High School
100% (1)
PIG Paper: Dress Code in Herricks High School
14 pages
Tugas AIT - Beda Interest, ROR, Dan DCF ROR
No ratings yet
Tugas AIT - Beda Interest, ROR, Dan DCF ROR
3 pages
Week 13 CE422 L02
No ratings yet
Week 13 CE422 L02
37 pages
Moodys Presentation 2005
No ratings yet
Moodys Presentation 2005
146 pages
Forms of Business Organisation
No ratings yet
Forms of Business Organisation
15 pages
Hanuman Chalisa With Meaning
100% (5)
Hanuman Chalisa With Meaning
4 pages
Narito Ako
No ratings yet
Narito Ako
3 pages
WINSEM2024-25 BMAT102L TH VL2024250501140 2025-01-03 Reference-Material-I
No ratings yet
WINSEM2024-25 BMAT102L TH VL2024250501140 2025-01-03 Reference-Material-I
2 pages
LAB Fish Dissection
No ratings yet
LAB Fish Dissection
5 pages
Financial Inclusion and Its Implications For Inclusive Growth in Pakistan
No ratings yet
Financial Inclusion and Its Implications For Inclusive Growth in Pakistan
29 pages
(End of Unit Task) Gr.1 - Daily & Seasonal Changes
No ratings yet
(End of Unit Task) Gr.1 - Daily & Seasonal Changes
3 pages
90 Minutes at Entebbe Stevenson William Download
No ratings yet
90 Minutes at Entebbe Stevenson William Download
40 pages
SFM Theory Notes - Adish Jain
No ratings yet
SFM Theory Notes - Adish Jain
52 pages
Valueofinfosharing
No ratings yet
Valueofinfosharing
12 pages
Rhyme Time Lesson Plan
No ratings yet
Rhyme Time Lesson Plan
3 pages
Paticca Samuppada
No ratings yet
Paticca Samuppada
13 pages

Students Exam Scores Analysis - Ipynb

Uploaded by

Students Exam Scores Analysis - Ipynb

Uploaded by

{"metadata":{"kernelspec":{"display_name":"Python

You might also like