KnnImputer Ipynb

Uploaded by

UJJAWAL GAMER

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

14 views

KnnImputer Ipynb

Uploaded by

UJJAWAL GAMER

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 6

{

"cells": [
{
"cell_type": "code",
"execution_count": 32,
"metadata": {},
"outputs": [],
"source": [
"import numpy as np\n",
"import pandas as pd\n",
"\n",
"from sklearn.model_selection import train_test_split\n",
"\n",
"from sklearn.impute import KNNImputer,SimpleImputer\n",
"from sklearn.linear_model import LogisticRegression\n",
"\n",
"from sklearn.metrics import accuracy_score"
]
},
{
"cell_type": "code",
"execution_count": 33,
"metadata": {},
"outputs": [],
"source": [
"df = pd.read_csv('train.csv')[['Age','Pclass','Fare','Survived']]"
]
},
{
"cell_type": "code",
"execution_count": 34,
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"<div>\n",
"<style scoped>\n",
" .dataframe tbody tr th:only-of-type {\n",
" vertical-align: middle;\n",
" }\n",
"\n",
" .dataframe tbody tr th {\n",
" vertical-align: top;\n",
" }\n",
"\n",
" .dataframe thead th {\n",
" text-align: right;\n",
" }\n",
"</style>\n",
"<table border=\"1\" class=\"dataframe\">\n",
" <thead>\n",
" <tr style=\"text-align: right;\">\n",
" <th></th>\n",
" <th>Age</th>\n",
" <th>Pclass</th>\n",
" <th>Fare</th>\n",
" <th>Survived</th>\n",
" </tr>\n",
" </thead>\n",
" <tbody>\n",
" <tr>\n",
" <th>0</th>\n",
" <td>22.0</td>\n",
" <td>3</td>\n",
" <td>7.2500</td>\n",
" <td>0</td>\n",
" </tr>\n",
" <tr>\n",
" <th>1</th>\n",
" <td>38.0</td>\n",
" <td>1</td>\n",
" <td>71.2833</td>\n",
" <td>1</td>\n",
" </tr>\n",
" <tr>\n",
" <th>2</th>\n",
" <td>26.0</td>\n",
" <td>3</td>\n",
" <td>7.9250</td>\n",
" <td>1</td>\n",
" </tr>\n",
" <tr>\n",
" <th>3</th>\n",
" <td>35.0</td>\n",
" <td>1</td>\n",
" <td>53.1000</td>\n",
" <td>1</td>\n",
" </tr>\n",
" <tr>\n",
" <th>4</th>\n",
" <td>35.0</td>\n",
" <td>3</td>\n",
" <td>8.0500</td>\n",
" <td>0</td>\n",
" </tr>\n",
" </tbody>\n",
"</table>\n",
"</div>"
],
"text/plain": [
" Age Pclass Fare Survived\n",
"0 22.0 3 7.2500 0\n",
"1 38.0 1 71.2833 1\n",
"2 26.0 3 7.9250 1\n",
"3 35.0 1 53.1000 1\n",
"4 35.0 3 8.0500 0"
]
},
"execution_count": 34,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"df.head()"
]
},
{
"cell_type": "code",
"execution_count": 35,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"Age 19.86532\n",
"Pclass 0.00000\n",
"Fare 0.00000\n",
"Survived 0.00000\n",
"dtype: float64"
]
},
"execution_count": 35,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"df.isnull().mean() * 100"
]
},
{
"cell_type": "code",
"execution_count": 36,
"metadata": {},
"outputs": [],
"source": [
"X = df.drop(columns=['Survived'])\n",
"y = df['Survived']"
]
},
{
"cell_type": "code",
"execution_count": 37,
"metadata": {},
"outputs": [],
"source": [
"X_train,X_test,y_train,y_test =
train_test_split(X,y,test_size=0.2,random_state=2)"
]
},
{
"cell_type": "code",
"execution_count": 38,
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"<div>\n",
"<style scoped>\n",
" .dataframe tbody tr th:only-of-type {\n",
" vertical-align: middle;\n",
" }\n",
"\n",
" .dataframe tbody tr th {\n",
" vertical-align: top;\n",
" }\n",
"\n",
" .dataframe thead th {\n",
" text-align: right;\n",
" }\n",
"</style>\n",
"<table border=\"1\" class=\"dataframe\">\n",
" <thead>\n",
" <tr style=\"text-align: right;\">\n",
" <th></th>\n",
" <th>Age</th>\n",
" <th>Pclass</th>\n",
" <th>Fare</th>\n",
" </tr>\n",
" </thead>\n",
" <tbody>\n",
" <tr>\n",
" <th>30</th>\n",
" <td>40.0</td>\n",
" <td>1</td>\n",
" <td>27.7208</td>\n",
" </tr>\n",
" <tr>\n",
" <th>10</th>\n",
" <td>4.0</td>\n",
" <td>3</td>\n",
" <td>16.7000</td>\n",
" </tr>\n",
" <tr>\n",
" <th>873</th>\n",
" <td>47.0</td>\n",
" <td>3</td>\n",
" <td>9.0000</td>\n",
" </tr>\n",
" <tr>\n",
" <th>182</th>\n",
" <td>9.0</td>\n",
" <td>3</td>\n",
" <td>31.3875</td>\n",
" </tr>\n",
" <tr>\n",
" <th>876</th>\n",
" <td>20.0</td>\n",
" <td>3</td>\n",
" <td>9.8458</td>\n",
" </tr>\n",
" </tbody>\n",
"</table>\n",
"</div>"
],
"text/plain": [
" Age Pclass Fare\n",
"30 40.0 1 27.7208\n",
"10 4.0 3 16.7000\n",
"873 47.0 3 9.0000\n",
"182 9.0 3 31.3875\n",
"876 20.0 3 9.8458"
]
},
"execution_count": 38,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"X_train.head()"
]
},
{
"cell_type": "code",
"execution_count": 53,
"metadata": {},
"outputs": [],
"source": [
"knn = KNNImputer(n_neighbors=3,weights='distance')\n",
"\n",
"X_train_trf = knn.fit_transform(X_train)\n",
"X_test_trf = knn.transform(X_test)"
]
},
{
"cell_type": "code",
"execution_count": 54,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"0.7150837988826816"
]
},
"execution_count": 54,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"lr = LogisticRegression()\n",
"\n",
"lr.fit(X_train_trf,y_train)\n",
"\n",
"y_pred = lr.predict(X_test_trf)\n",
"\n",
"accuracy_score(y_test,y_pred)"
]
},
{
"cell_type": "code",
"execution_count": 55,
"metadata": {},
"outputs": [],
"source": [
"# Comparision with Simple Imputer --> mean\n",
"\n",
"si = SimpleImputer()\n",
"\n",
"X_train_trf2 = si.fit_transform(X_train)\n",
"X_test_trf2 = si.transform(X_test)"
]
},
{
"cell_type": "code",
"execution_count": 56,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"0.6927374301675978"
]
},
"execution_count": 56,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"lr = LogisticRegression()\n",
"\n",
"lr.fit(X_train_trf2,y_train)\n",
"\n",
"y_pred2 = lr.predict(X_test_trf2)\n",
"\n",
"accuracy_score(y_test,y_pred2)"
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": []
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.8.3"
}
},
"nbformat": 4,
"nbformat_minor": 4
}

Essential n8n Playbook
From Everand
Essential n8n Playbook
Leandro Calado
No ratings yet
My Guitar Shop
0% (5)
My Guitar Shop
25 pages
Az4 Ipynb
No ratings yet
Az4 Ipynb
17 pages
Untitled 0
No ratings yet
Untitled 0
537 pages
Heart Disease Prediction.ipynb (1)
No ratings yet
Heart Disease Prediction.ipynb (1)
207 pages
Heart Attack - Ipynb
No ratings yet
Heart Attack - Ipynb
162 pages
DS Unit 6
No ratings yet
DS Unit 6
16 pages
Simple Linear Regression PDF
No ratings yet
Simple Linear Regression PDF
40 pages
Sesion_01b_pandas_V1.ipynb
No ratings yet
Sesion_01b_pandas_V1.ipynb
197 pages
ML Project - Ipynb
No ratings yet
ML Project - Ipynb
324 pages
Diabetes_prediction.ipynb
No ratings yet
Diabetes_prediction.ipynb
69 pages
Experiment No.2.Ipynb
No ratings yet
Experiment No.2.Ipynb
7 pages
Vecinos Mas Cercanos Ejercicio Propuesto PDF
No ratings yet
Vecinos Mas Cercanos Ejercicio Propuesto PDF
945 pages
1 4-EDA Ipynb
No ratings yet
1 4-EDA Ipynb
12 pages
02-Pandas Data Visualization Exercises
No ratings yet
02-Pandas Data Visualization Exercises
53 pages
Cleaning_data - Copy
No ratings yet
Cleaning_data - Copy
6 pages
1.vecinos Mas Cercanos Ejercicio Propuesto PDF
No ratings yet
1.vecinos Mas Cercanos Ejercicio Propuesto PDF
1,053 pages
信用卡欺诈数据分析 01分类样本不平衡
No ratings yet
信用卡欺诈数据分析 01分类样本不平衡
16 pages
Admission Prediction - Ipynb
No ratings yet
Admission Prediction - Ipynb
42 pages
Student Performance in Exams
No ratings yet
Student Performance in Exams
71 pages
Arima Text
No ratings yet
Arima Text
49 pages
1 Introduction To Statsmodels
No ratings yet
1 Introduction To Statsmodels
28 pages
PreguntaB
No ratings yet
PreguntaB
50 pages
House Prices.ipynb
No ratings yet
House Prices.ipynb
23 pages
Credit Card Fraud Detection V29.Ipynb
No ratings yet
Credit Card Fraud Detection V29.Ipynb
976 pages
1_linear_regression.ipynb
No ratings yet
1_linear_regression.ipynb
16 pages
RecommendationSystem - R5 - Project7 - Amazon Product - Ipynb
No ratings yet
RecommendationSystem - R5 - Project7 - Amazon Product - Ipynb
112 pages
Time Series Forecasting Jupyter Code - Ipynb
No ratings yet
Time Series Forecasting Jupyter Code - Ipynb
2,484 pages
RegresiÃ N Lineal Con Python - Ipynb
No ratings yet
RegresiÃ N Lineal Con Python - Ipynb
83 pages
Exploratory Data Analysis BCG - Ipynb
No ratings yet
Exploratory Data Analysis BCG - Ipynb
273 pages
OLSLinear Regquestion
No ratings yet
OLSLinear Regquestion
5 pages
Shared Bike Demand Analysis.ipynb
No ratings yet
Shared Bike Demand Analysis.ipynb
390 pages
Breast Cancer Prediction
No ratings yet
Breast Cancer Prediction
163 pages
Untitled1.ipynb (1)
No ratings yet
Untitled1.ipynb (1)
19 pages
Kidney Ipynb
No ratings yet
Kidney Ipynb
253 pages
Docu 2
No ratings yet
Docu 2
43 pages
Coca Cola Stock Analysis.ipynb (1)
No ratings yet
Coca Cola Stock Analysis.ipynb (1)
197 pages
Kidney Disease Prediction.ipynb (1)
No ratings yet
Kidney Disease Prediction.ipynb (1)
148 pages
Kata Pengantar Vano
No ratings yet
Kata Pengantar Vano
86 pages
Stock Price Prediction.ipynb
No ratings yet
Stock Price Prediction.ipynb
62 pages
DS Task 1.ipynb
No ratings yet
DS Task 1.ipynb
92 pages
Machine Learning With Iris Dataset - Ipynb
No ratings yet
Machine Learning With Iris Dataset - Ipynb
150 pages
2 3-SVM Ipynb
No ratings yet
2 3-SVM Ipynb
111 pages
test-_1_
No ratings yet
test-_1_
3 pages
LinearReg Checkpoint
No ratings yet
LinearReg Checkpoint
26 pages
Linear Regression With Python - Part 1
No ratings yet
Linear Regression With Python - Part 1
167 pages
BD WPS2
No ratings yet
BD WPS2
23 pages
Krishna
No ratings yet
Krishna
278 pages
Exploratory Data Analysis BCG - Ipynb
No ratings yet
Exploratory Data Analysis BCG - Ipynb
260 pages
Data_Science_Cohort_1_Assignment_1.ipynb
No ratings yet
Data_Science_Cohort_1_Assignment_1.ipynb
53 pages
Datascience Pr 6 Veda
No ratings yet
Datascience Pr 6 Veda
6 pages
Untitled
No ratings yet
Untitled
463 pages
Marketing Campaigns Analysis.ipynb
No ratings yet
Marketing Campaigns Analysis.ipynb
138 pages
Campus Placement Prediction Using ML.ipynb
No ratings yet
Campus Placement Prediction Using ML.ipynb
54 pages
Linear
No ratings yet
Linear
107 pages
Ejercicio Bayes - Ipynb
No ratings yet
Ejercicio Bayes - Ipynb
148 pages
K Means
No ratings yet
K Means
15 pages
Stoxydom Prediction.ipynb
No ratings yet
Stoxydom Prediction.ipynb
112 pages
Multi Classification.py(for 1 Class Tp,Tn,Fp,Fn)
No ratings yet
Multi Classification.py(for 1 Class Tp,Tn,Fp,Fn)
25 pages
Source Code
No ratings yet
Source Code
28 pages
Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet
Lecture 12
No ratings yet
Lecture 12
3 pages
EMT Notes Post Midsem Upto 12th October
No ratings yet
EMT Notes Post Midsem Upto 12th October
26 pages
EE250 PS04 Solution
No ratings yet
EE250 PS04 Solution
13 pages
Ujjawal BusinessTrainee
No ratings yet
Ujjawal BusinessTrainee
1 page
AWS DB Licensing Model
No ratings yet
AWS DB Licensing Model
1 page
The Table Tennis Olympics Database: Ttms Games Color Who Country
No ratings yet
The Table Tennis Olympics Database: Ttms Games Color Who Country
27 pages
Relational Databases: 8. Why Are Entity Integrity and Referential Integrity Important in A Database?
No ratings yet
Relational Databases: 8. Why Are Entity Integrity and Referential Integrity Important in A Database?
7 pages
Osi Layers
No ratings yet
Osi Layers
43 pages
HW4 Solutions
No ratings yet
HW4 Solutions
7 pages
Home User Guide PDF
No ratings yet
Home User Guide PDF
47 pages
SAS Notes
No ratings yet
SAS Notes
6 pages
MLA703b Maritime Industry Practice Assessment Information
No ratings yet
MLA703b Maritime Industry Practice Assessment Information
23 pages
Dobimigrate-6 4 3
100% (1)
Dobimigrate-6 4 3
203 pages
Creation of Business Partner Using BOL Programming
No ratings yet
Creation of Business Partner Using BOL Programming
4 pages
Tute 6
No ratings yet
Tute 6
2 pages
SDD - Company Data Dictionary
No ratings yet
SDD - Company Data Dictionary
2 pages
Lustre Admin Monitor
No ratings yet
Lustre Admin Monitor
25 pages
LAB # 07 KNN_Iris Dataset.ipynb - Colab
No ratings yet
LAB # 07 KNN_Iris Dataset.ipynb - Colab
8 pages
16-05 LUN Space Reservation and Fractional Reserve
No ratings yet
16-05 LUN Space Reservation and Fractional Reserve
10 pages
Financial Literacy of Youth
No ratings yet
Financial Literacy of Youth
71 pages
How To Switch Replica Master of A Non-GTID Slave in Percona Cluster ? - Mydbops
No ratings yet
How To Switch Replica Master of A Non-GTID Slave in Percona Cluster ? - Mydbops
5 pages
Transactions
No ratings yet
Transactions
6 pages
Optmization in Alteryx
No ratings yet
Optmization in Alteryx
7 pages
Jurnal (John Denver) Rifki
No ratings yet
Jurnal (John Denver) Rifki
11 pages
Final Report
No ratings yet
Final Report
42 pages
2.2 CU Memory System Design
No ratings yet
2.2 CU Memory System Design
75 pages
Course Outline For PHP
No ratings yet
Course Outline For PHP
3 pages
Dynatrace Associate Demo
No ratings yet
Dynatrace Associate Demo
4 pages
Name_ Jeromei B-WPS Office
No ratings yet
Name_ Jeromei B-WPS Office
4 pages
Z SCR Word Upload
No ratings yet
Z SCR Word Upload
6 pages
TeamMate Operational Utility
No ratings yet
TeamMate Operational Utility
35 pages
Looking For Real Exam Questions For IT Certification Exams!
No ratings yet
Looking For Real Exam Questions For IT Certification Exams!
17 pages
Gamification ECGBL2014
No ratings yet
Gamification ECGBL2014
9 pages

KnnImputer Ipynb

Uploaded by

KnnImputer Ipynb

Uploaded by

{

You might also like