0% found this document useful (0 votes)

16 views6 pages

ML - 2 - Jupyter Notebook

Uploaded by

Anushka Jadhav

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

16 views6 pages

ML - 2 - Jupyter Notebook

Uploaded by

Anushka Jadhav

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 6

10/1/24, 10:25 PM ML_2 - Jupyter Notebook

In [1]: import pandas as pd

import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression, Ridge, Lasso
from sklearn.metrics import r2_score, mean_squared_error
from sklearn.preprocessing import StandardScaler

In [2]: df = pd.read_csv('uber.csv')

In [3]: df.head()

Out[3]:
Unnamed:
key fare_amount pickup_datetime pickup_longitude pickup_latitude dropoff_longitude dro
0

2015-05-07
0 24238194 52:06.0 7.5 -73.999817 40.738354 -73.999512
19:52:06 UTC

2009-07-17
1 27835199 04:56.0 7.7 -73.994355 40.728225 -73.994710
20:04:56 UTC

2009-08-24
2 44984355 45:00.0 12.9 -74.005043 40.740770 -73.962565
21:45:00 UTC

2009-06-26
3 25894730 22:21.0 5.3 -73.976124 40.790844 -73.965316
08:22:21 UTC

2014-08-28
4 17610152 47:00.0 16.0 -73.925023 40.744085 -73.973082
17:47:00 UTC

In [4]: df.describe()

Out[4]:
Unnamed: 0 fare_amount pickup_longitude pickup_latitude dropoff_longitude dropoff_latitude pa

count 2.000000e+05 200000.000000 200000.000000 200000.000000 199999.000000 199999.000000

mean 2.771250e+07 11.359955 -72.527638 39.935885 -72.525292 39.923890

std 1.601382e+07 9.901776 11.437787 7.720539 13.117408 6.794829

min 1.000000e+00 -52.000000 -1340.648410 -74.015515 -3356.666300 -881.985513

25% 1.382535e+07 6.000000 -73.992065 40.734796 -73.991407 40.733823

50% 2.774550e+07 8.500000 -73.981823 40.752592 -73.980093 40.753042

75% 4.155530e+07 12.500000 -73.967153 40.767158 -73.963659 40.768001

max 5.542357e+07 499.000000 57.418457 1644.421482 1153.572603 872.697628

In [5]: df.shape

Out[5]: (200000, 9)

localhost:8888/notebooks/BE_PRACTICALS/ML_2.ipynb 1/6
10/1/24, 10:25 PM ML_2 - Jupyter Notebook

In [6]: df.isnull().sum()

Out[6]: Unnamed: 0 0
key 0
fare_amount 0
pickup_datetime 0
pickup_longitude 0
pickup_latitude 0
dropoff_longitude 1
dropoff_latitude 1
passenger_count 0
dtype: int64

In [9]: df.columns

Out[9]: Index(['Unnamed: 0', 'key', 'fare_amount', 'pickup_datetime',

'pickup_longitude', 'pickup_latitude', 'dropoff_longitude',
'dropoff_latitude', 'passenger_count'],
dtype='object')

In [10]: df = df.drop(columns=['Unnamed: 0', 'key'])

In [11]: df = df.dropna()

In [12]: df.info()

<class 'pandas.core.frame.DataFrame'>
Index: 199999 entries, 0 to 199999
Data columns (total 7 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 fare_amount 199999 non-null float64
1 pickup_datetime 199999 non-null datetime64[ns, UTC]
2 pickup_longitude 199999 non-null float64
3 pickup_latitude 199999 non-null float64
4 dropoff_longitude 199999 non-null float64
5 dropoff_latitude 199999 non-null float64
6 passenger_count 199999 non-null int64
dtypes: datetime64[ns, UTC](1), float64(5), int64(1)
memory usage: 12.2 MB

localhost:8888/notebooks/BE_PRACTICALS/ML_2.ipynb 2/6
10/1/24, 10:25 PM ML_2 - Jupyter Notebook

In [13]: plt.figure(figsize=(10, 6))

sns.boxplot(data=df[['fare_amount', 'pickup_longitude', 'pickup_latitude', 'dropoff_long
plt.title('Outliers in the dataset')
plt.show()

In [15]: df = df[df['fare_amount'] > 0]

df = df[df['fare_amount'] <= 100]

localhost:8888/notebooks/BE_PRACTICALS/ML_2.ipynb 3/6
10/1/24, 10:25 PM ML_2 - Jupyter Notebook

In [16]: plt.figure(figsize=(10, 6))

corr_matrix = df.corr()
sns.heatmap(corr_matrix, annot=True, cmap='coolwarm')
plt.title('Correlation Matrix')
plt.show()

In [17]: X = df[['pickup_longitude', 'pickup_latitude', 'dropoff_longitude', 'dropoff_latitude',

y = df['fare_amount']

In [18]: X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42

In [19]: scaler = StandardScaler()

X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

In [20]: lr_model = LinearRegression()

lr_model.fit(X_train_scaled, y_train)
y_pred_lr = lr_model.predict(X_test_scaled)

In [21]: r2_lr = r2_score(y_test, y_pred_lr)

rmse_lr = np.sqrt(mean_squared_error(y_test, y_pred_lr))

In [22]: print(f"Linear Regression - R²: {r2_lr:.4f}, RMSE: {rmse_lr:.4f}")

Linear Regression - R²: -0.0000, RMSE: 9.3393

In [23]: ridge_model = Ridge(alpha=1.0)

ridge_model.fit(X_train_scaled, y_train)
y_pred_ridge = ridge_model.predict(X_test_scaled)

localhost:8888/notebooks/BE_PRACTICALS/ML_2.ipynb 4/6
10/1/24, 10:25 PM ML_2 - Jupyter Notebook

In [24]: r2_ridge = r2_score(y_test, y_pred_ridge)

rmse_ridge = np.sqrt(mean_squared_error(y_test, y_pred_ridge))

In [25]: print(f"Ridge Regression - R²: {r2_ridge:.4f}, RMSE: {rmse_ridge:.4f}")

Ridge Regression - R²: -0.0000, RMSE: 9.3393

In [26]: lasso_model = Lasso(alpha=0.1)

lasso_model.fit(X_train_scaled, y_train)
y_pred_lasso = lasso_model.predict(X_test_scaled)

In [27]: r2_lasso = r2_score(y_test, y_pred_lasso)

rmse_lasso = np.sqrt(mean_squared_error(y_test, y_pred_lasso))

In [28]: print(f"Lasso Regression - R²: {r2_lasso:.4f}, RMSE: {rmse_lasso:.4f}")

Lasso Regression - R²: -0.0000, RMSE: 9.3394

In [29]: model_scores = pd.DataFrame({

"Model": ["Linear Regression", "Ridge Regression", "Lasso Regression"],
"R2 Score": [r2_lr, r2_ridge, r2_lasso],
"RMSE": [rmse_lr, rmse_ridge, rmse_lasso]
})

In [30]: print(model_scores)

Model R2 Score RMSE

0 Linear Regression -0.000004 9.339345
1 Ridge Regression -0.000004 9.339345
2 Lasso Regression -0.000017 9.339403

In [32]: fig, ax = plt.subplots(1, 2, figsize=(12, 6))

sns.barplot(x="Model", y="R2 Score", data=model_scores, ax=ax[0])
ax[0].set_title("R² Score Comparison")
ax[0].set_ylim(0, 1)

sns.barplot(x="Model", y="RMSE", data=model_scores, ax=ax[1])
ax[1].set_title("RMSE Comparison")

plt.tight_layout()
plt.show()

localhost:8888/notebooks/BE_PRACTICALS/ML_2.ipynb 5/6
10/1/24, 10:25 PM ML_2 - Jupyter Notebook

localhost:8888/notebooks/BE_PRACTICALS/ML_2.ipynb 6/6

Электросчетчик ME337-Manual-V1.1.230626-EN
No ratings yet
Электросчетчик ME337-Manual-V1.1.230626-EN
103 pages
Delhivery Mani
No ratings yet
Delhivery Mani
79 pages
Multiple - Linear - Regression - AirBNB - Student - File0.2 - New (1) .Ipynb - Colaboratory
No ratings yet
Multiple - Linear - Regression - AirBNB - Student - File0.2 - New (1) .Ipynb - Colaboratory
8 pages
Free Astrology Birth Chart Report, Free Natal Birth Chart Calculator - Just Astrology Things
No ratings yet
Free Astrology Birth Chart Report, Free Natal Birth Chart Calculator - Just Astrology Things
1 page
F X X F X X F X X X X X: Graphing Linear Function
No ratings yet
F X X F X X F X X X X X: Graphing Linear Function
2 pages
Name: Siddhesh Asati: #Group: B (ML) #Assignment: 6
No ratings yet
Name: Siddhesh Asati: #Group: B (ML) #Assignment: 6
9 pages
ML 1 Um
No ratings yet
ML 1 Um
5 pages
ML - Practical - 1 - Jupyter Notebook
No ratings yet
ML - Practical - 1 - Jupyter Notebook
15 pages
27_ML_A1
No ratings yet
27_ML_A1
9 pages
SPPUML1
No ratings yet
SPPUML1
8 pages
ML 1 16
No ratings yet
ML 1 16
13 pages
SourceCode Assignment1
No ratings yet
SourceCode Assignment1
9 pages
ML Practical 1
No ratings yet
ML Practical 1
15 pages
ML All Prints
No ratings yet
ML All Prints
25 pages
Practical 1
No ratings yet
Practical 1
6 pages
Merged
No ratings yet
Merged
47 pages
P1) Code Uber
No ratings yet
P1) Code Uber
6 pages
ml_code_output
No ratings yet
ml_code_output
38 pages
Lab1.ipynb - Colaboratory
No ratings yet
Lab1.ipynb - Colaboratory
9 pages
Loading The Dataset: First We Load The Dataset and Find Out The Number of Columns, Rows, NULL Values, Etc
100% (1)
Loading The Dataset: First We Load The Dataset and Find Out The Number of Columns, Rows, NULL Values, Etc
8 pages
Assignment No 1 output
No ratings yet
Assignment No 1 output
42 pages
Analyzing Taxi Trends
No ratings yet
Analyzing Taxi Trends
43 pages
Uber ml1 - Jupyter Notebook
No ratings yet
Uber ml1 - Jupyter Notebook
10 pages
ML Practical 1 Code
100% (1)
ML Practical 1 Code
1 page
Bose A S
No ratings yet
Bose A S
37 pages
Airfare ML - Predicting Flight Fares
No ratings yet
Airfare ML - Predicting Flight Fares
21 pages
Ml-Exp-1 - Jupyter Notebook
No ratings yet
Ml-Exp-1 - Jupyter Notebook
8 pages
Praktikum 5
No ratings yet
Praktikum 5
20 pages
Airline Passenger Booking Analyze
No ratings yet
Airline Passenger Booking Analyze
26 pages
ML Practical 1
No ratings yet
ML Practical 1
15 pages
Uber
No ratings yet
Uber
7 pages
Flight-Price-Prediction - Flight - Price - Ipynb at Master Mandal-21 - Flight-Price-Prediction
No ratings yet
Flight-Price-Prediction - Flight - Price - Ipynb at Master Mandal-21 - Flight-Price-Prediction
28 pages
Taxi Fare Team 09
No ratings yet
Taxi Fare Team 09
25 pages
ML A 6 project
No ratings yet
ML A 6 project
18 pages
UBER
No ratings yet
UBER
2 pages
Supervised Regression
No ratings yet
Supervised Regression
24 pages
Railway Price Prediction
No ratings yet
Railway Price Prediction
20 pages
Dse4 Stug082
No ratings yet
Dse4 Stug082
43 pages
Taxi Trips Analysis Project 1682332303
100% (2)
Taxi Trips Analysis Project 1682332303
28 pages
report
No ratings yet
report
25 pages
Credit Card 1679991215
No ratings yet
Credit Card 1679991215
26 pages
12212221 (1) copy
No ratings yet
12212221 (1) copy
9 pages
Multiple - Linear - Regression - AirBNB - Solution-0.2 - New - Ipynb - Colaboratory
No ratings yet
Multiple - Linear - Regression - AirBNB - Solution-0.2 - New - Ipynb - Colaboratory
11 pages
University of Northern Philippines
No ratings yet
University of Northern Philippines
5 pages
Titanic
No ratings yet
Titanic
22 pages
Data Mining - Project
100% (2)
Data Mining - Project
11 pages
Practical No 01
No ratings yet
Practical No 01
9 pages
1
No ratings yet
1
13 pages
Machine Learning Lab
No ratings yet
Machine Learning Lab
20 pages
Fraud Transaction Detection.ipynb - Colab - Rameshkumar
No ratings yet
Fraud Transaction Detection.ipynb - Colab - Rameshkumar
7 pages
scaffold fg
No ratings yet
scaffold fg
13 pages
Flight Fare Prediction Using ML Algorithms
No ratings yet
Flight Fare Prediction Using ML Algorithms
40 pages
Copy of Project 4 _ House Price Prediction.ipynb - Colab
No ratings yet
Copy of Project 4 _ House Price Prediction.ipynb - Colab
5 pages
Machine Learning Model Building
No ratings yet
Machine Learning Model Building
6 pages
Ds Pract 5 Data Analytics1 Vedanti
No ratings yet
Ds Pract 5 Data Analytics1 Vedanti
7 pages
Shaheed Zulfikar Ali Bhutto Institute of Science & Technology
No ratings yet
Shaheed Zulfikar Ali Bhutto Institute of Science & Technology
12 pages
Step 16 Chapter4
No ratings yet
Step 16 Chapter4
64 pages
DA_lab2
No ratings yet
DA_lab2
5 pages
House Price Prediction Models
No ratings yet
House Price Prediction Models
16 pages
EDA Plots Code
No ratings yet
EDA Plots Code
13 pages
ML Lab File Final.docx - Google Docs
No ratings yet
ML Lab File Final.docx - Google Docs
17 pages
SN Travel Jupyter Notebook PDF
No ratings yet
SN Travel Jupyter Notebook PDF
28 pages
Profound Python Libraries
From Everand
Profound Python Libraries
Onder Teker
No ratings yet
Updated Placement Report Final Modified (2)
No ratings yet
Updated Placement Report Final Modified (2)
457 pages
DMV - 1 - Jupyter Notebook
No ratings yet
DMV - 1 - Jupyter Notebook
4 pages
Clustering - With - Elbow - Plot - ML - 4 - Jupyter Notebook
No ratings yet
Clustering - With - Elbow - Plot - ML - 4 - Jupyter Notebook
6 pages
DMV - 6 - Jupyter Notebook
No ratings yet
DMV - 6 - Jupyter Notebook
6 pages
Ensmble - Learning - ML - 5 - Jupyter Notebook
No ratings yet
Ensmble - Learning - ML - 5 - Jupyter Notebook
7 pages
Cape It Unit 2 Compiled
100% (1)
Cape It Unit 2 Compiled
54 pages
Abetic Apps BD
No ratings yet
Abetic Apps BD
2 pages
PRL Pmod3-L4
No ratings yet
PRL Pmod3-L4
18 pages
Precalculus Sigma Notation Practice
No ratings yet
Precalculus Sigma Notation Practice
4 pages
Soil Stabilization Using Crumb Rubber
No ratings yet
Soil Stabilization Using Crumb Rubber
36 pages
Sadashiva Nagar School 3rd and Final Bill
No ratings yet
Sadashiva Nagar School 3rd and Final Bill
42 pages
GX-8000 Operating Manual
No ratings yet
GX-8000 Operating Manual
42 pages
NFC Iet Multan: Faiz-Ul-Rehman
No ratings yet
NFC Iet Multan: Faiz-Ul-Rehman
3 pages
Instruction Manual
No ratings yet
Instruction Manual
225 pages
Hard Disk Jumper Settings Guide
No ratings yet
Hard Disk Jumper Settings Guide
3 pages
SB+ Overview Brochure
No ratings yet
SB+ Overview Brochure
2 pages
Traingle Class 10th
No ratings yet
Traingle Class 10th
6 pages
Hurricane Gust Factors
No ratings yet
Hurricane Gust Factors
2 pages
Vienna Ensemble PRO 6 Manual English v3.0.0.1.34
No ratings yet
Vienna Ensemble PRO 6 Manual English v3.0.0.1.34
121 pages
VR-UNIT 4-MODELING THE PHYSICAL WORLD (1)
No ratings yet
VR-UNIT 4-MODELING THE PHYSICAL WORLD (1)
39 pages
Ebara Databook 6-8BHE (L) 60Hz
No ratings yet
Ebara Databook 6-8BHE (L) 60Hz
75 pages
18cvl38 - BMT Lab - Manual
No ratings yet
18cvl38 - BMT Lab - Manual
79 pages
2.3 Living Processes in Multicellular Organisms
No ratings yet
2.3 Living Processes in Multicellular Organisms
84 pages
JSW Jaigarh Port LTD.: Sap Order No
No ratings yet
JSW Jaigarh Port LTD.: Sap Order No
9 pages
1288 Au24 M2 Practice
No ratings yet
1288 Au24 M2 Practice
2 pages
Introduction To Isotopes and Environmental Tracers As Indicators of Groundwater Flow
No ratings yet
Introduction To Isotopes and Environmental Tracers As Indicators of Groundwater Flow
85 pages
8FG15 8FD15: Main฀Vehicle฀Specifications
No ratings yet
8FG15 8FD15: Main฀Vehicle฀Specifications
3 pages
Studymanual PDF
No ratings yet
Studymanual PDF
34 pages
Mathematical Economics Mod L
No ratings yet
Mathematical Economics Mod L
22 pages
Experiment No. 5 Preparation of Aspirin (Initial)
No ratings yet
Experiment No. 5 Preparation of Aspirin (Initial)
2 pages
3mocl Max Des Exchange Rate Sap To Ams Va Updated
No ratings yet
3mocl Max Des Exchange Rate Sap To Ams Va Updated
11 pages
Express JS
No ratings yet
Express JS
9 pages

ML - 2 - Jupyter Notebook

Uploaded by

ML - 2 - Jupyter Notebook

Uploaded by

10/1/24, 10:25 PM ML_2 - Jupyter Notebook

In [1]: import pandas as pd

count 2.000000e+05 200000.000000 200000.000000 200000.000000 199999.000000 199999.000000

mean 2.771250e+07 11.359955 -72.527638 39.935885 -72.525292 39.923890

std 1.601382e+07 9.901776 11.437787 7.720539 13.117408 6.794829

min 1.000000e+00 -52.000000 -1340.648410 -74.015515 -3356.666300 -881.985513

25% 1.382535e+07 6.000000 -73.992065 40.734796 -73.991407 40.733823

50% 2.774550e+07 8.500000 -73.981823 40.752592 -73.980093 40.753042

75% 4.155530e+07 12.500000 -73.967153 40.767158 -73.963659 40.768001

max 5.542357e+07 499.000000 57.418457 1644.421482 1153.572603 872.697628

Out[9]: Index(['Unnamed: 0', 'key', 'fare_amount', 'pickup_datetime',

In [10]: df = df.drop(columns=['Unnamed: 0', 'key'])

In [13]: plt.figure(figsize=(10, 6))

In [15]: df = df[df['fare_amount'] > 0]

In [16]: plt.figure(figsize=(10, 6))

In [17]: X = df[['pickup_longitude', 'pickup_latitude', 'dropoff_longitude', 'dropoff_latitude',

In [18]: X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42

In [19]: scaler = StandardScaler()

In [20]: lr_model = LinearRegression()

In [21]: r2_lr = r2_score(y_test, y_pred_lr)

In [22]: print(f"Linear Regression - R²: {r2_lr:.4f}, RMSE: {rmse_lr:.4f}")

Linear Regression - R²: -0.0000, RMSE: 9.3393

In [23]: ridge_model = Ridge(alpha=1.0)

In [24]: r2_ridge = r2_score(y_test, y_pred_ridge)

In [25]: print(f"Ridge Regression - R²: {r2_ridge:.4f}, RMSE: {rmse_ridge:.4f}")

Ridge Regression - R²: -0.0000, RMSE: 9.3393

In [26]: lasso_model = Lasso(alpha=0.1)

In [27]: r2_lasso = r2_score(y_test, y_pred_lasso)

In [28]: print(f"Lasso Regression - R²: {r2_lasso:.4f}, RMSE: {rmse_lasso:.4f}")

Lasso Regression - R²: -0.0000, RMSE: 9.3394

In [29]: model_scores = pd.DataFrame({

Model R2 Score RMSE

In [32]: fig, ax = plt.subplots(1, 2, figsize=(12, 6))

You might also like