0% found this document useful (0 votes)

40 views4 pages

Data Analytics: Histogram & Regression Analysis

Uploaded by

vickyvpatil25

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

40 views4 pages

Data Analytics: Histogram & Regression Analysis

Uploaded by

vickyvpatil25

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

12/3/24, 4:15 PM Vicky patil_Practical_9 - Colab

Practical No.9

Name:-Vicky v patil

Class:-MCA 2nd Year Semester 3rd

Subject:-Data Anaytics Lab

Title of Practical:-Read a data which will give a proper distribution curve using pandas. Apply preprocessing on the data and plot a histogram
for the same. Properly label the plot. Analyze the plot

import pandas as pd
from sklearn.preprocessing import StandardScaler
from sklearn.preprocessing import LabelEncoder
from sklearn.impute import SimpleImputer
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.linear_model import LinearRegression

#
df=pd.read_csv('/content/Iris.csv')
df

Id SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCm Species

0 1 5.1 3.5 1.4 0.2 Iris-setosa

1 2 4.9 3.0 1.4 0.2 Iris-setosa

2 3 4.7 3.2 1.3 0.2 Iris-setosa

3 4 4.6 3.1 1.5 0.2 Iris-setosa

4 5 5.0 3.6 1.4 0.2 Iris-setosa

... ... ... ... ... ... ...

145 146 6.7 3.0 5.2 2.3 Iris-virginica

146 147 6.3 2.5 5.0 1.9 Iris-virginica

147 148 6.5 3.0 5.2 2.0 Iris-virginica

148 149 6.2 3.4 5.4 2.3 Iris-virginica

149 150 5.9 3.0 5.1 1.8 Iris-virginica

150 rows × 6 columns

from google.colab import drive

drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).

print(df.isnull().sum())

Id 0
SepalLengthCm 0
SepalWidthCm 0
PetalLengthCm 0
PetalWidthCm 0
Species 0
dtype: int64

le=LabelEncoder()
df['Species']=le.fit_transform(df['Species'])
df

https://colab.research.google.com/drive/1S8CI8u92AuPe6vwKOCNQdusyjrCoArqs?usp=sharing#scrollTo=HsAEcmTrKUV0&printMode=true 1/4
12/3/24, 4:15 PM Vicky patil_Practical_9 - Colab

Id SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCm Species

0 1 5.1 3.5 1.4 0.2 0

1 2 4.9 3.0 1.4 0.2 0

2 3 4.7 3.2 1.3 0.2 0

3 4 4.6 3.1 1.5 0.2 0

4 5 5.0 3.6 1.4 0.2 0

... ... ... ... ... ... ...

145 146 6.7 3.0 5.2 2.3 2

146 147 6.3 2.5 5.0 1.9 2

147 148 6.5 3.0 5.2 2.0 2

148 149 6.2 3.4 5.4 2.3 2

149 150 5.9 3.0 5.1 1.8 2

150 rows × 6 columns

x=df[df.columns[0:3]]
y=df[df.columns[4]]

df.shape

(150, 6)

x.head()

Id SepalLengthCm SepalWidthCm

0 1 5.1 3.5

1 2 4.9 3.0

2 3 4.7 3.2

3 4 4.6 3.1

4 5 5.0 3.6

y.head()

PetalWidthCm

0 0.2

1 0.2

2 0.2

3 0.2

4 0.2

dtype: float64

x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.3,random_state=10)

x_train.head()

Id SepalLengthCm SepalWidthCm

32 33 5.2 4.1

52 53 6.9 3.1

70 71 5.9 3.2

121 122 5.6 2.8

144 145 6.7 3.3

y_train.head()

https://colab.research.google.com/drive/1S8CI8u92AuPe6vwKOCNQdusyjrCoArqs?usp=sharing#scrollTo=HsAEcmTrKUV0&printMode=true 2/4
12/3/24, 4:15 PM Vicky patil_Practical_9 - Colab

PetalWidthCm

32 0.1

52 1.5

70 1.8

121 2.0

144 2.5

dtype: float64

# prompt: how to build a regression model

from sklearn.linear_model import LinearRegression

# Initialize the model

model = LinearRegression()

# Train the model

model.fit(x_train, y_train)

# Make predictions on the test set

y_pred = model.predict(x_test)

# Evaluate the model (example: R-squared)

from sklearn.metrics import r2_score
r2 = r2_score(y_test, y_pred)
print(f"R-squared: {r2}")

R-squared: 0.8627149401415144

md=LinearRegression()

md.fit(x_train,y_train)

▾ LinearRegression i ?
LinearRegression()

y_pred=md.predict(x_test)
y_pred

array([ 1.56788019, 1.81167007, 0.26224485, 1.45759149, 0.59318562,

0.86904724, 1.38235127, 1.13323559, 0.50776235, 0.95786364,
1.01767325, 1.9396602 , 0.92852498, 0.07921787, 0.24422778,
1.92294443, 1.31036751, 0.30594397, 0.27785444, 0.45477503,
1.91808717, 2.02534696, 1.89238898, 0.2438114 , 1.06657763,
-0.00271782, 1.36371277, 1.28999511, 1.56010462, 2.18772813,
1.28599669, 1.56844946, 2.24262204, 1.62647301, 2.17802355,
0.44691494, 1.98138436, 2.01894106, 2.34394446, 2.25686195,
0.33376007, 0.50442765, 0.84188492, 0.45727696, 1.11333801])

from sklearn.metrics import r2_score

from sklearn.metrics import mean_squared_error

r2 = r2_score(y_test, y_pred)
print(f"R-squared: {r2}")

mse = mean_squared_error(y_test, y_pred)

print(f"Mean Squared Error: {mse}")

R-squared: 0.8627149401415144
Mean Squared Error: 0.07482273045106973

import seaborn as sns

import matplotlib.pyplot as plt

plt.figure(figsize=(9,6))
sns.histplot(df['Species'])
plt.title('Distribution of Species')
plt.xlabel('Species')
plt.ylabel('Count')
plt.show()

https://colab.research.google.com/drive/1S8CI8u92AuPe6vwKOCNQdusyjrCoArqs?usp=sharing#scrollTo=HsAEcmTrKUV0&printMode=true 3/4
12/3/24, 4:15 PM Vicky patil_Practical_9 - Colab

https://colab.research.google.com/drive/1S8CI8u92AuPe6vwKOCNQdusyjrCoArqs?usp=sharing#scrollTo=HsAEcmTrKUV0&printMode=true 4/4

Vicky Patil - Practical - 10 - Colab
No ratings yet
Vicky Patil - Practical - 10 - Colab
3 pages
Machine Learning - Lab Record
No ratings yet
Machine Learning - Lab Record
43 pages
Iris Dataset Analysis and Visualization
No ratings yet
Iris Dataset Analysis and Visualization
13 pages
Bda Assign
No ratings yet
Bda Assign
15 pages
Data Science Practical With Solutions BSC Cs Sem 6
No ratings yet
Data Science Practical With Solutions BSC Cs Sem 6
29 pages
Dav Lab Manual
No ratings yet
Dav Lab Manual
28 pages
Set B
No ratings yet
Set B
4 pages
ML LabReport Final Index Edited
No ratings yet
ML LabReport Final Index Edited
35 pages
Ds 1 DW1
No ratings yet
Ds 1 DW1
2 pages
Excel and Data Analysis Techniques
No ratings yet
Excel and Data Analysis Techniques
32 pages
Practical No - 1
No ratings yet
Practical No - 1
5 pages
AI & ML Lab Journal for MCA Students
No ratings yet
AI & ML Lab Journal for MCA Students
77 pages
Machine Learning Practical Exercises Guide
No ratings yet
Machine Learning Practical Exercises Guide
53 pages
Experimenting With Data Analysis Packages and Statistical Operations
No ratings yet
Experimenting With Data Analysis Packages and Statistical Operations
18 pages
Load and Visualize Data with Pandas
No ratings yet
Load and Visualize Data with Pandas
32 pages
Data Science Practicals
No ratings yet
Data Science Practicals
47 pages
Data Science
No ratings yet
Data Science
15 pages
Case Study Output
No ratings yet
Case Study Output
4 pages
Sample
No ratings yet
Sample
1 page
DSBDA6
No ratings yet
DSBDA6
6 pages
ML L - Ab
No ratings yet
ML L - Ab
13 pages
Iris and Diabetes Data Analysis
No ratings yet
Iris and Diabetes Data Analysis
8 pages
Python ML Programs for Data Analysis
No ratings yet
Python ML Programs for Data Analysis
16 pages
ML Lab File
No ratings yet
ML Lab File
43 pages
DA Manual - Part B
No ratings yet
DA Manual - Part B
13 pages
Lab Test Questions for Python Data Analysis
No ratings yet
Lab Test Questions for Python Data Analysis
8 pages
DSBDA Practicals
No ratings yet
DSBDA Practicals
16 pages
DS Journal - Final
No ratings yet
DS Journal - Final
37 pages
Data Science Practical Certificate
No ratings yet
Data Science Practical Certificate
25 pages
EXP 07 (ML) - Ashu
No ratings yet
EXP 07 (ML) - Ashu
4 pages
Iris Dataset Analysis and Statistics
No ratings yet
Iris Dataset Analysis and Statistics
3 pages
Aiml Lab
No ratings yet
Aiml Lab
37 pages
ML Manual
No ratings yet
ML Manual
9 pages
EXP 07 (ML) - Sarthak
No ratings yet
EXP 07 (ML) - Sarthak
4 pages
Exp 07 (ML)
No ratings yet
Exp 07 (ML)
4 pages
A09Ass06 - Jupyter Notebook
No ratings yet
A09Ass06 - Jupyter Notebook
29 pages
EXP 07 (ML) - Darshu
No ratings yet
EXP 07 (ML) - Darshu
4 pages
ML Yogesh
No ratings yet
ML Yogesh
23 pages
Data Science Lab: Iris Dataset Analysis
No ratings yet
Data Science Lab: Iris Dataset Analysis
4 pages
Python Libraries for Data Analysis
No ratings yet
Python Libraries for Data Analysis
11 pages
Python Programs
No ratings yet
Python Programs
7 pages
Eai Exp 2-5
No ratings yet
Eai Exp 2-5
13 pages
Code
No ratings yet
Code
3 pages
Data Analysis with Pandas and Matplotlib
No ratings yet
Data Analysis with Pandas and Matplotlib
6 pages
Machine Learning Practical Exercises
100% (1)
Machine Learning Practical Exercises
12 pages
Pattern Recognition Lab Experiments Guide
No ratings yet
Pattern Recognition Lab Experiments Guide
26 pages
Student Data Analysis and Correlation
No ratings yet
Student Data Analysis and Correlation
33 pages
Assign5
No ratings yet
Assign5
2 pages
NumPy and Pandas Data Analysis Techniques
No ratings yet
NumPy and Pandas Data Analysis Techniques
6 pages
Pandas
No ratings yet
Pandas
21 pages
Id Sepallengthcm Sepalwidthcm Petallengthcm Petalwidthcm Species 0 1 2 3 4
No ratings yet
Id Sepallengthcm Sepalwidthcm Petallengthcm Petalwidthcm Species 0 1 2 3 4
4 pages
VAMSHI PR (1) 2 Edit
No ratings yet
VAMSHI PR (1) 2 Edit
16 pages
Update on pandas.util.testing Deprecation
No ratings yet
Update on pandas.util.testing Deprecation
10 pages
Python Depth First Search & Stacking Techniques
No ratings yet
Python Depth First Search & Stacking Techniques
18 pages
Data and Visual Analytics Lab Manual
No ratings yet
Data and Visual Analytics Lab Manual
20 pages
NumPy and Pandas Data Manipulation Guide
No ratings yet
NumPy and Pandas Data Manipulation Guide
11 pages
BHMC17 P5.ipynb - Colaboratory
No ratings yet
BHMC17 P5.ipynb - Colaboratory
4 pages
Iris Dataset EDA & ML Techniques
100% (2)
Iris Dataset EDA & ML Techniques
24 pages
T Adele Etal Article 2022
No ratings yet
T Adele Etal Article 2022
17 pages
Achieving A Finer Grain Structure Using The Indium Sulfamate Plating Bath 97760 A4 r2
No ratings yet
Achieving A Finer Grain Structure Using The Indium Sulfamate Plating Bath 97760 A4 r2
1 page
Sel027 PDF
No ratings yet
Sel027 PDF
9 pages
Architecture, Nature & Conclusion
100% (2)
Architecture, Nature & Conclusion
37 pages
Santa Maria Church: UNESCO Heritage Site
No ratings yet
Santa Maria Church: UNESCO Heritage Site
1 page
Ground Floor Lighting Plan for MS Building
No ratings yet
Ground Floor Lighting Plan for MS Building
1 page
Grey Rabbit - Color
No ratings yet
Grey Rabbit - Color
19 pages
470) Comprehension Cpo (Tier-II I) 2022
No ratings yet
470) Comprehension Cpo (Tier-II I) 2022
61 pages
Concrete Pavement Thickness Design Guide
No ratings yet
Concrete Pavement Thickness Design Guide
105 pages
Westmed Syringe Brochure
100% (1)
Westmed Syringe Brochure
2 pages
PA-28 Warrior Inspection Checklist
100% (1)
PA-28 Warrior Inspection Checklist
5 pages
Michael SCHEIBELHUT - Obituary - Calgary Herald
No ratings yet
Michael SCHEIBELHUT - Obituary - Calgary Herald
2 pages
Bahasa Inggris Iup Reading
No ratings yet
Bahasa Inggris Iup Reading
3 pages
7 2 Aldehydes and Ketones A Level Only HgQs8JCg9gzMPCmd
No ratings yet
7 2 Aldehydes and Ketones A Level Only HgQs8JCg9gzMPCmd
24 pages
Safety Sheet for Marine Use
No ratings yet
Safety Sheet for Marine Use
4 pages
Vicky 67
No ratings yet
Vicky 67
13 pages
Thesis Statement For Antigone and Creon
100% (3)
Thesis Statement For Antigone and Creon
6 pages
Understanding Balanced and Unbalanced Forces
No ratings yet
Understanding Balanced and Unbalanced Forces
28 pages
Hps 165958ecol Als
100% (3)
Hps 165958ecol Als
195 pages
Hnology and Livelihood Education: Quarter 1 - Module 2: Cookery
No ratings yet
Hnology and Livelihood Education: Quarter 1 - Module 2: Cookery
15 pages
Restriction Enzyme
No ratings yet
Restriction Enzyme
45 pages
Types of Upholstery Material
No ratings yet
Types of Upholstery Material
15 pages
Crush Triangle Training
No ratings yet
Crush Triangle Training
43 pages
My Royal Billionaire Boss
No ratings yet
My Royal Billionaire Boss
124 pages
Syvecs Huracan Kit Manual
No ratings yet
Syvecs Huracan Kit Manual
11 pages
Grade 11 Enghl Poetry Study Guide
No ratings yet
Grade 11 Enghl Poetry Study Guide
59 pages
DT2 Manual
No ratings yet
DT2 Manual
3 pages
Aatp Sap
No ratings yet
Aatp Sap
4 pages
Daewoo Matiz 2000-2013 Heating, Ventilation and Air Conditioner 21-33
No ratings yet
Daewoo Matiz 2000-2013 Heating, Ventilation and Air Conditioner 21-33
13 pages
Astana: Architecture & Culture Guide
No ratings yet
Astana: Architecture & Culture Guide
6 pages

Data Analytics: Histogram & Regression Analysis

Uploaded by

Data Analytics: Histogram & Regression Analysis

Uploaded by

12/3/24, 4:15 PM Vicky patil_Practical_9 - Colab

Class:-MCA 2nd Year Semester 3rd

Subject:-Data Anaytics Lab

Id SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCm Species

0 1 5.1 3.5 1.4 0.2 Iris-setosa

1 2 4.9 3.0 1.4 0.2 Iris-setosa

2 3 4.7 3.2 1.3 0.2 Iris-setosa

3 4 4.6 3.1 1.5 0.2 Iris-setosa

4 5 5.0 3.6 1.4 0.2 Iris-setosa

... ... ... ... ... ... ...

145 146 6.7 3.0 5.2 2.3 Iris-virginica

146 147 6.3 2.5 5.0 1.9 Iris-virginica

147 148 6.5 3.0 5.2 2.0 Iris-virginica

148 149 6.2 3.4 5.4 2.3 Iris-virginica

149 150 5.9 3.0 5.1 1.8 Iris-virginica

150 rows × 6 columns

from google.colab import drive

Id SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCm Species

0 1 5.1 3.5 1.4 0.2 0

1 2 4.9 3.0 1.4 0.2 0

2 3 4.7 3.2 1.3 0.2 0

3 4 4.6 3.1 1.5 0.2 0

4 5 5.0 3.6 1.4 0.2 0

... ... ... ... ... ... ...

145 146 6.7 3.0 5.2 2.3 2

146 147 6.3 2.5 5.0 1.9 2

147 148 6.5 3.0 5.2 2.0 2

148 149 6.2 3.4 5.4 2.3 2

149 150 5.9 3.0 5.1 1.8 2

150 rows × 6 columns

121 122 5.6 2.8

144 145 6.7 3.3

# prompt: how to build a regression model

from sklearn.linear_model import LinearRegression

# Initialize the model

# Train the model

# Make predictions on the test set

# Evaluate the model (example: R-squared)

array([ 1.56788019, 1.81167007, 0.26224485, 1.45759149, 0.59318562,

from sklearn.metrics import r2_score

mse = mean_squared_error(y_test, y_pred)

import seaborn as sns

You might also like