0% found this document useful (0 votes)

35 views9 pages

ML Lab

The document contains multiple Python programs that perform various data analysis tasks, including outlier detection in housing data, visualization of correlations and distributions, PCA on the Iris dataset, and k-NN classification on randomly generated data. Each program utilizes libraries such as NumPy, pandas, Matplotlib, and Seaborn for data manipulation and visualization. The overall focus is on data exploration and machine learning techniques.

Uploaded by

Vaishnavi Y. U

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

35 views9 pages

ML Lab

Uploaded by

Vaishnavi Y. U

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

Program

1
import numpy as np
plt.tight_layout()
import seaborn as
[Link]()
sns
print("Outliers Detection:")
import [Link] as plt
outliers_summary = {}
from [Link] import
fetch_california_housing for feature in numerical_features:

data = Q1 =
housing_df[feature].quantile(0
fetch_california_housing(as_frame=True) .25)
housing_df = [Link] Q3 =
housing_df = housing_df[feature].quantile(0
.75)
[Link]
IQR = Q3 - Q1
housing_df =
lower_bound = Q1 - 1.5 * IQR
[Link]
upper_bound = Q3 + 1.5 * IQR
housing_df =
outliers =
[Link] housing_df[(housing_df[feature]
<
housing_df =
lower_bound) |
data['frame'] (housing_df[feature]
numerical_features = > upper_bound)]
housing_df.select_dtypes(in outliers_summary[feature] =
clude= len(outliers)

[[Link]]).columns print(f"{feature}:
{len(outliers)} outliers")
n_features =
len(numerical_features) n_cols = 3
n_rows = (n_features // n_cols) +
(n_features % n_cols > 0)
[Link](figsize=(15, 5 * n_rows))
for i, feature in
enumerate(numerical_features):
[Link](n_rows, n_cols, i + 1)
[Link](housing_df[feature],
kde=True, bins=30, color='blue')
[Link](f'Distribution of {feature}')
plt.tight_layout()
Program
2
[Link]()
[Link](figsize=(15, 5 * n_rows))
for i, feature in
enumerate(numerical_features):
[Link](n_rows, n_cols, i + 1)
[Link](x=housing_df[feature],
color='orange') [Link](f'Box Plot of
{feature}')
Program
3
import pandas as
pd import seaborn
as sns
import [Link] as plt
from [Link] import fetch_california_housing

california_data =
fetch_california_housing(as_frame=True) data =
california_data.frame

correlation_matrix = [Link]()

[Link](figsize=(10, 8))
[Link](correlation_matrix, annot=True, cmap='coolwarm',
fmt='.2f', linewidths=0.5)
[Link]('Correlation Matrix of California Housing
Features') [Link]()

[Link](data, diag_kind='kde',
plot_kws={'alpha': 0.5}) [Link]('Pair Plot of
California Housing Features', y=1.02) [Link]()
Program
4
import numpy as np
import pandas as pd
from [Link] import
load_iris from
[Link] import PCA
import [Link] as plt
iris =
load_iris()
data =
[Link]
labels =
[Link]
label_names = iris.target_names
iris_df = [Link](data,
columns=iris.feature_names) pca =
PCA(n_components=2)
data_reduced = pca.fit_transform(data)
reduced_df = [Link](data_reduced, columns=['Principal
Component 1', 'Principal Component 2'])
reduced_df['Label'] =
labels
[Link](figsize=(8, 6))
colors = ['r', 'g', 'b']
for i, label in enumerate([Link](labels)):
[Link](
reduced_df[reduced_df['Label'] == label]['Principal
Component 1'], reduced_df[reduced_df['Label'] ==
label]['Principal Component 2'],
label=label_names[label],
color=colors[i]
)
[Link]('PCA on Iris
Dataset')
Program
5
[Link]('Principal
Component 1')
[Link]('Principal
Component 2') [Link]()
[Link]
()
[Link]
w()
Program
6
import pandas as pd
def find_s_algorithm(file_path):
data =
pd.read_csv(file_path)
print("Training data:")
print(data)
attributes =
[Link][:-1]
class_label =
[Link][-1]
hypothesis = ['?' for _ in
attributes] for index, row in
[Link]():
if row[class_label] == 'Yes':
for i, value in enumerate(row[attributes]):
if hypothesis[i] == '?' or hypothesis[i] ==
value: hypothesis[i] = value
else:
hypothesis[i]
= '?' return
hypothesis
file_path = 'C:\\Users\\Admin\\Desktop\\
[Link]' hypothesis =
find_s_algorithm(file_path)
print("\nThe final hypothesis is:", hypothesis)
Program
7
import numpy as np
import [Link] as
plt from collections import
Counter data =
[Link](100)
labels = ["Class1" if x <= 0.5 else "Class2" for x
in data[:50]] def euclidean_distance(x1, x2):
return abs(x1 - x2)
def knn_classifier(train_data, train_labels, test_point, k):
distances = [(euclidean_distance(test_point, train_data[i]), train_labels[i])
for i in range(len(train_data))]
[Link](key=lambda
x: x[0]) k_nearest_neighbors
= distances[:k]
k_nearest_labels = [label for _, label in
k_nearest_neighbors] return
Counter(k_nearest_labels).most_common(1)[0][0]
train_data = data[:50]
train_labels = labels
test_data = data[50:]
k_values = [1, 2, 3, 4, 5, 20, 30]
print("--- k-Nearest Neighbors Classification ---")
print("Training dataset: First 50 points labeled based on the rule (x
<= 0.5 -> Class1, x > 0.5 -> Class2)")
print("Testing dataset: Remaining 50 points to be
classified\n") results = {}
for k in k_values:
print(f"Results for k = {k}:")
classified_labels = [knn_classifier(train_data, train_labels,
test_point, k) for test_point in test_data]
results[k] = classified_labels
for i, label in enumerate(classified_labels, start=51):
print(f"Point x{i} (value: {test_data[i - 51]:.4f}) is classified as
Program
8 {label}") print("\n")
print("Classification
complete.\n") for k in
k_values:
classified_labels = results[k]
class1_points = [test_data[i] for i in range(len(test_data)) if
classified_labels[i] == "Class1"]
class2_points = [test_data[i] for i in range(len(test_data)) if
classified_labels[i] == "Class2"]
[Link](figsize=(10, 6))
[Link](train_data, [0] * len(train_data),
c=["blue" if label == "Class1" else "red" for label in
train_labels], label="Training Data", marker="o")
[Link](class1_points, [1] * len(class1_points), c="blue", label="Class1
(Test)", marker="x")
[Link](class2_points, [1] * len(class2_points), c="red", label="Class2
(Test)", marker="x")
[Link](f"k-NN Classification Results
for k = {k}") [Link]("Data Points")
[Link]("Classification
Level") [Link]()
[Link](True)
[Link]()

ML Programs
No ratings yet
ML Programs
14 pages
V
No ratings yet
V
8 pages
Titanic Shuffle Analysis in ML Lab
No ratings yet
Titanic Shuffle Analysis in ML Lab
24 pages
ML Experiment WithDataset
No ratings yet
ML Experiment WithDataset
23 pages
ML Spy Programs
No ratings yet
ML Spy Programs
16 pages
Machine Learning Lab
No ratings yet
Machine Learning Lab
33 pages
MLLab Manual
No ratings yet
MLLab Manual
24 pages
Mlalllabprgs
No ratings yet
Mlalllabprgs
17 pages
ML - Datascience Manual
No ratings yet
ML - Datascience Manual
64 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
9 pages
Machine Learning Programs
No ratings yet
Machine Learning Programs
10 pages
ML Short Code - Under Updating
No ratings yet
ML Short Code - Under Updating
4 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
26 pages
Machine Learning Lab Manual
No ratings yet
Machine Learning Lab Manual
18 pages
ML
No ratings yet
ML
5 pages
ML Journal External
No ratings yet
ML Journal External
14 pages
California Housing Data Analysis Tools
No ratings yet
California Housing Data Analysis Tools
33 pages
ML Labmanual
No ratings yet
ML Labmanual
33 pages
ML Lab Manual
No ratings yet
ML Lab Manual
43 pages
Machine Learning Lab Manaul BCSL606
No ratings yet
Machine Learning Lab Manaul BCSL606
27 pages
M PDF
No ratings yet
M PDF
13 pages
Auto MPG Dataset Analysis
No ratings yet
Auto MPG Dataset Analysis
25 pages
ML Lab Mannual1
No ratings yet
ML Lab Mannual1
37 pages
Lab Extern L
No ratings yet
Lab Extern L
8 pages
ML Manual
No ratings yet
ML Manual
30 pages
ML 3
No ratings yet
ML 3
24 pages
kNN and K-Means Python Implementations
No ratings yet
kNN and K-Means Python Implementations
25 pages
Strangers
No ratings yet
Strangers
8 pages
Final ML Programs 075005
No ratings yet
Final ML Programs 075005
15 pages
ML Lab Manual for CSE Students
No ratings yet
ML Lab Manual for CSE Students
32 pages
Apriori Algorithm
No ratings yet
Apriori Algorithm
12 pages
Local Weight Regression with Python
No ratings yet
Local Weight Regression with Python
14 pages
BCSL606 Machine Learning Lab
No ratings yet
BCSL606 Machine Learning Lab
33 pages
Wa0003
No ratings yet
Wa0003
16 pages
ML Lab Experiment Shortened With Same Output
No ratings yet
ML Lab Experiment Shortened With Same Output
6 pages
Naïve Bayes and KNN Classifier Code
No ratings yet
Naïve Bayes and KNN Classifier Code
13 pages
ML
No ratings yet
ML
11 pages
Minor Assignment 4
No ratings yet
Minor Assignment 4
17 pages
Argha's ML LAB - 240927 - 121838
No ratings yet
Argha's ML LAB - 240927 - 121838
13 pages
Lab4 KNN
No ratings yet
Lab4 KNN
9 pages
ML Lab Mannual
No ratings yet
ML Lab Mannual
29 pages
ML Manual
No ratings yet
ML Manual
9 pages
PrOGRAM1.Ipynb - Colab
No ratings yet
PrOGRAM1.Ipynb - Colab
2 pages
Decision Boundary Visualization in Python
No ratings yet
Decision Boundary Visualization in Python
7 pages
Machine Learning All Lab Experiments VTU 6th Sem
No ratings yet
Machine Learning All Lab Experiments VTU 6th Sem
27 pages
Program 01
No ratings yet
Program 01
1 page
K-Means Clustering From Scratch
No ratings yet
K-Means Clustering From Scratch
3 pages
ML 5
No ratings yet
ML 5
2 pages
California Housing Data Analysis
No ratings yet
California Housing Data Analysis
2 pages
Advanced Machine Learning Experiments
No ratings yet
Advanced Machine Learning Experiments
15 pages
Assignment 4
No ratings yet
Assignment 4
9 pages
ML Lab 1-5
No ratings yet
ML Lab 1-5
5 pages
KNN Classification Model Implementation
No ratings yet
KNN Classification Model Implementation
21 pages
KNN Classifier for Iris Dataset Analysis
No ratings yet
KNN Classifier for Iris Dataset Analysis
3 pages
Data Analysis with Machine Learning Techniques
No ratings yet
Data Analysis with Machine Learning Techniques
14 pages
Aam Codes
No ratings yet
Aam Codes
8 pages
Ai Lab
No ratings yet
Ai Lab
11 pages
KNN - Predictive Analysis
No ratings yet
KNN - Predictive Analysis
6 pages
KNN Classifier Implementation in Python
No ratings yet
KNN Classifier Implementation in Python
8 pages
Research Paper1
No ratings yet
Research Paper1
5 pages
Pasted Text 1742970942586
No ratings yet
Pasted Text 1742970942586
4 pages
Question Bank 1
No ratings yet
Question Bank 1
2 pages
Pasted Text 1745216466226
No ratings yet
Pasted Text 1745216466226
4 pages
Final Project Review 2
No ratings yet
Final Project Review 2
17 pages
Gen AI Micro
No ratings yet
Gen AI Micro
15 pages
1 s2.0 S0167739X19313494 Main
No ratings yet
1 s2.0 S0167739X19313494 Main
10 pages
NLP Module2
No ratings yet
NLP Module2
40 pages
Sustainable Blockchain-Based Digital Twin Management Architecture For IoT Devices
No ratings yet
Sustainable Blockchain-Based Digital Twin Management Architecture For IoT Devices
14 pages
1 s2.0 S0278612520300091 Main
No ratings yet
1 s2.0 S0278612520300091 Main
11 pages
NLP Module - 1
No ratings yet
NLP Module - 1
16 pages
Tolerances 01
100% (1)
Tolerances 01
76 pages
Understanding Statistics and Data Types
No ratings yet
Understanding Statistics and Data Types
44 pages
Data Types and Statistical Analysis Guide
No ratings yet
Data Types and Statistical Analysis Guide
10 pages
Understanding Measures of Dispersion
No ratings yet
Understanding Measures of Dispersion
42 pages
Discovering Statistics Using IBM SPSS Statistics 5th Edition by Andy Fie Question Bank
No ratings yet
Discovering Statistics Using IBM SPSS Statistics 5th Edition by Andy Fie Question Bank
22 pages
Lab 7.1 Questions
No ratings yet
Lab 7.1 Questions
6 pages
1993-Linnet - Evaluation of Regression Procedures For Methods Comparison Studies
No ratings yet
1993-Linnet - Evaluation of Regression Procedures For Methods Comparison Studies
9 pages
Basic Terms of Statistics
No ratings yet
Basic Terms of Statistics
5 pages
Understanding Mesokurtosis in Statistics
No ratings yet
Understanding Mesokurtosis in Statistics
43 pages
AP Stats: Data Distribution Basics
No ratings yet
AP Stats: Data Distribution Basics
3 pages
Exam 1 Review F25 Key
No ratings yet
Exam 1 Review F25 Key
12 pages
Statistics For Managers Using Microsoft® Excel 5th Edition: Two-Sample Tests
No ratings yet
Statistics For Managers Using Microsoft® Excel 5th Edition: Two-Sample Tests
53 pages
SD of M25 Cube
No ratings yet
SD of M25 Cube
3 pages
Introduction to Business Statistics
No ratings yet
Introduction to Business Statistics
5 pages
k5 Learning Statistics Probability Workbook
No ratings yet
k5 Learning Statistics Probability Workbook
135 pages
Parametric & Nonparametric Tests in SPSS
No ratings yet
Parametric & Nonparametric Tests in SPSS
1 page
Student Score Gains Analysis
No ratings yet
Student Score Gains Analysis
2 pages
Japanese H-Section Dimensions
No ratings yet
Japanese H-Section Dimensions
4 pages
Peramalan (Forecasting)
No ratings yet
Peramalan (Forecasting)
24 pages
Lucille Britz PDF
No ratings yet
Lucille Britz PDF
18 pages
Cohen's Conventions For Small, Medium, and Large Effects: Difference Between Two Means
No ratings yet
Cohen's Conventions For Small, Medium, and Large Effects: Difference Between Two Means
2 pages
Demand Forecasting Metrics Analysis
No ratings yet
Demand Forecasting Metrics Analysis
14 pages
Standard Costing
No ratings yet
Standard Costing
5 pages
Mean and Variance of Sampling Distribution of Sample Means Performance Task
No ratings yet
Mean and Variance of Sampling Distribution of Sample Means Performance Task
24 pages
Population Mean t-Test Analysis
No ratings yet
Population Mean t-Test Analysis
3 pages
Market Anomaly
No ratings yet
Market Anomaly
23 pages
Determinants of UK Corporate Capital Structure
No ratings yet
Determinants of UK Corporate Capital Structure
21 pages
Gridding Report: Data Analysis Summary
No ratings yet
Gridding Report: Data Analysis Summary
10 pages

ML Lab

Uploaded by

ML Lab

Uploaded by

Program

You might also like