Open navigation menu

Scribd

0% found this document useful (0 votes)

26 views6 pages

Stratified K-Fold in Scikit-Learn

The document contains multiple questions demonstrating the use of machine learning techniques on the Iris and Libras datasets using Python's scikit-learn library. It includes implementations of Logistic Regression and Random Forest classifiers with cross-validation, as well as performance metrics like accuracy, precision, recall, and F1-score. The results show varying accuracies for different models and datasets, highlighting the effectiveness of these classifiers.

Uploaded by

dehurinibedita025

Copyright

© © All Rights Reserved

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

26 views6 pages

Stratified K-Fold in Scikit-Learn

The document contains multiple questions demonstrating the use of machine learning techniques on the Iris and Libras datasets using Python's scikit-learn library. It includes implementations of Logistic Regression and Random Forest classifiers with cross-validation, as well as performance metrics like accuracy, precision, recall, and F1-score. The results show varying accuracies for different models and datasets, highlighting the effectiveness of these classifiers.

Uploaded by

dehurinibedita025

Copyright

© © All Rights Reserved

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

QUESTION 1:

from sklearn.datasets import load_iris

from sklearn.linear_model import LogisticRegression

from sklearn.model_selection import cross_val_score

from sklearn.datasets import load_iris

from sklearn.linear_model import LogisticRegression

from sklearn.model_selection import cross_val_score

import numpy as np

iris = load_iris()

x,y = iris.data, iris.target

logreg = LogisticRegression(max_iter=200,random_state=42)

k = 10

cv_scores = cross_val_score(logreg, x, y, cv=k, scoring='accuracy')

accuracy = np.mean(cv_scores)

print(f"Cross-validation scores:{cv_scores}")

print(f"accuracy:{accuracy: .4f}")

OUTPUT: Accuracy: 0.9733

QUESTION 2:

from sklearn.datasets import load_iris

from sklearn.model_selection import StratifiedKFold, cross_val_score

from sklearn.linear_model import LogisticRegression

from sklearn.preprocessing import StandardScaler

import numpy as np

# Load Iris dataset

iris = load_iris()

X, y = iris.data, iris.target

# Standardize the features for better performance

scaler = StandardScaler()

X = scaler.fit_transform(X)

# Define Logistic Regression model

model = LogisticRegression(max_iter=200)

# Set up Stratified K-Fold Cross-Validation

skf = StratifiedKFold(n_splits=5, shuffle=True, random_state=42)

# Perform cross-validation and calculate accuracy

scores = cross_val_score(model, X, y, cv=skf, scoring='accuracy')

# Display results

print(f"Accuracy: {scores.mean():.4f} ± {scores.std():.4f}")

OUTPUT: Accuracy: 0.9533 ± 0.0452

QUESTION 3:

from sklearn.datasets import load_iris

from sklearn.ensemble import RandomForestClassifier

from sklearn.model_selection import cross_val_score, StratifiedKFold

import numpy as np

# Load the Iris dataset

iris = load_iris()

X = iris.data

y = iris.target

# Initialize the RandomForestClassifier

rf_model = RandomForestClassifier(random_state=42)
# Set up K-Fold Cross-Validation (Stratified to maintain class balance)

kfold = StratifiedKFold(n_splits=10, shuffle=True, random_state=42)

# Perform cross-validation and compute accuracy for each fold

cv_scores = cross_val_score(rf_model, X, y, cv=kfold, scoring='accuracy')

# Display the accuracy and standard deviation

print(f" Accuracy: {np.mean(cv_scores):.4f}")

OUTPUT: Accuracy: 0.9533

QUESTION 4:

from sklearn.datasets import load_iris

from sklearn.ensemble import RandomForestClassifier

from sklearn.model_selection import StratifiedKFold, cross_val_score

import numpy as np

# Load the Iris dataset

iris = load_iris()

X = iris.data

y = iris.target

# Initialize the RandomForestClassifier

rf_model = RandomForestClassifier(random_state=42)

# Set up Stratified K-Fold Cross-Validation (10 folds)

stratified_kfold = StratifiedKFold(n_splits=10, shuffle=True, random_state=42)

# Perform cross-validation and compute accuracy for each fold

cv_scores = cross_val_score(rf_model, X, y, cv=stratified_kfold, scoring='accuracy')

# Display the accuracy and standard deviation

print(f"Accuracy: {np.mean(cv_scores):.4f}")

OUTPUT: Accuracy: 0.9533

QUESTION 5:

# Load the Libras dataset

libras_data_path = '/mnt/data/movement_libras.data'

libras_data = pd.read_csv(libras_data_path, header=None)

# Display the first few rows of the dataset

libras_data.head()

from sklearn.model_selection import train_test_split

from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score

# Separate features and target

X_libras = libras_data.iloc[:, :-1] # Features (columns 0 to 89)

y_libras = libras_data.iloc[:, -1] # Target (column 90)

# Split data into training and testing sets

X_train, X_test, y_train, y_test = train_test_split(X_libras, y_libras, test_size=0.2, random_state=42)

# Train the random forest model

rf_model_libras = RandomForestClassifier(random_state=42)

rf_model_libras.fit(X_train, y_train)

# Make predictions on the test set

y_pred = rf_model_libras.predict(X_test)
# Calculate metrics

accuracy = accuracy_score(y_test, y_pred)

precision = precision_score(y_test, y_pred, average='weighted')

recall = recall_score(y_test, y_pred, average='weighted')

f1 = f1_score(y_test, y_pred, average='weighted')

accuracy, precision, recall, f1

OUTPUT:

Accuracy: 0.8055555555555556

Precision: 0.8413018308851642

Recall: 0.8055555555555556

F1-score: 0.8074919315718324

Classification Report:

precision recall f1-score support

1 0.88 0.88 0.88 8

2 0.83 0.62 0.71 8

3 1.00 0.83 0.91 6

4 1.00 0.91 0.95 11

5 0.75 0.75 0.75 8

6 1.00 0.50 0.67 6

7 0.88 1.00 0.93 7

8 0.40 0.67 0.50 3

9 0.77 1.00 0.87 10

10 1.00 0.78 0.88 9

11 0.60 1.00 0.75 3

12 0.71 0.83 0.77 6

13 0.67 0.67 0.67 6

14 0.64 0.88 0.74 8

15 1.00 0.67 0.80 9

accuracy 0.81 108

macro avg 0.81 0.80 0.78 108

weighted avg 0.84 0.81 0.81 108

You might also like

ML Program 7, 8,9 And10
No ratings yet
ML Program 7, 8,9 And10
12 pages
EXP - 7 - Prasham Doshi - 22bec097
No ratings yet
EXP - 7 - Prasham Doshi - 22bec097
7 pages
CD 505 Itds Practical 2
No ratings yet
CD 505 Itds Practical 2
4 pages
Data Mining Lab Manual
No ratings yet
Data Mining Lab Manual
7 pages
Code
No ratings yet
Code
5 pages
ML LAB 12 - Jupyter Notebook
No ratings yet
ML LAB 12 - Jupyter Notebook
11 pages
CD 505 Itds Practical 1
No ratings yet
CD 505 Itds Practical 1
8 pages
Assaignment 3 1
No ratings yet
Assaignment 3 1
5 pages
Karisma 23011101119 Eda Rec
No ratings yet
Karisma 23011101119 Eda Rec
88 pages
IEEE 30-Bus Test System Analysis
No ratings yet
IEEE 30-Bus Test System Analysis
6 pages
MNIST Digit Recognition Guide
No ratings yet
MNIST Digit Recognition Guide
8 pages
KNN Classifier on Digits Data
No ratings yet
KNN Classifier on Digits Data
3 pages
Program - 9
No ratings yet
Program - 9
7 pages
7 Distribuciones Probabilidades Tablas
No ratings yet
7 Distribuciones Probabilidades Tablas
27 pages
Boosting Robustness in Handwritten Digit Recognition
No ratings yet
Boosting Robustness in Handwritten Digit Recognition
29 pages
Tablas Dis Tri Buci Ones I
No ratings yet
Tablas Dis Tri Buci Ones I
27 pages
TablasDistribucionesI PDF
No ratings yet
TablasDistribucionesI PDF
27 pages
Tablas Dis Tri Buci Ones I
No ratings yet
Tablas Dis Tri Buci Ones I
27 pages
Tablas Dis Tri Buci Ones I
No ratings yet
Tablas Dis Tri Buci Ones I
27 pages
Tablas Dis Tri Buci Ones I
No ratings yet
Tablas Dis Tri Buci Ones I
27 pages
Tablas Dis Tri Buci Ones I
No ratings yet
Tablas Dis Tri Buci Ones I
27 pages
Binomial Distribution Tables
No ratings yet
Binomial Distribution Tables
27 pages
Tablas Dis Tri Buci Ones I
No ratings yet
Tablas Dis Tri Buci Ones I
27 pages
ML Outputs
No ratings yet
ML Outputs
4 pages
Program Analisa Aliran Daya Pada Sistem 30 Bus Dengan Metode Newton Rapshon
No ratings yet
Program Analisa Aliran Daya Pada Sistem 30 Bus Dengan Metode Newton Rapshon
2 pages
Model Evaluation and Hyperparameter Tuning
No ratings yet
Model Evaluation and Hyperparameter Tuning
11 pages
DISTRIBUCIÓN BINOMIAL - Términos Acumulativos
No ratings yet
DISTRIBUCIÓN BINOMIAL - Términos Acumulativos
5 pages
Tugas Besar ASTL Lanjut&Softwarwe STL
No ratings yet
Tugas Besar ASTL Lanjut&Softwarwe STL
8 pages
Tables For CQE Exam
No ratings yet
Tables For CQE Exam
22 pages
Statistical Formulas for STAT2602
No ratings yet
Statistical Formulas for STAT2602
3 pages
Week 4 Naive Bayes Classifier
No ratings yet
Week 4 Naive Bayes Classifier
2 pages
Exam Formula Sheet
No ratings yet
Exam Formula Sheet
3 pages
CPDScardno 044-0141
100% (1)
CPDScardno 044-0141
3 pages
Documents Downloader
No ratings yet
Documents Downloader
16 pages
JCPDScardno 024-0735
No ratings yet
JCPDScardno 024-0735
3 pages
Binomial Distribution Table For: P P C X X P
No ratings yet
Binomial Distribution Table For: P P C X X P
6 pages
BFCG
No ratings yet
BFCG
4 pages
Business Statistics Formula
No ratings yet
Business Statistics Formula
4 pages
Soal 1:: Tugas Proyek Akhir Software Sistem Tenaga Listrik
No ratings yet
Soal 1:: Tugas Proyek Akhir Software Sistem Tenaga Listrik
5 pages
Table For: Binomial Distribution
No ratings yet
Table For: Binomial Distribution
6 pages
Tablas Esta Di Sticas
No ratings yet
Tablas Esta Di Sticas
24 pages
Random Forest
No ratings yet
Random Forest
5 pages
Lab 07 NR
No ratings yet
Lab 07 NR
6 pages
Statistical Tables and Formulae Guide
No ratings yet
Statistical Tables and Formulae Guide
8 pages
Tabla Poisson 022021 Final
No ratings yet
Tabla Poisson 022021 Final
5 pages
RSS Tables
No ratings yet
RSS Tables
18 pages
Transmittance-Absorbance Conversion Table
No ratings yet
Transmittance-Absorbance Conversion Table
3 pages
Database Fe2o3 Gamma
No ratings yet
Database Fe2o3 Gamma
3 pages
Lecture 08 Nonlinearity
No ratings yet
Lecture 08 Nonlinearity
26 pages
Standard Normal Distribution Table
No ratings yet
Standard Normal Distribution Table
3 pages
Survival Models in SAS Part 7: PROC PHREG - Part 2: May 21, 2008 Charlie Hallahan
No ratings yet
Survival Models in SAS Part 7: PROC PHREG - Part 2: May 21, 2008 Charlie Hallahan
30 pages
JCPDS Card 00-017-0306
No ratings yet
JCPDS Card 00-017-0306
3 pages
SSTA032 QUIZ 1 - Corrected
No ratings yet
SSTA032 QUIZ 1 - Corrected
7 pages
(Open This Document in 'Page Layout' View!) : TABLE 15: Cumulative Binomial Distribution - 1
No ratings yet
(Open This Document in 'Page Layout' View!) : TABLE 15: Cumulative Binomial Distribution - 1
8 pages
Cumulative Binomial Distribution Table
No ratings yet
Cumulative Binomial Distribution Table
9 pages
Tables Perf
No ratings yet
Tables Perf
3 pages
DW Criticalvalues
No ratings yet
DW Criticalvalues
95 pages
3 Tablas Poisson PDF
No ratings yet
3 Tablas Poisson PDF
4 pages
AC Voltage Controllers Overview
No ratings yet
AC Voltage Controllers Overview
47 pages
Policy POPM2W00103119182
No ratings yet
Policy POPM2W00103119182
13 pages
ImagineFX 11.2020
100% (2)
ImagineFX 11.2020
100 pages
New Lichen Species in Uttarakhand
No ratings yet
New Lichen Species in Uttarakhand
6 pages
Chicco OneFit Car Seat Product Manual
No ratings yet
Chicco OneFit Car Seat Product Manual
70 pages
Mindray BC 21s Auto Hematology Analyzer
No ratings yet
Mindray BC 21s Auto Hematology Analyzer
2 pages
Blood Sorcery, Adapted
100% (1)
Blood Sorcery, Adapted
81 pages
3.61st Quarter SK - Register of Cash in Bank and Other Related Financial Transaction
100% (1)
3.61st Quarter SK - Register of Cash in Bank and Other Related Financial Transaction
2 pages
The Bruce-Partington Plans Unveiled
No ratings yet
The Bruce-Partington Plans Unveiled
16 pages
SRGM Merged
No ratings yet
SRGM Merged
18 pages
Introduction to Scientific Programming in C
No ratings yet
Introduction to Scientific Programming in C
17 pages
M. Com. (Sem. - IV) Examination April - 2023 Financial and Management Account: Paper - X
No ratings yet
M. Com. (Sem. - IV) Examination April - 2023 Financial and Management Account: Paper - X
7 pages
Enheduana (The Hymn To Inana)
No ratings yet
Enheduana (The Hymn To Inana)
34 pages
Exam Osp
No ratings yet
Exam Osp
12 pages
HE6 - q1 - Mod13 - Assessing Preserved Processed Food Using Rubric
No ratings yet
HE6 - q1 - Mod13 - Assessing Preserved Processed Food Using Rubric
15 pages
Circular Motion Formula Sheet
No ratings yet
Circular Motion Formula Sheet
21 pages
Objective-Infinitive Construction Guide
No ratings yet
Objective-Infinitive Construction Guide
3 pages
Gargun JSW
No ratings yet
Gargun JSW
6 pages
Ordnance Factory Bhandara Apprenticeship 2024
No ratings yet
Ordnance Factory Bhandara Apprenticeship 2024
7 pages
B.Tech Project Report Submission
No ratings yet
B.Tech Project Report Submission
5 pages
Handout 8 Macro
No ratings yet
Handout 8 Macro
2 pages
Python Lists & AI Applications
No ratings yet
Python Lists & AI Applications
44 pages
Internship 2024
No ratings yet
Internship 2024
4 pages
Challenging Experiencesof English Major Studentsin Language
No ratings yet
Challenging Experiencesof English Major Studentsin Language
10 pages
Print Synopsis
No ratings yet
Print Synopsis
9 pages
2021 Toyota Hilux Accessories Catalogue
100% (1)
2021 Toyota Hilux Accessories Catalogue
2 pages
Airport Design Standard and Consideration (Not Sure)
100% (1)
Airport Design Standard and Consideration (Not Sure)
29 pages
Math 473/MAST666 Assignment 1 Solutions
No ratings yet
Math 473/MAST666 Assignment 1 Solutions
3 pages
Curriculum Map Grade 9
No ratings yet
Curriculum Map Grade 9
7 pages
Advanced Materials Management - Instructor
No ratings yet
Advanced Materials Management - Instructor
46 pages