Course Outline

The Foundations of Data Science course, taught by Ms. Sumaira Saeed in Spring 2025, focuses on data mining theory and algorithms, emphasizing practical skills using tools like KNIME and Python. Key topics include classification, regression, clustering, and data preprocessing, with a grading scheme based on midterms, finals, quizzes, and assignments. Students will gain knowledge in data-driven decision making and practical skills in data cleaning, transformation, and predictive modeling.

Uploaded by

m.mujtabarehan319

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

2 views2 pages

Course Outline

Uploaded by

m.mujtabarehan319

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 2

Course: Foundations of Data Science

Spring 2025
Name: Ms. Sumaira Saeed
Email: [email protected]
Counselling hours: Tues/Thurs 2:30 to 3:30

Course Description
The course introduces students to fundamentals of data mining theory and algorithms. In addition to
building a strong mathematical foundation, the course puts heavy emphasis on analysis and mining of
actual data sets via popular data mining tools such as KNIME and Python. The list of covered topics
include classification (k-nearest neighborhood, classification tree, naïve Bayes, random forest),
regression, clustering (k-means, fuzzy c-mean, hierarchical clustering), association rules and text mining.
Feature selection, data cleaning, data transformation, model evaluation and data visualization are also
covered in sufficient details.

Course Objectives
• To excite students about the potential that resides in data and the value that data analytics can
add to business processes
• To impart skills related to data cleaning/wrangling, data transformation/preprocessing, and data
comprehension through statistical analysis
• To impart skills related to analytical (mathematical) data modeling

Learning Outcomes
 Thorough knowledge about the science of data-driven decision making with respect to data
science and its relationship to solving core business problems, along with success stories
• Knowledge of data cleaning/wrangling in data science and practical skillset
• Knowledge on data transformation/ pre-processing in data science and practical skillset
• Practical skillset on extracting initial insights from data to facilitate data comprehension (through
hands-on activity)
• Theoretical mathematical knowledge about standard predictive modeling algorithms (supervised
learning).
• Practical skillset on how predictions can be generated from data.

Grading Scheme
Midterm- 30
Final Exam 40
Quiz 10
Assignments – 15
CP - 5
Course Outline

Week Topics
1 Course Overview, What is Data Mining and its Origin, Typical Data
Mining Tasks, Data Mining Applications/Examples, Data Mining vs.
OLAP, Statistics and Machine Learning
2 CRISP-DM Model , Data preparation, Data Cleaning, Introduction to
Decision Trees
3 Handling Continuous variables, Avoiding overfitting in Decision Trees,
Python Demo of DT
4 Variance-Bias Tradeoff, Receiver Evaluation Metrices
5 Lazy Learner vs. Eager Learner, k-Nearest Neighbor: Pros and Cons,
Hold-out Method vs Cross-Validation
6 ROC curve, Feature Selection and Correlation Analysis through
Hypothesis Testing, Scatterplots
7 Naïve Bayes Classifier, Feature Selection: Filter vs Wrappers, Forward
and Backward Selection
8 Ensemble Methods: Bagging vs Boosting, Working of Random Forest
and AdaBoost
9 Stacking, Revisiting Variance-Bias Tradeoff, Feature Reduction using
Principal Component Analysis (PCA) Python Code
10 Multiple Linear Regression, Regression Diagnostics and Evaluation
11 kNN Regression, Regression Tree and Tree Ensemble Regression
12 Clustering: Agglomerative vs Partitional
13 Association Rule Mining
14 Project Presentations

Reference Books
Principles of Data Mining by Max Bremer (2020)

Data Mining – Concepts, Models, Methods, and Algorithms by Mehmed Kantardzic (2020)

Data Mining for Business Analytics – Concepts, Techniques and Applications in Python (2020)

DATA MINING Syllabus
No ratings yet
DATA MINING Syllabus
1 page
Summer Training Project Report
100% (1)
Summer Training Project Report
72 pages
DM Day2 DataUnderstanding MS S25
No ratings yet
DM Day2 DataUnderstanding MS S25
165 pages
Unit-1
No ratings yet
Unit-1
148 pages
DM Day1 Intro MS F24 (1)
No ratings yet
DM Day1 Intro MS F24 (1)
111 pages
Data Mining Course Outline
No ratings yet
Data Mining Course Outline
7 pages
PAM - Complete
No ratings yet
PAM - Complete
322 pages
PPT 1.1.1
No ratings yet
PPT 1.1.1
42 pages
DataClassification
No ratings yet
DataClassification
65 pages
1676457507
No ratings yet
1676457507
113 pages
6_DM
No ratings yet
6_DM
2 pages
DSBA Curriculum Booklet
No ratings yet
DSBA Curriculum Booklet
14 pages
IT-416 Data Mining
No ratings yet
IT-416 Data Mining
3 pages
Course Outline ADV 08 - Data Mining
No ratings yet
Course Outline ADV 08 - Data Mining
3 pages
Guidelines Data mining-II BA Major Sem 4 NEP
No ratings yet
Guidelines Data mining-II BA Major Sem 4 NEP
2 pages
DM
No ratings yet
DM
2 pages
Adv. DM Intro
No ratings yet
Adv. DM Intro
11 pages
BCSE_0553
No ratings yet
BCSE_0553
1 page
Da Handbook
No ratings yet
Da Handbook
18 pages
154751920_DS- 311 Data Mining
No ratings yet
154751920_DS- 311 Data Mining
1 page
Co-Requisite: Prerequisite: Data Book / Codes/Standards Course Category Course Designed by Approval
No ratings yet
Co-Requisite: Prerequisite: Data Book / Codes/Standards Course Category Course Designed by Approval
2 pages
Sp24-DM-Teaching-plan-02042024-114322am
No ratings yet
Sp24-DM-Teaching-plan-02042024-114322am
7 pages
Course Outline (Ds & Ai) 2024
No ratings yet
Course Outline (Ds & Ai) 2024
13 pages
new-Guidelines-Datamining-I-UGCF-DSE-CS Hons-Sem 4-Jan 25
No ratings yet
new-Guidelines-Datamining-I-UGCF-DSE-CS Hons-Sem 4-Jan 25
3 pages
Guidelines-Datamining-I-UGCF-DSE-CS Hons-Sem 4-Jan2024
No ratings yet
Guidelines-Datamining-I-UGCF-DSE-CS Hons-Sem 4-Jan2024
3 pages
CourseOutline FDS
No ratings yet
CourseOutline FDS
2 pages
IOE Syllabus of Data Mining
No ratings yet
IOE Syllabus of Data Mining
2 pages
Business Analytics Outline
No ratings yet
Business Analytics Outline
4 pages
FCH_IME672A_JAN_2018
No ratings yet
FCH_IME672A_JAN_2018
2 pages
CS F415 DATA MINING L1
No ratings yet
CS F415 DATA MINING L1
4 pages
New Syllabus - COMP 482 Data Mining1674216496
No ratings yet
New Syllabus - COMP 482 Data Mining1674216496
3 pages
DMPA
No ratings yet
DMPA
5 pages
Course Details
No ratings yet
Course Details
2 pages
Kotter's 8 Steps To Leading Change
67% (3)
Kotter's 8 Steps To Leading Change
6 pages
3.6_Unit_Assessment_Question_Paper
No ratings yet
3.6_Unit_Assessment_Question_Paper
10 pages
RMM Unit-I Introdution To Data Mining
No ratings yet
RMM Unit-I Introdution To Data Mining
129 pages
CS F415 1322 Data Mining
No ratings yet
CS F415 1322 Data Mining
3 pages
Handout
No ratings yet
Handout
4 pages
dmsyll
No ratings yet
dmsyll
2 pages
Course Outline DM F13
No ratings yet
Course Outline DM F13
2 pages
Customer Satisfaction Towards Lux Soap
100% (1)
Customer Satisfaction Towards Lux Soap
71 pages
Aula 1 - Programa Mestrado Data Mining I 201617 v2
No ratings yet
Aula 1 - Programa Mestrado Data Mining I 201617 v2
6 pages
Ba 404
No ratings yet
Ba 404
2 pages
ME F321 - Data Minining in Mechanical Sciences - Handout - Jan 2023
No ratings yet
ME F321 - Data Minining in Mechanical Sciences - Handout - Jan 2023
4 pages
Syllabus
No ratings yet
Syllabus
12 pages
Data Mining Lesson Plan-Revised Syllabus
No ratings yet
Data Mining Lesson Plan-Revised Syllabus
4 pages
DM Guidelines 14jan2022
No ratings yet
DM Guidelines 14jan2022
5 pages
Data Mining Notes: 7 Semester. CS 1435: Syllabus
No ratings yet
Data Mining Notes: 7 Semester. CS 1435: Syllabus
4 pages
DMDW Lesson Plan
No ratings yet
DMDW Lesson Plan
8 pages
Course Objectives:: University of Mumbai, Information Technology (Semester V and VI) (Rev-2012)
No ratings yet
Course Objectives:: University of Mumbai, Information Technology (Semester V and VI) (Rev-2012)
5 pages
Summer Term 2024 Course Handout: Date: 28.05.2024
No ratings yet
Summer Term 2024 Course Handout: Date: 28.05.2024
3 pages
Guidelines-Datamining-I - UGCF-BA-major-sem 3 - July 24
No ratings yet
Guidelines-Datamining-I - UGCF-BA-major-sem 3 - July 24
3 pages
CS-DM MODULE -1
No ratings yet
CS-DM MODULE -1
27 pages
Manifestors Guide To Creative Urges by The Manifestor Community
No ratings yet
Manifestors Guide To Creative Urges by The Manifestor Community
16 pages
Data Mining and Business Intelligence
No ratings yet
Data Mining and Business Intelligence
4 pages
02601649091c6-Chapter 1 Logic Gate SC
No ratings yet
02601649091c6-Chapter 1 Logic Gate SC
3 pages
Gujarat Technological University: Page 1 of 2
No ratings yet
Gujarat Technological University: Page 1 of 2
2 pages
IT304 Data Warehousing and Mining
No ratings yet
IT304 Data Warehousing and Mining
2 pages
Btech Sem6 Cs1141 Data Mining
No ratings yet
Btech Sem6 Cs1141 Data Mining
5 pages
Data Mining Handout
No ratings yet
Data Mining Handout
4 pages
A4629ac494 Syllabus
No ratings yet
A4629ac494 Syllabus
3 pages
Retail Management Literature Review
100% (3)
Retail Management Literature Review
7 pages
B.Tech Jntuh DWDM Course Description
No ratings yet
B.Tech Jntuh DWDM Course Description
6 pages
LMS_Y22_ENDSEM_CRS22UC2204_SEATING_PLAN_18_12_2024_ALL_SLOTS
No ratings yet
LMS_Y22_ENDSEM_CRS22UC2204_SEATING_PLAN_18_12_2024_ALL_SLOTS
63 pages
Gujarat Technological University: Subject Name: Elective I - Data Warehousing & Data Mining (DWDM) Subject Code: 640005
No ratings yet
Gujarat Technological University: Subject Name: Elective I - Data Warehousing & Data Mining (DWDM) Subject Code: 640005
5 pages
Course Plan - Data Mining
No ratings yet
Course Plan - Data Mining
3 pages
Gaucher Friesen Kay 2011
No ratings yet
Gaucher Friesen Kay 2011
20 pages
Flexible AC Transmission System
No ratings yet
Flexible AC Transmission System
3 pages
Chapter 3 Characteristics of Driver, The Pedestrian, The Vehicle, and The Road
No ratings yet
Chapter 3 Characteristics of Driver, The Pedestrian, The Vehicle, and The Road
96 pages
Bank Kkkkk
No ratings yet
Bank Kkkkk
6 pages
Hydrogen Generator
No ratings yet
Hydrogen Generator
4 pages
PRACTICE /TƩ/ /DƷ/ /Ʃ/ /Ʒ/ SOUNDS
No ratings yet
PRACTICE /TƩ/ /DƷ/ /Ʃ/ /Ʒ/ SOUNDS
4 pages
Meniscal Root Injuries.3
No ratings yet
Meniscal Root Injuries.3
9 pages
Data Science Course Content Chapter 1: Introduction To Data Science
No ratings yet
Data Science Course Content Chapter 1: Introduction To Data Science
8 pages
Ac Series Literature PDF
0% (1)
Ac Series Literature PDF
8 pages
Guía Completa de Calistenia y Street Workout
No ratings yet
Guía Completa de Calistenia y Street Workout
137 pages
RFP CoE Resiliency - Final
No ratings yet
RFP CoE Resiliency - Final
4 pages
Rom31 99 PART I
100% (1)
Rom31 99 PART I
30 pages
APPLICation of Solving Polynomial Equation
No ratings yet
APPLICation of Solving Polynomial Equation
13 pages
Are NLP Models Really Able To Solve Simple Math Word Problems?
No ratings yet
Are NLP Models Really Able To Solve Simple Math Word Problems?
15 pages
Abhishek Electrical Industries Manufacturers, Suppliers, Exporters, Dealers in India
No ratings yet
Abhishek Electrical Industries Manufacturers, Suppliers, Exporters, Dealers in India
2 pages
Aluminium Glass Composite Facade System
No ratings yet
Aluminium Glass Composite Facade System
8 pages
NCSQualification Package
No ratings yet
NCSQualification Package
30 pages
Co Hen
No ratings yet
Co Hen
40 pages
QGCIO Sample SoA Annd Essential 8 For Workshop
No ratings yet
QGCIO Sample SoA Annd Essential 8 For Workshop
29 pages
Description: Remarks
No ratings yet
Description: Remarks
4 pages
02 Padure, L. Spastic Hip in Cerebral Palsy
No ratings yet
02 Padure, L. Spastic Hip in Cerebral Palsy
4 pages
Annex E Advance Payment Guarantee
No ratings yet
Annex E Advance Payment Guarantee
1 page
General Journal
No ratings yet
General Journal
12 pages
Data Science Unveiled: A Practical Guide to Key Techniques
From Everand
Data Science Unveiled: A Practical Guide to Key Techniques
Ed A Norex
No ratings yet

Course Outline

Uploaded by

Course Outline

Uploaded by

Course: Foundations of Data Science

You might also like