0% found this document useful (0 votes)

7 views39 pages

Big Data Analytics_Drivers

Uploaded by

baibhav2811

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

7 views39 pages

Big Data Analytics_Drivers

Uploaded by

baibhav2811

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 39

Big Data Analytics

Big Data Applications: Transforming Industries with

Data-Driven Insights
Big Data refers to the massive volumes of structured, semi-
structured, and unstructured data that organizations collect
daily. When processed and analyzed, this data unlocks powerful
insights across industries. Below are key applications of Big
1. Healthcare
Data in real-world scenarios.
Applications:
•Predictive Analytics: Identifying disease outbreaks (e.g.,
tracking Infection spread).
•Personalized Medicine: Genomic data analysis for tailored
treatments.
•EHR Optimization: Reducing medical errors by analyzing
patient records.
•Drug Discovery: AI-driven analysis of clinical trial data.
Example:
IBM Watson Health uses Big Data to analyze medical research
2. Finance & Banking
Applications:
•Fraud Detection: Machine learning models detect unusual
transactions in real time.
•Risk Management: Predictive analytics for credit scoring.
•Algorithmic Trading: Analyzing market trends for high-
frequency trading.
•Customer Insights: Personalized banking
recommendations.
Example:
PayPal uses Big Data to prevent fraudulent transactions,
saving millions annually.
3. Retail & E-Commerce
Applications:
•Recommendation Engines: Amazon & Netflix suggest
products/movies based on user behavior.
•Inventory Optimization: Predictive analytics for stock
management.
•Dynamic Pricing: Real-time price adjustments (e.g., Uber
surge pricing).
•Customer Sentiment Analysis: Social media monitoring for
brand perception.
Example:
Walmart analyzes 2.5 petabytes of customer data hourly to
optimize supply chains.
4. Manufacturing & IoT
Applications:
•Predictive Maintenance: Sensors detect machine failures
before they happen.
•Supply Chain Optimization: Real-time tracking of goods
via RFID/sensors.
•Smart Factories: AI-driven automation in Industry 4.0.
Example:
Tesla uses Big Data from vehicle sensors to improve self-
driving algorithms.
5. Telecommunications
Applications:
•Network Optimization: Analyzing call drops and
bandwidth usage.
•Customer Churn Prediction: Identifying users likely
to switch providers.
•5G Deployment: Managing massive data traffic
efficiently.
Example:
AT&T processes 500+ TB of data daily to enhance
network performance.
7. Government & Smart Cities
Applications:
•Crime Prediction: AI models analyze crime patterns
(e.g., PredPol).
•Traffic Management: Real-time analysis of
congestion data.
•Disaster Response: Social media & satellite data for
emergency management.
Example:
Singapore’s "Smart Nation" initiative uses Big Data for
urban planning.
8. Energy & Utilities
Applications:
•Smart Grids: Real-time electricity demand
forecasting.
•Oil & Gas Exploration: Analyzing seismic data for
drilling.
•Renewable Energy: Optimizing wind/solar farm
efficiency.
Example:
GE’s Predix platform analyzes sensor data from
turbines to prevent failures.
9. Media & Entertainment
Applications:
•Content Personalization: Spotify’s music
recommendations.
•Audience Analytics: Predicting box office success.
•Piracy Detection: Identifying illegal streaming.
Example:
Disney+ uses Big Data to recommend shows based
on viewing history.
10. Agriculture (AgTech)
Applications:
•Precision Farming: Drones & sensors monitor crop
health.
•Livestock Monitoring: Wearables track animal
health.
•Weather Prediction: AI models forecast
droughts/floods.
Example:
John Deere’s FarmSight uses Big Data to optimize
harvests.
6. Transportation & Logistics
Applications:
•Route Optimization: GPS + traffic data for efficient
deliveries.
•Autonomous Vehicles: Real-time sensor data
processing.
•Fleet Management: Predictive analytics for fuel
efficiency.
Example:
Uber uses Big Data to calculate ETAs and optimize
driver routes.
Categorization of Data
In statistics and data analysis, data can be classified into four main
types. These classifications help determine the appropriate statistical
methods, visualizations, and machine learning techniques to apply.

• Nominal
• Ordinal
• Ratio
• Interval
Nominal Data (Categorical, No Order)
•Definition: Categories with no inherent order or
ranking.
•Key Properties:
• Used for labeling variables.
• No mathematical meaning (only mode is
meaningful).
•Examples:
• Gender (Male, Female, Non-binary)
• Colors (Red, Blue, Green)
Analysis Methods:
• Country names (USA, Japan, Germany)
Frequency counts (Bar charts, Pie charts).
•Chi-square tests (checking relationships between
categories).
2. Ordinal Data (Ordered Categories, Unequal Intervals)
•Definition: Categories with a meaningful order but unknown
differences between them.
•Key Properties:
• Can be ranked, but arithmetic operations (mean, subtraction)
are invalid.
• Median & mode are meaningful, but mean is misleading.
•Examples:
• Education level (High School < Bachelor’s < Master’s < PhD)
• Customer ratings (Poor < Fair < Good < Excellent)
• Economic class (Low < Middle < High income)

Analysis Methods:
•Non-parametric tests (Mann-Whitney U, Kruskal-Wallis).
•Spearman’s rank correlation (measures ordinal relationships).
3. Interval Data (Ordered + Fixed Intervals, No True
Zero)
•Definition: Numeric data with consistent intervals but
no absolute zero.
•Key Properties:
• Differences between values are meaningful, but ratios
are not.
• Negative values are possible.
•Examples:
• Temperature (°C or °F) → 0°C doesn’t mean "no
temperature."
• Calendar years (2020, 2021, 2022) → Year 0 is arbitrary.

Analysis Methods:
•Mean, standard deviation.
•T-tests, ANOVA (parametric tests).
4. Ratio Data (Ordered + Fixed Intervals + True Zero)
•Definition: Numeric data with a true zero point, allowing
ratio comparisons.
•Key Properties:
• All arithmetic operations (+, −, ×, ÷) are valid.
• Cannot have negative values.
•Examples:
• Height, Weight → 0 kg means "no weight."
• Sales revenue → $0 means "no sales."
• Age → 0 years means birth.

Analysis Methods:
•All statistical methods apply (mean, median, regression).
•Geometric mean, coefficient of variation.
BIG DATA BUSINESS DRIVERS

Current Business Problems Provide Opportunities for Organizations to Become More

Analytical & Data Driven
1. Desire to Optimize Business Operations
•What it means: Companies use Big Data to streamline
processes, reduce costs, and maximize efficiency.
•Examples:
• Sales:
Analyzing customer purchase patterns to boost revenue.
• Pricing:
Dynamic pricing models (e.g., Uber surge pricing, airline
ticket adjustments).
• Profitability:
Identifying high-margin products or services.
• Efficiency:
2. Desire to Identify Business Risk
•What it means: Big Data helps detect and mitigate risks
proactively.
•Examples:
• Customer Churn:
Predicting which customers might leave (e.g., telecom
companies offering retention discounts).
• Fraud:
Real-time detection of suspicious transactions (e.g., credit
card fraud alerts).
• Default:
Assessing loan repayment risks (e.g., banks using credit
scoring models).
3. Predict New Business Opportunities
•What it means: Leveraging data to uncover growth
avenues.
•Examples:
• Upsell/Cross-sell: Recommending
complementary products (e.g., Amazon’s
“Frequently bought together”).
• Best New Customer Prospects: Targeted
marketing using demographic/behavioral data
(e.g., LinkedIn ad targeting).
4. Comply with Laws or Regulatory Requirements
•What it means: Using Big Data to meet legal and industry
standards.
•Examples:
• Anti-Money Laundering (AML): Banks tracking
unusual transaction patterns.
• Fraud Prevention: Healthcare providers detecting
false insurance claims.
• Fair Lending: Ensuring unbiased loan approvals via
algorithmic audits.
• Basel II: Financial institutions calculating risk-weighted
assets.
Why This Matters for Businesses

•Competitive Edge: Companies like Netflix and Walmart use these drivers to
outperform rivals.
•Cost Savings: Reducing fraud or inefficiencies directly impacts the bottom line.
•Innovation: Data-driven insights fuel new products/services (e.g., Tesla’s
autonomous driving).
Big Data Mart

A Big Data Mart is a specialized subset of a data

warehouse designed for a specific business function,
department, or subject area. Unlike traditional data marts (which
rely on structured data), a Big Data Mart incorporates large-
scale, multi-structured data (structured, semi-structured, and
unstructured) from sources like IoT, social media, logs, and
transactional systems.

It enables faster, more focused analytics for business units

(e.g., marketing, finance, operations) by providing curated, high-
performance access to relevant data.
Big Data Mart Types

Big Data Marts can be classified based on their data sourcing strategy,
architectural design, and business use cases.

1. Dependent Big Data Mart

A dependent data mart is built directly from an existing enterprise

data warehouse (EDW) or data lake, ensuring consistency with the
organization's central data repository.

Key Characteristics:

✔ Source: Pulls data from a centralized EDW or data lake.

✔ Governance: Follows the same data definitions, schemas, and
security policies as the EDW.
✔ Use Case: When business units need department-specific
analytics without compromising data integrity.
Advantages:

✅ Consistency – Data aligns with the enterprise warehouse.

✅ Lower Redundancy – Avoids duplicate data storage.
✅ Easier Maintenance – Changes in EDW automatically reflect in the mart.

Disadvantages:

❌ Slower Deployment – Requires coordination with central IT.

❌ Less Flexibility – Must adhere to EDW’s structure.

Example:

•A sales team extracts customer transaction data from the corporate EDW to
build a sales performance mart.
•A bank’s risk management team creates a fraud detection mart from
the central data warehouse.
2. Independent Big Data Mart
An independent data mart is created without relying on
a central data warehouse, often using direct data
feeds from operational systems or external sources.

Key Characteristics:
✔ Source: Built standalone, often from departmental
databases, cloud apps, or external APIs.
✔ Governance: Managed independently, leading to
potential silos.
✔ Use Case: When a business unit needs quick,
autonomous analytics without enterprise-wide
dependencies.
Advantages:
✅ Fast Deployment – No dependency on EDW.
✅ Flexibility – Can use custom schemas and unstructured
data.
✅ Cost-Effective – No need for large-scale EDW integration.

Disadvantages:
❌ Data Silos – May not align with enterprise data.
❌ Redundancy – Same data may exist in multiple marts.
❌ Governance Challenges – Harder to enforce compliance.

Example:
•A marketing team builds a campaign analytics mart using
Google Ads, Facebook, and CRM data.
•A healthcare research team creates a patient outcomes
mart from EHR and IoT wearable data.
3. Hybrid Big Data Mart
A hybrid data mart combines data from both the EDW
and external sources, offering a balance between central
governance and departmental flexibility.

Key Characteristics:
✔ Source: Mix of EDW data + external datasets (e.g.,
market trends, social media, IoT).
✔ Governance: Partially controlled by central IT but allows
custom integrations.
✔ Use Case: When business units need enriched
analytics beyond what the EDW provides.
Advantages:
✅ Best of Both Worlds – Combines enterprise data with external
insights.
✅ Enhanced Analytics – Enables 360-degree views (e.g., customer
behavior + market trends).
✅ Scalable – Can grow with business needs.

Disadvantages:
❌ Complex Integration – Requires ETL/ELT pipelines for merging
data.
❌ Higher Maintenance – Needs coordination between central and
local teams.

Example:
•A retailer’s pricing team combines internal sales
data with competitor pricing feeds (from web scraping).
•A financial services firm merges transaction records (from
EDW) with credit bureau data for risk modeling.
Data Lake?

A data lake is a centralized repository that stores raw,

unstructured, semi-structured, and structured
data in its native format (without predefined schema). It
allows organizations to store massive volumes of diverse
data (like text, images, logs, IoT streams, and databases)
for future processing and analysis.
Key Characteristics of a Data
Lake
Feature Description
Data is stored as-is; structure is applied
Schema-on-Read
only when read/analyzed.
Built on low-cost systems like Hadoop
Scalable Storage
(HDFS), Amazon S3, or Azure Blob.
Supports CSV, JSON, images, videos, logs,
Multi-Format
etc.
Cheaper than traditional databases (pay for
Cost-Effective
storage, not compute).
Enables SQL queries, ML, real-time
Flexible Analytics
processing, and batch analytics.

Kwasu-Csc204 Module 1 Big Data Computing and Security 2
No ratings yet
Kwasu-Csc204 Module 1 Big Data Computing and Security 2
22 pages
Industrial Ventilation A Manual of Recommended Practice For Operation and Maintenance 2nd Edition Acgih Download
100% (1)
Industrial Ventilation A Manual of Recommended Practice For Operation and Maintenance 2nd Edition Acgih Download
58 pages
Big Data Analysis by Deshbandhu
No ratings yet
Big Data Analysis by Deshbandhu
368 pages
Drivers For Big Data
No ratings yet
Drivers For Big Data
7 pages
2015 Renault Trafic 63463 PDF
No ratings yet
2015 Renault Trafic 63463 PDF
292 pages
Big Data Manual - Edited
No ratings yet
Big Data Manual - Edited
69 pages
DSBDA Unit 3 Notes
No ratings yet
DSBDA Unit 3 Notes
16 pages
Business Analytics Notes
No ratings yet
Business Analytics Notes
31 pages
IoT NOtes
No ratings yet
IoT NOtes
34 pages
Unit 2 Notes Data Analytics
No ratings yet
Unit 2 Notes Data Analytics
11 pages
Implementing Merchandise Plans
100% (4)
Implementing Merchandise Plans
19 pages
Big Data Analytics
No ratings yet
Big Data Analytics
19 pages
Big Data Analytics Nep Sem 2 23-24
No ratings yet
Big Data Analytics Nep Sem 2 23-24
15 pages
Attachment
No ratings yet
Attachment
25 pages
Kwasu-Csc204 Big Data Computing and Security-1
No ratings yet
Kwasu-Csc204 Big Data Computing and Security-1
57 pages
DA Answers
No ratings yet
DA Answers
30 pages
384736bf-fcc4-4a3c-820e-e1c5ba93916d-1.2-big-data
No ratings yet
384736bf-fcc4-4a3c-820e-e1c5ba93916d-1.2-big-data
23 pages
Big Data Analytics Unit-i
No ratings yet
Big Data Analytics Unit-i
38 pages
Big Data
No ratings yet
Big Data
67 pages
Chap 1
No ratings yet
Chap 1
41 pages
Business Analytics
No ratings yet
Business Analytics
34 pages
Unit I - BigData
No ratings yet
Unit I - BigData
47 pages
Unit 1
No ratings yet
Unit 1
23 pages
BIG DATA
No ratings yet
BIG DATA
54 pages
What's Is Big D-WPS Office
No ratings yet
What's Is Big D-WPS Office
3 pages
Big Data Analytics. Notes
No ratings yet
Big Data Analytics. Notes
32 pages
Present
No ratings yet
Present
6 pages
FUNDAMENTALS OF BIG DATA ANALYTICS Digital Notes
No ratings yet
FUNDAMENTALS OF BIG DATA ANALYTICS Digital Notes
121 pages
Intel - RKL-S Plamform: System Chipset: Cpu
No ratings yet
Intel - RKL-S Plamform: System Chipset: Cpu
71 pages
Resumos GLO
No ratings yet
Resumos GLO
20 pages
Big Data Analytics
No ratings yet
Big Data Analytics
9 pages
ETB 1 (Big Data)
No ratings yet
ETB 1 (Big Data)
28 pages
big data-one
No ratings yet
big data-one
9 pages
CS 329 Lecture One 2025
No ratings yet
CS 329 Lecture One 2025
28 pages
Big Data Analysis
No ratings yet
Big Data Analysis
39 pages
Introduction Part
No ratings yet
Introduction Part
5 pages
Big Data Analytics 1
No ratings yet
Big Data Analytics 1
21 pages
Ebook BigData Beginners
No ratings yet
Ebook BigData Beginners
15 pages
Introduction To Business Analytics
No ratings yet
Introduction To Business Analytics
63 pages
Presentation 20
No ratings yet
Presentation 20
31 pages
What Is Big Data
No ratings yet
What Is Big Data
4 pages
DBMS Unit1
No ratings yet
DBMS Unit1
30 pages
What Is Big Data Analytics-1
No ratings yet
What Is Big Data Analytics-1
9 pages
HY Syllabus Class 12 - 2024-25
No ratings yet
HY Syllabus Class 12 - 2024-25
4 pages
Seminar Report Alisha
No ratings yet
Seminar Report Alisha
22 pages
Introduction To Big Data Unit - 2
No ratings yet
Introduction To Big Data Unit - 2
75 pages
Continental Steel V Montano
No ratings yet
Continental Steel V Montano
1 page
Manoj Kumari Roll No. 20
No ratings yet
Manoj Kumari Roll No. 20
11 pages
BDA-1st Unit
No ratings yet
BDA-1st Unit
39 pages
Big Data Analytics02
No ratings yet
Big Data Analytics02
20 pages
Astm D7234-12 (Adhesion Strength of Coatings On Concrete)
No ratings yet
Astm D7234-12 (Adhesion Strength of Coatings On Concrete)
9 pages
UNIT Two Emerging Technology
No ratings yet
UNIT Two Emerging Technology
43 pages
Digital Paddlewheel Flow Meter: Features
No ratings yet
Digital Paddlewheel Flow Meter: Features
4 pages
Big Data Analytics
No ratings yet
Big Data Analytics
6 pages
Big Data Analytics
No ratings yet
Big Data Analytics
37 pages
Unit - 1 Bda
No ratings yet
Unit - 1 Bda
14 pages
Title - Concept of Big Data: Presented by - Divyanshu Upadhyay Naman Gupta Adarsh Pandey Pankaj Chaudhary Shivbrat Singh
No ratings yet
Title - Concept of Big Data: Presented by - Divyanshu Upadhyay Naman Gupta Adarsh Pandey Pankaj Chaudhary Shivbrat Singh
17 pages
Big Data Technology Report With Pages Removed
No ratings yet
Big Data Technology Report With Pages Removed
32 pages
MAEF636850781708236636 EOI Seekho Aur Kamao 18-19
No ratings yet
MAEF636850781708236636 EOI Seekho Aur Kamao 18-19
13 pages
Fundamentals Big DAta Read
100% (1)
Fundamentals Big DAta Read
61 pages
BJT AC Analysis Part 1 PDF
100% (1)
BJT AC Analysis Part 1 PDF
9 pages
Introduction To Big Data
No ratings yet
Introduction To Big Data
4 pages
Big Data
No ratings yet
Big Data
18 pages
Unit 1 - ETI (BDA)
No ratings yet
Unit 1 - ETI (BDA)
20 pages
Big Data Ashish
No ratings yet
Big Data Ashish
7 pages
Chapter 1
No ratings yet
Chapter 1
40 pages
Mosfet Testing PDF
100% (1)
Mosfet Testing PDF
3 pages
HIRA Night Works
No ratings yet
HIRA Night Works
13 pages
BDA Class1
No ratings yet
BDA Class1
26 pages
Introduction
No ratings yet
Introduction
17 pages
Privacy Information For Installation Features Windows 7 Privacy Statement For Installation Features
No ratings yet
Privacy Information For Installation Features Windows 7 Privacy Statement For Installation Features
13 pages
Compression: DMET501 - Introduction To Media Engineering
No ratings yet
Compression: DMET501 - Introduction To Media Engineering
26 pages
AVR128DA28 32 48 64 Data Sheet 40002183C
No ratings yet
AVR128DA28 32 48 64 Data Sheet 40002183C
684 pages
03-Lab Manual CC2231
No ratings yet
03-Lab Manual CC2231
15 pages
Pari 1
No ratings yet
Pari 1
35 pages
University of Cambridge International Examinations International General Certificate of Secondary Education
0% (1)
University of Cambridge International Examinations International General Certificate of Secondary Education
109 pages
Lithium-Ion Battery: Specification
No ratings yet
Lithium-Ion Battery: Specification
14 pages
DIAGNOSTIC AND LABORATORY TESTS (Lecture) 1
No ratings yet
DIAGNOSTIC AND LABORATORY TESTS (Lecture) 1
4 pages
Ca Inter FM List of Important Concepts & List of Important Questions
No ratings yet
Ca Inter FM List of Important Concepts & List of Important Questions
5 pages
Applied Electronics Paper - IV: B.E. Sixth Semester (Aeronautical Engineering) (C.B.S.)
No ratings yet
Applied Electronics Paper - IV: B.E. Sixth Semester (Aeronautical Engineering) (C.B.S.)
2 pages
Write The Room
No ratings yet
Write The Room
11 pages
Proof of Concept (POC) in Automation Testing - 5
No ratings yet
Proof of Concept (POC) in Automation Testing - 5
3 pages
Презентация По Английском Языку На Тему - СМИ - (8 Класс)
No ratings yet
Презентация По Английском Языку На Тему - СМИ - (8 Класс)
13 pages
Pci Leasing and Finance
No ratings yet
Pci Leasing and Finance
6 pages
Understanding Compilers Presentation
No ratings yet
Understanding Compilers Presentation
7 pages
4th Sem Exam Fees Paid Yogi
No ratings yet
4th Sem Exam Fees Paid Yogi
1 page
Epie Vs Ulat-Marredo
No ratings yet
Epie Vs Ulat-Marredo
1 page
Shell Script for Apache Server and Firewall Configuration
No ratings yet
Shell Script for Apache Server and Firewall Configuration
10 pages
Polity (Articles Compilation June2024-Jan2025) M IE Explained - All Subjects (Dec 2025)
No ratings yet
Polity (Articles Compilation June2024-Jan2025) M IE Explained - All Subjects (Dec 2025)
23 pages
Windows Movie Maker
100% (2)
Windows Movie Maker
6 pages
Op-Amp 2
No ratings yet
Op-Amp 2
17 pages

Big Data Analytics_Drivers

Uploaded by

Big Data Analytics_Drivers

Uploaded by

Big Data Analytics

Big Data Applications: Transforming Industries with

Current Business Problems Provide Opportunities for Organizations to Become More

A Big Data Mart is a specialized subset of a data

It enables faster, more focused analytics for business units

1. Dependent Big Data Mart

A dependent data mart is built directly from an existing enterprise

✔ Source: Pulls data from a centralized EDW or data lake.

✅ Consistency – Data aligns with the enterprise warehouse.

❌ Slower Deployment – Requires coordination with central IT.

A data lake is a centralized repository that stores raw,

You might also like