0% found this document useful (0 votes)

2 views9 pages

MultiTask DL

cupidatat quis aliqua culpa ut duis cupidatat proident eiusmod aliquip pariatur magna fugiat anim reprehenderit magna sit duis adipisicing adipisicing labore ad excepteur Lorem excepteur aliquip laboris do exercitation aliquip officia voluptate quis velit do ad commodo minim exercitation mollit quis amet anim nisi veniam ipsum pariatur irure in exercitation labore aute et aliquip magna laborum nisi deserunt laborum ut velit ad nisi sunt exercitation dolor nisi enim reprehenderit non enim proiden

Uploaded by

Shishir Tamrakar

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

2 views9 pages

MultiTask DL

Uploaded by

Shishir Tamrakar

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 9

Deep Learning Srihari

Multi-task Learning

Sargur N. Srihari
[email protected]

1
Deep Learning Srihari

Regularization Strategies
1. Parameter Norm Penalties 8. Early Stopping
2. Norm Penalties as 6. Parameter tying and
Constrained Optimization parameter sharing
3. Regularization and Under- 7. Sparse representations
constrained Problems 8. Bagging and other
4. Data Set Augmentation ensemble methods
5. Noise Robustness 9. Dropout
6. Semi-supervised learning 10. Adversarial training
7. Multi-task learning 11. Tangent methods

2
Deep Learning Srihari

Sharing parameters over tasks

• Multi-task learning is a way to improve
generalization by pooling the examples out of
several tasks
– Examples can be seen as providing soft constraints
on the parameters
• In the same way that additional training
examples put more pressure on the parameters
of the model towards values that generalize
well
3
Deep Learning Srihari

Common form of multitask learning

• Different supervised tasks, predicting y(i) given x
• Share the same input x, as well as some
intermediate representation h(shared) capturing a
common pool of factors

4
Deep Learning Srihari

Ex: Autonomous Navigation

y(1) y(2) y(3) 5

Deep Learning Srihari

Common multi-task situation

• Common input but different
target random variables
• Lower layers (whether feedforward
or includes a generative component
with downward arrows)
can be shared across such tasks.
• Task-specific parameters h(1), h(2)
can be learned on top of those yielding
a shared representation h(shared)
Common pool of factors explain variations of
Input x while each task is associated with a
Subset of these factors

6
Deep Learning Srihari

Multi-task in Unsupervised Learning

• In the unsupervised learning context

• some of the top level factors are associated with none
of the output tasks h(3)
These are factors that explain some of the input
variations but not relevant for predicting h(1), h(2)

7
Deep Learning Srihari

Model can be divided into two parts

1. Task specific parameters
– Which only benefit from the examples of their task
to achieve good generalization
• These are the upper layers of the neural network
2. Generic parameters
– Shared across all tasks
• Which benefit from the pooled data of all tasks
• These are the lower levels of the neural network

8
Deep Learning Srihari

Benefits of multi-tasking
• Improved generalization and generalization
error bounds
– achieved due to shared parameters
• For which statistical strength can be greatly improved
– In proportion to the increased no. of examples for the shared
parameters compared to the scenario of single-task models

• From the point of view of deep learning, the

underlying prior belief is the following:
– Among the factors that explain the variations
observed in the data associated with different tasks,
some are shared across two or more tasks
9

Eleeza - The Art of Eliza Ivanova - With Signed Bookplate - 3dtotal Shop
0% (1)
Eleeza - The Art of Eliza Ivanova - With Signed Bookplate - 3dtotal Shop
16 pages
API Mode Reference-Guide
No ratings yet
API Mode Reference-Guide
60 pages
Slipknot Logo
No ratings yet
Slipknot Logo
3 pages
5.2 MLBasics-Capacity
No ratings yet
5.2 MLBasics-Capacity
30 pages
8.2 NNOptimization
No ratings yet
8.2 NNOptimization
17 pages
5.11 MLBasics-Challenges
No ratings yet
5.11 MLBasics-Challenges
20 pages
Greedy-Layerwise in Deep Learning
No ratings yet
Greedy-Layerwise in Deep Learning
15 pages
Regularization in Neural Networks: Sargur Srihari Srihari@buffalo - Edu
No ratings yet
Regularization in Neural Networks: Sargur Srihari Srihari@buffalo - Edu
31 pages
5.3 MLBasics Hyperparam
No ratings yet
5.3 MLBasics Hyperparam
13 pages
ArchitectureDesign For DeepLearning
No ratings yet
ArchitectureDesign For DeepLearning
34 pages
9.2 CNN-Motivation
No ratings yet
9.2 CNN-Motivation
17 pages
Distral Original Paper
No ratings yet
Distral Original Paper
13 pages
NLP-NeuralNetworks Reading Notes
No ratings yet
NLP-NeuralNetworks Reading Notes
13 pages
6.1 DeepFFNets
No ratings yet
6.1 DeepFFNets
47 pages
Deep Feedforward Networks
No ratings yet
Deep Feedforward Networks
103 pages
9.5 CNN-Variants
No ratings yet
9.5 CNN-Variants
21 pages
8.5 AdaptiveLearning
No ratings yet
8.5 AdaptiveLearning
15 pages
11.2 BaselineModels
No ratings yet
11.2 BaselineModels
6 pages
Deep Learning Unit 2
No ratings yet
Deep Learning Unit 2
25 pages
sminton,+13445-Article+(PDF)-30493-1-11-20220502
No ratings yet
sminton,+13445-Article+(PDF)-30493-1-11-20220502
74 pages
2018_Learning to Multitask_Zhang Et Al_Curran Associates, Inc.
No ratings yet
2018_Learning to Multitask_Zhang Et Al_Curran Associates, Inc.
12 pages
Unit 5 (Second Half)
No ratings yet
Unit 5 (Second Half)
10 pages
Do Deep Nets Really Need to be Deep
No ratings yet
Do Deep Nets Really Need to be Deep
9 pages
diligenti2017
No ratings yet
diligenti2017
4 pages
10.5 DeepRecurrent
No ratings yet
10.5 DeepRecurrent
8 pages
21.3 VAE Apps
No ratings yet
21.3 VAE Apps
29 pages
The Little Book of Deep Learning
No ratings yet
The Little Book of Deep Learning
168 pages
Stochastic Backpropagation and Approximate Inference in Deep Generative Models
No ratings yet
Stochastic Backpropagation and Approximate Inference in Deep Generative Models
14 pages
Unit Ii
No ratings yet
Unit Ii
8 pages
RADL TQKhoat
No ratings yet
RADL TQKhoat
50 pages
3
No ratings yet
3
11 pages
Unit 3
No ratings yet
Unit 3
110 pages
10.1 UnfoldingGraphs
No ratings yet
10.1 UnfoldingGraphs
16 pages
Deep Learning Module 3
No ratings yet
Deep Learning Module 3
15 pages
Unit - V
No ratings yet
Unit - V
44 pages
DL_M2_Regularization
No ratings yet
DL_M2_Regularization
12 pages
AML_mod4
No ratings yet
AML_mod4
22 pages
10.2.4 RNN-Context
No ratings yet
10.2.4 RNN-Context
10 pages
How To Transfer Algorithmic Reasoning Knowledge To Learn New Algorithms?
No ratings yet
How To Transfer Algorithmic Reasoning Knowledge To Learn New Algorithms?
21 pages
Table of Content
No ratings yet
Table of Content
9 pages
Deep Learning Material
No ratings yet
Deep Learning Material
136 pages
Lec1 Introduction
No ratings yet
Lec1 Introduction
60 pages
2 CNN-Motivation
No ratings yet
2 CNN-Motivation
17 pages
Towards Causal Representation Learning
No ratings yet
Towards Causal Representation Learning
24 pages
20 StatMechDeep
No ratings yet
20 StatMechDeep
30 pages
conmatphys-031119-050745
No ratings yet
conmatphys-031119-050745
28 pages
Statistics Mechanic of Deep Learning
No ratings yet
Statistics Mechanic of Deep Learning
28 pages
Data - and AI-driven Methods in Engineering
No ratings yet
Data - and AI-driven Methods in Engineering
40 pages
2010 07140 PDF
No ratings yet
2010 07140 PDF
34 pages
Module 1.Pptx
No ratings yet
Module 1.Pptx
64 pages
2020_Which Tasks Should Be Learned Together in Multi-task Learning_Standley et al_PMLR
No ratings yet
2020_Which Tasks Should Be Learned Together in Multi-task Learning_Standley et al_PMLR
13 pages
Mapping the Neuro-Symbolic AI Landscape by Architectures: A Handbook on Augmenting Deep Learning Through Symbolic Reasoning
No ratings yet
Mapping the Neuro-Symbolic AI Landscape by Architectures: A Handbook on Augmenting Deep Learning Through Symbolic Reasoning
57 pages
Unit 2.1
No ratings yet
Unit 2.1
37 pages
Deep Learning Midsem Merged Previous Batch
No ratings yet
Deep Learning Midsem Merged Previous Batch
423 pages
UNIT-2 Foundations of Deep Learning
No ratings yet
UNIT-2 Foundations of Deep Learning
64 pages
Cheatsheets For Deep Learning 1650192034
No ratings yet
Cheatsheets For Deep Learning 1650192034
95 pages
DL Theory
No ratings yet
DL Theory
20 pages
Machine Learning and Pattern Recognition Week 8 - Neural - Net - Fitting
No ratings yet
Machine Learning and Pattern Recognition Week 8 - Neural - Net - Fitting
3 pages
generalize_DL_2023
No ratings yet
generalize_DL_2023
28 pages
1710 11573 PDF
No ratings yet
1710 11573 PDF
14 pages
Unit II
No ratings yet
Unit II
27 pages
Neural Networks For Machine Learning: Lecture 9a Overview of Ways To Improve Generalization
No ratings yet
Neural Networks For Machine Learning: Lecture 9a Overview of Ways To Improve Generalization
39 pages
Design Patterns Made Easy: A Practical Guide with Examples
From Everand
Design Patterns Made Easy: A Practical Guide with Examples
William E. Clark
No ratings yet
Trs 80 Model 1 Clone
No ratings yet
Trs 80 Model 1 Clone
46 pages
Ed0754a 50a10 Ab4d
No ratings yet
Ed0754a 50a10 Ab4d
3 pages
Basic Concepts of Reliability
No ratings yet
Basic Concepts of Reliability
9 pages
Aiir Condition Specifications
No ratings yet
Aiir Condition Specifications
24 pages
Varnish and Resin Usage With Various Motor Constructions
No ratings yet
Varnish and Resin Usage With Various Motor Constructions
6 pages
Lis32 Topic Outline Updated
No ratings yet
Lis32 Topic Outline Updated
3 pages
LSAT Logic Arguments Free Preview
No ratings yet
LSAT Logic Arguments Free Preview
3 pages
Streamlined Risk and Controls Management: How Do Organizations Use Workiva Solutions?
No ratings yet
Streamlined Risk and Controls Management: How Do Organizations Use Workiva Solutions?
3 pages
Zavilife Skincare Pitch Deck - Detailed Slide Guide
No ratings yet
Zavilife Skincare Pitch Deck - Detailed Slide Guide
4 pages
Lab 3 Communication System D
No ratings yet
Lab 3 Communication System D
14 pages
Artificial Intelligence- Friend or Foe
No ratings yet
Artificial Intelligence- Friend or Foe
1 page
The DCS-1800 Communication System: Although DCS-1800 Is Considered A
No ratings yet
The DCS-1800 Communication System: Although DCS-1800 Is Considered A
2 pages
wind turbine generator
No ratings yet
wind turbine generator
14 pages
Checkpoint of Vulcanization of Bladder
No ratings yet
Checkpoint of Vulcanization of Bladder
2 pages
Ebooks File (Ebook PDF) Data Structures and Problem Solving Using Java 4th Edition All Chapters
86% (7)
Ebooks File (Ebook PDF) Data Structures and Problem Solving Using Java 4th Edition All Chapters
41 pages
Chapter08 - Delivering Requirements Business Solution
No ratings yet
Chapter08 - Delivering Requirements Business Solution
49 pages
A Mathematical Model For Supply Chain Management of Blood Banks in India
No ratings yet
A Mathematical Model For Supply Chain Management of Blood Banks in India
12 pages
Diagnostic Table ZDC10: Intercom System
No ratings yet
Diagnostic Table ZDC10: Intercom System
1 page
Dirt Bike Running Case 3-2
No ratings yet
Dirt Bike Running Case 3-2
3 pages
Accu-Lube LB-4000__ GB
No ratings yet
Accu-Lube LB-4000__ GB
2 pages
As-7m144-Bhc 530W 550W Monocrystalline Module
No ratings yet
As-7m144-Bhc 530W 550W Monocrystalline Module
2 pages
New Society Registraction Rajasthan
No ratings yet
New Society Registraction Rajasthan
17 pages
Test Javascript
No ratings yet
Test Javascript
61 pages
Chitransh REPORT Final
No ratings yet
Chitransh REPORT Final
62 pages
Daytona Cockpit
0% (1)
Daytona Cockpit
1 page
Zerodha Amibroker
No ratings yet
Zerodha Amibroker
18 pages
42 LN 5700
No ratings yet
42 LN 5700
52 pages

MultiTask DL

Uploaded by

MultiTask DL

Uploaded by

Deep Learning Srihari

Sharing parameters over tasks

Common form of multitask learning

Ex: Autonomous Navigation

y(1) y(2) y(3) 5

Common multi-task situation

Multi-task in Unsupervised Learning

• In the unsupervised learning context

Model can be divided into two parts

• From the point of view of deep learning, the

You might also like