深度學習入門4强化學習 (簡體) 部分166

The document contains a list of references related to reinforcement learning and robotics, including works on deep Q-learning and solving Rubik's cube with a robotic hand. It cites various preprints and conference proceedings from notable authors in the field. The references highlight ongoing research and perspectives on reinforcement learning techniques and applications.

Uploaded by

liang

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

59 views2 pages

深度學習入門4强化學習 (簡體) 部分166

Uploaded by

liang

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

参考文献 I 313

[44] Azal i a M 的 ose i n i , e t al. "Chip placemen t with deep re info rceme11 t learn i ng." arX1v
pre pri nt arX iv:2004. l 0746 (2020).
[45] Il ge A烛aya, e t a l. "Solvi ng rub i k's cube with a robo t hand." arXi v prepri nt arX i v
I 910.071 13 (2019).
[46] Sergey Lev ine, et a l. "Offlin e re inforcemen t learni 11 g: Tu torial, rev i ew, and perspec ti ves
on open problems. " 扣沁v pre pr int arXi v:2005.01643 (2020)

[47] Todd Hes ter, et a l. "Deep Q-learn i n g fr om Demons tra ti ons." Proceed i n gs o f t he
AAAI Conference on 凡tifi c i a l In tell igence. Vo l. 32. No. 1. 2018.
[48] Dav id Si lver, e t a l. " Reward is enou gh." Ar tifi c i al In telligence 299 (2021) : 103535.

附录 C

[49] horom a1-y 「 D QN 0)迪化史＠ Dou ble-D QN, Duelin g-ne tw ork, No i sy network 」

参考文献313

[46] Sergey Levine, et al. Ofline reinforeement leaming: Tutorial, review, and perspectives

[4]Todd Hester, et al. "Deep Q-leaming from Demonstrations." Proceedings of the

[45] Ilge Akkaye, et al, "Solving rubik's cube with a robot hand." arXiv preprint arXiv
Azalia Mirboseini, et al. "Chip placement with deep reinforcement leaming," arXiv

[48] David Silver, etal. "Reward is enongh." Artificial Intelligence 299 (2021): 103535.

[49] horomary [DQN の通化史② Double-DQN, Dueling-network, Noisymetwork]

AAAI Conference on Artificial Intlligence. Vol. 32. No. 1. 2018.
on open problems." arXiv preprint arXiv:2005.01643 (2020).
preprint arXiv:2004.10746 (2020)

1910.07113 (2019)

录C
[44]
丫

-
,
I`

RL Report
No ratings yet
RL Report
37 pages
Towards Monocular Vision Based Obstacle Avoidance Through Deep Reinforcement Learning
No ratings yet
Towards Monocular Vision Based Obstacle Avoidance Through Deep Reinforcement Learning
14 pages
Expert Systems - 2022 - Wang - Dexterous Robotic Manipulation Using Deep Reinforcement Learning and Knowledge Transfer For
No ratings yet
Expert Systems - 2022 - Wang - Dexterous Robotic Manipulation Using Deep Reinforcement Learning and Knowledge Transfer For
19 pages
Deep Deformable Q-Network An Extension of Deep Q-Network
No ratings yet
Deep Deformable Q-Network An Extension of Deep Q-Network
4 pages
Deep Reinforcement Learning Techniques
No ratings yet
Deep Reinforcement Learning Techniques
29 pages
A Deep Reinforcement-Learning Approach For Inverse Kinematics Solution of A High Degree of Freedom Robotic Manipulator
No ratings yet
A Deep Reinforcement-Learning Approach For Inverse Kinematics Solution of A High Degree of Freedom Robotic Manipulator
17 pages
13-RL DRL
No ratings yet
13-RL DRL
102 pages
Human-Level Control Through Deep Reinforcement Learning
No ratings yet
Human-Level Control Through Deep Reinforcement Learning
13 pages
Nature 14236
No ratings yet
Nature 14236
13 pages
Deep Q-Learning
No ratings yet
Deep Q-Learning
14 pages
18 Deeprl
No ratings yet
18 Deeprl
19 pages
Lecture 6 Deep Q Network and Its Variants
No ratings yet
Lecture 6 Deep Q Network and Its Variants
59 pages
RLDL PBL AmriteshChandra 09411503121
No ratings yet
RLDL PBL AmriteshChandra 09411503121
15 pages
Playing Tetris With Deep Reinforcement Learning: Matt Stevens Sabeek Pradhan
No ratings yet
Playing Tetris With Deep Reinforcement Learning: Matt Stevens Sabeek Pradhan
7 pages
Mobile Robot Navigation with DRL
No ratings yet
Mobile Robot Navigation with DRL
12 pages
Chapter 1 Introduction RL Report Kiran
No ratings yet
Chapter 1 Introduction RL Report Kiran
2 pages
Untitled Document
No ratings yet
Untitled Document
11 pages
DDQN PDF
No ratings yet
DDQN PDF
13 pages
Continuous Deep Q-Learning With Model-Based Acceleration: Shixiang Gu Timothy Lillicrap Ilya Sutskever Sergey Levine
No ratings yet
Continuous Deep Q-Learning With Model-Based Acceleration: Shixiang Gu Timothy Lillicrap Ilya Sutskever Sergey Levine
10 pages
Towards Adapting Reinforcement Learning Agents To New Tasks: Insights From Q-Values
No ratings yet
Towards Adapting Reinforcement Learning Agents To New Tasks: Insights From Q-Values
10 pages
Lecture 6 Deep Q Network and Its Variants 21 40
No ratings yet
Lecture 6 Deep Q Network and Its Variants 21 40
20 pages
CS6700 Reinforcement Learning Assignment
No ratings yet
CS6700 Reinforcement Learning Assignment
17 pages
Hierarchical Reinforcement Learning For Swarm Confrontation With High Uncertainty
No ratings yet
Hierarchical Reinforcement Learning For Swarm Confrontation With High Uncertainty
15 pages
Assignment3 Report MDS202312
No ratings yet
Assignment3 Report MDS202312
2 pages
Control of Nonholonomic Vehicle System Using Hierarchical Deep Reinforcement Learning
No ratings yet
Control of Nonholonomic Vehicle System Using Hierarchical Deep Reinforcement Learning
4 pages
Chapter 1
No ratings yet
Chapter 1
33 pages
Complexity - 2021 - Kayakoku - A Novel Behavioral Strategy For RoboCode Platform Based On Deep Q Learning
No ratings yet
Complexity - 2021 - Kayakoku - A Novel Behavioral Strategy For RoboCode Platform Based On Deep Q Learning
14 pages
Hota ML ReinforcementLearning
No ratings yet
Hota ML ReinforcementLearning
12 pages
Continuous Deep Q-Learning Acceleration
No ratings yet
Continuous Deep Q-Learning Acceleration
13 pages
Deep Q-Learning for Pacman Game
No ratings yet
Deep Q-Learning for Pacman Game
6 pages
Q-Transformer: Scalable Offline RL Method
No ratings yet
Q-Transformer: Scalable Offline RL Method
20 pages
Q-Learning Assignment for CS 285
No ratings yet
Q-Learning Assignment for CS 285
6 pages
Reinforcement Learning in Super Mario
No ratings yet
Reinforcement Learning in Super Mario
59 pages
Curiosity-Driven RL for Robot Tasks
No ratings yet
Curiosity-Driven RL for Robot Tasks
17 pages
Teaching Robots via Imitation and Feedback
No ratings yet
Teaching Robots via Imitation and Feedback
8 pages
Sensors 23 02036
No ratings yet
Sensors 23 02036
24 pages
Ref 11
No ratings yet
Ref 11
12 pages
Unit Iv Deep Q Learning
No ratings yet
Unit Iv Deep Q Learning
27 pages
Multi-Agent Deep Reinforcement Learning-Based Robo
No ratings yet
Multi-Agent Deep Reinforcement Learning-Based Robo
35 pages
Sim-to-Real RL for Humanoid Manipulation
No ratings yet
Sim-to-Real RL for Humanoid Manipulation
12 pages
Efficient Deep RL for Robotic Walking
No ratings yet
Efficient Deep RL for Robotic Walking
10 pages
Deep Reinforcement Learning in Poker Game
No ratings yet
Deep Reinforcement Learning in Poker Game
12 pages
DDRQN for Multi-Agent Riddle Solving
No ratings yet
DDRQN for Multi-Agent Riddle Solving
10 pages
Ref 1
No ratings yet
Ref 1
7 pages
RL vs DRL: Robotics Arm Motion Planning
No ratings yet
RL vs DRL: Robotics Arm Motion Planning
9 pages
Yang 20 A
No ratings yet
Yang 20 A
4 pages
Op Tim Ization
No ratings yet
Op Tim Ization
19 pages
HER With Demonstration
No ratings yet
HER With Demonstration
8 pages
Relational RL for Multi-Object Manipulation
No ratings yet
Relational RL for Multi-Object Manipulation
10 pages
Deep Reinforcement Learning from Human Preferences (深度强化学习来自人类偏好)
No ratings yet
Deep Reinforcement Learning from Human Preferences (深度强化学习来自人类偏好)
9 pages
Lecture 7
No ratings yet
Lecture 7
52 pages
DQN and Q-Learning Experiment Analysis
No ratings yet
DQN and Q-Learning Experiment Analysis
5 pages
Re Max
No ratings yet
Re Max
36 pages
Deep RL from Human Preferences
No ratings yet
Deep RL from Human Preferences
17 pages
Pac-Man RL Algorithms Project Proposal
No ratings yet
Pac-Man RL Algorithms Project Proposal
1 page
Reinforcement Learning in Aircraft Warfare Game
No ratings yet
Reinforcement Learning in Aircraft Warfare Game
3 pages
Efficient Deep Reinforcement Learning for Game Strategy
No ratings yet
Efficient Deep Reinforcement Learning for Game Strategy
12 pages
Dexterous Manipulation With Deep Reinforcement Learning: Efficient, General, and Low-Cost
No ratings yet
Dexterous Manipulation With Deep Reinforcement Learning: Efficient, General, and Low-Cost
8 pages
OSPF and Is-Is - A Comparative Anatomy
No ratings yet
OSPF and Is-Is - A Comparative Anatomy
48 pages
MBGP
No ratings yet
MBGP
44 pages
Deploying OSPF2205
No ratings yet
Deploying OSPF2205
45 pages
BGP A
No ratings yet
BGP A
16 pages
LMSMBGP
No ratings yet
LMSMBGP
44 pages
SFTRST
No ratings yet
SFTRST
14 pages
BGP1
No ratings yet
BGP1
60 pages
Icsbgp 4
No ratings yet
Icsbgp 4
66 pages
ISP Policy Implementation Case Study V 1 31
No ratings yet
ISP Policy Implementation Case Study V 1 31
28 pages
BGP Med
No ratings yet
BGP Med
19 pages
RFC 1771
No ratings yet
RFC 1771
58 pages
Intro To BGP
No ratings yet
Intro To BGP
59 pages
Bgpprop
No ratings yet
Bgpprop
16 pages
Deploying BGP
No ratings yet
Deploying BGP
51 pages
Multi Homing
No ratings yet
Multi Homing
45 pages
Bgpcasestudy
No ratings yet
Bgpcasestudy
88 pages
BGP 4
No ratings yet
BGP 4
100 pages
Trans Oceanic Systems BGP
No ratings yet
Trans Oceanic Systems BGP
7 pages
Avi BGP
No ratings yet
Avi BGP
55 pages
3 Bgpintro
No ratings yet
3 Bgpintro
24 pages
4 Bgpcont
No ratings yet
4 Bgpcont
59 pages
BGP Cisco
No ratings yet
BGP Cisco
162 pages
0 Value of Peering
No ratings yet
0 Value of Peering
37 pages
Configuring and Troubleshooting: 0943 - 03F8 - c2 NW98 - US - 102 1
No ratings yet
Configuring and Troubleshooting: 0943 - 03F8 - c2 NW98 - US - 102 1
85 pages
深度學習入門4强化學習 (簡體) 部分165
No ratings yet
深度學習入門4强化學習 (簡體) 部分165
2 pages
EPEAT Network Equipment Criteria - FINAL April 2021
No ratings yet
EPEAT Network Equipment Criteria - FINAL April 2021
75 pages
1 IXP Network Design
No ratings yet
1 IXP Network Design
63 pages
Internet Internet
No ratings yet
Internet Internet
11 pages
Internet Internet
No ratings yet
Internet Internet
12 pages
3D Text and SVG Creation in ZBrush
No ratings yet
3D Text and SVG Creation in ZBrush
12 pages
Cats: The Superior Pet Choice
No ratings yet
Cats: The Superior Pet Choice
2 pages
Agha Khan Board SSC Syllabus Chemistry
0% (1)
Agha Khan Board SSC Syllabus Chemistry
60 pages
Ch02 D (Vergin)
No ratings yet
Ch02 D (Vergin)
2 pages
The Silent Struggles of Mariana
No ratings yet
The Silent Struggles of Mariana
4 pages
Coulter ACT DIFF
No ratings yet
Coulter ACT DIFF
196 pages
BA Chapter 1 Managing Personal Performance and Development Resource Wo...
No ratings yet
BA Chapter 1 Managing Personal Performance and Development Resource Wo...
34 pages
Ucsp 8
No ratings yet
Ucsp 8
7 pages
Data Mining Techniques and Applications
No ratings yet
Data Mining Techniques and Applications
3 pages
Education: Anne G. Mooney
No ratings yet
Education: Anne G. Mooney
11 pages
Ôn Tập Ngữ Âm và Trọng Âm
No ratings yet
Ôn Tập Ngữ Âm và Trọng Âm
1 page
Information On Brine Peeling
No ratings yet
Information On Brine Peeling
4 pages
Elem 10A
No ratings yet
Elem 10A
12 pages
Critical Path Method in Construction Scheduling
No ratings yet
Critical Path Method in Construction Scheduling
40 pages
Current Affairs July 2nd Week 2025.Pptx - 20250726 - 210906 - 0000
No ratings yet
Current Affairs July 2nd Week 2025.Pptx - 20250726 - 210906 - 0000
6 pages
Handout Phonology-Morphology
No ratings yet
Handout Phonology-Morphology
17 pages
Backward-Design-Cells - Template Original
100% (3)
Backward-Design-Cells - Template Original
4 pages
English 7 - Worksheet - Q4 - W1
No ratings yet
English 7 - Worksheet - Q4 - W1
2 pages
Comparatives and Superlatives
No ratings yet
Comparatives and Superlatives
2 pages
Leadership Analysis in International Schools
No ratings yet
Leadership Analysis in International Schools
7 pages
Epicor Table ERP
No ratings yet
Epicor Table ERP
39 pages
Banking Industry Resume of D. Rajeshkumar
No ratings yet
Banking Industry Resume of D. Rajeshkumar
2 pages
Defensive Driving Course Registration Form
No ratings yet
Defensive Driving Course Registration Form
11 pages
Numerical Reasoning Tips & Examples
100% (1)
Numerical Reasoning Tips & Examples
7 pages
Course Outline Microeconomics
No ratings yet
Course Outline Microeconomics
6 pages
Internship Report Sharman Ramesh AP190426
No ratings yet
Internship Report Sharman Ramesh AP190426
61 pages
Assignment 1 - Mohd Kaif
No ratings yet
Assignment 1 - Mohd Kaif
1 page
PRMSU Vision, Mission, and Quality Policy
No ratings yet
PRMSU Vision, Mission, and Quality Policy
38 pages
FullText PDF
No ratings yet
FullText PDF
412 pages
Grade 6 Math Summative Test Q2
No ratings yet
Grade 6 Math Summative Test Q2
2 pages

深度學習入門4强化學習 (簡體) 部分166

Uploaded by

深度學習入門4强化學習 (簡體) 部分166

Uploaded by

参考文献 I 313

[4]Todd Hester, et al. "Deep Q-leaming from Demonstrations." Proceedings of the

[49] horomary [DQN の通化史② Double-DQN, Dueling-network, Noisymetwork]

You might also like