Using neural networks methods in reinforcement learning tasks

1. Нейросетевые методы в задачах обучения с подкреплением Михаил Бурцев, к.ф.-м.н., НИЦ "Курчатовский институт", МФТИ

2. ОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ

3. ПОСТАНОВКА ЗАДАЧИ

4. ОСНОВНЫЕ ПОНЯТИЯ

5. ВЫЧИСЛЕНИЕ ПОЛЕЗНОСТИ

6. ПРОБЛЕМА “ПРОКЛЯТЬЯ РАЗМЕРНОСТИ”

7. НЕЙРОСЕТЬ, КАК УНИВЕРСАЛЬНЫЙ АППРОКСИМАТОР

8. ИГРА - МОДЕЛЬ РЕАЛЬНОСТИ

11. ГЛУБОКОЕ Q-ОБУЧЕНИЕ

12. ПРОБЛЕМА что-то не сходится…

13. ПРОИГРЫВАНИЕ ОПЫТА

14. ЗАМОРОЗКА Q-СЕТИ

15. ОГРАНИЧЕНИЕ АМПЛИТУДЫ НАГРАДЫ

16. АРХИТЕКТУРА ГЛУБОКОЙ СЕТИ

18. SEAQUEST

19. ЧТО ОБЪЕДИНЯЕТ ЭТИХ ДВУХ ЛЮДЕЙ?

21. ALPHAGO

22. ПОИСК ПО ДЕРЕВУ

24. DeepMind AlphaGo vs Lee Sedol

26. СПАСИБО ЗА ВНИМАНИЕ!

More Related Content