# A2C advantage actor-critic
- A3C 中的 Asynchronous 是导入异步训练的思想,但是这个算法只增强了CPU的计算能力,没有扩展到GPU上。所以我没有使用 Asynchronous,仅仅使用GPU版的 advantage actor-critic,即A2C。
- A3C 虽然没有利用GPU,但是nivida意识到了这点,推出了CPU/GPU混合实现的A3C——[NVlabs/GA3C](https://github.com/NVlabs/GA3C),这个以后有机会在尝试吧。;)
没有合适的资源?快使用搜索试试~ 我知道了~
人工智能-项目实践-强化学习-基于深度强化学习的资源调度研究.zip

共22个文件
py:19个
md:2个
txt:1个

1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉

温馨提示
人工智能-项目实践-强化学习-基于深度强化学习的资源调度研究 本项目基于hongzimao/deeprm,原作者还著有论文Resource Management with Deep Reinforcement Learning 。 原作者使用的神经网络框架是 Theano。但是Yoshua Bengio 在2017年9月28日通过公开信的形式宣布 Theano 停止更新维护。所以我准备将Theano替换为目前更为流行的 Tensorflow 框架进行二次开发。 除去更换框架之外,我希望对深度强化学习算法进行多种尝试。包括但不限于policy_grandient、A2C、A3C、DDPG、PPO等,每种算法以不同的文件夹名区分。 强化学习参考MorvanZhou/Reinforcement-learning-with-tensorflow,莫烦的视频通俗易懂,强推。
资源推荐
资源详情
资源评论



























格式:pptx 资源大小:8.2MB 页数:120




收起资源包目录


























共 22 条
- 1
资源评论

- 大龄青年学编程2025-02-22发现一个宝藏资源,赶紧冲冲冲!支持大佬~
- @MrWang2024-04-06感谢大佬,让我及时解决了当下的问题,解燃眉之急,必须支持!

博士僧小星
- 粉丝: 2563
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- 基于python的sql注入.zip
- 基于Python的WiFi密码安全性测试(字典穷举).zip
- 基于Python的XBridge.zip
- 基于Python的百度百科爬虫.zip
- 基于python的北邮半自动健身房预约脚本.zip
- 基于Python的本地离线语音合成(TTS),学习Python第七天的练手作品。语音库来自@葛平 老师.zip
- 基于Python的饭卡管理系统.zip
- 基于python的词频统计.zip
- 基于python的二元霍夫曼编码译码详细设计及代码实现.zip
- 基于Python的服务器负载均衡(Load Balance)服务.zip
- 基于Python的光学衍射模拟.zip
- 基于ZYNQ平台的远程固化升级系统_实现FPGA设备通过网口远程升级固件并集成CRC校验确保数据安全_用于嵌入式设备固件远程维护与可靠性验证_二次开发ALINX固化例程集成LWIP.zip
- 依托外挂知识库的大模型问答机制解析
- 基于python的高考志愿填报系统.zip
- 基于python的广度优先爬虫.zip
- 基于python的简单文件服务器,支持上传,下载,多级目录.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈



安全验证
文档复制为VIP权益,开通VIP直接复制
