
gym
文章平均质量分 96
panbaoran913
学习Python,深度学习,强化学习的知识
有时间看私聊和回答问题
私聊我问题请写好题目
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【gym】实验taxi-v3案例(三)
中,Q表格.shape=(500,6).假设state=67,其decode=[0,3,1,3],含义为vehicle在index(0,3)的位置,乘客的位置为1(Green),目的地为3(Blue).见图a.最优的路线之一见图b.出租车开到乘客的位置,接乘客,开到乘客的目的地(四个指定位置中的另一个),然后下车。当乘客在目的地的位置的时候(乘客位置=目的地位置,供4种),出租车的随机位置共100个,所以要删除4*25=100个没必要的状态。智能体需要根据当前状态选择适当的动作,以最大化其获得的奖励。原创 2025-02-20 17:53:08 · 1103 阅读 · 0 评论 -
【gym】给定的强化学习环境简介(二)
环境中有4个子文件包。原创 2024-12-25 17:02:49 · 1462 阅读 · 0 评论 -
【gym】理解gym并测试gym小游戏CartPole (一)
同时,在上述行为的作用下,推车速度降低或提高的速度并不是固定的,而是取决于杆子所指向的方向(因为杆子重心的改变使得移动推车所需的能量改变)。为了录制 Gym 环境的视频,你可以使用 Gymnasium 库,这是 Gym 的一个后续项目,旨在提供更新和更好的功能。” ,这里“render_mode="rgb_array”把env.render该为数组模式,所以,打印image是一个数组。,为什么现在会报错?原因在于,调用gym的时候会使用一个虚拟环境,比如我的虚拟环境是。的时候会默认运行该文件中的代码。原创 2024-12-22 02:07:15 · 1245 阅读 · 0 评论