没有合适的资源？快使用搜索试试~ 我知道了~

文库首页人工智能深度学习人工智能-项目实践-强化学习-基于深度强化学习的资源调度研究.zip

人工智能-项目实践-强化学习-基于深度强化学习的资源调度研究.zip

共22个文件

py：19个

md：2个

txt：1个

1.该资源内容由用户上传，如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款（资源遇到问题，请及时私信上传者）

版权申诉

人工智能

tensorflow

强化学习

深度学习

资源调度

5星 · 超过95%的资源 2 下载量 87 浏览量 2024-01-04 09:56:11 上传评论 1 收藏 34KB ZIP 举报

温馨提示

人工智能-项目实践-强化学习-基于深度强化学习的资源调度研究本项目基于hongzimao/deeprm，原作者还著有论文Resource Management with Deep Reinforcement Learning 。原作者使用的神经网络框架是 Theano。但是Yoshua Bengio 在2017年9月28日通过公开信的形式宣布 Theano 停止更新维护。所以我准备将Theano替换为目前更为流行的 Tensorflow 框架进行二次开发。除去更换框架之外，我希望对深度强化学习算法进行多种尝试。包括但不限于policy_grandient、A2C、A3C、DDPG、PPO等，每种算法以不同的文件夹名区分。强化学习参考MorvanZhou/Reinforcement-learning-with-tensorflow，莫烦的视频通俗易懂，强推。

资源推荐

资源详情

资源评论

基于深度增强学习和多目标优化改进的卫星资源分配算法

5星 · 资源好评率100%

针对多波束卫星系统中资源分配序列决策的多目标优化（MOP）问题，为了在提升卫星系统性能的同时，提高用户业务需求的满意度，提出了一种基于深度增强学习（DRL）的DRL-MOP 算法。所提算法基于DRL和MOP 技术，对动态变化的系统环境和用户到达模型建模，以归一化处理后的频谱效率、能量效率和业务满意度指数的加权和作为优化目标，实现了系统和用户累计性能的优化。仿真对比表明，所提算法可以更好地解决面向多

格式：pdf 资源大小：1.0MB 页数：10

基于深度强化学习的资源调度研究python源码+项目说明.zip

基于深度强化学习的资源调度研究python源码+项目说明.zip 基于深度强化学习的资源调度研究python源码+项目说明.zip 基于深度强化学习的资源调度研究python源码+项目说明.zip 基于深度强化学习的资源调度研究python...

格式：zip 资源大小：33.8KB

毕业设计基于深度强化学习的资源调度研究python源码.zip

5星 · 资源好评率100%

毕业设计基于深度强化学习的资源调度研究python源码.zip毕业设计基于深度强化学习的资源调度研究python源码.zip毕业设计基于深度强化学习的资源调度研究python源码.zip毕业设计基于深度强化学习的资源调度研究python...

格式：zip 资源大小：34.0KB

基于深度强化学习的资源调度研究python源码+详细注释.zip

5星 · 资源好评率100%

基于深度强化学习的资源调度研究python源码+详细注释.zip基于深度强化学习的资源调度研究python源码+详细注释.zip基于深度强化学习的资源调度研究python源码+详细注释.zip基于深度强化学习的资源调度研究python源码+...

格式：zip 资源大小：34.1KB

基于深度强化学习的云工作流调度python源码+详细注释+数据+项目说明（高分毕设）.zip

基于深度强化学习的云工作流调度python源码+详细注释+数据+项目说明（高分毕设）.zip 基于深度强化学习的云工作流调度python源码+详细注释+数据+项目说明（高分毕设）.zip 基于深度强化学习的云工作流调度python源码...

格式：zip 资源大小：11.2MB

基于深度强化学习的云工作流调度.zip

本项目“基于深度强化学习的云工作流调度”聚焦于利用深度学习技术解决云环境中的工作流调度问题，旨在提高资源利用率、降低延迟并优化服务性能。首先，我们要理解深度学习的基本概念。深度学习是一种模仿人脑神经...

格式：zip 资源大小：11.2MB

基于深度强化学习的目的楼层预约调度算法的多智能体电梯群控系统的研究源码+项目说明.zip

5星 · 资源好评率100%

基于深度强化学习的目的楼层预约调度算法的多智能体电梯群控系统的研究源码+项目说明.zip基于深度强化学习的目的楼层预约调度算法的多智能体电梯群控系统的研究源码+项目说明.zip基于深度强化学习的目的楼层预约调度...

格式：zip 资源大小：1.9MB

基于深度强化学习的资源调度研究.zip

5星 · 资源好评率100%

本项目“基于深度强化学习的资源调度研究”旨在探讨如何利用这种先进技术来优化资源调度问题，特别是在计算密集型任务中，如云计算、大数据处理以及物联网(IoT)设备的管理。深度强化学习是机器学习的一个分支，它...

格式：zip 资源大小：33.6KB

Python基于深度强化学习的目的楼层预约调度算法的多智能体电梯群控系统设计源码+报告文档.zip

5星 · 资源好评率100%

Python基于深度强化学习的目的楼层预约调度算法的多智能体电梯群控系统设计源码+报告文档.zipPython基于深度强化学习的目的楼层预约调度算法的多智能体电梯群控系统设计源码+报告文档.zip Python基于深度强化学习的...

格式：zip 资源大小：1.9MB

基于深度强化学习的目的楼层预约调度算法的多智能体电梯群控系统的研究python源码+方案文档+项目说明.zip

基于深度强化学习的目的楼层预约调度算法的多智能体电梯群控系统的研究python源码+方案文档+项目说明.zip基于深度强化学习的目的楼层预约调度算法的多智能体电梯群控系统的研究python源码+方案文档+项目说明.zip基于...

格式：zip 资源大小：1.9MB

毕设&课程作业_基于深度强化学习的资源调度研究.zip

在本项目"毕设&课程作业_基于深度强化学习的资源调度研究.zip"中，学生或研究人员探讨了如何运用深度强化学习（Deep Reinforcement Learning, DRL）来优化计算机系统的资源调度。这是一个融合了计算机科学多个领域的...

格式：zip 资源大小：33.9KB

基于深度强化学习的资源调度研究源码（期末作业）.zip

5星 · 资源好评率100%

随着人工智能技术的飞速发展，深度强化学习作为一种结合深度学习和强化学习的前沿技术，为解决复杂的资源调度问题提供了新的思路和方法。深度强化学习是强化学习的一种扩展，它通过利用深度神经网络的强大表达能力...

格式：zip 资源大小：33.9KB

本科毕业设计-基于深度强化学习的云工作流调度详细文档+全部资料+源码.zip

本科毕业设计-基于深度强化学习的云工作流调度详细文档+全部资料+源码.zip 【备注】 1、该项目是个人高分项目源码，已获导师指导认可通过，答辩评审分达到95分 2、该资源内项目代码都经过测试运行成功，功能ok的情况...

格式：zip 资源大小：11.2MB

一种基于深度强化学习的资源调度方法.zip

具体到基于深度强化学习的资源调度方法，该方法主要利用深度神经网络来逼近最优价值函数或者最优策略，以此来解决大规模、非线性、多约束的资源调度问题。在调度过程中，该方法能够实时地根据环境状态反馈和历史经验...

格式：zip 资源大小：1.8MB

基于深度学习的角度测量方法.zip

在现代科技领域，人工智能（AI）正逐渐渗透到各个行业，其中深度学习作为AI的重要分支，已经成为解决复杂问题的关键技术。本项目实践旨在探讨如何利用深度学习来实现精确的角度测量，这在机器人导航、自动驾驶、...

格式：zip 资源大小：6.5MB

深度强化学习.zip

深度强化学习是人工智能领域的一个重要分支，它结合了深度学习的表示能力与强化学习的决策制定过程，使得智能体能够通过与环境的交互学习到最优策略。在这个“深度强化学习.zip”压缩包中，可能包含了关于这个主题的...

格式：zip 资源大小：304.4KB

20. 深度强化学习.zip

深度强化学习是人工智能领域的一个重要分支，它结合了深度学习的表示能力与强化学习的决策制定过程，使得智能体能够通过与环境的交互学习到最优策略。在这个"20. 深度强化学习.zip"压缩包中，我们很可能会找到一系列...

格式：zip 资源大小：567.0KB

基于深度强化学习的资源调度研究详细文档+全部资料+源码.zip

5星 · 资源好评率100%

基于深度强化学习的资源调度研究详细文档+全部资料+源码.zip 【备注】 1、该项目是个人高分项目源码，已获导师指导认可通过，答辩评审分达到95分 2、该资源内项目代码都经过测试运行成功，功能ok的情况下才上传的，...

格式：zip 资源大小：35.9KB

AI-游戏类资源算法-机器学习.zip

2. 《星际争霸II》的AI对手：使用深度强化学习，使得计算机对手能够学习并改进其战斗策略。 3. 《文明 VI》的城市规划：通过机器学习预测城市发展趋势，辅助玩家做出更有效的规划。综上所述，"AI-游戏类资源算法-...

格式：zip 资源大小：72.7MB

基于深度强化学习的k8s调度器.zip

而深度强化学习（Deep Reinforcement Learning, DRL）作为人工智能的一个重要分支，也在优化调度问题上展现出强大的潜力。本项目"基于深度强化学习的k8s调度器"结合了这两个领域的精华，旨在提升Kubernetes集群的...

格式：zip 资源大小：91.1KB

深度强化学习视频.zip

深度强化学习（Deep Reinforcement Learning, DRL）是人工智能领域的一个重要分支，它结合了深度学习的表征能力与强化学习的决策制定机制。在这个视频合集中，我们可能涵盖了一系列关于模仿学习和深度强化学习的基础...

格式：zip 资源大小：135.0MB

python本科毕业设计《基于深度强化学习的云工作流调度》.zip

该项目是针对本科学生的毕业设计，主题为“基于深度强化学习的云工作流调度”。这个设计融合了计算机科学的两个重要领域：云计算和人工智能，特别是深度强化学习。在云环境中，工作流调度是一个关键问题，涉及到如何...

格式：zip 资源大小：12.3MB

强化学习-中文笔记&资源-以python实例为主-由浅入深.zip

强化学习是一种人工智能领域的学习方法，它让智能系统通过与环境的交互来学习最优策略，以最大化预期的奖励或累积回报。这份资料集“强化学习-中文笔记&资源-以python实例为主-由浅入深”是针对初学者和进阶者...

格式：zip 资源大小：101.9MB

北京化工大学本科毕业设计《基于深度强化学习的云工作流调度》.zip

【标题】：“北京化工大学本科毕业设计《基于深度强化学习的云工作流调度》”是一个学术性质的项目，主要探讨了如何运用深度强化学习技术来优化云环境中的工作流调度问题。深度强化学习（Deep Reinforcement ...

格式：zip 资源大小：11.2MB

基于深度强化学习的相变材料建筑中暖通空调系统的优化调度.zip

代码的编写思路清晰，注释详尽，对于希望深入学习和理解深度强化学习及暖通空调系统优化调度的学生和研究人员来说，是一份宝贵的实践资源。适用对象主要是计算机、电子信息工程、数学等专业的大学生，他们可以将这...

格式：zip 资源大小：344.6KB

Python本科毕业设计《基于深度强化学习的云工作流调度》.zip

这个Python本科毕业设计项目主要关注的是“基于深度强化学习的云工作流调度”问题，它涉及到计算机科学领域中的多个重要知识点。以下是对这些关键概念的详细解释： 1. **深度强化学习 (Deep Reinforcement Learning...

格式：zip 资源大小：8.1MB

公益资料（120页PPT）人工智能与数字化转型的业财融合.pptx

5星 · 资源好评率100%

公益资料（120页PPT）人工智能与数字化转型的业财融合.pptx

格式：pptx 资源大小：8.2MB 页数：120

DeepSeek引领2025年人工智能算法变革：算力效率提升与普惠应用新时代

5星 · 资源好评率100%

内容概要：本文探讨了2025年人工智能发展的战略转折，特别是DeepSeek在算法和算力效率上的革新及其对未来的深远影响。首先介绍了当前AI技术正处于发展阶段向应用需求转变的关键节点，并强调算力拐点已临，特别是DeepSeek通过对基础设施的重新设计优化算力利用，降低成本且保持高效能。随后文章讨论了数据和技术发展的变化趋势，尤其是模型大小与推理成本间的权衡，并指出2025年成为算法创新的重要一年。

格式：pdf 资源大小：1.6MB 页数：16

中文短信数据集-带标签

本数据集可用于进行文本分类、信息检索等自然语言处理实验，共包含80万条短信。其中：原始数据集data.txt每行为1条短信，格式为“标签\t短信内容”，标签=0表示正常短信，标签=1表示垃圾短信。train.csv和test.csv为拆分后的训练集与测试集，拆分代码为train_test_split.py。stopwords.txt为使用的停用词。基于该数据集的文本分类详见文章https://

格式：rar 资源大小：40.9MB

人工智能大模型介绍.pptx

**内容概要:** 人工智能大模型是近年来迅速发展的技术领域，旨在构建具有人类智能水平的模型。通过大规模数据和深度学习方法，这些模型能够处理自然语言理解、图像识别、自动驾驶等复杂任务。本资源推荐旨在介绍人工智能大模型的相关资源，助您深入了解和应用这一领域的最新进展。 **适用群体:** 本资源推荐适用于各类人群，对人工智能大模型

格式：pptx 资源大小：30.3MB 页数：15

IERG 5320 Assignment2 Reference

Digital forensics Assignment2 咱这个课程号+课程名称，懂得都懂，要不是本科没学网安相关课程，一窍不通，我也不至于到处找答案唉。 There is no exact answer here, just for reference. Problem 1 Problem 1: One morning, one staff working at IT department of a company noticed a strange laptop which connected fro

解析数据库编程语言前沿

### 《XQueryU与代数表达式：类型规则、语义及编译的深入解析》在数据库查询和处理领域，X......

收起资源包目录

人工智能-项目实践-强化学习-基于深度强化学习的资源调度研究.zip （22个子文件）

新建文本文档.txt 0B

deeprm_reforement_learning-master

policy_gradient

parameters.py 4KB

job_distribution.py 2KB

other_agents.py 2KB

run_script.py 1KB

environment.py 17KB

readme.md 274B

RL_brain.py 6KB

pg_re.py 11KB

launcher.py 6KB

slow_down_cdf.py 6KB

A2C

parameters.py 4KB

job_distribution.py 2KB

other_agents.py 2KB

run_script.py 1KB

environment.py 16KB

readme.md 447B

actor_critic_brain.py 4KB

RL_brain.py 4KB

pg_re.py 10KB

launcher.py 5KB

slow_down_cdf.py 6KB

共 22 条

# A2C advantage actor-critic - A3C 中的 Asynchronous 是导入异步训练的思想，但是这个算法只增强了CPU的计算能力，没有扩展到GPU上。所以我没有使用 Asynchronous，仅仅使用GPU版的 advantage actor-critic，即A2C。 - A3C 虽然没有利用GPU，但是nivida意识到了这点，推出了CPU/GPU混合实现的A3C——[NVlabs/GA3C](https://github.com/NVlabs/GA3C)，这个以后有机会在尝试吧。;)

评论收藏

内容反馈

1.该资源内容由用户上传，如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款（资源遇到问题，请及时私信上传者）

版权申诉