自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(74)
  • 问答 (1)
  • 收藏
  • 关注

原创 强化学习-MATLAB

black box -> machine learning不需要标签,根据内在特征进行聚类等相似操作;这就是ML所擅长的,从数据中找出特征进而得到label;序列行为实现最优的回报;可以将policy使用深度神经网络这也是DRL的由来;RL算法的作用就是基于观测,奖励等去优化策略,以采取最优动作进而获得最大回报;所以,RL就是一个优化问题:与其他优化问题区分开来:关键点:评估状态价值,将能够使得智能体获得更高回报,而不是只是关注即时奖励;如果不能够评估状态价值,很有可能导致Agent陷入利用(贪婪)的状态,

2025-08-09 17:19:50 243

原创 训练模型时梯度出现NAN或者inf

这将避免因 bfloat16 引起的问题。按操作动态调整精度:AMP 会根据具体操作的数值稳定性来选择 float32 或 float16,对于稳定性较好的操作(如矩阵乘法)使用 float16,对精度要求较高的操作(如归一化)则保留 float32。在训练过程中,这意味着模型将会使用全精度(通常是 float32)进行计算,而不使用混合精度。GradScaler 动态调整梯度缩放:AMP 默认使用 GradScaler 对梯度进行缩放,以避免因 float16 造成的数值下溢(过小梯度被舍去)。

2025-08-08 11:59:07 615

原创 MATLAB核心技巧:从入门到精通

显示。

2025-08-06 17:22:38 374

原创 Sum-rate计算

【代码】Sum-rate计算。

2025-07-28 15:24:11 219

原创 无线通信相关概念(二)

也就是说利用DRL提高缓存命中率,实际上就是预测卫星预缓存哪些数据能最大化命中率,提高效率,降低演示项目含义在卫星中的考虑缓存位置内容实际存储的卫星或地面节点位置考虑卫星可视性、轨道预测、接入概率缓存命中请求内容已在当前可达节点中减少回源延迟、提高传输效率优化目标提高命中率、降低延迟、节省带宽基于轨迹和请求预测进行内容预分发。

2025-07-27 10:41:04 296

原创 RL相关知识补缺

即使是 model-based 也是不断交互获得实现最大化长期累积奖励的策略,只不过交互过程中转移是去额定的,而 model-free 是依靠经验去学习的。Model-Based RL 先还原“环境逻辑”,再在这个逻辑中寻找最优行为;而 Model-Free RL 则靠大量试错直接学习出最优策略。是两种基本的策略类型,主要区分于是否显式使用环境的“模型”(model)来辅助学习。在强化学习(Reinforcement Learning, RL)中,的问题,当前主流的方法确实倾向于采用。

2025-07-26 12:58:46 302

原创 jabref快速上手指南

使用jabref,目前还是为了期刊的快速缩写,导入bib更加方便;

2025-07-25 11:53:43 221

原创 无线通信资源分配相关算法

它常用于图着色问题(Graph Coloring Problem, GCP),在无线通信(如频率分配)、任务调度、资源管理等领域广泛应用。,通过优先处理染色约束最强的最大团顶点,为整体着色过程提供良好的下界引导,在无线资源调度等实际场景中具有重要意义。看了一下做的这篇DRL做通信下面的服务分配的,为终端选择最合适的卫星,在大规模星座中。感觉以后如果做DRL 那感觉选错了啊,笑哭,还不如去厦大。,然后再依次为其他顶点上色,以尽量减少总用色数(染色数)。

2025-07-24 22:56:20 329

原创 深度学习-梯度无法回传

主要是在调度任务中,如果使用硬判决进行决策,梯度将无法回传;

2025-07-22 11:09:14 1166

原创 无线通信相关概念(一)

下)无线接入网(RAN)模块的功能拆分单元,是构建灵活、高性能、可编程无线接入网络的重要组成部分。(面试的爱立信就是5G RAN工程师,给我的感觉不是爬杆子也要在杆子下面干活)[RRU] ——前传(Fronthaul)——> [DU] ——中传(Midhaul)——> [CU] ——回传(Backhaul)——> [核心网]DU:进行物理层的相关操作,编解码,调制解调等,还有MAC层的资源分配等;流程:可以理解为数据传到基站后怎么传到网络中)RRU:可以理解为射频信号收发模块;现代无线通信系统中(尤其在。

2025-07-20 09:48:20 300

原创 期刊论文-图片格式要求

问题2:我的图片针对RL的奖励曲线绘制,会存在不同seed的阴影部分,而eps无法对阴影保留而会形成实线导致效果截然不同;方案:通过修改库源码,能够实现字体保证 新罗马,并且字体大小可以设置,然后设置输出eps格式;方案:保存成svg格式,然后通过AI转换成eps这样就还是维持了矢量图并且阴影部分仍然存在;问题1:论文中存在一些曲线图由python绘制,并且由库绘制,如何解决输出eps?前言:最近,一篇论文被接收,期刊要求所有图片格式eps而非pdf;

2025-07-18 20:30:34 235

原创 Zotero笔记图片同步难题与解决方案

独立笔记,可以理解为和文章同级,可以收录其他条目笔记,形成笔记的集合;条目笔记:文献下面的笔记,为一篇文章而写;前言:该插件为Zotero的笔记工具;分为两类笔记:条目笔记,独立笔记。

2025-07-18 20:25:23 217

原创 期刊会议缩写查询

1. EI检索会议或者文章名字。然后选择机构登录,自己学校网;2.详细信息查看 Abbr。

2025-07-15 11:32:58 115

原创 投稿接收快速指南

作者照片和简介需。

2025-07-13 09:51:38 860

原创 EndNote快速入手指南

2.导入文献:在不同的数据库网站导入,中文的知网和万方(可能需要手动导入),英文的导出endnote格式可以直接双击就能够import;整体的逻辑和zotero一样,里面存条目,然后连接到pdf;也可以直接导入文件夹,但是由于Endnote不支持三级目录。主要用来进行参考文献插入;1. 文献管理:分组界面。

2025-07-11 20:32:31 209

原创 Latex 快速入手指南

2.文献管理,导入格式国标等等,一般我都是利用reference.bib的文件单独存放bibtex,然后在主文件中引入reference.这样就实现了文献的引用。前言:研究生阶段其实已经使用了很久的latex,趁这段博0时期再度回顾一些知识点,希望后续使用过程更加流畅。3.宏包,概念其实就和大多数语言一样,比如python就需要import其他的包不论是自定义的还是库的。文中使用的话:~\cite{}即可。

2025-07-11 11:29:53 104

原创 Zotero+zotmoov+坚果云同步

到此,移动pdf到zotero会自动附加到同步目录对应的本地目录,并且会同步到坚果云,在另一台电脑上也设置相应的目录,那么通过坚果云就能实现不同设备之间的附件的同步。至于条目数据则直接用zotero的300M即可。3.设置坚果云的同步目录到本地:右键,将zotero同步到本地;2.设置同步目录:这里的同步目录需要在不同电脑上都有一份;4. zotmoov设置附件移动目录;1.插件安装:zotmoov;

2025-07-10 23:40:16 171

原创 Overleaf快速入手指南

2. 点击“Recompile”处的倒三角,可以选中“Auto Compile”的“On”模式,开启自动编译,但我并不习惯也不推荐这样做,请尽可能保持默认。1. 在使用部分命令排版内容、进行交叉引用时,需要对.tex源文件编译两次及以上,因此如果你发现你点击Compile后没有反应,试着再点击一次!由于编辑内容与呈现效果并非同步,每当你需要查看代码带来的效果,必须点击“(部分功能的实现需要导入其他的插件协助完成,将这些套件称为“宏包”)、”进行编译查看最新的PDF效果。大部分指令都以\作为开头。

2025-06-16 10:51:21 535

原创 hot100-day5

思路:先用map存,然后再去遍历,如果mp中存在target-nums[i]并且索引不等于i,那么就存在;思路:先用map去存,然后重新遍历,碰到一个就开始while循环n++,直到断开;思路:用一个map存排序好的,然后遍历mp就能得到结果;然后对每个元素都去这样做,最后得到的就是最长的ans;

2025-03-19 23:36:55 243

原创 操作系统-八股

进程定义:运行中的程序,有独立的内存空间和地址,是系统进行资源调度和分配的基本单位。并发,并行并发就是单核上面轮询,并行就是同时执行(多核);进程上下文切换,由于进程是调度的基本单位,所以涉及到。

2025-03-15 23:53:14 265

原创 hot100-day4

思路:搞清楚为什么是下界left就可以了,就是简单的二分法,下界是因为要找到添加该元素的第一个位置,看最后一次循环,left=mid+1,说明他放在mid之后,而mid此时对于的元素刚好小于target,所以这个位置就是第一个能放元素的位置;整体思路:先写出判断当前位置能否放Q的函数,之后进入递归,先写终止条件,然后写循环逻辑,也就是根据这个判断函数确定是否能放,能放之后就进入下一行,然后返回的时候需要记得将当前放的Q抹去;思路:还是二分法,展开即可;

2025-03-15 09:47:45 190

原创 hot100---day3

思路:利用数据结构栈来实现,前序,中左右,所以碰到的栈顶元素就需要push_back到数组中去;然后对于左右节点,是右节点先进入,然后左节点,这样弹出的时候才是左节点先弹出,然后右节点弹出;递归法的前中后序遍历,格式比较一致;二叉树复习+hot100专题。

2025-02-24 23:49:18 176

原创 hot100--day2

并且使用carry/10得到进位的值,并且由于carry都是+=的形式,所以在第二轮中进位会得到使用;记住这里还是需要一个head来保存最开始的头节点,不然没办法找到返回的节点;先比较,将一个链表排完,之后开始对更长的链表剩余部分去追加到新的上面;最后返回head->next就得到了相加后的新链表;先创建一个carry作为标记位也就是计算两数的和;注意:1和2链表的判断要分开,因两者不一定一样长;然后根据carry%10得到和的个位数上的值;所以整体逻辑分成了两个部分。

2025-02-17 23:41:08 222

原创 hot100-day1

【代码】hot100-day1。

2025-02-06 22:56:55 309

原创 DP专题----

第一步就是明确dp[i]的含义:调到楼梯i的最小花费;然后初始化第 0 1 个元素的值;3.dp数值如何初始化。

2025-01-27 23:07:35 337

原创 贪心专题----

当胃口大于饼干尺寸,说明此时这个胃口在当前饼干数组中 得不到满足,那么去遍历下一个胃口,饼干不做移动;直到饼干满足胃口,再移动饼干;(遍历胃口,至少能实现把饼干分发出去的思路,用饼干去找胃口)但是如果遍历饼干,会导致如果一个胃口不被饼干满足,饼干继续移动,导致可能出现所有饼干都不满足改胃口,也就是所有饼干都没有被使用到;看了讲解,贪心似乎没有定式的解题方法,更多是按照常识来;然后遍历胃口,从饼干尺寸的最后一个开始。将胃口和饼干尺寸 都排序;因此,我们需要遍历胃口,这里为什么是遍历胃口?

2025-01-25 20:32:29 376

原创 迭代器失效问题

对于序列容器,vector,queue来说,使用erase后,后面每个元素都需要移动,也就是地址都发生了变化,因此原来的迭代器就失效了(其实将迭代器理解成泛化的指针即可,因为移动导致指向的地址都发生了改变,所以迭代器失效),就需要erase返回的下一个元素的有效迭代器;对于关联容器map,set而言,底层数据结构是红黑树,所有元素内存并不连续,而通过节点指向,因此erase当前元素,其他元素的迭代器并不会失效,而只是当前的这个失效,所以在erase之前,记录下一个元素的迭代器就行了;

2025-01-25 10:06:35 98

原创 hot 100--->回溯

思路依旧,if+for,但是需要注意这道题可以重复取当前的元素,所以在进入下一次递归时不需要将index+1,而还是index;

2025-01-24 23:45:30 251

原创 代码随想录算法训练营day02| 977.有序数组的平方、209.长度最小的子数组、59.螺旋矩阵II

由于已经排序,所以比较两侧数据即可;双指针,新数组用k;

2025-01-15 22:11:45 273

原创 回溯专题 记录

我感觉整体逻辑还是递归,只不过有了pop_back才是回溯概念;(按照模板来,不过c++没有直接计算容器sum的函数)写一个;回溯的题目按照这套模板进行;

2025-01-12 22:36:21 159

原创 代码随想录算法训练营day01| 704. 二分查找、27. 移除元素

【代码】代码随想录算法训练营day01| 704. 二分查找、27. 移除元素。

2025-01-11 23:20:37 224

原创 二叉树专题

递归法,就以一棵树作为主树,然后从根节点开始同时遍历两棵树。如果在同一个位置都存在则两者节点的值相加。(使用递归就是 能把大问题分解成相同的小问题,然后确定参数返回值、TreeNode* mergeTrees(TreeNode* root1, TreeNode* root2)(通过递归遍历所有节点并记录,然后判断是否符合搜索树规则)(思路就是先用递归,先跑到最底层,然后回溯,一层一层往上找)(同理先把树的值排序,然后找到最小的绝对差)(一样,先把树的值保存下来,用中序遍历就行)

2025-01-10 22:17:52 257

原创 muduo 学习

2.bind是一个指的注意的点,因为对于成员函数而言,第一个参数是this,但是作为回调函数,没有示例对象也就没有this,这个时候用bind去绑定解决这个问题,然后后面的_1,_2,_3就是占位符,去代替这个回调函数的参数;1.更多关注IO网络编程和业务分离,构造函数通过两个回调函数去调用具体的处理函数;我们更多关注的就是这两个 回调函数;客户端连接上后,服务端会显示connection的提示符也就是之前在onConnection定义的;telnet 192.168.... port 去实现通信。

2024-12-02 12:00:50 343

原创 Linux网络编程

也称为套接字,描述计算机的IP和端口,运行在计算机的程序之间采用socket进行数据通信,通信两端都有socket,他是一个通道,数据在两个socket之间传输。TCP提供了 流 和数据报 两种通信机制,因此socket也分为流套接字和数据报套接字;1.服务端程序将一个套接字绑定到指定的ip地址和端口,并通过这个套接字等待和监听客户端连接请求;TCP/IP网络应用中,两个程序之间的通信模式是客户端-服务端模式;5.与客户端通信,接收客户端发送来的报文后,回复处理结果;绑定到服务端的IP和端口。

2024-11-30 10:55:46 363

原创 C++ For Hot100

【代码】C++ For Hot100。

2024-11-23 17:29:36 283

原创 AutoDL抽显卡

冲冲冲,之前租卡也挺便宜,流程也很简单。

2024-11-21 16:35:14 140

原创 c++ 编程之 编译过程

cmake .. make 就会看到在build目录下面有一个libhello.a------lib是自动加的 .a表示静态库 .so表示动态库。关于静态库连接和动态库连接,区别就是静态库会加到可执行文件里面,如果静态库过大就不太合适,这个时候就是用动态库,可执行文件用到时候再去链接动态库。g++ main.o -L. -lmymath -o main 找动态库会在系统路径下找,可能需要在系统路径加上库的路径。动态库是在用到的时候可执行文件再去找,因此动态库更新,也不会导致项目需要重新编译;

2024-11-12 15:42:52 1479

原创 C++实现用户分组--学习

类提供了一系列方法,用于读取数据、分割数据集、统计类别数量以及获取训练集、测试集和验证集。通过这些方法,可以方便地管理和处理数据集,适用于机器学习和数据分析等场景。

2024-11-11 11:42:22 788

原创 高并发内存池

回答:因为用户进程一般都是在操作系统用户态,如果没有内存池,会导致不断地进行系统调用,在内核态获得内存,从而导致大量切换开销,效率低下。并且也会存在内存碎片的问题。问题1:用户进程通过malloc申请内存空间需要转到操作系统内核空间进而读取内存,是不是需要系统调用这个操作?如果没有内存池,那么每次都需要这样导致效率很低。内存池很好地解决了这两个问题:通过一次性申请大块内存空间到内存池,之后需要内存就从内存池获取,而不是频繁向内存获取;记录第一个C++ 实战项目。

2024-11-11 00:19:06 212

原创 备战春招--

C++中对构造函数使用初始列和函数体中赋值结果是一样的,但是为什么使用初始列的形式更好。

2024-11-05 23:37:49 282

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除