- 博客(2294)
- 收藏
- 关注
原创 针对目标跟踪,生成模型和判别模型有什么区别呢?各有什么优缺点?YOLO+deepsort跟踪属于上面两类算法中的一类吗?
问题描述:针对目标跟踪,生成模型和判别模型有什么区别呢?各有什么优缺点?YOLO+deepsort跟踪属于上面两类算法中的一类吗?问题解答:核心思想:把目标建模,然后在后续帧里找出与目标模型最相似的区域。做法:通过颜色直方图、角点(Harris/SIFT)、纹理特征等描述目标 → 在搜索区域里匹配相似特征 → 得到目标位置。本质:属于“找相似”的问题。代表方法:MeanShift、CamShift、粒子滤波 + 特征描述子、Harris-meanShift。核心思想:把跟踪问题转化为一个分类任务,即“区分目
2025-09-12 22:35:46
613
原创 对于可变形注意力,我怎么知道选择的那几个点是不是关键的点,万一选择的点是废物的点呢?
虽然一开始采样点可能是“废物点”,但由于偏移量是可学习的,训练过程会自动修正采样点,让它们逐渐对齐到对任务最有帮助的区域(比如目标的边缘、纹理、关键部位)。
2025-09-08 09:49:54
190
原创 transformer中l是什么呢?l-1是什么呢?LN是什么操作呢?MHSA是什么操作,英文全称是什么呢?MLP是什么操作呢?英文全称是什么呢?
transformer中l是什么呢?MHSA是什么操作,英文全称是什么呢?MLP是什么操作呢?
2025-09-08 09:31:14
226
原创 transformer中wo的作用就是reshape形状为想要的形状吗?
transformer中wo的作用就是reshape形状为想要的形状吗?
2025-09-08 09:30:57
170
原创 _pickle.UnpicklingError: invalid load key, ‘\xb4‘.
权重文件拷贝失败,常见于ubuntu系统拷贝。这个 错误原因是什么呢?
2025-09-08 09:30:21
905
原创 在transformer中,以相亲为通俗举例,解释Query、Key、Value。举例要贴近现实。
在transformer中,以相亲为通俗举例,解释Query、Key、Value。意思是value比key更细致更细节吗?
2025-09-08 09:30:04
138
原创 CNN的运算是叫卷积操作,那么transformer的运算操作叫什么呢?
CNN的运算是叫卷积操作,那么transformer的运算操作叫什么呢?
2025-09-07 16:24:03
214
原创 transformer中z是一个很长的向量,那么这个参数量相当大了吗?
transformer中z是一个很长的向量,那么这个参数量相当大了吗?不是参数量大是计算量大。
2025-09-07 16:21:16
225
原创 VIT如何对特征图进行计算的呢?比如32×160×160的特征图经过VIT之后如何输出的还是32×160×160呢?这里的计算过程是什么呢?transformer的注意力机制到底注意到哪里去了呢?
VIT如何对特征图进行计算的呢?比如32×160×160的特征图经过VIT之后如何输出的还是32×160×160呢?这里的计算过程是什么呢?transformer的注意力机制到底注意到哪里去了呢?
2025-09-07 16:16:52
194
原创 为什么有的YOLO里面和transformer结合了呢?比如放入VIT注意力机制,这合理吗?既卷积又要进行transformer计算吗?
为什么有的YOLO里面和transformer结合了呢?比如放入VIT注意力机制,这合理吗?既卷积又要进行transformer计算吗?
2025-09-07 16:14:28
162
原创 为什么有的YOLO里面和transformer结合了呢?比如放入VIT注意力机制,这合理吗?既卷积又要进行transformer计算吗?
CNN 提供局部强特征,Transformer 提供全局上下文,两者互补。在 YOLO 中插入 Transformer 是合理的,前提是平衡好精度提升 vs 速度消耗。这类结合方法已经有很多成熟研究,比如:YOLOv5-Trans、YOLOv7-E6E+Transformer、YOLOv8 + ViT backbone。✅ 一句话:YOLO 加 Transformer 是“局部特征 + 全局关系”的结合,非常合理,但要考虑计算成本。要不要我给你画一张的结构对比图(示意全局/局部信息流)?
2025-09-07 11:28:43
283
原创 transformer中的强相关和弱相关说明那块区域和整张图有什么关系吗?这跟目标检测有什么关系吗?为什么transformer可以进行目标检测到框的坐标呢?
transformer中的强相关和弱相关说明那块区域和整张图有什么关系吗?这跟目标检测有什么关系吗?为什么transformer可以进行目标检测到框的坐标呢?
2025-09-07 11:26:16
135
原创 假如40×40的图片,按照10×10,可以分成N=16,假如C=8,给出具有具体数字的公式代入过程。
假如40×40的图片,按照10×10,可以分成N=16,假如C=8,给出具有具体数字的公式代入过程。
2025-09-07 11:19:48
125
原创 Transformer和CNN的方法完全不同啊,我会CNN,这里怎么看不懂了呢?
Transformer和CNN的方法完全不同啊,我会CNN,这里怎么看不懂了呢?
2025-09-07 11:16:30
92
原创 Transformer中的N×C是什么意思呢?
问题描述:Transformer中的N×C是什么意思呢?问题解答:好问题 👍,我们一步步拆开解释 N×CN \times C 的含义。在 Transformer 或神经网络里,输入特征通常写成一个 矩阵:x∈RN×Cx \in \mathbb{R}^{N \times C}NN:样本里一共有多少个 token(也就是向量的数量)。在 NLP:NN = 句子里单词的数量。在 CV:NN = 图像被切分成的 patch 数量,或者 flatten 后的像素点数。CC:每个 token 的特征维度。就像卷积里
2025-09-06 22:41:59
327
原创 机械臂静态重复定位精度和动态重复定位精度有什么区别呢?静态是在什么工况下测量呢?动态是在什么工况下测量呢?
指标静态重复定位精度动态重复定位精度工况低速、轻负载、稳定环境、停止后测量高速、有负载、震动干扰、轨迹中测量结果数值更小(更精确)数值稍大(受惯性、震动影响)意义理想条件下的理论极限精度实际工况下可达到的应用精度✅ 你提到的“静态 ≤ ±2 mm,动态 ≤ ±5 mm”,就表示:在实验室或理想状态下,机械臂能稳定回到 ±2 mm 的范围。在实际挖掘机臂上、带载和运动中,重复精度会降低到 ±5 mm,但仍然可接受。要不要我帮你画一张对比示意图。
2025-09-03 21:24:27
416
原创 吃辣椒容易导致嘴角长粉刺吗?如果是,原因是什么呢?
吃辣椒可能会导致嘴角长粉刺,但主要是因为它刺激油脂分泌和影响胃肠/激素平衡。并不是辣椒直接堵住毛孔,而是通过间接机制让痘痘更容易冒出来。个体差异很大:有的人没影响,有的人就特别敏感。
2025-09-03 19:28:40
238
原创 Brokk 60干什么的?
Brokk 60 = 世界最小的遥控破拆机器人,它就像“雷神之锤的温柔版”,能在最危险、最狭窄、最极端的环境里安全地完成拆除任务。要不要我帮你把Brokk 60 和大型 Brokk 机器人(比如 Brokk 170/200)做个对比表,清楚展示它们在尺寸、重量、用途上的差别?
2025-09-02 11:00:20
188
原创 每个人心中都有自己的世外桃源吗?
世外桃源”源于陶渊明的《桃花源记》,代表着一种远离喧嚣、安宁美好的理想世界。它不一定是真实存在的地方,而更多是一种心灵的寄托与理想化的栖息地。
2025-09-02 10:52:06
634
原创 汽车不是靠滑移拐弯吗?
汽车:靠轮胎偏转方向 → 滚动转弯,轮胎几乎不横向滑动。滑移装载机:靠左右轮差速/反转 → 强迫横向滑动来转弯。✅ 结论:汽车不是靠“滑移”拐弯,而是靠转向几何(阿克曼原理)来滚动转弯;只有像滑移装载机、坦克这类没有转向轮的设备,才用“滑移”来转向。
2025-09-02 10:24:46
133
原创 滑移式装载机中的滑移是什么意思呢?是可以滑动式移动吗,类似于溜冰那样?
靠左右两侧车轮(或履带)的速度差来转向。它没有像汽车一样的转向轮机构,而是让左侧和右侧的车轮(或履带)反向或差速运动,整机就能原地掉头。因为车轮在地面上“拖拽着滑动”来完成转弯,所以叫“滑移转向”。
2025-09-02 10:24:14
390
原创 打印机脱机的原因是什么呢?除了打印机没有开机,还有其他什么原因呢?如果笔记本电脑和打印机没有共同连接一个WIFI会报脱机错误吗?
问题描述:打印机脱机的原因是什么呢?除了打印机没有开机,还有其他什么原因呢?如果笔记本电脑和打印机没有共同连接一个WIFI会报脱机错误吗?
2025-09-01 22:30:15
432
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人