- 博客(2)
- 收藏
- 关注
原创 论文学习记录1——YOLO-World: Real-Time Open-Vocabulary Object Detection
该新方法基于标准的yolov8,并使用预训练的clip编码器对输入的提示词进行文本编码,并使用一种新的神经网络 Re-parameterizable Vision-Language Path Aggregation Network (RepVL-PAN)来连接图像特征和文本特征,因为yolo的表现能力很大程度上依赖于训练时的表现信息,视觉信息和文本信息在一起建模,可以提高视觉语义表示。
2024-10-07 22:10:09
1831
18
原创 小土堆pytorch学习记录
when True, will use ceil instead of floor to compute the output shape 是否使用ceil模式(ceil是向上取整(保留出界部分),floor是向下取整(不保留))) – Zero-padding added to both sides of the input. Default: 0 是否填充。– the size of the window to take a max over 池化核,最大值的一个窗口。
2024-09-11 21:14:10
1123
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人