自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 Python 多文件项目的ModuleNotFoundError问题

没有正确设置或文件结构不规范导致的,一般只要将。如以上project中,在main.py中执行。在 Python 多文件项目中,如果遇到。加入到模块搜索路径中即可。

2025-06-05 18:52:27 232

原创 关于forward函数

它将输入数据通过模型的各层(如卷积层、全连接层等),计算出模型的输出。第二种方式更为简洁,是 PyTorch 推荐的使用方式。在 PyTorch 中,

2025-03-23 01:40:11 671

原创 边际排名损失函数

即 loss = max(0, margin - (input1 - input2))是深度学习框架中一个内置的标准损失函数。

2025-03-22 02:08:20 757

原创 梯度下降法优化模型参数的简单示例与理解

减号表示沿负梯度方向调整参数。因为梯度是上坡最快的方向,则负梯度就是下坡最快的方向,即损失函数减小最快的方向。

2025-03-20 16:47:00 878

原创 Transformer模型的自注意力机制

【Transformer模型】:【自注意力机制】:计算每个单词与句子中所有单词的相关度,并生成一个新的词向量。引入参数矩阵每个输入通过线性变换(与参数矩阵相乘 )生成。

2025-03-19 00:15:27 707

原创 用余弦相似度衡量文本相似度的理解

对于两个词向量 A=[a1, a2, ..., an] 和 B=[b1, b2, ..., n],它们的余弦相似度定义为:余弦相似度衡量的是两个向量在空间中的方向相似度,而不是它们的大小。具体来说:

2025-03-18 18:05:12 721

原创 关于GPU

GPU 的架构NVIDIA 的 CUDA 核心各厂商 GPU 的对比以下是 NVIDIA、AMD 和 Intel GPU 计算单元的对比:

2025-03-18 15:15:31 365

原创 Python偏函数partial

para1|para2|...分别为所需参数。【step2】创建原函数。【step3】固定参数。

2025-03-18 00:09:58 405

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除