- 博客(8)
- 收藏
- 关注
原创 Python 多文件项目的ModuleNotFoundError问题
没有正确设置或文件结构不规范导致的,一般只要将。如以上project中,在main.py中执行。在 Python 多文件项目中,如果遇到。加入到模块搜索路径中即可。
2025-06-05 18:52:27
232
原创 关于forward函数
它将输入数据通过模型的各层(如卷积层、全连接层等),计算出模型的输出。第二种方式更为简洁,是 PyTorch 推荐的使用方式。在 PyTorch 中,
2025-03-23 01:40:11
671
原创 梯度下降法优化模型参数的简单示例与理解
减号表示沿负梯度方向调整参数。因为梯度是上坡最快的方向,则负梯度就是下坡最快的方向,即损失函数减小最快的方向。
2025-03-20 16:47:00
878
原创 Transformer模型的自注意力机制
【Transformer模型】:【自注意力机制】:计算每个单词与句子中所有单词的相关度,并生成一个新的词向量。引入参数矩阵每个输入通过线性变换(与参数矩阵相乘 )生成。
2025-03-19 00:15:27
707
原创 用余弦相似度衡量文本相似度的理解
对于两个词向量 A=[a1, a2, ..., an] 和 B=[b1, b2, ..., n],它们的余弦相似度定义为:余弦相似度衡量的是两个向量在空间中的方向相似度,而不是它们的大小。具体来说:
2025-03-18 18:05:12
721
原创 关于GPU
GPU 的架构NVIDIA 的 CUDA 核心各厂商 GPU 的对比以下是 NVIDIA、AMD 和 Intel GPU 计算单元的对比:
2025-03-18 15:15:31
365
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人