pytorch小记（一）：pytorch矩阵乘法：torch.matmul(x, y)

原创

已于 2025-01-12 04:41:34 修改 · 1.4k 阅读

29 ·

CC 4.0 BY-SA版权

文章标签：

#pytorch #矩阵 #人工智能

于 2025-01-12 04:38:03 首次发布

pytorch小记（一）：pytorch矩阵乘法：torch.matmul（x, y）/ x @ y

代码

x = torch.tensor([[1,2,3,4], [5,6,7,8]])
y = torch.tensor([2, 3, 1, 0]) # y.shape == (4)
print(torch.matmul(x, y))
print(x @ y)

>>>
tensor([11, 35])
tensor([11, 35])

x = torch.tensor([[1,2,3,4], [5,6,7,8]])
y = torch.tensor([2, 3, 1, 0]) # y.shape == (4)
y = y.view(4,1)                # y.shape == (4, 1)
'''
tensor([[2],
        [3],
        [1],
        [0]])
'''
print(torch.matmul(x, y))
print(x @ y)

>>>
tensor([[11],
        [35]])
tensor([[11],
        <

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

墨绿色的摆渡人

关注关注

22
点赞
踩
29

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【torch函数】torch.matmul——矩阵乘法

weixin_45780075的博客

04-18

541

是 PyTorch 中用于执行张量之间的矩阵乘法的函数。它可以用于两个张量之间的矩阵乘法，也可以用于高维张量之间的批量矩阵乘法。在矩阵乘法中，torch.matmul 会根据输入张量的维度自动进行广播，以便进行有效的矩阵乘法运算。

【torch小知识点03】矩阵乘法总结

羊老羊

01-24

3299

torch中，矩阵乘法总结

参与评论您还未登录，请先登录后发表或查看评论

关于pytorch中部分矩阵乘法的总结（torch.mm,torch.mul,torch.matmul）

12-21

一、torch.mul 该乘法可简单理解为矩阵各位相乘，一个常见的例子为向量点乘，源码定义为torch.mul（input,other,out=None）。其中other可以为一个数也可以为一个张量，other为数即张量的数乘。该函数可触发广播机制（broadcast）。 tensor1 = 2*torch.ones(1,4) tensor2 = 3*torch.ones(4,1) print(torch.mul(tensor1, tensor2)) #输出结果为： tensor([[6., 6., 6., 6.], [6., 6., 6., 6.], [6.

PyTorch中matmul函数使用详解和示例代码

热门推荐

Wendy的博客

11-05

5万+

目录一、函数介绍二、常见用法2.1 两个一维向量的乘积运算2.2 两个二维矩阵的乘积运算2.3 一个一维向量和一个二维矩阵的乘积运算2.4 一个二维矩阵和一个一维向量的乘积运算2.5 其他一、函数介绍 pytorch中两个张量的乘法可以分为两种：两个张量对应元素相乘，在PyTorch中可以通过torch.mul函数（或*运算符）实现；两个张量矩阵相乘，在PyTorch中可以通过torch.matmul函数实现； torch.matmul(input, other) → Tensor 计算两个张量i

pytorch torch.matmul函数介绍

qq_27390023的博客

09-07

1031

是 PyTorch 中用于进行矩阵乘法的函数。它可以执行两维矩阵、向量和更高维张量之间的乘法运算，支持的运算取决于输入张量的维度。

pytorch小记（二）：pytorch中的连接操作：torch.cat(tensors, dim=0)

xzs1210652636的博客

01-12

1273

在 PyTorch 中，`torch.cat()` 是一种用于在指定维度上连接张量的操作。它能够将多个张量沿某个轴拼接成一个新的张量。

Pytorch学习小记1：torch.utils.data.Dataset类和datasat.py文件的初读笔记

weixin_42214565的博客

08-29

5770

昨天在使用torch.utils.data.DataLoader类时遇到了一些问题，通过粗略的学习了解到了Pytorch的数据处理主要基于三个类：Dataset，DatasetLoader和DatasetLoaderIter，并且它们依次构成封装关系。关于他们之间的关系和解读，这篇文章总结得比较好理解：https://zhuanlan.zhihu.com/p/30934236 于是追根溯源找到了...

pytorch小记（五）：pytorch中的求导操作：backward()

xzs1210652636的博客

01-12

1210

pytorch中的求导操作：backward()

pytorch小记（六）：pytorch中的clone和detach操作：克隆/复制数据 vs 共享相同数据但与计算图断开联系

xzs1210652636的博客

01-12

1195

clone()：深拷贝一个张量。detach()：断开张量与计算图的连接。：将非张量数据转换为浮点型 PyTorch 张量。它们在不同场景下各有用途，可以单独使用或结合使用。

PyTorch学习之torch.matmul函数

qq_46396470的博客

07-01

1032

用于两维或更高维张量的矩阵乘法操作。它支持广播机制，并且能够处理不同形状和维度的张量，适用于广泛的应用场景。

PyTorch 对应点相乘、矩阵相乘实例

12-23

一，对应点相乘，x.mul(y) ，即点乘操作，点乘不求和操作，又可以叫作Hadamard product；点乘再求和，即为卷积 data = [[1,2], [3,4], [5, 6]] tensor = torch.FloatTensor(data) tensor Out[27]: tensor([[ 1., 2.], [ 3., 4.], [ 5., 6.]]) tensor.mul(tensor) Out[28]: tensor([[ 1., 4.], [ 9., 16.], [ 25., 36.]]) 二，矩阵相乘，x.mm(y) ，矩阵大小需满

pytorch:torch.mm()和torch.matmul()的使用

12-23

如下所示： torch.mm(mat1, mat2, out=None) → Tensor torch.matmul(mat1, mat2, out=None) → Tensor 对矩阵mat1和mat2进行相乘。如果mat1 是一个n×m张量，mat2 是一个 m×p 张量，将会输出一个 n×p 张量out。参数： mat1 (Tensor) – 第一个相乘矩阵 mat2 (Tensor) – 第二个相乘矩阵 out (Tensor, optional) – 输出张量代码示例: import torch a=torch.randn(2,3) b=torch.randn(3,2)

pytorch之torch中的几种乘法 #点乘torch.mm() #矩阵乘torch.mul()，torch.matmul() #高维Tensor相乘维度要求

夏普通

06-21

4万+

文章目录1. 点乘——`torch.mul(a, b)`2. 矩阵乘2.1. 二维矩阵乘——`torch.mm(a, b)`2.2. 高维矩阵乘——`torch.matmul(a, b)`3. 高维的Tensor相乘维度要求3.1. 对于维数相同的张量3.2. 对于维数不一样的张量 1. 点乘——torch.mul(a, b) 点乘都是broadcast的，可以用torch.mul(a, b)实现，也可以直接用*实现。当a, b维度不一致时，会自动填充到相同维度相点乘。 import torch a =

【PyTorch】torch.matmul() 函数：矩阵乘法（矩阵点积）

彬彬侠的博客

04-02

1798

torch.matmul() 是 PyTorch 中用于执行矩阵乘法（矩阵点积）的函数，与 @ 运算符等价，支持 1D、2D、3D 及更高维度张量的广义矩阵乘法，是深度学习中非常常用的线性代数运算。

torch 的 3种矩阵乘法运算

OrdinaryMatthew的博客

08-17

5781

说明 2 维 tensor 与 2 维 tensor，torch.matmul 函数也是执行矩阵乘法。会得到 torch.Size([1]) 而不是 torch.Size([])，Vec3 的 shape 是 torch.Size([])。结果和 torch.mm 计算出来的例 2 的结果一样的。注，输入的两个 tensor 的 shape 都是。当操作符是最最最自然的 “*” 时，执行的时。输出的 tensor 的shape 也是。的矩阵对应相乘，拼成一个。将 Mat1 修改为。.........

Pytorch中矩阵乘法使用及案例

Iawfy22的博客

03-13

762

Pytorch中矩阵乘法的使用以及使用案例

torch中的几种乘法。torch.mm, torch.mul, torch.matmul

weixin_42105432的博客

09-10

2万+

一、点乘点乘都是broadcast的，可以用torch.mul(a, b)实现，也可以直接用*实现。 >>> a = torch.ones(3,4) >>> a tensor([[1., 1., 1., 1.], [1., 1., 1., 1.], [1., 1., 1., 1.]]) >>> b = torc...

PyTorch中的矩阵乘法

woshipihe的博客

09-30

2104

torch.mm() torch.mm(input, mat2, out=None) → Tensor 矩阵乘法，不进行 broadcast torch.bmm() 输入1 ：(b×n×m) tensor, 输入2：(b×m×p) tensor, 输出：(b×n×p) tensor. batch 式的矩阵乘法，不broadcast torch.matmul() torch.matmul(input, other, out=None) → Tensor 矩阵乘法，有broadcast功能如果输入的tens

y = torch.matmul(X, w) + b 解释

03-10

<think>嗯，用户想理解PyTorch中线性变换的计算方式，特别是y = torch.matmul(X, w) + b这句话的含义和用法。首先，我需要拆解这个表达式里的每个部分。用户可能对torch.matmul不太熟悉，需要先解释这个函数的作用。根据引用[2]和[4]，torch.matmul可以进行矩阵乘法，支持不同维度的张量，比如向量和矩阵相乘。例如，如果X是一个二维张量（比如batch_size × input_features），而w是一个二维张量（input_features × output_features），那么matmul(X, w)的结果就是矩阵相乘后的结果，形状为batch_size × output_features。然后加上偏置b，这里的b应该是一个一维张量，形状是output_features，PyTorch会自动进行广播，把b加到每个样本的输出上。接下来要考虑用户可能的疑问点。比如，为什么用matmul而不是mm或者bmm？根据引用[3]和[4]，mm只能处理二维矩阵，而matmul更灵活，可以处理高维情况，所以更适合神经网络中的批量数据。此外，用户可能对广播机制不太清楚，需要解释加法操作中如何自动扩展维度。用户的应用场景可能是在构建神经网络的全连接层，所以需要强调这在全连接层中的典型应用。比如，线性变换后通常接激活函数。还要注意参数w的形状是否正确，比如input_features和output_features的匹配，否则矩阵乘法会出错。另外，用户提供的示例代码中引用了不同函数，比如dot和matmul的区别。可能需要简要说明，dot是向量内积，而matmul在向量相乘时会进行矩阵乘法，得到标量或者更高维度的结果，视输入而定。最后，用户可能需要具体的例子来理解，比如给出X、w、b的具体形状，并展示运算后的结果形状。这样用户能更直观地看到维度变化，避免形状不匹配的错误。总结来说，回答需要分步骤解释表达式中的每个操作，说明函数的作用，形状变化，广播机制，以及在实际中的应用场景。同时结合用户提供的引用，确保引用正确，比如引用[2]和[4]来支持matmul的解释。</think>### PyTorch中线性变换的计算方式解析在PyTorch中，表达式 $y = \text{torch.matmul}(X, w) + b$ 是神经网络中实现线性变换的核心操作，其作用类似于全连接层（Fully Connected Layer）。以下是分步解析： #### 1. **张量形状要求** - **输入 $X$**：通常为二维张量，形状为 $(\text{batch\_size}, \text{input\_features})$，表示批量数据。例如，输入包含100个样本，每个样本有5个特征，则形状为 $(100,5)$。 - **权重 $w$**：二维张量，形状为 $(\text{input\_features}, \text{output\_features})$。例如，输入特征为5，输出特征为3，则形状为 $(5,3)$。 - **偏置 $b$**：一维张量，形状为 $(\text{output\_features})$。例如，输出特征为3时，形状为 $(3,)$。 #### 2. **矩阵乘法 $\text{torch.matmul}(X, w)$** - 该操作等效于线性代数中的矩阵乘法：$X \cdot w$，结果形状为 $(\text{batch\_size}, \text{output\_features})$[^2][^4]。 - **示例**：若 $X$ 形状为 $(100,5)$，$w$ 形状为 $(5,3)$，则结果形状为 $(100,3)$。 #### 3. **偏置加法 $+ b$** - PyTorch通过广播机制自动将一维偏置 $b$ 扩展为与矩阵乘法结果相同的形状。例如，$(3,)$ 扩展为 $(100,3)$，逐元素相加[^1]。 #### 4. **代码示例** ```python import torch # 定义输入和参数 X = torch.randn(100, 5) # 输入数据 w = torch.randn(5, 3) # 权重矩阵 b = torch.randn(3) # 偏置向量 # 计算线性变换 y = torch.matmul(X, w) + b print(y.shape) # 输出: torch.Size([100, 3]) ``` #### 5. **与全连接层的关系** - `torch.nn.Linear` 模块内部正是通过此公式实现，等价于： ```python linear_layer = torch.nn.Linear(in_features=5, out_features=3) y = linear_layer(X) ``` #### 6. **常见问题** - **为什么用 $\text{matmul}$ 而非 $\text{mm}$？** `torch.mm` 仅支持二维矩阵乘法，而 `torch.matmul` 支持高维张量（如批量矩阵乘法）[^3]。 - **形状不匹配的典型错误**：若 $w$ 形状为 $(5,3)$ 而 $X$ 形状为 $(10,5,5)$（如错误地添加了多余维度），会导致无法广播。 ---