NumPy数组维度增加与移除的详细方法与实战指南

代码漫叙

于 2025-09-21 10:00:00 发布

阅读量614

点赞数 16

CC 4.0 BY-SA版权

分类专栏： Python：数据分析与处理文章标签： numpy 数组维度 python

本文链接：https://blog.csdn.net/a246808642/article/details/151630757

Python：数据分析与处理专栏收录该内容

10 篇文章

订阅专栏

#新星杯·14天创作挑战营·第15期#

前言

在数据科学和科学计算领域，数组维度的调整是一项基础且至关重要的操作。NumPy作为Python科学计算的核心库，提供了多种灵活的方法来增加或移除数组的维度。这些操作在数据预处理、特征工程、模型输入准备以及结果可视化等场景中都有广泛应用。

理解并掌握NumPy中维度调整的各种方法，不仅能够提高数据处理的效率，还能帮助开发者编写更加简洁和高效的代码。无论是在准备机器学习模型的输入数据，还是在处理多维科学数据时，正确的维度操作都能显著提升工作效率和代码质量。

本文将深入探讨NumPy中增加和移除数组维度的各种方法，通过详细的示例代码和实际应用场景，帮助读者全面掌握这一重要技能。

一、维度增加方法

1.1 使用np.newaxis增加维度

np.newaxis是NumPy中用于增加数组维度的最直观方法，它实际上是None的别名，可以在索引操作中增加一个新的轴。

import numpy as np

# 创建一维数组
arr = np.array([1, 2, 3])
print("原始数组:", arr)
print("原始形状:", arr.shape)

# 增加行维度（变为行向量）
arr_row = arr[np.newaxis, :]
print("增加行维度后:", arr_row)
print("行向量形状:", arr_row.shape)

# 增加列维度（变为列向量）
arr_col = arr[:, np.newaxis]
print("增加列维度后:\n", arr_col)
print("列向量形状:", arr_col.shape)

# 在多个位置增加维度
arr_3d = arr[np.newaxis, :, np.newaxis]
print("增加两个维度后:", arr_3d)
print("三维数组形状:", arr_3d.shape)

1.2 使用expand_dims增加维度

np.expand_dims函数提供了更明确的方式来增加数组的维度，可以指定要插入新轴的位置。

# 使用expand_dims增加维度
arr = np.array([1, 2, 3])

# 在轴0位置增加维度
arr_expanded_0 = np.expand_dims(arr, axis=0)
print("axis=0扩展后:", arr_expanded_0)
print("形状:", arr_expanded_0.shape)

# 在轴1位置增加维度
arr_expanded_1 = np.expand_dims(arr, axis=1)
print("axis=1扩展后:\n", arr_expanded_1)
print("形状:", arr_expanded_1.shape)

# 在负轴位置增加维度
arr_expanded_neg = np.expand_dims(arr, axis=-1)
print("axis=-1扩展后:\n", arr_expanded_neg)
print("形状:", arr_expanded_neg.shape)

# 同时增加多个维度
arr_multi = np.array([1, 2, 3])
for i in range(2):
    arr_multi = np.expand_dims(arr_multi, axis=0)
print("增加两个维度后:", arr_multi)
print("形状:", arr_multi.shape)

1.3 使用reshape增加维度

虽然reshape主要用于改变数组形状，但也可以通过巧妙地设置形状参数来增加维度。

# 使用reshape增加维度
arr = np.array([1, 2, 3, 4, 5, 6])

# 增加一个维度
arr_2d = arr.reshape(2, 3)
print("reshape为2x3:\n", arr_2d)
print("形状:", arr_2d.shape)

# 增加两个维度
arr_3d = arr.reshape(2, 3, 1)
print("reshape为2x3x1:\n", arr_3d)
print("形状:", arr_3d.shape)

# 使用-1自动计算
arr_auto = arr.reshape(1, -1, 1)
print("使用-1自动计算:\n", arr_auto)
print("形状:", arr_auto.shape)

1.4 使用广播机制隐式增加维度

NumPy的广播机制可以隐式地增加维度，使不同形状的数组能够进行运算。

# 使用广播机制隐式增加维度
arr = np.array([1, 2, 3])
matrix = np.array([[1, 2, 3], [4, 5, 6]])

# 一维数组与二维数组相加，会自动广播
result = arr + matrix
print("广播结果:\n", result)
print("结果形状:", result.shape)

# 显式使用广播增加维度
arr_broadcast = arr[:, np.newaxis]  # 变为列向量
print("显式广播前:", arr_broadcast.shape)
result_explicit = arr_broadcast + matrix
print("显式广播结果:\n", result_explicit)

二、维度移除方法

2.1 使用squeeze移除维度

np.squeeze是减少数组维度的主要方法，它可以移除长度为1的维度。

# 创建具有单维度的数组
arr_3d = np.array([[[1], [2], [3]]])
print("原始三维数组:\n", arr_3d)
print("形状:", arr_3d.shape)

# 使用squeeze移除所有单维度
arr_squeezed = np.squeeze(arr_3d)
print("squeeze后:", arr_squeezed)
print("形状:", arr_squeezed.shape)

# 指定要移除的轴
arr_squeezed_axis = np.squeeze(arr_3d, axis=0)
print("squeeze axis=0后:\n", arr_squeezed_axis)
print("形状:", arr_squeezed_axis.shape)

# 移除特定轴（必须是长度为1的维度）
try:
    arr_squeezed_axis2 = np.squeeze(arr_3d, axis=2)
    print("squeeze axis=2后:\n", arr_squeezed_axis2)
    print("形状:", arr_squeezed_axis2.shape)
except ValueError as e:
    print("错误:", e)

# 处理多个单维度
arr_multi = np.array([[[[1, 2, 3]]]])
print("多维数组形状:", arr_multi.shape)
arr_multi_squeezed = np.squeeze(arr_multi)
print("squeeze后:", arr_multi_squeezed)
print("形状:", arr_multi_squeezed.shape)

2.2 使用reshape移除维度

虽然reshape主要用于改变形状，但也可以通过减少维度数来实现维度移除。

# 使用reshape移除维度
arr_3d = np.arange(24).reshape(2, 3, 4)
print("原始三维数组形状:", arr_3d.shape)

# 减少到二维
arr_2d = arr_3d.reshape(2, 12)
print("reshape为2x12:\n", arr_2d)
print("形状:", arr_2d.shape)

# 减少到一维
arr_1d = arr_3d.reshape(-1)
print("reshape为一维:", arr_1d)
print("形状:", arr_1d.shape)

# 保留部分维度，减少其他维度
arr_partial = arr_3d.reshape(2, -1)
print("部分维度减少:\n", arr_partial)
print("形状:", arr_partial.shape)

2.3 使用索引移除维度

通过索引操作也可以实现维度的移除，特别是在处理特定维度的数据时。

# 使用索引移除维度
arr_3d = np.arange(24).reshape(2, 3, 4)
print("原始三维数组形状:", arr_3d.shape)

# 选择特定索引移除维度
arr_2d = arr_3d[0, :, :]  # 选择第一个二维切片
print("选择第一个二维切片:\n", arr_2d)
print("形状:", arr_2d.shape)

# 选择特定行或列
arr_1d = arr_3d[0, 0, :]  # 选择第一行第一列的一维数组
print("选择第一行第一列:", arr_1d)
print("形状:", arr_1d.shape)

# 使用省略号
arr_2d_ellipsis = arr_3d[0, ...]  # 等同于arr_3d[0, :, :]
print("使用省略号:\n", arr_2d_ellipsis)
print("形状:", arr_2d_ellipsis.shape)

2.4 使用reduce函数移除维度

某些聚合函数（如sum、mean等）可以通过指定axis参数来移除维度。

# 使用聚合函数移除维度
arr_3d = np.random.rand(2, 3, 4)
print("原始三维数组形状:", arr_3d.shape)

# 沿特定轴求和，移除该维度
arr_sum_axis0 = np.sum(arr_3d, axis=0)
print("沿轴0求和后形状:", arr_sum_axis0.shape)

arr_sum_axis1 = np.sum(arr_3d, axis=1)
print("沿轴1求和后形状:", arr_sum_axis1.shape)

arr_sum_axis2 = np.sum(arr_3d, axis=2)
print("沿轴2求和后形状:", arr_sum_axis2.shape)

# 沿多个轴求和
arr_sum_multi = np.sum(arr_3d, axis=(0, 1))
print("沿轴0和1求和后形状:", arr_sum_multi.shape)

# 移除所有维度，得到标量
arr_scalar = np.sum(arr_3d)
print("所有元素求和:", arr_scalar)
print("形状:", arr_scalar.shape)  # 标量没有维度

三、高级维度操作

3.1 使用einsum进行复杂维度操作

np.einsum函数可以实现复杂的维度操作，包括维度的增加、减少和重新排列。

# 使用einsum进行维度操作
arr = np.random.rand(3, 4)

# 增加维度
arr_expanded = np.einsum('ij->ijk', arr)
print("原始形状:", arr.shape)
print("einsum增加维度后形状:", arr_expanded.shape)

# 减少维度（求和）
arr_summed = np.einsum('ij->i', arr)  # 对每行求和
print("einsum行求和后形状:", arr_summed.shape)

# 对角线操作（减少维度）
arr_square = np.random.rand(3, 3)
diag = np.einsum('ii->i', arr_square)  # 提取对角线
print("原始方阵形状:", arr_square.shape)
print("对角线形状:", diag.shape)

3.2 使用transpose和swapaxes进行维度重排

虽然主要用于维度重排，但这些操作也可以间接实现维度的增加和减少效果。

# 使用transpose和swapaxes进行维度操作
arr_3d = np.random.rand(2, 1, 4)
print("原始形状:", arr_3d.shape)

# 转置可以改变维度顺序
arr_transposed = np.transpose(arr_3d, (1, 0, 2))
print("转置后形状:", arr_transposed.shape)

# 结合squeeze使用
arr_squeezed = np.squeeze(arr_transposed)
print("转置后squeeze形状:", arr_squeezed.shape)

# 使用swapaxes交换轴
arr_swapped = np.swapaxes(arr_3d, 0, 1)
print("swapaxes后形状:", arr_swapped.shape)

四、实际应用场景

4.1 图像数据处理

# 图像数据通常需要增加批次维度
# 假设有一张图像 (高度, 宽度, 通道)
image = np.random.rand(64, 64, 3)
print("原始图像形状:", image.shape)

# 增加批次维度用于深度学习模型
batch = np.expand_dims(image, axis=0)
print("增加批次维度后:", batch.shape)

# 转换为通道优先格式 (批次, 通道, 高度, 宽度)
batch_channels_first = np.transpose(batch, (0, 3, 1, 2))
print("通道优先格式:", batch_channels_first.shape)

# 处理完成后减少维度
output = np.squeeze(batch_channels_first)
print("处理完成后形状:", output.shape)

4.2 时间序列数据处理

# 时间序列数据通常需要调整维度结构
# 创建时间序列数据 (时间步, 特征)
time_series = np.random.rand(100, 5)
print("时间序列形状:", time_series.shape)

# 增加批次维度
batch_series = np.expand_dims(time_series, axis=0)
print("增加批次维度后:", batch_series.shape)

# 转换为适合RNN的格式 (批次, 时间步, 特征)
# 已经是正确格式，无需调整

# 处理多个时间序列
multiple_series = np.random.rand(10, 100, 5)
print("多个时间序列形状:", multiple_series.shape)

# 减少维度（例如求平均）
mean_series = np.mean(multiple_series, axis=0)
print("平均后形状:", mean_series.shape)

4.3 特征工程中的应用

# 在特征工程中经常需要调整维度
# 创建一些特征数据
features = np.random.rand(100, 10)
print("原始特征形状:", features.shape)

# 增加维度以适应某些模型
features_expanded = np.expand_dims(features, axis=-1)
print("增加维度后:", features_expanded.shape)

# 或者减少维度
features_reduced = features[:, :5]  # 选择前5个特征
print("减少特征后形状:", features_reduced.shape)

# 使用reshape调整维度结构
features_reshaped = features.reshape(100, 2, 5)
print("reshape后形状:", features_reshaped.shape)

4.4 模型输出处理

# 处理模型输出通常需要调整维度
# 模拟模型输出 (批次, 类别)
model_output = np.random.rand(32, 10)
print("模型输出形状:", model_output.shape)

# 获取预测结果（减少维度）
predictions = np.argmax(model_output, axis=-1)
print("预测结果形状:", predictions.shape)

# 增加维度用于后续处理
predictions_expanded = np.expand_dims(predictions, axis=-1)
print("增加维度后:", predictions_expanded.shape)

# 或者转换为one-hot编码
one_hot = np.eye(10)[predictions]
print("one-hot编码形状:", one_hot.shape)

五、性能优化与最佳实践

5.1 内存效率考虑

# 选择适当的方法以提高内存效率
arr = np.random.rand(1000, 1000, 1)
print("原始数组形状:", arr.shape)

# 方法1: 使用squeeze（高效，返回视图）
squeezed = np.squeeze(arr)
print("squeeze后形状:", squeezed.shape)
print("squeeze是视图:", squeezed.base is arr)

# 方法2: 使用reshape（可能返回视图或副本）
reshaped = arr.reshape(1000, 1000)
print("reshape后形状:", reshaped.shape)
print("reshape是视图:", reshaped.base is arr)

# 方法3: 使用索引（返回视图）
indexed = arr[:, :, 0]
print("索引后形状:", indexed.shape)
print("索引是视图:", indexed.base is arr)

5.2 避免不必要的复制

# 尽量避免不必要的数组复制
large_arr = np.random.rand(1000, 1000, 1)

# 不推荐：使用flatten会创建副本
flat_copy = large_arr.flatten()  # 创建副本

# 推荐：使用ravel可能创建视图
flat_view = large_arr.ravel()  # 可能创建视图

# 推荐：使用squeeze和reshape组合
squeezed = np.squeeze(large_arr)  # 移除单维度
if squeezed.base is large_arr:
    print("squeeze返回视图")
else:
    print("squeeze返回副本")

# 对于维度操作，优先使用返回视图的方法

5.3 批量处理技巧

# 使用向量化操作提高效率
# 创建多个需要调整维度的数组
arrays = [np.random.rand(10, 10, 1) for _ in range(100)]

# 不推荐：循环处理每个数组
result = []
for arr in arrays:
    result.append(np.squeeze(arr))

# 推荐：使用列表推导式（稍快）
result = [np.squeeze(arr) for arr in arrays]

# 更推荐：如果可以，先合并再处理
stacked = np.stack(arrays)  # 形状: (100, 10, 10, 1)
squeezed = np.squeeze(stacked)  # 形状: (100, 10, 10)
print("批量处理後形状:", squeezed.shape)