05 | Tensor变形记：快速掌握Tensor切分、变形等方法-PyTorch深度学习实战

当前位置:　首页>> 技术小册>> PyTorch深度学习实战

05 | Tensor变形记：快速掌握Tensor切分、变形等方法

在PyTorch的深度学习之旅中，Tensor（张量）作为数据处理与模型计算的核心单元，其操作的灵活性和高效性直接关系到模型设计的复杂度和训练效率。本章“Tensor变形记：快速掌握Tensor切分、变形等方法”将深入探讨PyTorch中Tensor的切分（Splitting）、变形（Reshaping）、转置（Transposing）以及合并（Concatenating）等关键操作，帮助读者快速掌握这些技巧，从而在构建和训练深度学习模型时游刃有余。

一、Tensor基础回顾

在深入讲解之前，我们先简要回顾一下Tensor的基本概念。Tensor是PyTorch中的一个核心概念，它类似于NumPy的ndarray，但专为GPU加速计算而设计。Tensor可以看作是一个高维数组，其维度由torch.Size对象表示，可以通过.shape属性访问。Tensor的元素可以是任何数据类型，但最常见的是浮点数（用于神经网络计算）。

二、Tensor切分（Splitting）

Tensor的切分是将一个大的Tensor沿着指定的维度分割成多个较小的Tensor的过程。PyTorch提供了torch.split()和torch.chunk()两个主要函数来实现这一功能。

2.1 torch.split()

torch.split()函数允许你根据指定的分割大小或分割段数来切分Tensor。其语法如下：

torch.split(tensor, split_size_or_sections, dim=0)

tensor：待切分的Tensor。
split_size_or_sections：可以是整数或整数列表。如果是整数，表示每个分割段的大小；如果是整数列表，则直接指定每个段的具体大小。
dim：沿着哪个维度进行切分，默认为0。

示例：

import torch
x = torch.arange(9).reshape(3, 3)
# 使用整数分割大小
split1 = torch.split(x, 2, dim=1)  # 沿第1维（列）分割，每块2列
# 使用整数列表指定具体大小
split2 = torch.split(x, [1, 2, 1], dim=0)  # 沿第0维（行）分割，分别为1, 2, 1行
print(list(split1))
print(list(split2))

2.2 torch.chunk()

torch.chunk()函数根据指定的分割段数来切分Tensor，每个段的大小尽可能相等（除了最后一个段可能较小）。其语法如下：

torch.chunk(tensor, chunks, dim=0)

tensor：待切分的Tensor。
chunks：分割成的段数。
dim：沿着哪个维度进行切分，默认为0。

示例：

chunks = torch.chunk(x, 3, dim=1)  # 沿第1维（列）分割成3块
print(list(chunks))

三、Tensor变形（Reshaping）

Tensor的变形操作不改变其元素的总数，只改变其形状。PyTorch提供了多种方法来实现Tensor的变形，其中torch.reshape()和torch.view()最为常用。

3.1 torch.reshape()

torch.reshape()函数返回一个新的Tensor，其数据与输入Tensor相同，但形状已改变。如果新形状与原始形状的乘积不相等，则会抛出错误。

y = x.reshape(1, 9)  # 将3x3的Tensor变形为1x9
print(y)

3.2 torch.view()

torch.view()函数与reshape()类似，但它会尝试在不复制数据的情况下返回一个新的视图。如果新形状与原始数据的存储方式不兼容（例如，跨越了非连续的内存块），则会抛出错误。

z = x.view(9, 1)  # 将3x3的Tensor变形为9x1
print(z)

四、Tensor转置（Transposing）

Tensor的转置操作是交换其两个维度的过程。在PyTorch中，可以使用.transpose(dim0, dim1)或.T（仅对二维Tensor有效）来实现。

4.1 .transpose(dim0, dim1)

transposed = x.transpose(0, 1)  # 交换第0维和第1维
print(transposed)

4.2 .T（仅限二维）

if x.ndim == 2:
    print(x.T)  # 对于二维Tensor，.T是.transpose(0, 1)的简写

五、Tensor合并（Concatenating）

Tensor的合并操作是将多个Tensor沿着指定的维度拼接起来，形成一个更大的Tensor。PyTorch提供了torch.cat()函数来实现这一功能。

torch.cat(tensors, dim=0)

tensors：待合并的Tensor序列。
dim：沿着哪个维度进行合并，默认为0。

示例：

a = torch.arange(3).reshape(1, 3)
b = torch.arange(3, 6).reshape(1, 3)
concatenated = torch.cat((a, b), dim=0)  # 沿第0维（行）合并
print(concatenated)

六、高级变形技巧

除了上述基本的Tensor操作外，PyTorch还提供了更多高级变形技巧，如torch.squeeze()（去除单维度条目）、torch.unsqueeze()（在指定位置增加单维度）、torch.flatten()（展平Tensor，默认展平所有维度但保留一个维度）等，这些技巧在处理复杂模型结构和数据预处理时非常有用。

七、总结

本章通过详细介绍Tensor的切分、变形、转置和合并等操作，展示了PyTorch在处理多维数据时的强大能力。掌握这些基础而关键的Tensor操作技巧，对于设计复杂的深度学习模型、优化模型训练过程以及进行高效的数据预处理都具有重要意义。希望读者能够通过实践，进一步加深对这些操作的理解和应用，从而在PyTorch的深度学习之路上越走越远。