Pytorch各种维度变换函数总结 - 教程之家

介绍

本文对于PyTorch中的各种维度变换的函数进行总结，包括reshape()、view()、resize_()、transpose()、permute()、squeeze()、unsqeeze()、expand()、repeat()函数的介绍和对比。

contiguous

区分各个维度转换函数的前提是需要了解contiguous。在PyTorch中，contiguous指的是Tensor底层一维数组的存储顺序和其元素顺序一致。

Tensor是以一维数组的形式存储的，C/C++使用行优先(按行展开)的方式，Python中的Tensor底层实现使用的是C，因此PyThon中的Tensor也是按行展开存储的，如果其存储顺序和按行优先展开的一维数组元素顺序一致，就说这个Tensor是连续(contiguous)的。

形式化定义：

对于任意的d维张量 t，如果满足对于所有的 i，第 i 维相邻元素间隔=第 i + 1 维相邻元素间隔 × 第 i + 1 维长度的乘积，则 t 是连续的:

stride[i] 表示第 i 维相邻元素之间间隔的位数，称为步长，可通过 stride () 方法获得。
size [i] 表示固定其他维度时，第 i 维的元素数量，即第 i 维的长度，通过 size () 方法获得。

Python中的多维张量按照行优先展开的方式存储，访问矩阵中下一个元素是通过偏移来实现的，这个偏移量称为步长(stride)，比如python中，访问2 × 3 矩阵的同一行中的相邻元素，物理结构需要偏移 1 个位置，即步长为 1 ，同一列中的两个相邻元素则步长为 3 。

举例说明：

>>>t = torch.arange(12).reshape(3,4)
>>>t
tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]])
>>>t.stride(),t.stride(0),t.stride(1) # 返回t两个维度的步长，第0维的步长，第1维的步长
((4,1),4,1)
# 第0维的步长，表示沿着列的两个相邻元素，比如‘0'和‘4'两个元素的步长为4
>>>t.size(1)
4
# 对于i=0，满足stride[0]=stride[1] * size[1]=1*4=4，那么t是连续的。

PyTorch提供了两个关于contiguous的方法：

is_contiguous() : 判断Tensor是否是连续的
contiguous() : 返回新的Tensor，重新开辟一块内存，并且是连续的

举例说明(参考[1])：

>>>t = torch.arange(12).reshape(3,4)
>>>t
tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]])
>>>t2 = t.transpose(0,1)
>>>t2
tensor([[ 0,  4,  8],
        [ 1,  5,  9],
        [ 2,  6, 10],
        [ 3,  7, 11]])
>>>t.data_ptr() == t2.data_ptr()  # 返回两个张量的首元素的内存地址
True    	#说明底层数据是同一个一维数组
>>>t.is_contiguous(),t2.is_contiguous()  # t连续，t2不连续
(True, False)

可以看到，t和t2共享内存中的数据。如果对t2使用contiguous()方法，会开辟新的内存空间：

>>>t3 = t2.contiguous()
>>>t3
tensor([[ 0,  4,  8],
        [ 1,  5,  9],
        [ 2,  6, 10],
        [ 3,  7, 11]])
>>>t3.data_ptr() == t2.data_ptr() # 底层数据不是同一个一维数组
False
>>>t3.is_contiguous()
True

关于contiguous的更深入的解释可以参考[1].

view()/reshape()

view()

tensor.view()函数返回一个和tensor共享底层数据，但不同形状的tensor。使用view()函数的要求是tensor必须是contiguous的。

用法如下：

>>>t
tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]])
>>>t2 = t.view(2,6)
>>>t2
tensor([[ 0,  1,  2,  3,  4,  5],
        [ 6,  7,  8,  9, 10, 11]])
>>>t.data_ptr() == t2.data_ptr()	# 二者的底层数据是同一个一维数组
True

reshape()

tensor.reshape()类似于tensor.contigous().view()操作，如果tensor是连续的，则reshape()操作和view()相同，返回指定形状、共享底层数据的tensor；如果tensor是不连续的，则会开辟新的内存空间，返回指定形状的tensor，底层数据和原来的tensor是独立的，相当于先执行contigous()，再执行view()。

如果不在意底层数据是否使用新的内存，建议使用reshape()代替view().

resize_()

tensor.resize_()函数，返回指定形状的tensor，与reshape()和view()不同的是，resize_()可以只截取tensor一部分数据，或者是元素个数大于原tensor也可以，会自动扩展新的位置。

resize_()函数对于tensor的连续性无要求，且返回的值是共享的底层数据（同view()），也就是说只返回了指定形状的索引，底层数据不变的。

transpose()/permute()

permute()和transpose()还有t()是PyTorch中的转置函数，其中t()函数只适用于2维矩阵的转置，是这三个函数里面最”弱”的。

transpose()

tensor.transpose()，返回tensor的指定维度的转置，底层数据共享，与view()/reshape()不同的是，transpose()只能实现维度上的转置，不能任意改变维度大小。

对于维度交换来说，view()/reshape()和transpose()有很大的区别，一定不要混用！混用了以后虽然不会报错，但是数据是乱的，血坑。

reshape()/view()和transpose()的区别在于对于维度改变的方式不同，前者是在存储顺序的基础上对维度进行划分，也就是说将存储的一维数组根据shape大小重新划分，而transpose()则是真正意义上的转置，比如二维矩阵的转置。

举个例子：

>>>t
tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]])
>>> t.transpose(0,1)	# 交换t的前两个维度，即对t进行转置。
tensor([[ 0,  4,  8],
        [ 1,  5,  9],
        [ 2,  6, 10],
        [ 3,  7, 11]])
>>> a.reshape(4,3)     # 使用reshape()/view()的方法，虽然形状一样，但是数据排列完全不同
tensor([[ 0,  1,  2],
        [ 3,  4,  5],
        [ 6,  7,  8],
        [ 9, 10, 11]])

permute()

tensor.permute()函数，以view的形式返回矩阵指定维度的转置，和transpose()功能相同。

与transpose()不同的是，permute()同时对多个维度进行转置，且参数是期望的维度的顺序，而transpose()只能同时对两个维度转置，即参数只能是两个，这两个参数没有顺序，只代表了哪两个维度进行转置。

举个例子：

>>> t				# t的形状为(2,3,2)
tensor([[[ 0,  1],
         [ 2,  3],
         [ 4,  5]],

        [[ 6,  7],
         [ 8,  9],
         [10, 11]]])
>>> t.transpose(0,1)   # 使用transpose()将前两个维度进行转置，返回(3,2,2)
tensor([[[ 0,  1],
         [ 6,  7]],

        [[ 2,  3],
         [ 8,  9]],

        [[ 4,  5],
         [10, 11]]])
>>> t.permute(1,0,2)   # 使用permute()按照指定的维度序列对t转置，返回(3,2,2)
tensor([[[ 0,  1],
         [ 6,  7]],

        [[ 2,  3],
         [ 8,  9]],

        [[ 4,  5],
         [10, 11]]])

squeeze()/unsqueeze()

squeeze()

tensor.squeeze()返回去除size为1的维度的tensor，默认去除所有size=1的维度，也可以指定去除某一个size=1的维度，并返回去除后的结果。

举个例子：

>>> t.shape 
torch.Size([3, 1, 4, 1])
>>> t.squeeze().shape  # 去除所有size=1的维度
torch.Size([3, 4])
>>> t.squeeze(1).shape  # 去除第1维
torch.Size([3, 4, 1])
>>> t.squeeze(0).shape  #　如果指定的维度size不等于1，则不执行任何操作。
torch.Size([3, 1, 4, 1])

unsqueeze()

tensor.unsqueeze()与squeeze()相反，是在tensor插入新的维度，插入的维度size=1，用于维度扩展。

举个例子：

>>> t.shape
torch.Size([3, 1, 4, 1])
>>> t.unsqueeze(1).shape   # 在指定的位置上插入新的维度，size=1
torch.Size([3, 1, 1, 4, 1]) 
>>> t.unsqueeze(-1).shape  # 参数为-1时表示在最后一维添加新的维度，size=1
torch.Size([3, 1, 4, 1, 1])
>>> t.unsqueeze(4).shape   # 和dim=-1等价
torch.Size([3, 1, 4, 1, 1])

expand()/repeat()

expand()

tensor.expand()的功能是扩展tensor中的size为1的维度，且只能扩展size=1的维度。以view的形式返回tensor，即不改变原来的tensor，只是以视图的形式返回数据。

举个例子：

>>> t
tensor([[[0, 1, 2],
         [3, 4, 5]]])
>>> t.shape
torch.Size([1, 2, 3])
>>> t.expand(3,2,3)  # 将第0维扩展为3，可见其将第0维复制了3次
tensor([[[0, 1, 2],
         [3, 4, 5]],

        [[0, 1, 2],
         [3, 4, 5]],

        [[0, 1, 2],
         [3, 4, 5]]])
>>> t.expand(3,-1,-1) # dim=-1表示固定这个维度，效果是一样的，这样写更方便
tensor([[[0, 1, 2],
         [3, 4, 5]],

        [[0, 1, 2],
         [3, 4, 5]],

        [[0, 1, 2],
         [3, 4, 5]]])
>>> t.expand(3,2,3).storage()    # expand不扩展新的内存空间
 0
 1
 2
 3
 4
 5
[torch.LongStorage of size 6]

repeat()

tensor.repeat()用于维度复制，可以将size为任意大小的维度复制为n倍，和expand()不同的是，repeat()会分配新的存储空间，是真正的复制数据。

举个例子：

>>> t
tensor([[0, 1, 2],
        [3, 4, 5]])
>>> t.shape
torch.Size([2, 3])
>>> t.repeat(2,3)  # 将两个维度分别复制2、3倍
tensor([[0, 1, 2, 0, 1, 2, 0, 1, 2],
        [3, 4, 5, 3, 4, 5, 3, 4, 5],
        [0, 1, 2, 0, 1, 2, 0, 1, 2],
        [3, 4, 5, 3, 4, 5, 3, 4, 5]])
>>> t.repeat(2,3).storage()   # repeat()是真正的复制，会分配新的空间
 0
 1
 2
 0
 1
 2
 0
 1
 2
 3
 4
 5
 ......
 3
 4
 5
[torch.LongStorage of size 36]

如果维度size=1的时候，repeat()和expand()的作用是一样的，但是expand()不会分配新的内存，所以优先使用expand()函数。

总结

view()/reshape()两个函数用于将tensor变换为任意形状，本质是将所有的元素重新分配。
t()/transpose()/permute()用于维度的转置，转置和reshape()操作是有区别的，注意区分。
squeeze()/unsqueeze()用于压缩/扩展维度，仅在维度的个数上去除/添加，且去除/添加的维度size=1。
expand()/repeat()用于数据的复制，对一个或多个维度上的数据进行复制。
以上提到的函数仅有两种会分配新的内存空间：reshape()操作处理非连续的tensor时，返回tensor的copy数据会分配新的内存；repeat()操作会分配新的内存空间。其余的操作都是返回的视图，底层数据是共享的，仅在索引上重新分配。

Reference

1. PyTorch中的contiguous

2. stackoverflow-pytorch-contiguous

3. PyTorch官方文档

觉得上面的内容有用吗？快来点个赞吧！

点赞() 我要打赏

温馨提示 : 本站内容来自会员投稿以及互联网，所有源码及教程均为作者总结编辑，请大家在使用过程中提前做好备份，以免发生无法预知的错误，源码类教程请勿直接用于生产环境！

可能感兴趣的文章

目录一、开篇：Python最独特的设计二、缩进的基本规则 2.1 用空格还是Tab 2.2 缩进层级 2.3 什么情况下需要缩进三、缩进的嵌套 3.1 多层缩进 3.2 缩进的可视化理...

目录引言一、concurrent.futures基础 1.1 模块概述 1.2 基本使用模式 1.3 核心组件二、ThreadPoolExecutor详解 2.1 创建线程池 2.2 提交任务 2.3 批量提交任务...

目录前言一、函数：把重复代码封装起来二、函数参数：让函数处理不同的数据 1. 参数个数要匹配 2. Python 的参数不需要写类型三、函数返回值：把结果交还给调用者 1. r...

目录环境准备什么是内容控件添加组合框内容控件添加纯文本内容控件添加图片内容控件添加日期选择器内容控件添加下拉列表内容控件实用技巧锁定内容控件设置控...

目录项目概述游戏实现初始化与基础设置颜色定义砖块颜色与布局核心类设计 1. 挡板类（Paddle） 2. 小球类（Ball） 3. 砖块类（Brick） 4. 粒子类（Particle） ...

目录项目概述游戏实现初始化与基础设置颜色与方块样式配置字体加载函数核心函数设计 1. 网格操作 2. 核心滑动算法 3. 游戏状态检测核心类设...

目录导出依赖包安装依赖包原理 PyCharm查看和管理依赖包总结导出依赖包pip freeze > requirements.txt依赖包文件requirements.txt的内容如下：Django==2.1.15Pillow==7.1...

目录一、安装Poetry 不要在全局环境使用以下指令使用官方的安装指令前设置安装路径(可选) 二、设置使用项目内环境三、修改Python版本范围四、建立项目包总...

目录一、背景：为什么要去动 QDateTimeEdit？二、问题：原生 QDateTimeEdit 到底卡在哪？ 2.1 QSS 样式支持有限 2.2 时间选择体验糟糕 2.3 日期和时间"绑"在一起三、方案：拆...

目录环境准备 PDF 背景的应用场景设置纯色背景使用平铺图片作为背景实用技巧与高级应用封装背景管理工具类常见应用场景示例背景设计的最佳实践常见问题与解决...

目录

介绍

contiguous

view()/reshape()

view()

reshape()

resize_()

transpose()/permute()

transpose()

permute()

squeeze()/unsqueeze()

squeeze()

unsqueeze()

expand()/repeat()

expand()

repeat()

总结

Reference

可能感兴趣的文章

热门文章