torch.copy_()函数介绍

最新推荐文章于 2023-12-27 18:45:00 发布

原创最新推荐文章于 2023-12-27 18:45:00 发布 · 5.5k 阅读

7 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#copy_ #torch.copy_ #tensor.copy #拷贝

Pytorch 专栏收录该内容

77 篇文章

订阅专栏

本文详细讲解了PyTorch中tensor.copy_()函数的作用，强调其与直接赋值的内存管理差异，并通过实例演示了指定区域拷贝。重点在于优化内存使用和训练效率。

Qwen3-32B-Chat 私有部署镜像 | RTX4090D 24G 显存 CUDA12.4 优化版

Qwen

文本生成

Qwen3

本镜像基于 RTX 4090D 24GB 显存 + CUDA 12.4 + 驱动 550.90.07 深度优化，内置完整运行环境与 Qwen3-32B 模型依赖，开箱即用。

torch.copy_()函数进行tensor的复制。

Tensor.copy_(src, non_blocking=False) → Tensor

官网定义：Copies the elements from src into self tensor and returns self.

1）若采用直接赋值的方式，原来权重的存储指针会指向新得到的权重张量的存储区域；而使用 .copy_() 的话，仅仅是改变原来权重的值，存储区域则不发生改变。copy_()有利于降低运算。

import torch
x = torch.tensor([[1,2], [3,4], [5,6]])
y = torch.rand((3,2)) # [0,1)之间均匀分布
print(y,id(y))
y = x #赋值操作，导致y的地址指向变了
print(y,id(y))

import torch
x = torch.tensor([[1,2], [3,4], [5,6]])
y = torch.rand((3,2)) # [0,1)之间均匀分布
print(y,id(y))
y.copy_(x) # copy_()操作，y的地址指向没变，只是重新赋值。
print(y,id(y))

2）指定区域拷贝

import torch
x = torch.tensor([[1,2], [3,4], [5,6]])

z = torch.rand((4,2))
z[:x.shape[0],:x.shape[1]].copy_(x) #只拷贝x的大小区域
print(z[:x.shape[0],:x.shape[1]].copy_(x))
print(z)

参考文章《【Pytorch 模型训练 Issue】tensor.copy_() 与直接赋值(=) 对训练耗时的影响 - 知乎

您可能感兴趣的与本文相关的镜像

Qwen3-32B-Chat 私有部署镜像 | RTX4090D 24G 显存 CUDA12.4 优化版

Qwen

文本生成

Qwen3

本镜像基于 RTX 4090D 24GB 显存 + CUDA 12.4 + 驱动 550.90.07 深度优化，内置完整运行环境与 Qwen3-32B 模型依赖，开箱即用。