# 如何理解 Python 拷贝

## 知识点

### 一、几个概念

在理解 Python 的拷贝机制之前，需要先了解几个概念：

- 变量：是一个系统表的元素，拥有指向对象的连接空间
- 对象：被分配的一块内存，存储数据
- 引用：自动形成的从变量到对象的指针
- 类型：属于对象，而非属于变量
- **不可变对象**：一旦创建就不可以修改的对象，包括元组、字符串、数值类型等
- **可变对象**：创建后仍可以修改的对象，包括列表、字典、集合等

### 二、赋值（复制）

**赋值：只是复制了对象的引用，并不开辟新的内存空间。**并不会生成新的独立对象，只是为原有数据块打上新标签。

当执行 `a = 1` 时，Python 解释器做了什么？

- 创建变量（变量名） `a`
- 创建对象（分配内存空间，**仅首次**），存储数据 `1`
- 将变量与对象通过指针链接起来，称之为**引用**

深入了解 Python 解释器，请查看 [此文](https://app.yinxiang.com/shard/s64/nl/20318504/391dd303-4227-453e-8fa4-dcb20e39da1b)。

### 三、浅拷贝

**浅拷贝：创建了新对象，其内容是对原对象的引用。**浅拷贝有三种形式：切片操作、工厂函数、`copy.copy`。

```Python
lst = [1, [2, 3]]
cpy = lst[:]
cpy = list(lst)
cpy = copy.copy(lst)
```

浅拷贝分情况说明：

- 外层对象可变时改变地址，不可变时不改变地址
- 内部对象可变或不可变都不改变地址

### 四、深拷贝

**深拷贝：拷贝了原对象的所有元素，包括多层嵌套的元素，深拷贝的对象与原对象没有任何关联。**只有一种形式：`copy.deepcopy`。

```Python
lst = [1, [2, 3]]
cpy = copy.deepcopy(lst)
```

深拷贝分情况说明：

- 外部对象可变或不可变都会改变地址
- 内部对象可变时改变地址，不可变时不改变地址

### 五、特殊情况

- 对于**非容器类型**（譬如数字、字符串和其他原子类型数据）没有拷贝的概念，即对于原子类型数据，赋值=浅拷贝=深拷贝
- 对于**只包含原子类型数据的元组**不能进行深拷贝，或者说，浅拷贝=深拷贝

## 测试


In [18]:
import copy
oobj = (1, [2, 3])
print(oobj)
print(id(oobj))
print([id(elem) for elem in oobj])
print("====== 赋值 =====")
asgn = oobj
print(asgn)
print(id(asgn))
print([id(elem) for elem in asgn])
print("====== 浅拷贝 =====")
scpy = copy.copy(oobj)
print(scpy)
print(id(scpy))
print([id(elem) for elem in scpy])
print("====== 深拷贝 =====")
dcpy = copy.deepcopy(oobj)
print(dcpy)
print(id(dcpy))
print([id(elem) for elem in dcpy])
print("====== 修改 =====")
oobj[1].append(4)
print(oobj)
print(asgn)
print(scpy)
print(dcpy)

(1, [2, 3])
2306017971848
[140720296468880, 2306029906888]
(1, [2, 3])
2306017971848
[140720296468880, 2306029906888]
(1, [2, 3])
2306017971848
[140720296468880, 2306029906888]
(1, [2, 3])
2306023051464
[140720296468880, 2306020518280]
(1, [2, 3, 4])
(1, [2, 3, 4])
(1, [2, 3, 4])
(1, [2, 3])


In [20]:
import copy
oobj = [1, [2, 3]]
print(oobj)
print(id(oobj))
print([id(elem) for elem in oobj])
print("====== 赋值 =====")
asgn = oobj
print(asgn)
print(id(asgn))
print([id(elem) for elem in asgn])
print("====== 浅拷贝 =====")
scpy = copy.copy(oobj)
print(scpy)
print(id(scpy))
print([id(elem) for elem in scpy])
print("====== 深拷贝 =====")
dcpy = copy.deepcopy(oobj)
print(dcpy)
print(id(dcpy))
print([id(elem) for elem in dcpy])
print("====== 修改 =====")
oobj[0] = 2
oobj[1].append(4)
print(oobj)
print(asgn)
print(scpy)
print(dcpy)

[1, [2, 3]]
2306027126280
[140720296468880, 2306027710664]
[1, [2, 3]]
2306027126280
[140720296468880, 2306027710664]
[1, [2, 3]]
2306022008008
[140720296468880, 2306027710664]
[1, [2, 3]]
2306024181576
[140720296468880, 2306024180232]
[2, [2, 3, 4]]
[2, [2, 3, 4]]
[1, [2, 3, 4]]
[1, [2, 3]]


In [22]:
import copy
print("====== 非容器 =====")
oobj = "COPY"
scpy = copy.copy(oobj)
print(scpy is oobj)
dcpy = copy.deepcopy(oobj)
print(dcpy is oobj)
print("====== 不可变 =====")
oobj = (5, "5")
scpy = copy.copy(oobj)
print(scpy is oobj)
dcpy = copy.deepcopy(oobj)
print(dcpy is oobj)

True
True
True
True


## 总结

- Python 中的赋值都只是进行对象引用（内存地址）的传递
- 外层对象：浅拷贝在对象可变时改变了地址，不可变时不改变地址；深拷贝则都会改变地址
- 内部对象：浅拷贝都不改变地址；深拷贝则在对象可变时改变地址，不可变时不改变地址
- 对于非容器类型和只包含原子类型数据的元组（完全不可变），赋值=浅拷贝=深拷贝
- 地址的改变表示对原对象进行改变并不会影响到新对象