# Python 对象的比较、拷贝

## 比较 "==" VS "is"

- '=='操作符比较对象之间的值是否相等，比如下面的例子，表示比较变量 a 和 b 所指向的值是否相等
- 'is'操作符比较的是对象的身份标识是否相等，即它们是否是同一个对象，是否指向同一个内存地址。

In [5]:
# -5 到 256 的整数 a is b 为 true  类似java

a = 10
b = 10

print(a == b)
print(id(a), id(b), a is b)

c = 257
d = 257
print(id(c), id(d), c is d)


c = d = 257 # 这样子赋值指向同一个地址
print(id(c), id(d), c is d)

True
4390576576 4390576576 True
4835259312 4835259696 False
4835259472 4835259472 True


In [6]:
t1 = (1, 2, [3, 4])
t2 = (1, 2, [3, 4])
print(t1 == t2, t1 is t2)

t1[-1].append(5)
print(t1 == t2, t1 is t2)

True False
False False


## 拷贝

### 浅拷贝

浅拷贝，是指重新分配一块内存，创建一个新的对象，里面的元素是原对象中子对象的引用。

In [7]:
# 原对象子对象不可变
import copy

l1 = [1, 2, 3]
l2 = list(l1)
print(l1 == l2, l1 is l2)

l1 = [1, 2, 3]
l2 = l1[:]
print(l1 == l2, l1 is l2)

l1 = [1, 2, 3]
l2 = copy.copy(l1)
print(l1 == l2, l1 is l2)

s1 = set([1, 2, 3])
s2 = set(s1)
print(s1 == s2, s1 is s2)

t1 = (1, 2, 3)
t2 = tuple(t1) # 组 (1, 2, 3) 只被创建一次，t1 和 t2 同时指向这个元组
print(t1 == t2, t1 is t2)


True False
True False
True False
True False
True True


In [10]:
# 原对象子对象可变，会有副作用
l1 = [[1, 2], (30, 40)]
l2 = list(l1)
print(l1, l2)

l1.append(100)
l1[0].append(3)
print(l1, l2)

l1[1] += (50, 60)
print(l1, l2)


[[1, 2], (30, 40)] [[1, 2], (30, 40)]
[[1, 2, 3], (30, 40), 100] [[1, 2, 3], (30, 40)]
[[1, 2, 3], (30, 40, 50, 60), 100] [[1, 2, 3], (30, 40)]


### 深度拷贝

深度拷贝，是指重新分配一块内存，创建一个新的对象，并且将原对象中的元素，以递归的方式，通过创建新的子对象拷贝到新对象中。因此，新对象和原对象没有任何关联。

In [11]:
import copy
l1 = [[1, 2], (30, 40)]
l2 = copy.deepcopy(l1) # 使用 deepcopy
print(l1, l2)

l1.append(100)
l1[0].append(3)
print(l1, l2)

[[1, 2], (30, 40)] [[1, 2], (30, 40)]
[[1, 2, 3], (30, 40), 100] [[1, 2], (30, 40)]


深度拷贝的问题， 这块解释好像不是很清楚

In [17]:
import copy
x = [1]
x.append(x)
print(x)

y = copy.deepcopy(x)
print(y)

print(x == y, x is y)

[1, [...]]
[1, [...]]


RecursionError: maximum recursion depth exceeded in comparison

# 值传递、引用传递、其他

## python 变量及其赋值基本原理

- 变量的赋值，只是表示让变量指向了某个对象，并不表示拷贝对象给变量；而一个对象，可以被多个变量所指向。

- 可变对象（列表，字典，集合等等）的改变，会影响所有指向该对象的变量。

- 对于不可变对象（字符串、整型、元组等等），所有指向该对象的变量的值总是一样的，也不会改变。但是通过某些操作（+= 等等）更新不可变对象的值时，会返回一个新的对象。

- 变量可以被删除，但是对象无法被删除。

## Python 函数的参数传递

准确地说，Python 的参数传递是赋值传递 （pass by assignment），或者叫作对象的引用传递（pass by object reference）。Python 里所有的数据类型都是对象，所以参数传递时，只是让新变量与原变量指向相同的对象而已，并不存在值传递或是引用传递一说。

尤其要记住的是，改变变量和重新赋值的区别：
- my_func3() 中单纯地改变了对象的值，因此函数返回后，所有指向该对象的变量都会被改变；

- 但 my_func4() 中则创建了新的对象，并赋值给一个本地变量，因此原变量仍然不变。

In [31]:
def my_func3(l2): # 不会有类似 golang 的问题
  l2.append(4)
  l2.append(5)
  l2.append(6)
  l2.append(4)
  l2.append(5)
  l2.append(6)
  l2.append(4)
  l2.append(5)

l1 = [1, 2, 3]
print(l1.__sizeof__())
my_func3(l1)
print(l1.__sizeof__())
print(l1)

72
168
[1, 2, 3, 4, 5, 6, 4, 5, 6, 4, 5]


In [33]:
def my_func4(l2):
  l2 = l2 + [4] # 创建了新的对象 l2 指向了新的对象

l1 = [1, 2, 3]
my_func4(l1)
l1
[1, 2, 3]

[1, 2, 3]

## 思考题

In [36]:
def func(d):
   d['a'] = 10
   d['b'] = 20

d = {'a': 1, 'b': 2}
func(d)
print(d)

{'a': 10, 'b': 20}


In [38]:
l1 = [1, 2, 3]
l2 = [1, 2, 3]
l3 = l2
print(l1 == l2, l2 == l3, l1 is l2, l2 is l3)

True True False True
