이 장에서는 파이썬의 변수에 대해 알아보자. 그리고 객체의 정체성, 동질성, 별명의 개념, 그리고 얕은 복사에 대해 이야기한다. 마지막으로 가비지 컬렉션에 대해 이야기한다.

# 8.1 변수는 상자가 아니다

객체가 생성된 후에 변수가 객체에 할당된다.

In [1]:
class Gizmo:
    def __init__(self):
        print('Gizmo id: %d' % id(self))

In [2]:
x = Gizmo()

Gizmo id: 139952938663048


In [3]:
y = Gizmo() * 10

Gizmo id: 139952938680672


TypeError: unsupported operand type(s) for *: 'Gizmo' and 'int'

In [4]:
dir()

['Gizmo',
 'In',
 'Out',
 '_',
 '__',
 '___',
 '__builtin__',
 '__builtins__',
 '__doc__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 '_dh',
 '_i',
 '_i1',
 '_i2',
 '_i3',
 '_i4',
 '_ih',
 '_ii',
 '_iii',
 '_oh',
 'exit',
 'get_ipython',
 'quit',
 'x']

위 예제를 보면 곱셈을 시도하기 전에 두 번째 `Gizmo` 객체가 실제로 생성되었으나, 우측이 실행되는 동안 예외가 발생했기 때문에 변수 `y`는 생성되지 않았다. 파이썬에서 할당문은 오른쪽에서 객체를 생성하거나 가져온 후, 왼쪽에 잇는 변수가 객체에 바인딩된다.

# 8.2 정체성, 동질성, 별명

루이스 캐럴은 찰스 럿위지 도지슨 교수의 필명이다. 이 개념을 파이썬으로 표현하면 다음과 같다.

In [5]:
charles  = {'name': 'Charles L. Dodgson', 'born': 1832}
lewis = charles

In [13]:
lewis is charles # lewis는 charles의 별명이다

True

In [8]:
id(charles), id(lewis)

(139952919793168, 139952919793168)

* `is`는 변수가 같은 Object(객체)를 가리키면 True
* `==`는 변수가 같은 Value(값)을 가지면 True

In [14]:
lewis['balance'] = 950 # lewis에 항목을 추가하는 것은 charles에 항목을 추가하는 것과 동일
charles

{'name': 'Charles L. Dodgson', 'born': 1832, 'balance': 950}

그런데 다른 사람이 도지슨을 사칭하는 경우를 생각해보자.

In [15]:
alex = {'name': 'Charles L. Dodgson', 'born': 1832, 'balance': 950}
alex == charles

True

In [16]:
alex is charles

False

`lewis`와 `charles`는 동일 객체에 바인딩되어 있다. 반면 `alex`는 `charles`에 대한 별명이 아니므로 정체성이 다르다. 다만 값이 같으므로 `==` 연산자에 의해서는 동일하다고 판단된다. 파이썬에서는 다음과 같이 설명하고 있다.

    모든 객체는 정체성, 자료형, 값을 가지고 있따. 객체의 정체성은 일단 생성된 후에는 결쾌 변경되지 않는다. 정체성은 메모리 내의 객체 주소라고 생각할 수 있다. `is` 연산자는 두 객체의 정체성을 비교한다. `id()` 함수는 정체성을 나타내는 정수를 반환한다.

## 8.2.1 `==` 연산자와 `is` 연산자 간의 선택

`==` 연산자가 객체의 값을 비교하는 반면, `is` 연산자는 객체의 정체성을 비교한다. 정체성보다 값을 비교하는 경우가 많으므로 파이썬 코드에서는 `==` 연산자를 `is` 연산자보다 자주 볼 수 있지만, 변수를 싱글턴과 비교할 때는 `is` 연산자를 사용해야 한다.

    x is None
    x is not None
    
`is` 연산자를 평가하기 위해 특별 메서드를 호출할 필요가 없고 두 정수를 비교하는 정도로 연산이 간단하므로 `is` 연산자가 `==` 연산자보다 빠르다.

## 8.2.2 튜플의 상대적 불변성

대부분의 파이썬 컬렉션과 마찬가지로 튜플도 객체에 대한 참조를 담는다. 참조된 항목이 가변형이면 튜플 자체는 불변형이지만 참조된 항목은 변할 수 있다. 튜플에서 변경되지 않는 것은 튜플이 담고 있는 항목들의 정체성뿐이다.

In [19]:
t1 = (1,2,[30,40])
t2 = (1,2,[30,40])
t1 == t2, t1 is t2

(True, False)

In [20]:
id(t1[-1])

139952938675336

In [24]:
t1[-1].append(99)
t1, id(t1[-1]) # 정체성은 그대로이지만 값은 변경되었다.

((1, 2, [30, 40, 99, 99, 99]), 139952938675336)

In [23]:
t1 == t2

False

이러한 튜플의 상대적 불변성 때문에 일부 튜플이 해시 불가능하다.

동질성과 정체성 간의 차이는 객체를 복사할 때 더 큰 영향을 미친다. 

# 8.3 기본 복사는 얇은 복사

리스트나 대부분의 내장 가변 컬렉션을 복사하는 가장 손쉬운 방법은 그 자료형 자체의 내장 생성자를 사용하는 것이다.

In [27]:
l1 = [3, [55,44], (7,8,9)]
l2 = list(l1) # l2 는 l1의 사본
l2

[3, [55, 44], (7, 8, 9)]

In [28]:
l2 == l1, l2 is l1 # 두 사본은 동일하나 다른 객체를 참조한다.

(True, False)

리스트 및 가변형 시퀀스의 경우 `l2 = l1[:]` 코드는 사본을 생성한다. 그러나 생성자나 `[:]`를 사용하면 얕은 사본(shallow copy)을 생성한다. 즉, 최상위 컨테이너는 복제하지만 사본은 원래 컨테이너에 들어 있던 동일 객체에 대한 참조로 채워진다.

In [36]:
l1 = [3, [66,55,44], (7,8,9)]
l2 = list(l1)

<img src = './images/8_1.png'>

In [31]:
l1.append(100)

<img src = './images/8_2.png'>

In [31]:
l1[1].remove(55)
print('l1:', l1)
print('l2:', l2)

l1: [3, [66, 44], (7, 8, 9), 100]
l2: [3, [66, 44], (7, 8, 9)]


<img src = './images/8_3.png'>

In [37]:
l2[1] += [33,22]
# 가변 객체의 경우 += 연산자가 리스트를 그 자리에서 변경한다.

<img src = './images/8_4.png'>

In [41]:
l2[2] += (10,11)
# 새로운 튜플을 만들어서 l2[2] 에 바인딩. 따라서 l1[-1]과 l2[-1] 은 동일 객체가 아님
print('l1:', l1)
print('l2:', l2)

l1: [3, [66, 55, 44, 33, 22], (7, 8, 9)]
l2: [3, [66, 55, 44, 33, 22], (7, 8, 9, 10, 11, 10, 11)]


<img src = './images/8_5.png'>

## 8.3.1 객체의 깊은 복사와 얕은 복사

깊은 복사를 위해서는 `copy` 모듈이 제공하는 `deepcopy()` 함수를, 얕은 복사를 위해서는 `copy()` 함수를 사용한다.

In [42]:
class Bus:
    def __init__(self, passengers=None):
        if passengers is None:
            self.passengers = []
        else:
            self.passengers = list(passengers)
            
    def pick(self, name):
        self.passengers.append(name)
        
    def drop(self, name):
        self.passengers.remove(name)

In [43]:
import copy
bus1 = Bus(['Alice', 'Bill', 'Claire', 'David'])
bus2 = copy.copy(bus1)
bus3 = copy.deepcopy(bus1)
id(bus1), id(bus2), id(bus3)

(139952785463952, 139952785464008, 139952785464232)

In [44]:
bus1.drop('Bill')
bus1.passengers, bus2.passengers, bus3.passengers

(['Alice', 'Claire', 'David'],
 ['Alice', 'Claire', 'David'],
 ['Alice', 'Bill', 'Claire', 'David'])

In [46]:
id(bus1.passengers), id(bus2.passengers), id(bus3.passengers)
# bus1과 bus2가 동일 리스트를 공유한다. 반면 bus3는 다른 리스트를 가리킨다.

(139952443836104, 139952443836104, 139952786926664)

일반적으로 깊은 사본을 만드는 일은 간단하지 않으며, `deepcopy()` 함수는 순환 참조를 제대로 처리하기 위해 이미 복사한 객체에 대한 참조를 기억하고 있다.

In [47]:
a = [10, 20]
b = [a, 30]
a.append(b)
a

[10, 20, [[...], 30]]

In [48]:
c = copy.deepcopy(a)
c

[10, 20, [[...], 30]]

In [53]:
a[2], c[2]

([[10, 20, [...]], 30], [[10, 20, [...]], 30])

# 8.4 참조로서의 함수 매개변수

파이썬은 공유로 호출하는 매개변수 전달 방식만 지원한다. 이 말은 함수의 각 매개변수가 인수로 전달받은 각 참조의 사본을 받는다는 의미이다. 따라서 함수는 인수로 전달받은 모든 가변 객체를 변경할 수 있지만, 객체의 정체성은 변경할 수 없다.

In [54]:
def f(a,b):
    a += b
    return a

In [57]:
x = 1
y = 2
f(x,y), x, y

(3, 1, 2)

In [59]:
a = [1,2]
b = [3,4]
f(a,b), a, b

([1, 2, 3, 4], [1, 2, 3, 4], [3, 4])

In [60]:
t = (10,20)
u = (30, 40)
f(t,u), t, u

((10, 20, 30, 40), (10, 20), (30, 40))

## 8.4.1 가변형을 매개변수 기본값으로 사용하기: 좋지 않은 생각

기본값을 가진 선택적 인수는 아주 좋은 기능이지만, 매개변수 기본값으로 가변 객체를 사용하는 것은 피해야 한다.

In [81]:
class HauntedBus:
    """유령 승객이 출몰하는 버스 모델"""
    
    def __init__(self, passengers=[]):
        self.passengers = passengers
    
    def pick(self, name):
        self.passengers.append(name)
    
    def drop(self, name):
        self.passengers.remove(name)

In [82]:
bus1 = HauntedBus(['Alice', 'Bill'])
bus1.passengers

['Alice', 'Bill']

In [83]:
bus1.pick('Charlie')
bus1.drop('Alice')
bus1.passengers

['Bill', 'Charlie']

In [84]:
bus2 = HauntedBus()
bus2.pick('Carrie')
bus2.passengers

['Carrie']

In [85]:
bus3 = HauntedBus()
bus3.passengers # 초기값이 더이상 empty가 아님!

['Carrie']

In [86]:
bus3.pick('Dave')
bus2.passengers

['Carrie', 'Dave']

In [87]:
bus2.passengers is bus3.passengers

True

In [88]:
HauntedBus.__init__.__defaults__

(['Carrie', 'Dave'],)

In [90]:
HauntedBus.__init__.__defaults__[0] is bus2.passengers
# bus2.passengers가 HauntedBus.__init__.__defaults__[0] 에 바인딩된 별명임을 알 수 있다.

True

가변 기본값에 대한 이러한 문제 때문에, 가변 값을 받는 매개변수의 기본값으로 `None`을 주로 사용한다.

## 8.4.2 가변 매개변수에 대한 방어적 프로그래밍

가변 매개변수를 받는 함수를 구현할 때는 전달된 인수가 변경될 것이라는 것을 호출자가 예상할 수 있는지 여부를 고려해야 한다. 예를 들어 다음 같은 일이 일어날 수 있다.

In [91]:
class TwilightBus:
    """승객이 사라지게 만드는 버스 모델"""
    
    def __init__(self, passengers=None):
        if passengers is None:
            self.passengers = []
        else:
            self.passengers = passengers # 사본 생성이 아니라 인수를 별명으로 사용
            
    def pick(self, name):
        self.passengers.append(name)
    
    def drop(self, name):
        self.passengers.remove(name)

In [93]:
basketball_team = ['Sue', 'Tina', 'Maya', 'Diana', 'Pat']
bus = TwilightBus(basketball_team)
bus.drop('Tina')
bus.drop('Pat')
basketball_team # 선수단이 변경되어 버림

['Sue', 'Maya', 'Diana']

따라서 앞서 구현한 것처럼 다음과 같이 해야한다.

```python
def __init__(self, passengers=None):
    if passengers is None:
        self.passengers = []
    else:
        self.passengers = list(passengers)
```

# 8.5 del과 가비지 컬렉션

`del` 명령은 이름을 제거하는 것이지 객체를 제거하는 것이 아니다. `del` 명령으로 제거된 변수가 객체를 참조하는 최후의 변수거나 객체에 도달할 수 없을 때만 가비지 컬렉트된다.

`CPython`의 경우 가비지 컬렉션은 참조 카운트에 기반하여 0이 되는 순간 객체가 제거된다. 

In [106]:
import weakref
s1 = {1,2,3}
s2 = s1

In [107]:
def bye():
    print('Gone with the wind...')

In [108]:
ender = weakref.finalize(s1, bye) # s1이 가리키는 객체에 대해 bye() 콜백 등록
ender.alive

True

In [109]:
del s1 # del은 객체가 아니라 객체에 대한 참조를 제거한다.
ender.alive

True

In [110]:
s2 = 'spam' # s2를 다른 객체에 바인딩하면 {1,2,3} 이 제거되고, buye() 콜백이 호출되고, ender.alive는 거짓이 된다.

Gone with the wind...


In [111]:
ender.alive

False

여기서 `ender`가 `{1,2,3}`을 참조하고 있는 것처럼 보이지만 이건 약한 참조라서 카운트되지 않는다.

# 8.6 약한 참조

# 8.7 파이썬의 특이한 불변형 처리법

몰라도 될듯...