## 8. 객체 참조, 가변성, 재활용
### 8.1 변수는 상자가 아니다
[그림 8-1]을 보면 파이썬에서 상자 비유는 잘못된 반면, 포스트잇은 변수가 실제 작동하는 방식을 잘 보여주고 있다. <p><img src="Figure8-1.png"></p>

In [1]:
""" [예제 8-1] 사본이 아니라 동일한 리스트를 참조하는 변수 a와 b """
a = [1,2,3]
b = a
a.append(4)
print(b)

[1, 2, 3, 4]


In [2]:
""" [예제 8-2] 객체가 생성된 후에야 변수가 객체에 할당된다. """
class Gizmo:
    def __init__(self):
        print('Gizmo id: {:d}'.format(id(self)))

x = Gizmo()

Gizmo id: 140618640191896


In [3]:
y = Gizmo() * 10 # 객체에 숫자를 곱하면 예외가 생성된다. 
                 # 위와 다른 id를 볼 때 객체가 변수보다 먼저 생성됨을 알 수 있다.
                 # 변수를 먼저 선언하고 값을 대입하는 절차적 언어와 차이점

Gizmo id: 140618640551888


TypeError: unsupported operand type(s) for *: 'Gizmo' and 'int'

In [4]:
dir() # 할당문의 오른쪽이 실행되는 동안 예외가 발생했기 때문에 변수 y는 생성되지 않는다.

['Gizmo',
 'In',
 'Out',
 '_',
 '__',
 '___',
 '__builtin__',
 '__builtins__',
 '__doc__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 '_dh',
 '_i',
 '_i1',
 '_i2',
 '_i3',
 '_i4',
 '_ih',
 '_ii',
 '_iii',
 '_oh',
 'a',
 'b',
 'exit',
 'get_ipython',
 'quit',
 'x']

### 8.2 정체성, 동질성, 별명
모든 객체는 정체성, 자료형, 값을 가지고 있다. 객체의 정체성은 일단 생성한 후에는 결코 변경되지 않는다. 정체성은 메모리 내의 객체 주소라고 생각할 수 있다. is 연산자는 두 객체의 정체성을 비교한다. id( ) 함수는 정체성을 나타내는 정수를 반환한다.
#### 8.2.1 == 연산자와 is 연산자 간의 선택
== 연산자는 객체의 값(동치성)을 비교하는 반면, is 연산자는 객체의 정체성을 비교한다. a == b는 a.\_\_eq\_\_(b)를 줄인 구문이다. 
```
x in None
x in not None
```
#### 8.2.2 튜플의 상대적 불변성
리스트, 딕셔너리, 집합 등 대부분의 파이썬 컬렉션과 마찬가지로 튜플도 객체에 대한 참조를 담는다. <sub>반면 str, bytes, array.array 같은 단일형 시퉌스는 참조 대신 문자, 바이트, 숫자 등의 데이터를 물리적으로 연속된 메모리에 저장한다.</sub> 참조된 항목이 가변형이면 튜플 자체는 불변형이지만 참조된 항목은 변할 수 있다. 즉 참조된 객체까지 불변성을 가지는 것은 아니다.

In [5]:
""" [예제 8-5] 초기 t1, t2는 동일하지만, t1 튜플안에 있는 가변 항목을 변경하면 달라진다. """

t1 = (1, 2, [30, 40])
t2 = (1, 2, [30, 40])
print(t1 == t2)

print(id(t1[-1])) # 마지막 엘리먼트의 id 출력
t1[-1].append(99) # 마지막 엘리먼트에 99 추가
print(t1)

print(id(t1[-1])) # 마지막 엘리먼트의 id(참조)는 동일하지만 
print(t1 == t2)   # 99가 추가되었기 때문에 내용은 달라졌다.

True
140618640030984
(1, 2, [30, 40, 99])
140618640030984
False


### 8.3 기본 복사는 얕은 복사
리스트나 대부분의 내장 가변 컬렉션을 복사하는 가장 손쉬운 방법은 그 자료형 자체의 내장 생성자를 사용하는 것이다. 생성자나 [:]를 사용하면 얕은 사본을 생성한다.

In [6]:
l1 = [3, [55, 44], (7, 8, 9)]
l2 = list(l1) # 생성자나 :를 사용하면 얕은 사본을 생성한다.
              # l2 = l1[:]도 동일한 결과이다
              # l2 = l1는 결과가 모두 True로 다르다
print(l1)
print(l2)

print(l1 == l2)
print(l1 is l2)

[3, [55, 44], (7, 8, 9)]
[3, [55, 44], (7, 8, 9)]
True
False


In [7]:
""" [예제 8-6] 다른 리스트를 담고 있는 리스트의 얕은 복사 """
l1 = [3, [55, 44], (7, 8, 9)]
l2 = list(l1) # 얕은 복사
l1.append(100)
l1[1].remove(55)

print('l1:', l1)
print('l2:', l2)

l1[1] += [33, 22] # 리스트의 += 연산자는 기존 리스트를 변경한다.
l2[2] += (10, 11) # 튜플의 += 연산자는 새로운 튜플을 만들어서 다시 바인딩 한다. (아래 그림 참고)

print('l1:', l1)
print('l2:', l2)

l1: [3, [44], (7, 8, 9), 100]
l2: [3, [44], (7, 8, 9)]
l1: [3, [44, 33, 22], (7, 8, 9), 100]
l2: [3, [44, 33, 22], (7, 8, 9, 10, 11)]


<p><img src="Figure8-4.png"></p>

#### 8.3.1 객체의 깊은 복사와 얕은 복사
얕게 복사한다고 해서 늘 문제가 생기는 것은 아니지만, 내포된 객체의 참조를 공유하지 않도록 깊은 복사가 필요할 수 있다. copy 모듈이 제공하는 deepcopy( ) 함수는 깊은 복사를, copy( ) 함수는 얕은 복사를 지원한다.

In [1]:
""" [예제 8-8] 승객을 승차 및 하차하는 버스 """
class Bus:
    def __init__(self, passengers=None):
        if passengers is None:
            self.passengers = []
        else:
            self.passengers = list(passengers)
            
    def pick(self, name):
        self.passengers.append(name)
    
    def drop(self, name):
        self.passengers.remove(name)
        
import copy
bus1 = Bus(['Alice', 'Bill', 'Clarie', 'David']) 
bus2 = copy.copy(bus1)     # 얕은 복사
bus3 = copy.deepcopy(bus1) # 깊은 복사

print(id(bus1), id(bus2), id(bus3)) # 얕은 복사와 깊은 복사 모두 객체의 id는 다르다
bus1.drop('Bill')
print(bus2.passengers)              # 얕은 복사는 참조가 같기 때문에 bus1의 변경이 bus2에 영향을 준다

140298263487040 140298263487096 140298263487432
['Alice', 'Clarie', 'David']


In [9]:
print(id(bus1.passengers), id(bus2.passengers), id(bus3.passengers)) # 얕은 복사는 리스트의 참조가 같고 깊은 복사는 참조가 다르다
print(bus3.passengers) # 때문에 bus3은 bus1의 변화에 영향을 받지 않는다.

140618639679752 140618639679752 140618640181832
['Alice', 'Bill', 'Clarie', 'David']


In [6]:
print(id(bus1.__dict__['passengers'])) # Attribute를 저장하는 __dict__ 의 키값에 
print(id(bus2.__dict__['passengers'])) # 얕은 복사는 동일한 id
print(id(bus3.__dict__['passengers'])) # 깊은 복사는 새로운 id가 할당된 것을 확인할 수 있다.

140298262982984
140298262982984
140298263375752


일반적으로 깊은 사본을 만드는 일은 간단하지 않다. 특히 객체 안에 순환 참조가 있으면 단순한 알고리즘은 무한 루프에 빠질 수 있다. 또한 복사하면 안 되는 외부 리소스나 싱글턴을 객체가 참조하는 경우도 깊은 복사의 경우 문제일 수 있다. 따라서 \__copy__()와 \__deepcopy__() 특별 메소드를 구현해서 copy(), deepcopy()의 동작을 제어할 수 있다. 

In [7]:
""" [예제 8-10] 순환 참조를 깊에 복사하는 예 """

a = [10, 20]
b = [a, 30]

a.append(b)

print(a)

from copy import deepcopy
c = deepcopy(a)
print(c)

c[2][0][2][0][2][0][2][0] #....

[10, 20, [[...], 30]]
[10, 20, [[...], 30]]


[10, 20, [[...], 30]]

#### 8.4 참조로서의 함수 매개변수
파이썬은 Call by sharing, 즉 사본으로 매개변수를 전달한다. 때문에 함수는 인수로 전달받은 모든 가변객체를 변경할 수 있지만 객체의 정체성 자체는 변경할 수 없다. 즉, 어떤 객체를 다른 객체로 바꿀 수는 없다. 

In [11]:
""" [예제 8-11] 함수는 전달받은 가변 객체를 수정할 수 있다. """
def f(a, b):
    a += b
    return a 

x = 1
y = 2
print(f(1, 2))
print(x, y) # x가 3으로 바뀌지 않았다.

3
1 2


In [12]:
a = [1, 2]
b = [3, 4]
print(f(a, b))
print(a, b) # a의 elements가 추가되었다. 리스트는 변경되었다.

[1, 2, 3, 4]
[1, 2, 3, 4] [3, 4]


In [13]:
t = (1, 2)
u = (3, 4)
print(f(t, u))
print(t, u) # 튜플은 변경되지 않았다.

(1, 2, 3, 4)
(1, 2) (3, 4)


#### 8.4.1 가변형 매개변수 기본값으로 사용하기 : 좋지 않은 생각
기본값을 가진 선택적 인수는 파이썬 함수 정의에서 아주 좋은 기능으로 하위 호환성을 유지하며 API를 개선할 수 있게 해준다. 그러나 매개변수 기본값으로 가변 객체를 사용하는 것은 피해야한다. 

In [14]:
""" [예제 8-12] 가변형이 기본값이 될 때의 위험성을 보여주는 간단한 클래스 """
class HauntedBus:
    """ 유령 승객이 출몰하는 버스 모델 """
    
    def __init__(self, passengers=[]): # 인수를 전달하지 않는 경우 이 매개변수는 기본값인 빈 리스트에 바인딩 된다. 
        self.passengers = passengers   # passengers 인수를 전달하지 않는 경우 self.passengers를 기본값인 빈 리스트에 대한 별명으로 설정한다.  
        
    def pick(self, name):
        self.passengers.append(name) # 함수 객체 속성인 가변형 기본 리스트를 변경하게 된다. 
        
    def drop(self, name):
        self.passengers.remove(name) 
        
bus = HauntedBus()
bus.pick('Carrie')
print(bus.passengers)

['Carrie']


In [15]:
bus1 = HauntedBus()
print(bus.passengers)

['Carrie']


In [16]:
bus2 = HauntedBus()
print(bus2.passengers)
bus2.pick('Dive')
print(bus2.passengers)

['Carrie']
['Carrie', 'Dive']


In [17]:
bus1.passengers is bus2.passengers # bus1과 bus2가 동일 리스트를 참조한다.

True

In [18]:
print(HauntedBus.__init__.__defaults__) # 유령 학생이 있음
print(HauntedBus.__init__.__defaults__[0] is bus1.passengers)

(['Carrie', 'Dive'],)
True


#### 8.4.2 가변 매개변수에 대한 방어적 프로그래밍
TwilightBus<sup>불가사의한 버스</sup> 클래스는 인터페이스 디자인에서 가장 중요한 '최소 놀람의 법칙(?)<sup>Princliple of least astonishment</sup>를 어긴다. 학생이 버스에서 내린다고 해서 그 학생이 농구팀 출전 명단에서 빠진다는 것은 분명 놀라운 일이다.

In [19]:
""" [예제 8-15] 받은 인수를 변경하는 위험성을 보여주는 간단한 클래스 """

class TwilightBus:
    """ 승객이 사라지게 만드는 버스 모델 """
    
    def __init__(self, passengers=None):
        if passengers is None:
            self.passengers = []
        else:
            self.passengers = passengers # 이 할당문에 의해 self.passengers는 passenger의 변경이 된다.
            #self.passengers = list(passengers) # 이렇게 수정하면 문제가 없어진다.
            
    def pick(self, name):
        self.passengers.append(name)
        
    def drop(self, name):
        self.passengers.remove(name)
        
if __name__ == '__main__':
    basketball_team = ['Sue', 'Tina', 'Maya', 'Diana', 'Pat']
    bus = TwilightBus(basketball_team)
    bus.drop('Tina')
    bus.drop('Pat')
    print(basketball_team)

['Sue', 'Maya', 'Diana']


### 8.5 del과 가비지 컬렉션
del 명령은 객체의 참조를 제거하는 것이지 객체를 제거하는 것이 아니다. del 명령의 결과로 객체가 가비지 컬렉트될 수 있지만, 제거된 변수가 객체를 참조하는 최후의 변수거나 객체에 도달할 수 없을 때만 가비지 컬렉트된다. 변수를 새로운 객체에 바인딩하는 경우에도 이전 객체에 대한 참조 카운트를 0으로 만들어 객체가 제거될 수 있다. CPython의 경우 가비지 컬렉션은 주로 참조 카운트<sup>reference count</sup>에 기반한다. <b>refcount</b>가 0이 되자마자 CPython이 객체의 \_\_del\_\_( ) 메서드를 호출하고 객체에 할당되어 있는 메모리를 해제함으로써 객체가 제거된다. 

※ 주의 : \_\_del\_\_( )이라는 특별 메서드가 있기는 하지만, 객체가 제거되도록 만들지 않으며, 사용자 코드에서 직접 호출하면 안 된다. \_\_del\_\_( )은 객체가 제거되기 직전에 외부 리소스를 해제할 기회를 주기 위해 파이썬 인터프리터가 호출된다. 사용자 코드에서 \_\_del\_\_( )을 구현해야 하는 경우는 거의 없지만, 종종 파이썬 초보자들이 타당한 이유 없이 이 메서드에 시간을 쏟는 경우가 있다. \_\_del__( )은 제대로 사용하기 다소 어렵다. 파이썬 언어 참조 문서의 '데이터 모델' 장에서 \_\_del__( ) 특별 메스드 문서( http://bit.ly/1GsWPac )를 참조하라.

객체가 소멸될 때를 보여주기 위해 [예제 8-16]에서는 weakref.finalize( )를 사용해서 객체가 소멸될 때 호출되는 콜백 함수를 등록한다.

In [20]:
""" [예제 8-16] 가리키는 참조가 없을 때 객체가 소멸되는 것을 지켜보기 """
import weakref
s1 = {1,2,3}
s2 = s1 # s1과 s2는 동일한 집합 {1,2,3}을 가리키는 별명이다.

def bye(): # 이 함수는 제거될 객체의 메서드에 바인딩되거나 제거될 객체를 참조하면 안 된다.
    print('Gone with the wind ...')
    
ender = weakref.finalize(s1, bye) # s1이 가리키는 객체에 대해 bye() 콜백을 등록한다. 즉, s1이 사라질 때 bye()가 호출된다.
print(ender.alive) # finalize 객체가 호출되기 전의 alive 속성은 참이다.

del s1 # 앞에서 설명한 대로 del은 객체가 아니라 객체에 대한 참조를 제거한다.
print(ender.alive)

s2 = 'spam' # 마지막 참조인 s2를 다른 객체에 바인딩하면 {1,2,3} 튜플에 도달할 수 없게 된다. 튜플이 제거되고 bye() 콜백이 호출되고,
            # ender.alive는 거짓이 된다. 
print(ender.alive)

True
True
Gone with the wind ...
False


### 8.6 약한 참조
객체 참조 카운트가 0이 되면 가비지 컬렉터는 해당 객체를 제거한다. 그러나 불필요하게 객체를 유지시키지 않으면서 객체를 참조할 수 있으면 도움이 되는 경우가 종종 있다. 캐시가 대표적인 경우이다. 약한 참조는 참조 카운트를 증가시키지 않고 객체를 참조한다. 참조의 대상인 객체를 참조 대상<sup>referent</sup>이하고 한다. 따라서 약한 참조는 참조 대상이 가비지 컬렉트되는 것을 방지하지 않는다고 말할 수 있다.

약한 참조는 캐시 애플리케이션에서 유용하게 사용된다. 캐시가 참조하고 있다고 해서 캐시된 객체가 계속 남아있기 원치 않기 때문이다.

[예제 8-17]은 weakref.ref 객체를 호출해서 참조 대상에 접근하는 방법을 보여준다. 객체가 살아 있으면 약한 참조 호출은 참조된 객체를 반환하고, 그렇지 않으면 None을 반환한다.

In [21]:
""" [예제 8-17] 약한 참조는 콜러블이다. 객체가 살아 있으면 참조된 객체를 반환하고, 그렇지 않으면 None을 반환한다. """

import weakref
a_set = {0, 1}
wref = weakref.ref(a_set)
print(wref)
print(wref())

a_set = {2, 3, 4} # {0, 1}에 대한 참조가 모두 제거됨 
print(wref())

print(wref() is None)

# ※ 파이썬 3.6에서는 컨솔에서는 책처럼 구현되지 않음. 암묵적인 '_' 변수 할당이 사라진듯 함

<weakref at 0x7fe45411bae8; to 'set' at 0x7fe45c8514a8>
{0, 1}
None
True


#### 8.6.1 WeakValueDictionary 촌극
위 예제에서는 약한 참조 개념을 익히기 위해 weakref.ref 객체를 직접 만들었지만 실제로 대부분의 파이썬 프로그램은 weakref 컬렉션(WeakKeyDictionary, WeakValueDictionary, WeakSet, finalize( ))을 쓴다. 이 중 WeakValueDictionary 클래스는 객체에 대한 약한 참조를 값으로 가지는 가변 매핑을 구현한다. 참조된 객체가 프로그램 다른 곳에서 가비지 컬렉트되면 해당 키도 WeakValueDictionary에서 자동으로 제거된다. 

In [22]:
""" [예제 8-18]은 치즈의 종류를 나타내는 간단한 클래스를 구현한다. """
class Cheese:
    
    def __init__(self, kind):
        self.kind = kind
        
    def __repr__(self):
        return 'Cheese{!r}'.format(self.kind)

In [23]:
import weakref
stock = weakref.WeakValueDictionary() # stock은 WeakValueDictionary의 객체이다.
catalog = [Cheese('Red Leicester'),   
           Cheese('Tilsit'),
           Cheese('Brie'),
           Cheese('Parmesan')]

for cheese in catalog:
    stock[cheese.kind] = cheese # stock은 치즈명을 catalog에 있는 Cheese 객체에 대한 약한 참조로 매핑한다. 
    
sorted(stock.keys()) # 모든 치즈명이 있다.

['Brie', 'Parmesan', 'Red Leicester', 'Tilsit']

In [24]:
del catalog
sorted(stock.keys()) # catalog를 제거한 후 대부분의 치즈가 사라졌다. 그런데 하나가 남은 이유는?
                     # for문 내부 cheese는 전역변수이므로 명시적으로 제거하기 전에는 사라지지 않는다.

['Parmesan']

In [25]:
del cheese
sorted(stock.keys())

[]

참고 내용

<li> WeakKeyDictionary는 애플리케이션의 다른 부분에서 소유하고 있는 객체에 속성을 추가하지 않고 추가적인 데이터를 연결할 수 있다. 이 클래스는 속성 접근을 오버라이드하는 객체(디스크립터)에 특히 유용하다.</li>
<li> WeakSet는 어떤 요소에 대한 참조가 더 이상 존재하지 않으면 해당 요소가 제거된다. 자신의 객체를 모두 알고 있는 클래스를 만들어야 한다면 각 객체에 대한 참조를 모두 WeakSet형의 클래스 속성에 저장하는 것이 좋다. 그렇게 하지 않고 일반 집합을 사용하면 이 클래스로 생성한 모든 객체는 가비지 컬렉트되지 않을 것이다.</li>

#### 8.6.2 약한 참조의 한계
모든 파이썬 객체가 약한 참조의 대상이 될 수는 없다. 기본적인 list와 dict 객체는 약한 참조대상이 될 수 없지만, 이 클래스들의 서브 클래스는 이 문제를 다음 코드처럼 쉽게 해결할 수 있다.

In [28]:
class MyList(list):
    """약한 참조의 대상이 될 수 있는 list의 서브 클래스"""
    
a_list = MyList(range(10))

# a_list는 약한 참조의 대상이 될 수 있다.
wref_to_a_list = weakref.ref(a_list)
wref_to_a_list

a_reallist = [1,2,3]
wref_to_a_reallist = weakref.ref(a_reallist)

TypeError: cannot create weak reference to 'list' object

### 8.7 파이썬의 특이한 <b>불변형</b> 처리법
튜플 t에 대해 t[:]는 사본을 생성하지 않고 그 객체에 대한 참조를 반환한다. str, bytes, fronzenset 객체에서도 동일한 동작을 볼 수 있다. 이는 선의의 거짓말로써 메모리 사용량을 줄이고 인터프리터가 더 빨리 실행되게 하는 최적화 기법이다. 문자열 리터럴을 공유하는 최적화 기법은 특히 interning이라고 한다.

In [33]:
""" [예제 8-20] 다른 튜플로 생성한 튜플은 사실 동일한 튜플이다. """
t1 = (1, 2, 3)
t2 = tuple(t1)
print(t1 is t2) # 동일한 객체에 바인딩되어 있음

t3 = t1[:]
print(t3 is t1)

l1 = [1, 2, 3]
l2 = list(l1)
print(l1 is l2) # 리스트 불변형이 아니므로 동일한 객체가 아님

l3 = l1[:]
print(l3 is l1)

""" [예제 8-21] spring literal은 공유 객체를 생성하기도 한다. """
t1 = (1, 2, 3)
t2 = (1, 2, 3)
print(t1 is t2) 

s1 = 'ABC'
s2 = 'ABC'
print(s1 is s2) # 동일한 str을 참조한다.

True
True
False
False
False
True
