# 8.1 변수는 상자가 아니다
- 파이썬 변수는 자바에서의 참조 변수와 같으므로 변수는 객체에 붙은 레이블이라고 생각하는 것이 좋다.
- 참조 변수의 경우 변수가 객체에 할당되었다는 표현이 타당하다.
    - 객체는 변수가 할당되기 전에 생성된다.

#### Ex 8-1 : 사본이 아니라 동일한 리스트를 참조하는 변수 a 와 b

In [2]:
a = [1,2,3]
b = a
a.append(4)
print(b)

[1, 2, 3, 4]


#### Ex 8-2 : 객체가 생성된 후에야 변수가 객체에 할당된다.

In [3]:
class Gizmo:
    def __init__(self):
        print("Gizmo id : %d " %id(self) )
        
x = Gizmo()

Gizmo id : 2374766082848 


In [4]:
y = Gizmo() * 10

Gizmo id : 2374766164816 


TypeError: unsupported operand type(s) for *: 'Gizmo' and 'int'

#### without argument, dir() return the list of names in the current local scope

In [6]:
print(dir())

['Gizmo', 'In', 'Out', '_', '__', '___', '__builtin__', '__builtins__', '__doc__', '__loader__', '__name__', '__package__', '__spec__', '_dh', '_i', '_i1', '_i2', '_i3', '_i4', '_i5', '_i6', '_ih', '_ii', '_iii', '_oh', 'a', 'b', 'exit', 'get_ipython', 'quit', 'x']


# 8.2 정체성, 동질성, 별명
- 모든 객체는 정체성, 자료형, 값을 가지고 있다.
    - 객체의 정체성은 생성한 후에는 결코 변경되지 않는다.
    - 정체성은 메모리 내의 객체 주소라고 생각할 수 있다.
    - is 연산자는 두 객체의 정체성을 비교한다.
    - id() 함수는 정체성을 나타내는 정수를 반환한다.

In [12]:
charles  = {'name': 'Charles L. Dodgson', 'born': 1832}
lewis = charles
print(lewis is charles) # lewis는 charles의 별명이다

True


In [15]:
print(id(charles))
print(id(lewis))

2374794274432
2374794274432


- is 는 변수가 같은 객체를 가리키면 True
- == 는 변수가 같은 객체 값을 가지면 True

In [14]:
lewis['balance'] = 950 # lewis에 항목을 추가하는 것은 charles에 항목을 추가하는 것과 동일
print(charles)

{'name': 'Charles L. Dodgson', 'born': 1832, 'balance': 950}


In [16]:
alex = {'name': 'Charles L. Dodgson', 'born': 1832, 'balance': 950}
alex == charles

print(alex is charles)

False


## 8.2.1 == 연산자와 is 연산자 간의 선택
- ==연산자(동치 연산자)가 객체의 값을 비교하는 반면, is 연산자는 객체의 정체성을 비교한다.
- is 연산자는 오버로딩 할 수 없으므로 파이썬이 이 값을 평가하기 위해 특별 메서드를 호출할 필요가 없고, 두 정수를 비교하는 정도로 연산이 가능하므로 is 연산자가 == 연산자보다 빠르다.
- a == b 는 a.\_\_eq__(b) 의 편리 구문이며, object 객체에서 상속받은 \_\_eq__() 메서드는 객체의 ID 를 비교하므로 is 연산자와 동일한 결과를 산출한다.
    - 그러나 대부분의 내장 자료형은 \_\_eq__() 메서드를 오버라이드해서 객체의 값을 비교한다. 
    - 대형 컬렉션이나 깊이 내포된 구조체를 비교하는 경우 동치 비교는 상당한 처리를 요구한다.

## 8.2.2 튜플의 상대적 불변성
- 튜플의 불변성은 tuple 데이터 구조체의 물리적인 내용(즉, 참조 자체)만을 말하는 것이며, 참조된 객체까지 불변성을 가지는 것이 아니다. 즉, 참조된 항목이 가변형이면 튜플 자체는 불변형이지만 참도된 항목은 변할 수 있다.
    - 튜플 안에서 결코 변경되지 않는 것은 튜플이 담고 있는 항목들의 정체성뿐이다.

In [21]:
t1 = (1,2,[30,40])
t2 = (1,2,[30,40])
print(t1 == t2)
print(t1 is t2)

True
False


In [22]:
print(id(t1[-1]))

2374766360576


In [23]:
t1[-1].append(99)
print(t1)
print(id(t1[-1])) # 정체성은 그대로이지만 값은 변경되었다.

(1, 2, [30, 40, 99])
2374766360576


In [24]:
print(t1==t2)

False


# 8.3 기본 복사는 얕은 복사
- 기본 복사는 얕은 복사이다.
    - 즉, 최상위 컨테이너는 복제하여 새로운 객체를 만들지만 그 요소는 원래 컨테이너에 들어있던 동일 객체에 대한 참조로 채워진다.
- 리스트나 대부분의 내장 가변 컬렉션을 복사하는 가장 손쉬운 방법은 그 자료형 자체의 내장 생성자를 사용하는 것이다.
- 리스트 및 가변형 시퀀스의 경우 l2 = l1[:] 코드는 사본을 생성한다.


In [25]:
l1 = [3, [55,44], (7,8,9)]
l2 = list(l1) # l2 는 l1의 사본
print(l2)

[3, [55, 44], (7, 8, 9)]


In [26]:
print(l2 == l1)
print(l2 is l1)

True
False


#### Ex 8-6 : 다른 리스트를 담고 있는 리스트의 얕은 복사
- 불변형인 튜플 경우 += 연산자는 새로운 튜플을 생성
    - 튜플 외에 불변형인 str 에도 += 연산을 실행하면 새로운 객체를 생성 
        - 'ABC" += 'DEF' 로 'ABCDEF' 가 된다해서 가변형이 아님. 'ABCDEF' 값을 지닌 객체를 새로 가지는 것

In [27]:
l1 = [3,[66,55,44],(7,8,9)]
l2 = list(l1)
l1.append(100)
l1[1].remove(55)

print('l1 : ', l1)
print('l2 : ', l2)

l2[1] += [33,22]
l2[2] += (10,11) # 더 이상 l1 과 l2 마지막 튜플은 동일한 객체가 아니다.

print('l1 : ', l1)
print('l2 : ', l2)

l1 :  [3, [66, 44], (7, 8, 9), 100]
l2 :  [3, [66, 44], (7, 8, 9)]
l1 :  [3, [66, 44, 33, 22], (7, 8, 9), 100]
l2 :  [3, [66, 44, 33, 22], (7, 8, 9, 10, 11)]


## 8.3.1 객체의 깊은 복사와 얕은 복사
- 얕게 복사한다고 해서 늘 문제가 생기는 것은 아니지만, 내포된 객체의 참조를 공유하지 않도록 깊게 복사할 필요가 있는 경우가 종종 생김. copy 모듈이 제공하는 deepcopy() 함수는 깊은 복사를, copy() 함수는 얕은 복사를 지원한다.

In [29]:
class Bus:
    def __init__(self, passengers=None):
        if passengers is None:
            self.passengers = []
        else:
            self.passengers = list(passengers)
            
    def pick(self, name):
        self.passengers.append(name)
        
    def drop(self, name):
        self.passengers.remove(name)

In [30]:
import copy
bus1 = Bus(['Alice', 'Bill', 'Claire', 'David'])
bus2 = copy.copy(bus1)
bus3 = copy.deepcopy(bus1)
id(bus1), id(bus2), id(bus3)

(2374786178016, 2374783798048, 2374766019824)

In [31]:
bus1.drop('Bill')
bus1.passengers, bus2.passengers, bus3.passengers

(['Alice', 'Claire', 'David'],
 ['Alice', 'Claire', 'David'],
 ['Alice', 'Bill', 'Claire', 'David'])

In [32]:
id(bus1.passengers), id(bus2.passengers), id(bus3.passengers)
# bus1과 bus2가 동일 리스트를 공유한다. 반면 bus3는 다른 리스트를 가리킨다.

(2374794293760, 2374794293760, 2374794500992)

#### Ex 8-10 : 순환 참조. b가 a를 참조한 후 a 의 뒤에 바인딩 되는데, deepcopy()는 a를 제대로 복사한다.
- 깊은 사본을 만들 때 객체 안에 순환 참조가 있으면 단순한 알고리즘은 무한 루프에 빠질 수 있다.

In [33]:
a = [10, 20]
b = [a, 30]
a.append(b)
print(a)

[10, 20, [[...], 30]]


In [34]:
c = copy.deepcopy(a)
print(c)

[10, 20, [[...], 30]]


## 8.4 참조로서의 함수 매개변수
- 파이썬은 공유로 호출 ( call by sharing ) 하는 매개변수 전달 방식만 지원한다.
    - 공유로 호출한다는 말은 함수의 각 매개변수가 인수로 전달 받은 각 참조의 사본을 받는다는 의미다. 
    - 달리 말하면, 함수 안의 매개 변수는 실제 인수의 별명이 된다.
    - 이런 체계의 결괄서, 함수는 인수로 전달받은 모든 가변 객체를 변경할 수 있지만, 객체의 정체성 자체는 변경할 수 없다.

In [36]:
def f(a,b):
    a += b # 이 경우 리스트는 append 로 작동
    return a

In [37]:
x = 1
y = 2
print(f(x,y))
print(x, y)

3
1 2


In [38]:
a = [1,2]
b = [3,4]
print(f(a,b))
print(a, b)

[1, 2, 3, 4]
[1, 2, 3, 4] [3, 4]


#### 튜플(불변형)의 경우
- 튜플이 += 로 바뀐다는 것은 새로운 튜플이 만들어지는 것. 즉 정체성이 달라지는 것임. 함수 내에서 정체성을 바꿀 수 없기 때문에 튜플 t 는 변경되지 않음

In [39]:
t = (10,20)
u = (30, 40)
print(f(t,u))
print( t, u )

(10, 20, 30, 40)
(10, 20) (30, 40)


## 8.4.1 가변형을 매개변수 기본값으로 사용하기:좋지 않은 생각
- 매개변수 기본 값으로 가변 객체를 사용하는 것은 피해야한다.
- 다음 예제에서 볼 수 있는 가변 기본 값에 대한 문제 때문에, 가변 값을 받는 매개 변수의 기본 값으로 None 을 주로 사용한다.

In [40]:
class HauntedBus:
    """유령 승객이 출몰하는 버스 모델"""
    
    def __init__(self, passengers=[]): 
        # 이렇게 되면 [] 가 compile 단계에서 생성되며 모든 인스턴스들이 같은 대상을 참조하게 되어 오류 발생
        self.passengers = passengers
    
    def pick(self, name):
        self.passengers.append(name)
    
    def drop(self, name):
        self.passengers.remove(name)

In [41]:
bus1 = HauntedBus(['Alice', 'Bill'])
bus1.passengers

['Alice', 'Bill']

In [42]:
bus1.pick('Charlie')
bus1.drop('Alice')
bus1.passengers

['Bill', 'Charlie']

In [43]:
bus2 = HauntedBus()
bus2.pick('Carrie')
bus2.passengers

['Carrie']

In [44]:
bus3 = HauntedBus()
bus3.passengers # 초기값이 더이상 empty가 아님!

['Carrie']

In [45]:
bus3.pick('Dave')
bus2.passengers

['Carrie', 'Dave']

In [46]:
bus2.passengers is bus3.passengers

True

In [47]:
HauntedBus.__init__.__defaults__

(['Carrie', 'Dave'],)

In [48]:
HauntedBus.__init__.__defaults__[0] is bus2.passengers
# bus2.passengers가 HauntedBus.__init__.__defaults__[0] 에 바인딩된 별명임을 알 수 있다.

True

## 8.4.2 가변 매개변수에 대한 방어적 프로그래밍
- 인수로 받은 객체를 메서드가 변경할 것이라는 의도가 명백하지 않은 한 클래스 안에서 인수를 변수에 할당함으로써 인수 객체에 별명을 붙이는 것에 대해 주의할 필요가 있다.
- 불명확한 경우에는 사본을 만들어라.

In [49]:
class TwilightBus:
    """승객이 사라지게 만드는 버스 모델"""
    
    def __init__(self, passengers=None):
        if passengers is None:
            self.passengers = []
        else:
            self.passengers = passengers # 사본 생성이 아니라 인수를 별명으로 사용
            
    def pick(self, name):
        self.passengers.append(name)
    
    def drop(self, name):
        self.passengers.remove(name)

In [50]:
basketball_team = ['Sue', 'Tina', 'Maya', 'Diana', 'Pat']
bus = TwilightBus(basketball_team)
bus.drop('Tina')
bus.drop('Pat')
basketball_team # 선수단이 변경되어 버림

['Sue', 'Maya', 'Diana']

```python
# 따라서 앞서 구현한 것처럼 다음과 같이 해야한다.
# 만약 passengers가 다른 list를 담고 있으면 deepcopy를 하는 것이 좋음. 
# 다른 list를 담고 있으면 생성자에 인수로 전달된 리스트 안의 리스트를 변경할 것이므로

def __init__(self, passengers=None):
    if passengers is None:
        self.passengers = []
    else:
        self.passengers = list(passengers)
```

# 8.5 del 과 가비지 컬렉션
- garbage collection : 메모리 관리 기법 중 하나로, 동적 할당된 메모리 영역 가운데 더 이상 사용할 수 없게된 영역을 탐지하여 자동으로 해제하는 기법이다. 여기서 더 이상 사용할 수 없게 된 영역이란, 어떤 변수도 가리키지 않게된 영역을 말한다.
- del 명령은 이름을 제거하는 것이지, 객체를 제거하는 것이 아니다. 
    - del 명령의 결과로 객체가 가비지 컬렉트 될 수 있지만, 제거된 변수가 객체를 참조하는 최후의 변수거나 객체에 도달할 수 없을 때만 가비지 컬렉트된다.
    - 변수를 다시 바인딩해도 객체에 대한 참조 카운트를 0 으로 만들어 객체가 제거 될 수 있다.
- CPython 경우 가비지 컬렉션은 주로 참조 카운트에 기반한다.
    - 본질적으로 각 객체는 얼마나 많은 참조가 자신을 가리키는지 개수(refcount)를 세고 있다. Refcount 가 0이 되자마자 CPython 의 \_\_del__() 의 메서드를 호출하고 객체에 할당되어 있는 메모리를 해제함으로써 객체가 제거된다. 이외 가비지 컬렉션 알고리즘이 있으며, 파이썬 인터프리터마다 가비지 컬렉션 알고리즘이 다르다.
- 객체가 소멸될 때를 보여주기 위해 weakref.finalize() 를 사용해서 객체가 소멸될 때 호출되는 콜백 함수를 등록한다.

In [54]:
import weakref
s1 = {1,2,3}
s2 = s1

Gone with the wind...


In [55]:
def bye():
    print('Gone with the wind...')

In [56]:
ender = weakref.finalize(s1, bye) # s1이 가리키는 객체에 대해 bye() 콜백 등록
ender.alive

True

In [57]:
del s1 # del은 객체가 아니라 객체에 대한 참조를 제거한다.
ender.alive

True

In [58]:
s2 = 'spam' # s2를 다른 객체에 바인딩하면 {1,2,3} 이 제거되고, buye() 콜백이 호출되고, ender.alive는 거짓

Gone with the wind...


In [59]:
ender.alive

False

#### 여기서 ender 가 {1,2,3}을 참조하고 있는 것처럼 보이지만 이건 약한 참조라서 카운트 되지 않는다.

# 8.6 약한 참조
- 약한 참조는 참조 카운트를 증가시키지 않고 객체를 참조한다.
    - 참조의 대상인 객체를 참조 대상 referent 라고 한다.
    - 따라서 약한 참조는 참조 대상이 가비지 컬렉트되는 것을 방지하지 않는다고 말할 수 있다.
- weakref.ref 객체를 호출해서 참조 대상에 접근할 수 있다
    - 객체가 살아있으면 약한 참조 호출은 참조된 객체를 반환하고, 그렇지 않으면 None 을 반환한다.
    - weakref.ref 클래스는 고급 사용자를 위한 저수준 인터페이스이며, 일반 프로그래머는 weakref 컬렉션과 finalize() 를 사용하는 것이 좋다고 설명한다. 
        - 즉, weakref.ref 객체를 직접 만들기보다는 WeakKeyDictionary, WeakValueDictionary, WeakSet, 그리고 내부적으로 약한 참조를 이용하는 finalize() 를 사용하는 것이 좋다. 실제로 대부분의 파이썬 프로그램은 weakref 컬렉션을 사용한다.

## 8.6.1 WeakValueDictionary 촌극
- WeakValueDictionary 클래스는 객체에 대한 약한 참조를 값으로 가지는 가변 매핑을 구현한다.
- WeakKeyDictionary 클래스는 키가 약한 참조다.
    - WeakKeyDictionary 는 애플리케이션의 다른 부분에서 소유하고 있는 객체에 속성을 추가하지 않고 추가적인 데이터를 연결할 수 있다. 이 클래스는 속성 접근을 오버라이드하는 객체 ( 디스크립터 ) 에 특히 유용하다. => 무슨 말?

## 8.6.2 약한 참조의 한계
- 모든 파이썬 객체가 약한 참조의 대상이 될 수 있는 것은 아니다. 
    - 기본적인 list 와 dict 객체는 참조 대상이 될 수 없지만, 이 클래스들의 서브 클래스는 이 문제를 다음 코드처럼 쉽게 해결할 수 있다. 
    - set 객체는 참조 대상이 될 수 있다. 사용자 정의형도 아무런 문제 없이 참조 대상이 될 수 있다.

In [66]:
class MyList(list):
    """약한 참조의 대상이 될 수 있는 list 서브 클래스"""
    
a_list = MyList(range(10))

# a_list 는 약한 참조의 대상이 될 수 있다.
wref_to_a_list = weakref.ref(a_list)

# 8.7 파이썬의 특이한 불변형 처리법
- 튜플 t에 대해 t[:]는 사본을 생성하지 않고 그 객체에 대한 참조를 반환한다.
- tuple(t) 로 작성하더라도 튜플 t 에 대한 참조가 반환된다. 다음 예제는 이 사실을 입증한다.
- str, bytes, frozenset 객체에서도 이와 동일한 동작을 볼 수 있다. 
    - frozenset 은 시퀀스가 아니므로 frozenset 형인 fs 에 대해 fs[:] 은 작용하진 않지만, fs.copy() 는 동일하게 작동한다. 즉, fs.copy() 는 사본이 아니라 동일 객체에 대한 참조를 반환한다.

In [67]:
t1 = (1,2,3)
t2 = tuple(t1)

print(t2 is t1) # t1 과 t2가 동일한 객체에 바인딩 되어있다.

t3 = t1[:]
print(t3 is t1) # t3 도 마찬가지다.

True
True


In [69]:
t1 = (1,2,3)
t3 = (1,2,3)

print(t3 is t1)

s1 = "ABC"
s2 = "ABC"

print(s2 is s1) 

False
True


####  인터닝( interning) 기법 (s2 is s1 이 True인 이유)
- 문자열 리터럴을 공유하는 최적화 기법을 인터닝( interning ) 이라고 한다. CPython 에서는 0, -1 , 42 등 '인기있는' 숫자를 부릴요하게 중복하지 않도록 작은 정수에도 동일한 기법을 사용한다. CPython 이 모든 문자열이나 정수를 인터닝하는 것은 아니며, 인터닝 기준은 구현 특징으로서 문서화 되어있지 않다.