# Python Memory Management

## Objects in Python
Everything in Python is an object!! 파이썬은 모든 것들이 객체로 이루어져 있다. 클래스, 함수, 데이터 타입(integer, float, and string)은 역시 파이썬에서 객체로 이루어져 있다. 

In [24]:
# 3 은 integer class 에 속한 integer object 이다.
a = 3
print(type(a))

L = [1, 2, 3]
print(type(L))

def my_func(x):
    x += 1
    return x
print(type(my_func))

<class 'int'>
<class 'list'>
<class 'function'>


만약 한 변수에 integer 값 100을 할당한다면 파이썬 내부적으로 다음 절차가 진행된다.
```
a = 100

1. CPython은 내부적으로 integer type의 object(객체) 100 을 생성한다.
2. 100 이란 object 는 heap memory 에 저장된다.
3. heap memory 에 저장된 메모리 주소값을 a 라는 변수에 리턴해준다.
4. a 변수는 100 객체의 메모리 주소를 참조할 뿐이다. (a 변수에 값을 저장x)
```

## Variables in Python
특정 메모리 주소를 담는 혹은 가리키는 name or label 이다. 즉, 파이썬에서 변수는 “메모리 주소에 붙이는 라벨” 이다.</br>

<img src="./img/memory.png" width="400px" height="200px" alt="https://www.honeybadger.io/blog/memory-management-in-python/#python-as-a-language-specification">
위의 경우는 100 이란 integer object 의 주소를 가리키는 변수 a 의 주소를 다시 변수 b 가 할당 받고 있다.</br>
즉, 100 객체를 동시에 변수 a, b 가 가리키고 있다. (같은 메모리 주소를 담고 있다.)

In [31]:
a = 100
b = a

# same!!
print(hex(id(a)))
print(hex(id(b)))  

0x100d815d0
0x100d815d0


### id 함수 → (id(obj))

python Built-in function(내장함수)로 해당 객체/변수의 메모리 주소 값을 반환 (C/C++의 & 포인터 연산자와 동일)
- Built-in function(내장함수): 언제 어디서나 사용 가능한 다양한 함수가 파이썬에 내장되어 있다.

In [34]:
print(hex(id('a')))
print(hex(id('b')))
# ‘a’ 문자열과 ‘b’ 문자열은 서로 다른 메모리 주소에 저장되어 있다.

# C / C++ language
# char chr = 'a';
# printf("%x", &chr);

0x100e69ab0
0x100e20a30


## a is b / a == b

- **is 연산자**: 메모리 주소를 비교
- **== 연산자**: 2개의 값만 비교
</br></br>
- == 에 비해 is 가 약간 더 빠르다.
    - == 은 메모리 주소를 불러온 뒤 그 메모리 주소에 저장된 값을 비교하기 때문이다.
    - is 는 메모리 주소만을 비교한다.
- is 연산자는 오버라이드가 불가능
    - == 연산자는 파이썬에서 custom 연산자로 오버라이드가 가능
    - is 는 오버라이드가 불가능해 언제 어디서든 똑같은 경험을 제공 가능

In [37]:
a = 1000
b = 1000

print("1", a is b)
print("2", a == b)

a = 1000
b = a

print("3", a is b)
print("4", a == b)

1 False
2 True
3 True
4 True


## mutable vs immutable Objects

- **Mutable**
    - 변경 가능한 객체이다. 즉, 같은 주소값 내에서 값이 변경 가능한 객체이다.
    - 객체 값 변경 시 메모리 재할당 없다. ⇒ 변수에 할당된 메모리 번지(주소) 값이 바뀌지 않는다.
    - list, dict, set, byte array, user-definded classes

In [38]:
mutable_L = [1, 2, 3]
print(hex(id(mutable_L)))  # same

mutable_L.append(4)
print(hex(id(mutable_L)))  # same

mutable_L += [5]
print(hex(id(mutable_L)))  # same

# But, + 연산자만 사용할 경우 주소값이 다르게 출력
mutable_L = mutable_L + [6]
print(hex(id(mutable_L)))  # different!!

0x1076c49c0
0x1076c49c0
0x1076c49c0
0x1076803c0


- 왜 + 연산자만 mutable_L 변수의 주소값이 다르게 나올까??
    - '+' 연산자는 **__add__ magic method** 라고 한다. (명시적으로 호출할 필요없이 자동으로 호출되는 메서드) </br>
      이 연산자는 같은 주소에서 두 인자를 변경하지 않는다. 그러므로 mutable_L + [6] 로 새로운 객체가 생성되고 해당 주소값을 mutable_L 변수에 리턴한다.
    - '+=' 연산자는 __iadd__ magic method로 같은 주소에서 인자들을 수정해준다.
    
    ⇒ 해당 case 는 mutable 과 관련된 case

- **Immutable:**
    - 변경 불가능 객체이다. 즉, ***같은 주소값 내에서 값이 변경 불가한 객체***이다.
    - 객체 값 변경 시 **메모리를 재할당** 한다.
        - 객체 값 변경 시 실제 메모리에 할당된 값이 변경되는 것이 아니라 변수가 가리키고 있는 메모리의 값이 바뀐다.

        1. 객체 값을 변경한다.
        2. 실제 메로리에 할당된 값이 변경되지 않는다.
        3. 변경한 새로운 값에 대한 객체를 생성한다.
        4. 해당 변수는 새로 생성된 객체의 주소값을 참조한다.

        
    - int, float, string, string tuple, bool, complex

In [39]:
immutable_i = 1000  # int
print(hex(id(immutable_i)))

immutable_i += 1
print(hex(id(immutable_i)))  # different!!

0x107957a10
0x107957e50


## 주의점

### immutable

In [41]:
## immutuable
a = 1000
b = a  # b 변수가 1000 객체의 메모리 주소값을 가리키게 된다.
b += 1  # 1001 integer object 생성 후 할당된 메모리 주소값을 변수 b가 가리킨다.
print(a, b, a is b)

# 여기서 immutuable은 아무런 문제가 없다.

1000 1001 False


### mutable

In [2]:
a = ["Mon", "Tue"]
b = a
b.append("Wed")
print(a, b, a is b)

# a와 b는 서로 메모리 주소가 동일하여 둘 중 하나만 변경해도 전부 변경된다.
# ⇒ mutable 자료형은 메모리에 저장되어 있는 값 **자체를** 바꾸기에 주의해야 한다. 

['Mon', 'Tue', 'Wed'] ['Mon', 'Tue', 'Wed'] True


a와 b는 서로 메모리 주소가 동일하여 둘 중 하나만 변경해도 전부 변경된다.</br>
⇒ mutable 자료형은 메모리에 저장되어 있는 값 **자체를** 바꾸기에 주의해야 한다. </br></br>
이런 상황을 해결하기 위해 여러 가지 방법들이 존재한다.

### 1. **첫 번째 방법**

- **slice operator** 를 사용한 편법이라고 볼 수 있다.
- **[:]** : 배열 처음과 끝까지 복사
    - 메모리 주소값이 복사되는 것이 아닌 객체 자체가 복사
    - a 와 b 는 서로 독립된 상태를 유지 가능

In [5]:
# 첫 번째 방법
a = ["Mon", "Tue"]
b = a[:]  # only for list
b.append("Wed")

print("a:", a)
print("b:", b)
print("a is b:", a is b)

a: ['Mon', 'Tue']
b: ['Mon', 'Tue', 'Wed']
a is b: False


### 2. **두 번째 방법**

- copy() 메서드 사용
- copy 메서드는 [:] 에 비해 list, dict, set 모두에 사용 가능
- But, 직접 만든 객체, 클래스, 클래스 인스턴스에는 사용 불가,,,

In [14]:
# case 1
a = ["Mon", "Tue"]
b = a.copy()  # for list, dict, set
b.append("Wed")

print("case1")
print("a:", a)
print("b:", b)
print("a is b:", a is b, '\n')

# case 2
a = ["Head", ["Sub"]]
b = a.copy()  # or a[:]
b[1].append("Sub2")

print("case2")
print("a:", a)
print("b:", b)
print(">> b 객체만 수정했는데 a 객체도 수정되었다!!! 왜??")

case1
a: ['Mon', 'Tue']
b: ['Mon', 'Tue', 'Wed']
a is b: False 

case2
a: ['Head', ['Sub', 'Sub2']]
b: ['Head', ['Sub', 'Sub2']]
>> b 객체만 수정했는데 a 객체도 수정되었다!!! 왜??


다음과 같이 copy() 로 복사를 해줬음에도 불구하고 b 를 수정하니 a 도 같이 수정되었다. </br>
⇒ copy() 메서드는 ***‘얕은 복사’***를 하기 때문에 이러한 문제가 발생한다. </br></br>
이런 ***‘얕은 복사’***로 인한 문제점을 해결하기 위해서 파이썬에선 **<module ‘copy’>**가 존재한다.

### 3. **세 번째 방법**

- **<module ‘copy’>**
    - copy 모듈에는 2가지 메서드만이 존재한다.
    1. **copy.copy() method**
        - 해당 객체만 메모리를 새로 할당
        - 하위 객체들은 메모리 주소 유지
        - [:]이나, .copy() 등과 같은 기능

        ⇒ a 라는 배열이 있고 둘 다 월, 화를 가리키고 있었고 이걸 복사할 경우  b 라는 리스트 자체는 아예 새로 생성되지만 결국 동일한 월, 화를 가리키고 있다!

    2. **copy.deepcopy()**
        - 해당 객체와 하위 객체들의 메모리를 새로 할당
        - 완전히 새로운 객체를 만든다.

In [12]:
import copy

a = ["Head", ["Sub"]]
b = copy.deepcopy(a)
b[1].append("Sub2")

print(a)
print(b)

# [:], .copy() 같이 얕은 복사로 인한 문제 해결!

['Head', ['Sub']]
['Head', ['Sub', 'Sub2']]
