# 2-1. 객체(Type)의 분류


#### <목표>

- Type(DataType)을 구분하는 몇 가지 기준에 대해서 알아보자.
- 내장 DataType(Built-in Type)을 구분기준에 따라서 살펴보자.
<br>

## 2-1-1. Python 객체와 Type의 특징

- Python의 Datatype 혹은 Type은 곧 Class.

**Dynamic typing(동적자료형)** : 객체 할당이 자료형을 결정.

    - Python의 모든 것은 "객체(Object)"이며 그 모든 객체들은 Type(속성,특성)을 갖는다. 
    - 식별자(변수)에 객체를 어떤 메모리 공간을 참조하게 binding한다는 것은 어떤 Type의 Class의 객체를 할당하는 것과 같은 의미.


**Strong Typing(강한자료형)** : 임의의 클래스를 사용하여 자료형을 처리

    - 객체에 대한 자료형이 항상 클래스로 결정되어있음.
    - 대게 강한 자료형은 같은 클래스로 만들어진 객체일때만 연산가능

In [1]:
#Dynamic typing이해
# a에 list를 바인딩(할당) => Type과 __class__함수를통해 자료형이 결정되었음을 확인.
a = []
type(a)

list

In [2]:
a.__class__

list

In [3]:
# b는 할당되어있지 않다면 자료형이 결정되어있지 않음.
b

NameError: name 'b' is not defined

In [4]:
# Strong typing 이해

c = int('100')# 정수객체 만들기
type(c)# int라는 클래스의 객체임.

int

In [42]:
c= int()
type(c)

int

In [5]:
# int형과 문자열 -> 강한 자료형의 다른 Type끼리의 연산불가.
# 당연, 각 Type에 해당하는 Class에 다른 Type과의 연산자 오버로딩을 정의하지 않았기 때문.

b + '100'

TypeError: unsupported operand type(s) for +: 'int' and 'str'

In [43]:
# 함수와 메소드는 어떤 객체일까?

class A(object):
    def func(self):
        print("Hello world")

In [45]:
# function 객체이다.
type(A.func)

function

In [48]:
#  A의 메소드로 변환되어서 나타나짐
a = A()
print(type(a.func))
print(a.func)

<class 'method'>
<bound method A.func of <__main__.A object at 0x11017db20>>


## 2-1-2. Container Type



- 정의 : Container Type의 객체는 다른 Type의 객체의 "참조"를 포함하고있다.
- 즉, Container Type의 요소(element)들은 다른 Type일 수 있으며, **쪼개질 수 있다.**
    - DB의 원자성(Atomicity)
- 쪼개졌을때 *의미*가 있어야한다.

- Built-in DataType : List, Tuple, Set, String
    - 숫자형 자료형은 숫자 그 자체로 의미를 가지기 때문에 쪼개면 의미가 없음.
    
#### Homogeneous vs Heterogeneous

- Homogeneous : 일반적으로 Container Type중 한 가지의 클래스로 이루어진 것.
    - String 자료형
    - 'ABC' -> 'A' 'B' 'C' 쪼개도 의미가 잇다.
    
- Heterogeneous : 일반적으로 Container Type중 내부에 다른 Class로 참조가 되는 Container Type
    - List, Tuple, Set

#### vs Collection(Container datatype)

- [Collection](https://docs.python.org/ko/3/library/collections.html?highlight=collection) 공식문서.
- 일반적으로 Collection Class를 Container datatype이라고 공식문서에 명명되어있다. 그래서, Container라는 개념자체와 혼동하여 혹은 합쳐서 용어를 사용하는 경우가 있는데, Container Type은 *개념*의 일종이고 Collection은 python에서 구현한 Container Type에 속하는 **모듈**이다.


- Collection 모듈 : 파이썬의 범용 내장 컨테이너 dict, list, set 및 tuple에 대한 대안을 제공하는 특수 Container DataType을 구현.
- 자세한 내부 모듈은 공식문서 확인.

    - [collections.abc](https://docs.python.org/ko/3/library/collections.abc.html?highlight=collection#module-collections.abc) : 추상 클래스이며 여기에있는 메소드를 사용하여 len()등 우리가 익히 사용하는 함수 및 메소드를 구현(Class단원 참조)


In [9]:
# Homogenoeus container type == string

'ABC'

'ABC'

In [10]:
'A'

'A'

In [11]:
'B' # 다 쪼개서 의미를 가질 수 있음.

'B'

### Container Type인지 아닌지 확인 : issubclass 함수사용

In [35]:
from collections.abc import Container

print(issubclass(str, Container))
print(issubclass(set, Container))
print(issubclass(tuple, Container))

# int는 아님.
print(issubclass(int, Container))

True
True
True
False


### keyword 'in'

- 단, **sequence type**의 container객체 여야 한다.
- 또한, heterogenous type은 in 앞의 객체와 in 뒤의 객체의 type이 달라도 된다. ( homogenous 객체 불가)

In [36]:
1 in [1,2,3,4]

True

In [38]:
5 not in [1,2,3,4]

True

In [8]:
# list -> heterogeneous container type
1 in ['1',2,3,4,5]

False

In [7]:
# str -> homogenous type
1 in '12345'

TypeError: 'in <string>' requires string as left operand, not int

In [41]:
# 우아한 사용

# 코드 줄이기
a= [1,2,3,4]

for x in a:
    if x == 1:
        print("x는 1입니다.")
        
if 1 in a:
    print("x는 1입니다(2)")
    
# or 연산 대용
a = 2

if a==1 or a==2:
    print("Hello")
    
if a in [1,2]:
    print("Hello(2)")

x는 1입니다.
x는 1입니다(2)
Hello
Hello(2)


## 2-1-2. Mutable Object Type vs Immutable Object Type

- ~~모두 Container Type안에서의 분류이다.~~ => Object상의 분류


- Mutable : 내부주소값 그대로 사용하면서 재할당없이 내부를 바꿀 수 있는 객체
    - 편리하나 바뀐지 모르는 경우가 있기 때문에 실수를 유발
        - return의 용법 주의
    - list, bytearray, Dict, set이 여기에 속한다.
    - call by reference
    
    
- Immutable : 재할당 해야지만 값을 바꿀 수 있음.
    - 프로그래밍 관점에서 실수 혹은 오류를 줄일 수 있기 때문에 더 우아한 방법.
    - bool, int, float, str, frozenset, tuple, bytes
    - call by value
    - 함수형 패러다임에서는 Immutable이 많음.

In [15]:
# Immutable 실습
var = "문자열"
var[0] = "가"#변경불가

TypeError: 'str' object does not support item assignment

In [17]:
# replace함수를 통해 s에 재할당
s = var.replace("문","가")
print(s)
print(var)

가자열
문자열


In [18]:
# Mutable 실습
li = [1,2,3,4]
li[0] = '100'
li

['100', 2, 3, 4]

In [19]:
# __setitem__
li.__setitem__(1,999)
li

['100', 999, 3, 4]

### Datatype return의  3가지 

- return의 3가지 특징을 list의 메소드를 통해 알아보자.

1. 자기 자신이 바뀌었고 return 없음
    - append 
2. 자기 자신이 바뀌었고 return 있음
    - pop
3. 자기 자신 바뀌는게 없고 return 있음
    - count

In [1]:
# 1.
a = [1,2,3,4,5]
a.append(6)

In [2]:
# 2.
a.pop()

6

In [6]:
#3. count -> 인자로 보낸 값이 몇개 있는지 return
a.count(4)

1

#### Mutable class인지 아닌지 구분?

- 모든 Class에는 속성과 함수 등을 관리하는 \__dict__가 구현되며, 여기에 java에서의 getter, setter가 구현되어있음.

- immutable일때는 **변경불가** 이므로 \__setitem__과 \__delitem__구현이 되어있지 않음.

In [27]:
# immutable : __getitem__존재, __setitem__과 __delitem__ 존재하지 않음.
print('__getitem__' in str.__dict__)
print('__setitem__' in str.__dict__)
print('__delitem__' in str.__dict__)

True
False
False


In [28]:
# mutable : 모두 구현
print('__getitem__' in list.__dict__)
print('__setitem__' in list.__dict__)
print('__delitem__' in list.__dict__)

True
True
True


### id()

- 실제 메모리상의 주소이며 **고유한** 객체의 값이다. (unique)
- 다만, CPython이외의 Python 인터프리터에서는 실제 메모리상의 주소는 *아니다.*


- Python은 앞서 말했듯, 고유한 id를 가진 객체는 하나만 메모리에 하나만 존재한다.
- 하지만 내부를 변화시킬 수 있냐 아니냐에 따라서 id()를 사용한 결과가 달라진다.

In [27]:
# immutable - 변경 불가능하기 때문에, 변경한다면 달라짐.
a = "ABC"
b = a
print(id(a) == id(b))
a = a+"C"
print(id(a) == id(b))

True
False


In [28]:
# mutable - 변경가능하기 때문에 달라지지 않음.
a = [10,20]
b = a
print(id(a) == id(b))
a.pop()
print(id(a) == id(b))

True
True


 - 대게 id를 사용하여 mutable과 immutable을 비교한다. 하지만 개인적인 생각으로는 이렇게 비교하는 것은 재할당의 관점에서 생각한다면 비교의 대상이 잘못되었다고 생각한다(물론, 이해를 위한 가장 쉬운 예시이다.) 그 이유는 재할당의 관점에서 Mutable객체 또한 재할당을 한다면, 메모리 주소가 바뀐다.

다음 예시를 보자

In [29]:
a = [10,20]
b = a
print(id(a) == id(b))
a = a.pop()
print(id(a) == id(b))

True
False


- 결국, mutable은 변경할 수 있기때문에 고유한 객체가 만들어진 후의 시점에서도 내부를 변경할 수 있다.
    - 즉, 내부를 변경할 수 있는 메소드가 있다.(dir혹은 \_\_dict__로 확인가능)


- Immutable은 고유한 객체가 만들어진 후의 시점에 **변경불가**하기 때문에 내부를 변경하지 못해 **다른 값으로 재할당** 하는 것임에 유의하는 것이 좋다.

### Python object interning

- 정의 : 메모리 공유 기법으로서 이미 생성된 Object(객체)를 reuse(재사용)하는 기법. 대게 Immutable객체에 대해서 쓰며 개발자가 필요한 경우 function을 통해 interning을 지정 할 수 있다.
    - 이점 : 메모리의 효율성
    

- Python interning : 몇 가지 immutable객체에 대해서 default로 interning을 지정해놓았음.
    - 문자형 type 중 20자 미만의 공백을 포함하지 않는 문자열 같은 메모리 공유.
    - 숫자형 type 중 -5 ~ 256 까지는 메모리가 정해져 있어서 같은 메모리 공유.
    - python sys.intern() : intern 객체.
    - 주의점 : is 사용 주의.
    

In [4]:
# 문자형 : 20미만의 공백을 포함하지 않는 문자열.

a = "Hi"
a2 = "Hi"
print(id(a),id(a2))

b = "Hello world!"
b2 = "Hello world!"
print(id(b),id(b2))

4398773296 4398773296
4398774192 4398775216


In [5]:
# 숫자형 : -5 ~ 256
a = 256
a2 = 256
print(id(a),id(a2))

b = 257
b2 = 257

print(id(b),id(b2))


4364302736 4364302736
4398157456 4398157264


In [10]:
from sys import intern
 
c = intern('Hello world!')
d = 'Hello world!'
print(id(c), id(d), c is d)
 
e = intern('Hello world!')
print(id(c), id(e), c is e)

4398870576 4399368816 False
4398870576 4398870576 True


### is vs ==

- == : 값만 비교<br>
- is : id값을 통해서 고유한 객체인지를 비교.

In [39]:
# tuple - container, immutable
a = c= 1,
b = 1,
print(a == b)
print(b == c)


print(a is b)
print(a is c)

True
True
False
True


In [40]:
# 주의 - int는 immutable type이지만 container가 아니다. 따라서, 같은 int값은 어떻게 해도 같은 고유한 객체를 가리킨다.

a= c = 10
b= 10

print(a == b)
print(b == c)


print(a is b)
print(a is c)

True
True
True
True


### Copy

- Programming에서는 일반적으로 copy모듈을 통해서 복사를 지원한다. 
- 기본적으로는 Swallow Copy를 지원한다.
- 우리가 유의해서 보아햐 될 부분은 바로 Mutable객체에 대한 Copy이다.
    - 앞서 언급했듯, immutable은 불변하기 때문에 할당의 개념으로 보아야한다.

#### Simple Copy

- 단순복사는 우리가 일반적으로 하나의 변수를 다른 변수에 할당함으로써 같은 객체를 참조하는 것을 말한다.

In [42]:
# mutable
a = [1,2]
b = a    # 단순 복사
b.append(3)
print(a,b)
print(id(a),id(b))

[1, 2, 3] [1, 2, 3]
4407063104 4407063104


#### swallow copy

- 기본적으로 python에서 swallow copy를 지원하여 단순객체에서는 앞선 단순 복사와 하는 역할이 비슷하다.
- 하지만, 대표적으로 list dict처럼 mutable한 heterogeneous container type에서는 복합적인 type을 갖는 객체들을 수용할 수 있으므로 이러한 **복합객체**에서는 내부 객체 type에 따라 다른 양상을 보인다.

In [51]:
# 내부객체가 immutable 
import copy

a = [1,2,3,4]
b = copy.copy(a)
print(a,b)
print(id(a),id(b))
print(id(a[0]),id(a[1]), id(b[0]),id(b[1]))

b[0] = 999

print(a,b)
print(id(a),id(b))
print(id(a[0]),id(a[1]), id(b[0]),id(b[1]))

[1, 2, 3, 4] [1, 2, 3, 4]
4405298368 4405298176
4371757360 4371757392 4371757360 4371757392
[1, 2, 3, 4] [999, 2, 3, 4]
4405298368 4405298176
4371757360 4371757392 4405017008 4371757392


In [54]:
# 내부객체가 mutable
# copy모듈을 import하지않고 그냥 객체.copy()를 써도됨
import copy

a = [1,[2,3,4]]
b = copy.copy(a)
c = a.copy()# swallow copy 사용가능.
print(a,b)
print(id(a),id(b))
print(id(a[0]),id(a[1]), id(b[0]),id(b[1]))

b[1][2] = 33

print(a,b)
print(id(a),id(b))
print(id(a[0]),id(a[1]), id(b[0]),id(b[1]))

[1, [2, 3, 4]] [1, [2, 3, 4]]
4405418048 4406532608
4371757360 4406502720 4371757360 4406502720
[1, [2, 3, 33]] [1, [2, 3, 33]]
4405418048 4406532608
4371757360 4406502720 4371757360 4406502720


- 이러한 현상이 나타나는 이유는 바로 swallow copy의 특성에서 찾아볼 수 있다.
    1. 복합객체의 제일 바깥 객체는 복사하여 다른 id값일 가리킨다.
    2. 내부객체는 raw 객체의 주소를 그대로 참조하고 있다.
    3. 따라서 내부 객체를 변화시킬 때, 단순 복사처럼 내부 객체가 mutable이라면 주소를 유지 한테 변화시키고 immutable이라면 변경불가하다.
    
- 이러한 방식때문에 큰 data를 다뤄야하는 실무에서 실수가 발생할 가능성이 높아진다.

=> 따라서, 이 문제를 해결하기 위해 python에서는 **deepcopy** method를 제공한다. 

#### deepcopy()

    - swallow copy의 문제점을 해결하기위해서 재귀적으로 복합객체의 내부객체까지 복사해서 완전 새로운 객체를 만드는 함수.
    - swallow copy와 같이 copy module를 통해 사용 가능

In [55]:
import copy

a = [1,[2,3]]

b = copy.deepcopy(a)

print(a,b)
print(id(a),id(b))
print(id(a[0]),id(a[1]), id(b[0]),id(b[1]))

[1, [2, 3]] [1, [2, 3]]
4405433472 4407175296
4371757360 4405435392 4371757360 4405435648
