### 목차
- 파이썬 자료형(컨테이너(서로 다른 자료형), 플랫(Flat, 한개의 자료형))
- 파이썬 자료형(가변 자료형, 불변 자료형)
- 제너레이터
- 깊은 복사 vs 얕은 복사
- 언패킹
- sort vs sorted 
- 해시 테이블
- setdefault
- 집합(Set)


#### 파이썬 자료형  

#### 서로 다른 자료형, 단일 자료형으로 구분  
컨테이너(서로 다른 자료형)
- list, tuple, collections.deque
- 서로 다른 자료형을 담을 수 있다.

플랫(Flat, 한개의 자료형)
- str, byte, bytearray, array.array, memoryview
- 한개의 자료형만 담을 수 있다.

#### 가변 자료형, 불변 자료형으로 구분
파이썬 가변 자료형
- list, bytearray, array.array, memoryview, deque

파이썬 불변 자료형
- tuple, str, bytes

In [2]:
chars = '+_)(*&^%$#@!~)'
chars[2] = 'h' # str은 불변형 이므로 수정이 불가능 하다

TypeError: 'str' object does not support item assignment

In [31]:
# Mutable(가변) vs Immutable(불변)
l = (15, 20, 25)
m = [15, 20, 25]

print(l, id(l))
print(m, id(m))

l = l * 2    # 불변형인 튜플은 아이디 값이 계속 바뀐다. 
m = m * 2    # 깊은 복사를 수행한다. 

print(id(l)) 
print(id(m)) 

l *= 2       # 불변형인 튜플은 아이디 값이 계속 바뀐다.
m *= 2       # 얖은 복사를 수행한다.

print(id(l)) 
print(id(m))


(15, 20, 25) 2218907015104
[15, 20, 25] 2218900169472
2218901067808
2218899093888
2218891159152
2218899093888


In [6]:
code_list = [ord(s) for s in chars] # ord 함수는 str의 유니코드 반환
print(code_list)
code_list2 = [ord(s) for s in chars if ord(s) > 40]
print(code_list2)
code_list3 = list(filter(lambda x : x > 40, map(ord, chars)))
print(code_list3)

[43, 95, 41, 40, 42, 38, 94, 37, 36, 35, 64, 33, 126, 41]
[43, 95, 41, 42, 94, 64, 126, 41]
[43, 95, 41, 42, 94, 64, 126, 41]


#### 제너레이터


In [8]:
# [] 대신에 ()로 감싸면 제너레이터가 된다.
# 모든 값을 메모리에 할당하지 않는다.
tuple_g = (ord(s) for s in chars) 
print(type(tuple_g))
print(next(tuple_g))
print(next(tuple_g))

<class 'generator'>
43
95


In [10]:
import array
array_g = array.array('I', (ord(s) for s in chars))
print(type(array_g))
print(array_g.tolist())

<class 'array.array'>
[43, 95, 41, 40, 42, 38, 94, 37, 36, 35, 64, 33, 126, 41]


In [12]:
# 아래는 제너레이터이므로 메모리에 값을 할당한 상태가 아니다.
print(('%s' % c + str(n) for c in ['A', 'B', 'C', 'D'] for n in range(1,11)))

for s in ('%s' % c + str(n) for c in ['A', 'B', 'C', 'D'] for n in range(1,11)):
    print(s, end=' ')

<generator object <genexpr> at 0x00000204A12B2C10>
A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 B1 B2 B3 B4 B5 B6 B7 B8 B9 B10 C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 D1 D2 D3 D4 D5 D6 D7 D8 D9 D10 

#### 깊은 복사 vs 얕은 복사

In [16]:
# 아래의 출력은 동일하다, 하지만 메모리 적재 방식은 다르다.

# 서로 다른 3개의 리스트를 만들어 낸다. 깊은 복사.
marks1 = [['~'] * 3 for n in range(3)]  
# 동일한 메모리의 리스트를 복사한다. 얕은 복사.
marks2 = [['~'] * 3] * 3 

print(marks1)
print(marks2)

[['~', '~', '~'], ['~', '~', '~'], ['~', '~', '~']]
[['~', '~', '~'], ['~', '~', '~'], ['~', '~', '~']]


In [18]:
# 하지만, 변경을 가하면, 다른 결과를 낸다
marks1[0][1] = 'X'
marks2[0][1] = 'X'

print(marks1)
print(marks2)

# 증명
print([id(i) for i in marks1]) # 리스트의 주소 값이 서로 다르다.
print([id(i) for i in marks2]) # 리스트의 주소 값이 서로 같다.

[['~', 'X', '~'], ['~', '~', '~'], ['~', '~', '~']]
[['~', 'X', '~'], ['~', 'X', '~'], ['~', 'X', '~']]
[2218903596928, 2218907053312, 2218907016064]
[2218907006784, 2218907006784, 2218907006784]


#### 언패킹

In [19]:
print(divmod(100, 9))
print(divmod(*(100, 9)))
print(*divmod(100, 9))

(11, 1)
(11, 1)
11 1


In [21]:
x, y, *rest = range(10)
print(x, y, rest) # 나머지는 리스트에 담긴다
x, y, *rest = range(2)
print(x, y, rest) # rest는 언패킹 할 게 없으니 비어있다.
x, y, *rest = 1, 2, 3, 4, 5
print(x, y, rest)


0 1 [2, 3, 4, 5, 6, 7, 8, 9]
0 1 []
1 2 [3, 4, 5]


In [22]:
l = (15, 20, 25)
m = [15, 20, 25]

print(l, id(l))
print(m, id(m))

(15, 20, 25) 2218905584320
[15, 20, 25] 2218906985792


### sort vs sorted 
- sorted: 정렬 후 새로운 객체 반환
- sort: 정렬 후 객체 직접 변경

In [38]:
f_list = ['orange', 'apple', 'mango', 'papaya', 'lemon', 'strawberry', 'coconut']
print('sorted -', sorted(f_list))
print('sorted -', sorted(f_list, reverse=True))
print('sorted -', sorted(f_list, key=len))
print('sorted -', sorted(f_list, key=lambda x: x[-1]))
print('sorted -', sorted(f_list, key=lambda x: x[-1], reverse=True))
print('sorted -', f_list)

sorted - ['apple', 'coconut', 'lemon', 'mango', 'orange', 'papaya', 'strawberry']
sorted - ['strawberry', 'papaya', 'orange', 'mango', 'lemon', 'coconut', 'apple']
sorted - ['apple', 'mango', 'lemon', 'orange', 'papaya', 'coconut', 'strawberry']
sorted - ['papaya', 'orange', 'apple', 'lemon', 'mango', 'coconut', 'strawberry']
sorted - ['strawberry', 'coconut', 'mango', 'lemon', 'orange', 'apple', 'papaya']
sorted - ['orange', 'apple', 'mango', 'papaya', 'lemon', 'strawberry', 'coconut']


In [40]:
# {리스트}.sort() 하면 리스트를 직접 수정하기 때문에 
# 반환 값은 'None' 이며, 객체가 직접 변경된다.
print('sort -', f_list.sort(), f_list)
print('sort -', f_list.sort(reverse=True), f_list)
print('sort -', f_list.sort(key=len), f_list)
print('sort -', f_list.sort(key=lambda x: x[-1]), f_list)
print('sort -', f_list.sort(key=lambda x: x[-1], reverse=True), f_list)
print('sorted -', f_list)


sort - None ['apple', 'coconut', 'lemon', 'mango', 'orange', 'papaya', 'strawberry']
sort - None ['strawberry', 'papaya', 'orange', 'mango', 'lemon', 'coconut', 'apple']
sort - None ['mango', 'lemon', 'apple', 'papaya', 'orange', 'coconut', 'strawberry']
sort - None ['papaya', 'apple', 'orange', 'lemon', 'mango', 'coconut', 'strawberry']
sort - None ['strawberry', 'coconut', 'mango', 'lemon', 'apple', 'orange', 'papaya']
sorted - ['strawberry', 'coconut', 'mango', 'lemon', 'apple', 'orange', 'papaya']


In [41]:
# List vs Array 적합 한 사용법 설명
# 리스트 기반 : 융통성, 다양한 자료형, 범용적 사용
# 숫자 기반 : 배열(리스트와 거의 호환)

#### 해시 테이블
- Dict -> Key 중복 허용 X, Set -> 중복 허용 X


In [50]:
# Dict 구조
#print(__builtin__.__dict__) # 파이썬 builtin 객체 속성 정보를 확인

In [43]:
t1 = (10, 20, (30, 40, 50)) # 불변형, 해쉬화 할 수 있다.
t2 = (10, 20, [30, 40, 50]) # 가변형, 해쉬화 할 수 없다.

print(hash(t1)) # 고유한 해쉬값 부여
print(hash(t2)) # 예외, 리스트는 가변형이므로 해쉬화 할 수 없다.

465510690262297113


TypeError: unhashable type: 'list'

In [46]:
# Dict Setdefault 예제
source = (('k1', 'val1'),
            ('k1', 'val2'),
            ('k2', 'val3'),
            ('k2', 'val4'),
            ('k2', 'val5'))

# No use setdefault
new_dict1 = {} 
for k, v in source:
    if k in new_dict1:
        new_dict1[k].append(v)
    else:
        new_dict1[k] = [v]
print(new_dict1)

{'k1': ['val1', 'val2'], 'k2': ['val3', 'val4', 'val5']}


In [51]:
# Use setdefault
new_dict2 = {}
for k, v in source:
    new_dict2.setdefault(k, []).append(v)
print(new_dict2)

{'k1': ['val1', 'val2'], 'k2': ['val3', 'val4', 'val5']}


In [52]:
# 리스트와는 다르게 딕셔너리는 컴프리핸션이 안된다.
new_dict3 = {k : v for k , v in source}
print(new_dict3)

{'k1': 'val2', 'k2': 'val5'}


#### 불변의 딕셔너리(immutable Dict)

In [56]:
from types import MappingProxyType
d = {'key1': 'value1'}

d_frozen = MappingProxyType(d)
print(d, id(d))
print(d_frozen, id(d_frozen))
print(d is d_frozen, d == d_frozen)

# MappingProxyType로 감싼 딕셔너리는 수정 불가
d_frozen['key1'] = 'value2' 

{'key1': 'value1'} 2218903261568
{'key1': 'value1'} 2218902864896
False True


TypeError: 'mappingproxy' object does not support item assignment

In [58]:
d['key2'] = 'value2' # 삽입은 가능하다.
print(d)

{'key1': 'value1', 'key2': 'value2'}


#### Set

In [67]:
s1 = {'Apple', 'Orange', 'Apple', 'Orange', 'Kiwi'}
print(s1)
s2 = set(['Apple', 'Orange', 'Apple', 'Orange', 'Kiwi'])
print(s2) # 리스트 to 세트
s3 = {3}
print(s3)
s4 = set() # s4 = {} 이렇게 하면 s4는 딕셔너리가 된다.
print(s4)
s5 = frozenset({'Apple', 'Orange', 'Apple', 'Orange', 'Kiwi'})
print(s5)

print()
print()

s1.add('Melon')
print(s1)
s5.add('Melon')


{'Kiwi', 'Orange', 'Apple'}
{'Kiwi', 'Orange', 'Apple'}
{3}
set()
frozenset({'Kiwi', 'Orange', 'Apple'})


{'Kiwi', 'Orange', 'Apple', 'Melon'}


AttributeError: 'frozenset' object has no attribute 'add'

In [69]:
print(type(s1))
print(type(s2))
print(type(s3))
print(type(s4))
print(type(s5))

<class 'set'>
<class 'set'>
<class 'set'>
<class 'set'>
<class 'frozenset'>


#### 선언 최적화
- 파이썬은 내부적으로 스크립트를 바이트 코드로 변경

In [73]:
from dis import dis
print(dis('{10}')) # 바로 값을 대입하는 것이, 속도 면에서 미세하게 유리하다.

  1           0 LOAD_CONST               0 (10)
              2 BUILD_SET                1
              4 RETURN_VALUE
None


In [74]:
print(dis('set([10])'))

  1           0 LOAD_NAME                0 (set)
              2 LOAD_CONST               0 (10)
              4 BUILD_LIST               1
              6 CALL_FUNCTION            1
              8 RETURN_VALUE
None


In [80]:
# 지능형 집합(Comprehending Set)
from unicodedata import name
#print({chr(i) for i in range(0, 256)})

#print({name(chr(i), '') for i in range(0, 256)})

#### [enum — 열거형 지원](https://docs.python.org/ko/3.9/library/enum.html)
- 열거형(enumeration)은 고유한 상숫값에 연결된 기호 이름(멤버)의 집합
- 열거형 내에서, 멤버를 ID로 비교할 수 있고 열거형 자체는 이터레이트 될 수 있다.

class enum.Enum
열거형 상수를 만들기 위한 베이스 클래스. 대체 구성 문법은 함수형 API 섹션을 참조하십시오.

class enum.IntEnum
int의 서브 클래스이기도 한 열거형 상수를 만들기 위한 베이스 클래스.

class enum.IntFlag
IntFlag 멤버십을 잃지 않고 비트 연산자를 사용하여 결합할 수 있는 열거형 상수를 만들기 위한 베이스 클래스. IntFlag 멤버도 int의 서브 클래스입니다.

class enum.Flag
Flag 멤버십을 잃지 않고 비트 연산을 사용하여 결합할 수 있는 열거형 상수를 만들기 위한 베이스 클래스.

enum.unique()
한 값에 하나의 이름 만 연결되도록 하는 Enum 클래스 데코레이터.

class enum.auto
인스턴스는 Enum 멤버에 적절한 값으로 바뀝니다. 기본적으로, 초깃값은 1부터 시작합니다.

In [1]:
from enum import Enum
class Color(Enum):
    RED = 1
    GREEN = 2
    BLUE = 3

==>
Color 클래스는 열거형이다. 일반적인 파이썬 클래스가 아니다.
Color.RED, Color.GREEN 등의 속성은 열거형 멤버이며 상수이다.

In [8]:
print(Color.RED)
print(repr(Color.RED))
print(type(Color.RED))
print(isinstance(Color.GREEN, Color))
print(Color.RED.name)
print(Color.RED.value)

Color.RED
<Color.RED: 1>
<enum 'Color'>
True
RED
1


열거형은 정의 순서로 이터레이션을 지원합니다

In [7]:
class Shake(Enum):
    VANILLA = 7
    CHOCOLATE = 4
    COOKIES = 9
    MINT = 3

for shake in Shake:
    print(shake)

Shake.VANILLA
Shake.CHOCOLATE
Shake.COOKIES
Shake.MINT


열거형 멤버는 같은 값을 가질 수 있지만, 아래와 같이 고유한 열거형 값을 보장할 수도 있다.

In [11]:
from enum import Enum, unique
class Mistake(Enum):
    ONE = 1
    TWO = 2
    THREE = 3
    FOUR = 3
print(Mistake)

@unique
class Mistake2(Enum):
    ONE = 1
    TWO = 2
    THREE = 3
    FOUR = 3  # error

<enum 'Mistake'>


ValueError: duplicate values found in <enum 'Mistake2'>: FOUR -> THREE