## 6. 자료형 (지능형 리스트, 제너레이터, 가변불변, 정렬)

- **컨테이너(Container):** 서로 다른 자료형 포함 가능 
    - __list, tuple, collections.deque__ (ex) list: [1, 3, 0, 'hi']
- **Flat:** 한개의 자료형만을 포함 
    - __str, bytes, bytearray, array.array, memoryview__ 

---------------------------------------------------------------------------------------------------------

- **가변**
    - __list, bytearray, array.array, memoryview, deque__ 
- **불변** 
    - __tuple, str, bytes__

## - 지능형 리스트 (Comprehending Lists)

- None comprehending Lists

In [2]:
chars = "!@#$%^&*()_+"
codes1 = []

for s in chars:
    # 유니코드 변환 
    codes1.append(ord(s))
codes1

[33, 64, 35, 36, 37, 94, 38, 42, 40, 41, 95, 43]

- Comprehending Lists <br>
: 대단한 영향을 끼치는 것은 아니지만, 빅데이터 분야와 같은 데이터가 현저하게 많은 상황에서는 이 방법을 쓰는 것이 성능, 속도 면에서 더 유리하다. 

In [4]:
codes2 = [ord(s) for s in chars]
codes2

[33, 64, 35, 36, 37, 94, 38, 42, 40, 41, 95, 43]

- Comprehending List + Map Filter <br> 
: 이 방법 역시 속도가 약간 우세함.

In [6]:
codes3 = [ord(s) for s in chars if ord(s) > 40]
codes4 = list(filter(lambda x: x > 40, map(ord, chars)))
print(codes3, codes4, sep='\n')

[64, 94, 42, 41, 95, 43]
[64, 94, 42, 41, 95, 43]


- ord() 반대 chr()

In [7]:
print([chr(s) for s in codes1])
print([chr(s) for s in codes2])
print([chr(s) for s in codes3])
print([chr(s) for s in codes4])

['!', '@', '#', '$', '%', '^', '&', '*', '(', ')', '_', '+']
['!', '@', '#', '$', '%', '^', '&', '*', '(', ')', '_', '+']
['@', '^', '*', ')', '_', '+']
['@', '^', '*', ')', '_', '+']


- **cf)** 리스트 주의할 점

In [9]:
marks1 = [['~'] * 3 for n in range(3)]
marks2 = [['~'] * 3] * 3

print(marks1)
print(marks2)

[['~', '~', '~'], ['~', '~', '~'], ['~', '~', '~']]
[['~', '~', '~'], ['~', '~', '~'], ['~', '~', '~']]


In [10]:
# 값을 하나 변경 
marks1[0][1] = 'x'
marks2[0][1] = 'x'

print(marks1)
print(marks2)

[['~', 'x', '~'], ['~', '~', '~'], ['~', '~', '~']]
[['~', 'x', '~'], ['~', 'x', '~'], ['~', 'x', '~']]


In [11]:
#### 증명 
print([id(i) for i in marks1])  # id 값이 모두 다름. 
print([id(i) for i in marks2])  # id 값이 모두 같음. 

[2006881629128, 2006882137736, 2006882115528]
[2006881879432, 2006881879432, 2006881879432]


## - 제너레이터, Generator & Array

### (1) 제너레이터
- 제너레이터는 한 번에 한 개의 항목을 생성하므로 메모리를 유지하지 않는다. 메모리를 차지하지 않기 때문에 빅데이터를 사용할 때는 Generator가 훨씬 우세하다. 

In [17]:
tuple_g = (ord(s) for s in chars)  # 아직 메모리를 생성한 상태가 아님. 

### (2) Array
- **참고)** https://docs.python.org/3/library/array.html

In [18]:
import array 
array_g = array.array('I', (ord(s) for s in chars))

- 출력, 사용

In [20]:
print(tuple_g)
print(next(tuple_g))
print(next(tuple_g))
print(array_g)
print(array_g.tolist())

<generator object <genexpr> at 0x000001D3438AC048>
33
64
array('I', [33, 64, 35, 36, 37, 94, 38, 42, 40, 41, 95, 43])
[33, 64, 35, 36, 37, 94, 38, 42, 40, 41, 95, 43]


- 제너레이터 for문으로 사용하기

In [21]:
print(('%s' %c + str(n) for c in ['A', 'B', 'C', 'D'] for n in range(1, 11)))
for s in ('%s' %c + str(n) for c in list('abcd') for n in range(1, 11)): 
    print(s)

<generator object <genexpr> at 0x000001D3438AC2A0>
a1
a2
a3
a4
a5
a6
a7
a8
a9
a10
b1
b2
b3
b4
b5
b6
b7
b8
b9
b10
c1
c2
c3
c4
c5
c6
c7
c8
c9
c10
d1
d2
d3
d4
d5
d6
d7
d8
d9
d10


## - Tupl Advanced

- packing & unpacking

In [22]:
print(divmod(100, 9))
print(divmod(*(100, 9)))
print(*(divmod(100, 9)))

(11, 1)
(11, 1)
11 1


In [24]:
x, y, *rest = range(10)
print(x, y, rest)
x, y, *rest = range(2)
print(x, y, rest)
x, y, *rest = 1, 2, 3, 4, 5
print(x, y, rest)

0 1 [2, 3, 4, 5, 6, 7, 8, 9]
0 1 []
1 2 [3, 4, 5]


- __참고)__ **: dictionary를 받음 
    - (ex) def test(*args, **args):

## - Mutable (가변) vs Immutable (불변)

In [26]:
i = (10, 15, 20)
m = [10, 15, 20]

print(i, m, id(i), id(m), sep='\n')

(10, 15, 20)
[10, 15, 20]
2006881867960
2006882029384


- 객체를 새로 생성 <br> 
: 메모리를 더 잡아먹을 수도 있다는 것 

In [28]:
i = i * 2
m = m * 2 
print(i, m, id(i), id(m), sep='\n')

(10, 15, 20, 10, 15, 20, 10, 15, 20, 10, 15, 20)
[10, 15, 20, 10, 15, 20, 10, 15, 20, 10, 15, 20]
2006881808888
2006881199624


- 자체에서 연산 <br> 
: 튜플은 불변이기 때문에 이 방법에서도 객체를 새로 생성한다. 

In [29]:
i *= 2 
m *= 2 

print(i, m, id(i), id(m), sep='\n')

(10, 15, 20, 10, 15, 20, 10, 15, 20, 10, 15, 20, 10, 15, 20, 10, 15, 20, 10, 15, 20, 10, 15, 20)
[10, 15, 20, 10, 15, 20, 10, 15, 20, 10, 15, 20, 10, 15, 20, 10, 15, 20, 10, 15, 20, 10, 15, 20]
2006880184744
2006881199624


## - sort vs sorted

In [30]:
f_list = ['orange', 'apple', 'mango', 'papaya', 'lemon', 'strawberry', 'coconut']

- **(1) sorted:** 정렬 후 __새로운__ 객체 반환 -> __원본 리스트 변화 X__ 

In [35]:
print(sorted(f_list))
print(sorted(f_list, reverse=True)) # 역순으로 정렬 
print(sorted(f_list, key=len)) # 길이 순서대로 정렬 
print(sorted(f_list, key=lambda x: x[-1]))
print(sorted(f_list, key=lambda x: x[-1], reverse=True))
print('--------------------------------------------------------------------------')
print(f_list)

['apple', 'coconut', 'lemon', 'mango', 'orange', 'papaya', 'strawberry']
['strawberry', 'papaya', 'orange', 'mango', 'lemon', 'coconut', 'apple']
['apple', 'mango', 'lemon', 'orange', 'papaya', 'coconut', 'strawberry']
['papaya', 'orange', 'apple', 'lemon', 'mango', 'coconut', 'strawberry']
['strawberry', 'coconut', 'mango', 'lemon', 'orange', 'apple', 'papaya']
--------------------------------------------------------------------------
['orange', 'apple', 'mango', 'papaya', 'lemon', 'strawberry', 'coconut']


- __(2) sort:__ 정렬 후 객체 직접 변경 -> __원본 리스트 변화 O__
- None: 반환값이 없다는 뜻

In [38]:
print(f_list.sort(), f_list)
print(f_list.sort(reverse=True), f_list)
print(f_list.sort(key=len), f_list)
print(f_list.sort(key=lambda x: x[-1]), f_list)
print(f_list.sort(key=lambda x: x[-1], reverse=True), f_list)
print('--------------------------------------------------------------------------')
print(f_list)

None ['apple', 'coconut', 'lemon', 'mango', 'orange', 'papaya', 'strawberry']
None ['strawberry', 'papaya', 'orange', 'mango', 'lemon', 'coconut', 'apple']
None ['mango', 'lemon', 'apple', 'papaya', 'orange', 'coconut', 'strawberry']
None ['papaya', 'apple', 'orange', 'lemon', 'mango', 'coconut', 'strawberry']
None ['strawberry', 'coconut', 'mango', 'lemon', 'apple', 'orange', 'papaya']
--------------------------------------------------------------------------
['strawberry', 'coconut', 'mango', 'lemon', 'apple', 'orange', 'papaya']
