# 시퀀스형
> **자료형의 종류**
> - 컨테이너(Container) : 서로다른 자료형을 담음
> ```list, tuple, collections.deque```
>	
>    - 가변형 : ```list, deque```
>	
>    - 불변형 : ```tuple```
> - 플랫(Flat) : 한 유형의 자료형만 담음
> ```str, bytes, bytearray, array.array, memoryview```
>   - 가변형 : ```bytearray, array.array, memoryview```
>
>   - 불변형 : ```str, bytes```

In [7]:
a = [1, 2, 3]
b = (1, 2, 3)
print(a.__dir__(), '=='*50)
print(b.__dir__(), '=='*50)



In [8]:
set(a.__dir__()) - set(b.__dir__())

{'__delitem__',
 '__iadd__',
 '__imul__',
 '__reversed__',
 '__setitem__',
 'append',
 'clear',
 'copy',
 'extend',
 'insert',
 'pop',
 'remove',
 'reverse',
 'sort'}

## 리스트 및 튜플 고급
### 지능형 리스트(Comprehending Lists)
#### for문으로 접근

In [18]:
# Comprehending Lists 
import time

chars = '+)(*&^%$#@!)' # str은 불변형
code_list1 = []

for s in chars:
    code_list1.append(ord(s))
print(code_list1)

[43, 41, 40, 42, 38, 94, 37, 36, 35, 64, 33, 41]


#### List comprehensions
Comprehending Lists : 가독성이 좋고, 실행속도도 빠름  
=> 따라서 데이터가 클 경우엔 List comprehensions을 추천함 (큰 차이는 없음)
- 오로지 새로운 리스트를 만드는 일만 함  
  - => 따라서 생성된 리스트를 사용하지 않을 거라면 사용 XXX
  - => 또한 두 줄 이상 넘어가면, 코드 분할 or for문 사용!

In [19]:
code_list2 = [ord(s) for s in chars]
print(code_list2)

[43, 41, 40, 42, 38, 94, 37, 36, 35, 64, 33, 41]


In [20]:
# 지역변수 이슈
x = 'ABC'
dummy = [ord(x) for x in x]
print(x)
print(dummy)

ABC
[65, 66, 67]


### 2.2.2 지능형 리스트와 map()/filter() 비교

In [21]:
# Comprehending Lists + Map, Filter
code_list3 = [ord(s) for s in chars if ord(s) > 40]
# Map, Filter 사용
code_list4 = list(filter(lambda x : x > 40, map(ord, chars)))

print(code_list3)
print(code_list4)

[43, 41, 42, 94, 64, 41]
[43, 41, 42, 94, 64, 41]


### 2.2.3 데카르트 곱
데카르트 곱은 두 개 이상의 리스트에 있는 모든 항목을 이용해서 만든 튜플로 구성된 리스트이며, 지능형 리스트를 통해서도 만들 수 있다.

In [29]:
colors = ['black', 'white']
sizes = list('SML')

# color 다음에 size를 배치해서 만든 튜플 리스트를 생성
tshirts = [(color, size) for color in colors for size in sizes]
tshirts

[('black', 'S'),
 ('black', 'M'),
 ('black', 'L'),
 ('white', 'S'),
 ('white', 'M'),
 ('white', 'L')]

In [31]:
# color를 반복하는 루프 안에서 sizes를 반복해서 튜플 리스트를 출력한다.
for color in colors:
    for size in sizes:
        print((color, size))

('black', 'S')
('black', 'M')
('black', 'L')
('white', 'S')
('white', 'M')
('white', 'L')


In [32]:
# size 먼저 반복 후, color 반복
tshirts = [(color, size) for size in sizes
                            for color in colors]
tshirts

[('black', 'S'),
 ('white', 'S'),
 ('black', 'M'),
 ('white', 'M'),
 ('black', 'L'),
 ('white', 'L')]

## Generator 생성
A Python generator is a function that produces a sequence of results. **It works by maintaining its local state, so that the function can resume again exactly where it left off when called subsequent times.** Thus, you can think of a generator as something like a powerful iterator.

```__iter__```가 있으면 순회가 돼서 for문 등에서 사용할 수 있다.  
작은 메모리조각으로도 연속되는 데이터를 만들어낼 수 있다.

- 한 번에 한 개의 항목을 생성(메모리 유지X)

In [34]:
import array
# a = [1,2,3,4,5,6,7,......;;;;..,100000] # => 많은 메모리를 차지하게 될 것임. 그러면 읽고 수정하고 데이터를 새로 계산해서 새로운 변수에 할당하는 데에 또 매우 많은 메모리를 차지하게 됨.

In [64]:
# 한 번에 한 개의 항목을 생성(메모리 유지X)
chars = '+)(*&^%$#@!)'
tuple_l = [ord(s) for s in chars]
print(tuple_l)


[43, 41, 40, 42, 38, 94, 37, 36, 35, 64, 33, 41]


In [65]:
tuple_g = (ord(s) for s in chars)
print(tuple_g)
print(type(tuple_g))
print('=='*10)
print(next(tuple_g))
print(next(tuple_g))
print(next(tuple_g))
print(next(tuple_g))
print(next(tuple_g))
print(next(tuple_g))
print(next(tuple_g))

<generator object <genexpr> at 0x110a692e0>
<class 'generator'>
43
41
40
42
38
94
37


In [67]:
import array
array_g = array.array('I', (ord(s) for s in chars))
print(array_g)
print(type(array_g))
print(array_g.tolist()) # 왜 리스트로 바꾸면 'I'는 날라갈까?

array('I', [43, 41, 40, 42, 38, 94, 37, 36, 35, 64, 33, 41])
<class 'array.array'>
[43, 41, 40, 42, 38, 94, 37, 36, 35, 64, 33, 41]


In [78]:
colors = ['black', 'white']
sizes = list('SML')
tshirts = (f'{color} {size}' for color in colors for size in sizes)
for tshirt in tshirts:
    print(tshirt)

black S
black M
black L
white S
white M
white L


In [80]:
tshirts[1]

TypeError: 'generator' object is not subscriptable

In [73]:
# Python 객체가 "subscriptable"하다 : __getitem__() 메서드가 구현되어 있는, "컨테이너" 객체 => 없나 확인
'__getitem__' in tshirt.__dir__()

False

In [74]:
for i in tshirt:
    print(i)

black S
black M
black L
white S
white M
white L


In [55]:
# 제네레이터 예제
class_rank_g = (f'{c}반{n}번' for c in 'A B C D'.split() for n in range(1, 21))
print(class_rank_g)

# 제네레이터는 한 번에 만들어놓고 출력하는 것이 아니라, 하나 출력하고 하나 생성하고 하는 것임
for s in class_rank_g: 
    print(s) 

<generator object <genexpr> at 0x10dc68200>
A반1번
A반2번
A반3번
A반4번
A반5번
A반6번
A반7번
A반8번
A반9번
A반10번
A반11번
A반12번
A반13번
A반14번
A반15번
A반16번
A반17번
A반18번
A반19번
A반20번
B반1번
B반2번
B반3번
B반4번
B반5번
B반6번
B반7번
B반8번
B반9번
B반10번
B반11번
B반12번
B반13번
B반14번
B반15번
B반16번
B반17번
B반18번
B반19번
B반20번
C반1번
C반2번
C반3번
C반4번
C반5번
C반6번
C반7번
C반8번
C반9번
C반10번
C반11번
C반12번
C반13번
C반14번
C반15번
C반16번
C반17번
C반18번
C반19번
C반20번
D반1번
D반2번
D반3번
D반4번
D반5번
D반6번
D반7번
D반8번
D반9번
D반10번
D반11번
D반12번
D반13번
D반14번
D반15번
D반16번
D반17번
D반18번
D반19번
D반20번


In [12]:
# 리스트 주의
marks1 = [['~'] * 3 for _ in range(4)] # 사용하지 않는 원소들은 _언더바 처리가 가능!
marks2 = [['~'] * 3] * 4
print(marks1)
print(marks2)

[['~', '~', '~'], ['~', '~', '~'], ['~', '~', '~'], ['~', '~', '~']]
[['~', '~', '~'], ['~', '~', '~'], ['~', '~', '~'], ['~', '~', '~']]


In [13]:
# critical한 문제! : 수정
marks1[0][1] = 'X'
marks2[0][1] = 'X'
print(marks1)
print(marks2)

# 증명
print([id(i) for i in marks1])
print([id(i) for i in marks2]) # 모두 id값이 같음

[['~', 'X', '~'], ['~', '~', '~'], ['~', '~', '~'], ['~', '~', '~']]
[['~', 'X', '~'], ['~', 'X', '~'], ['~', 'X', '~'], ['~', 'X', '~']]
[4574019968, 4574025088, 4573899072, 4574024448]
[4573965760, 4573965760, 4573965760, 4573965760]


### 2.3.4 명명된 튜플(namedtuple)
> `collections.namedtuple()` : 튜플의 서브클래스를 생성하는 팩토리 함수. 

In [14]:
import collections

Card = collections.namedtuple('Card', ['rank', 'suit'])

In [21]:
# Ex. 2-9
from collections import namedtuple
City = namedtuple('City', 'name country population coordinates')
tokyo = City('Tokyo', 'Japan', 36.933, (35.68, 139.69))
print(tokyo)

tokyo.population
tokyo[3]

City(name='Tokyo', country='Japan', population=36.933, coordinates=(35.68, 139.69))


(35.68, 139.69)

In [23]:
tokyo._fields

('name', 'country', 'population', 'coordinates')

In [24]:
LatLong = namedtuple('LatLong', 'lat long')
delhi_data = ('Delhi NCR', 'IN', 21.935, LatLong(28, 77))

In [25]:
delhi_data

('Delhi NCR', 'IN', 21.935, LatLong(lat=28, long=77))

In [30]:
delhi = City._make(delhi_data)
print(delhi.name)
print(delhi.coordinates)

Delhi NCR
LatLong(lat=28, long=77)


In [31]:
delhi._asdict()

{'name': 'Delhi NCR',
 'country': 'IN',
 'population': 21.935,
 'coordinates': LatLong(lat=28, long=77)}

In [35]:
for key, value in delhi._asdict().items():
    print(key, value, sep=' : ')

name : Delhi NCR
country : IN
population : 21.935
coordinates : LatLong(lat=28, long=77)


In [3]:
# 두 점을 정의하고, 두 점 사이의 거리 구하기(2) - namedtuple 사용
## namedtuple 정의
import math
from collections import namedtuple
Point = namedtuple('Point', 'x y')

## 두 점 정의
pt3 = Point(1.0, 5.0)
pt4 = Point(2.5, 1.5)

## print로 출력해보기, 인덱스와 key로 접근하여 namedtuple의 values 출력하기
print(pt3); print(pt4)
print(pt3[0]); print(pt3[1]) # 인덱스로 접근 가능
print(pt3.x); print(pt3.y) # ㅑkey로 접근 가능

## 두 점사이의 거리 구하기
l_leng2 = math.sqrt((pt3.x - pt4.x) ** 2 + (pt3.y - pt4.y) ** 2) # namedtuple은 인덱스 뿐만 아니라 !key!로도 접근할 수 있음 = 유사 딕셔너

Point(x=1.0, y=5.0)
Point(x=2.5, y=1.5)
1.0
5.0
1.0
5.0


In [4]:
# namedtuple 선언 방법 - 총 4가지
## 1. 리스트로 
Point1 = namedtuple('Point', ['x', 'y'])

## 2. , 따옴표로 구분하기 
Point2 = namedtuple('Point', 'x, y')

## 3. 띄어쓰기로 구분하기
Point3 = namedtuple('Point', 'x y')

## 4. 
# Point4 = namedtuple('Point', 'x y x class') ### class는 예약어여서 에러가남
Point4 = namedtuple('Point', 'x y x class', rename=True) # Default = False

In [5]:
p1 = Point1(x=10, y=35)
p2 = Point2(20, 40)
p3 = Point3(45, y=20)
# p4 = Point4(10, 20, 30) ## 이러면 에러남?
p4 = Point4(10, 20, 30, 40)

In [6]:
# Dict to Unpacking(1)
temp_dict = {'x' : 75, 'y' : 55}
p5 = Point3(**temp_dict) # 별표 : 튜플은 한개, 딕셔너리는 두개

print(p1); print(p5)
print(p1[0] + p5[0])
print(p1.x + p5.y)

Point(x=10, y=35)
Point(x=75, y=55)
85
65


In [7]:
# 또 다른 Unpacking 방법(2)
x, y = p3
print(x, y)

x, y = p2
print(x, y)

45 20
20 40


In [8]:
# 네임드 튜플 메소드
temp = [52, 38] 

# _make() : 새로운 객체 생성
p4 = Point1._make(temp)
print(p4)

# 네임드 튜플 메소드
# temp = [52, 38, 0]  # 값이 세개면 에러뜸 정확하게 키밸류 개수와 일치해야 함 => 엄격한 코딩이 가능

Point(x=52, y=38)


In [9]:
# _fields : 필드 네임 확인 => 딕셔너리에서 키값만 조회할 때 사용함
print(p1._fields, p2._fields, p3._fields)

# 중요!! _asdict() : OrderedDict 정렬된 딕셔너리를 반환함 (원래 딕셔너리는 정렬하지 않음)
## namedtuple을 Dictionary로 변환하는 것임
print(p1._asdict())
print(p4._asdict())

('x', 'y') ('x', 'y') ('x', 'y')
{'x': 10, 'y': 35}
{'x': 52, 'y': 38}


In [10]:
divmod(20,8)

(2, 4)

In [11]:
t = (20,8)
divmod(t) # 튜플을 바로 인수로 입력하면 에러 발생

TypeError: divmod expected 2 arguments, got 1

In [None]:
t = (20,8)
divmod(*t) # 튜플을 바로 인수로 입력하면 에러 발생

In [1]:
# 초과된 항목을 언패킹으로 해결할 수 있음
a, b, *rest = range(5)
a, b, rest

(0, 1, [2, 3, 4])

In [None]:
a, *body, c, d = range(5)
a, body, c, d

## 2.4 슬라이싱
```python
[start:end+1:stride]
== 
seq.__getitem__(slice(start, stop, step))
```

In [37]:
s = 'bicycle'
print(s[::3])
print(s[::-1])
print(s[::-2])

bye
elcycib
eccb


In [38]:
import collections
Card = collections.namedtuple('Card', ['rank', 'suit'])

class FrenchDeck:
    ranks = [str(n) for n in range(2, 11)] + list('JQKA')
    suits = 'spades diamonds clubs hearts'.split()

    def __init__(self):
        self._cards = [Card(rank, suit) for suit in self.suits 
                                        for rank in self.ranks]

    def __len__(self):
        return len(self._cards)

    def __getitem__(self, position):
        return self._cards[position]

In [39]:
deck = FrenchDeck()
len(deck)

52

In [41]:
deck[12::13]

[Card(rank='A', suit='spades'),
 Card(rank='A', suit='diamonds'),
 Card(rank='A', suit='clubs'),
 Card(rank='A', suit='hearts')]

In [48]:
CARDDECK = slice(12, None, 13)
print(CARDDECK)
deck[CARDDECK] # 질문 : None으로 해주면 끝까지인 건가? # 어떨 때 대문자로 변수명을 하는 걸까?

slice(12, None, 13)


[Card(rank='A', suit='spades'),
 Card(rank='A', suit='diamonds'),
 Card(rank='A', suit='clubs'),
 Card(rank='A', suit='hearts')]

In [42]:
invoice = """
0.....6..............20.....
1909  Pimoroni      $17.50
1489  6mm Tactile    $4.95
"""

SKU = slice(0, 6)
DESCRIPTION = slice(6,20)
UNIT_PRICE = slice(20, None)

line_items = invoice.split('\n')[2:]
for item in line_items:
    print(item[UNIT_PRICE], item[DESCRIPTION])

$17.50 Pimoroni      
 $4.95 6mm Tactile   
 


In [61]:
line_items = invoice.split('\n')[2:]
for item in line_items:
    # print(item)
    print(f'SKU : {item[SKU]}, DESCRIPTION : {item[DESCRIPTION]}, UNIT_PRICE: {item[UNIT_PRICE]}')

SKU : 1909  , DESCRIPTION : Pimoroni      , UNIT_PRICE: $17.50
SKU : 1489  , DESCRIPTION : 6mm Tactile   , UNIT_PRICE:  $4.95
SKU : , DESCRIPTION : , UNIT_PRICE: 
