## Sequence1

- 컨테이너 시퀀스: 서로 다른 자료형의 항목들을 담을 수 있는 list, tuple, collections.deque형
- 균일 시퀀스: 단 하나의 자료형만 담을 수 있는 str,bytes,bytearray,memoryview,array.array형

컨테인너 시퀀스는 객체에 대한 참조를 담고있으며 객체는 어떠한 자료형도 될 수 있지만,<br>
균일 시퀀스는 객체에 대한 참조 대신 자신의 메모리 공간에 각 항목의 값을 직접 담는다.

- 가변 시퀀스 : list, bytearray, array.array, collections.deque, memoryview형
- 불변 시퀀스 : tuple, str, bytes형

가장 기본적인 시퀀스형인 list는 가변적이며 혼합된 자료형을 담을 수 있다. <br>
list comprehension을 제대로 알고있으면 제너레이터 표현식 generator expression도 쉽게 이해할 수 있다. <br>

- list comprehension = listcomp
- generator expression = genexp

시퀀스를 읽어서 개수를 세거나 어떤 항목을 골라내거나 합계를 구하는 등 for 루프는 아주 다양한 일에 사용할 수 있다.<br>
이와 대조적으로 list comprehension은 오로지 새로운 리스트를 만드는 일만을 한다.

<데카르트 곱> <br>
지능형 리스트는 두 개 이상의 반복가능한 자료형의 데카르트 곱을 나타내는 일련의 리스트를 만들 수 있다.<br>
데카르트 곱 안에 들어 있는 각 항목은 입력으로 받은 반복 가능한 데이터의 각 요소에서 만들어진 튜플로 구성된다.<br>

#### 지능형 리스트를 이용한 데카르트 곱

In [11]:
colors = ['black','white']
sizes = ['S','M','L']
tshirts = [(color,size) for color in colors for size in sizes]

print("=====================tshirts=====================")
print(tshirts)
print("="*50)

for color in colors:
    for size in sizes:
        print((color,size))
        
tshirts = [(color,size) for size in sizes
                        for color in colors]
print("="*50)
print(tshirts)

[('black', 'S'), ('black', 'M'), ('black', 'L'), ('white', 'S'), ('white', 'M'), ('white', 'L')]
('black', 'S')
('black', 'M')
('black', 'L')
('white', 'S')
('white', 'M')
('white', 'L')
[('black', 'S'), ('white', 'S'), ('black', 'M'), ('white', 'M'), ('black', 'L'), ('white', 'L')]


list comprehension은 단지 리스트를 만들 뿐이다.<br>
다른 종류의 시퀀스를 채우려면 generator expression을 사용해야한다.

#### generator expression

튜플, 배열 등의 시퀀스형을 초기화하려면 list comprehension을 사용할 수도 있지만, 다른 생성자에 전달할 리스트를 통째로 만들지 않고 <br>
반복자 프로토콜(iterator protocol)을 이용해서 항목을 하나씩 생성하는 제너레이터 표현식은 메모리를 더 적게 사용한다.

In [15]:
# 제네레이터 표현식에서의 데카르트 곱
colors = ['black','white']
sizes = ['S','M','L']
for tshirt in ('%s %s' %(c,s) for c in colors for s in sizes):
    print(tshirt)
    
# -->단지 리스트 이외의 시퀀스를 초기화하거나, 메모리에 유지할 필요가 없는 데이터를 생성하기 위해 제너레이터 표현식을 사용하는 방법을 보여줌

black S
black M
black L
white S
white M
white L


#### 튜플(tuple)

튜플은 불변리스트로 사용할 수도 있지만 필드명이 없는 레코드로 사용할 수도 있다.<br>
튜플은 레코드를 담고 있다. 튜플의 각 항목은 레코드의 필드 하나를 의미하며 항목의 위치가 의미를 결정한다.<br>
튜플을 단지 불변 리스트로 생각한다면 경우에 따라 항목의 크기와 순서가 중요할 수도 있고 그렇지 않을 수도 있다.<br>
그러나 튜플을 필드의 집합으로 사용하는 경우에는 항목 수가 고정되어 있고 항목의 순서가 중요하다 <br>

In [24]:
# 레코드로 사용된 튜플
# 튜플 안에서 항목의 위치가 항목의 의미를 나타내므로 튜플을 정렬하면 정보가 파괴된다는 점에 주의하라.

lax_coordinates = (33.9425, -118.408056)
city,year,pop,chg,area = ('Tokyo',2003,32450,0.66,8014)
traveler_ids = [('USA','31195855'),('BRA','CE42567'),('ESP','XDA205856')]
for passport in sorted(traveler_ids): # 리스트를 반복할 때 passport 변수가 각 튜플에 바인딩된다.
    print('%s / %s' %passport) # 퍼센트(%) 포맷 연산자는 튜플을 이해하고 각 항목을 하나의 필드로 처리한다.

# 퍼센트(%)연산자는 print()함수의 인수로 전달한 포맷 문자열의 각 슬롯에 passport 튜플의 각 항목을 할당했다.    

print("="*50)

#for 루프는 튜플의 각 항목을 어떻게 가져와야 하는지 알고있다 (unpacking) 여기서 두 번째 항목에는 관심이 없으므로 
#dummy variable을 나타내는 언더바(_)를 할당함.

for country,_ in traveler_ids: 
    print(country)

BRA / CE42567
ESP / XDA205856
USA / 31195855
USA
BRA
ESP


튜플 언패킹은 병렬할당(parallel assignment)을 할 때 가장 눈에 띈다.<br>
병렬 할당은 다음 코드에서 보는 것처럼 반복형 데이터를 변수로 구성된 튜플에 할당하는 것을 말한다.

In [25]:
lax_coordinates = (33.9425, -118.408056)
latitude, longitude = lax_coordinates # 튜플 언패킹
print(latitude)
print(longitude)

33.9425
-118.408056


인수 앞에 *를 붙여 튜플을 언패킹할 수도 있다.

In [26]:
divmod(20,8)


(2, 4)

In [28]:
t = (20,8)
divmod(*t)

(2, 4)

In [29]:
quotient, remainder = divmod(*t)
print(quotient)
print(remainder)

2
4


dummy variable(_)를 플레이스홀더로 사용해서 관심 없는 부분은 언패킹할 때 무시할 수 있다.

In [34]:
import os
_, filename = os.path.split("/home/luciano/.ssh/idrsa.pub")
print(filename)

idrsa.pub


- 초과항목을 잡기 위해 *을 사용하기

In [35]:
a,b,*rest = range(5)
print(a,b,rest)

a,b,*rest = range(3)
print(a,b,rest)

a,b,*rest = range(2)
print(a,b,rest)

0 1 [2, 3, 4]
0 1 [2]
0 1 []


In [36]:
a,*body,c,d = range(5)
print(a,body,c,d)

*head,b,c,d = range(5)
print(head,b,c,d)

0 [1, 2] 3 4
[0, 1] 2 3 4


- 내포된 튜플 언패킹

언패킹할 표현식을 받는 튜플은 (a,b,(c,d))처럼 다른 튜플을 내포할 수 있으며, <br>
파이썬은 표현식이 내포된 구조체에 일치하면 제대로 처리한다.<br>

In [37]:
# 내포된 튜플을 언패킹하는 사례

metro_areas = [
    ('Tokyo','JP',36.933,(35.6897,139.6916)),
    ('Delhi NCR','IN',21.935,(28.61,77.20)),
    ('New York-Newark','US',20.104,(40.80,-74.02)),
    ('Sao Paulo','BR',19.64,(-23.54,-46.63))
]

print('{:15} | {:^9} | {:^9}'.format('','lat.','long.'))
fmt = ' {:15} | {:9.4f} | {:9.4f} '

for name, cc, pop, (latitude,longitude) in metro_areas:
    print(fmt.format(name, latitude, longitude))

                |   lat.    |   long.  
 Tokyo           |   35.6897 |  139.6916 
 Delhi NCR       |   28.6100 |   77.2000 
 New York-Newark |   40.8000 |  -74.0200 
 Sao Paulo       |  -23.5400 |  -46.6300 


- collections.namedtuple()함수는 필드명과 클래스명을 추가한 튜플의 서브클래스를 생성하는 팩토리 함수로서 디버깅할 때 유용하다.

In [40]:
from collections import namedtuple
# namedtuple을 정의하려면 클래스명과 필드명의 list 등 총 2개의 매개변수가 필요하다.
# 필드명의 리스트는 반복형 문자열이나 공백으로 구분된 하나의 문자열을 이용해서 지정한다.

City = namedtuple('City','name country population coordinates') 
tokyo = City('Tokyo','JP',36.933,(35.689,139.69)) 
print(tokyo)
print(tokyo.population)
print(tokyo.coordinates)

City(name='Tokyo', country='JP', population=36.933, coordinates=(35.689, 139.69))
36.933
(35.689, 139.69)


named tuple은 튜플에서 상속받은 속성 외에 몇 가지 속성을 더 가지고 있다. <br>
_fields 클래스 속성, _make(iterable) 클래스 메서드, _asdict() 객체 메서드

In [41]:
City._fields

('name', 'country', 'population', 'coordinates')

In [42]:
LatLong = namedtuple('LatLong','lat long')
delhi_data = ('Delhi NCR','IN',21.935,LatLong(28.61,77.20))
delhi = City._make(delhi_data)
delhi._asdict()

{'name': 'Delhi NCR',
 'country': 'IN',
 'population': 21.935,
 'coordinates': LatLong(lat=28.61, long=77.2)}

In [43]:
for key,value in delhi._asdict().items():
    print(key+':',value)

name: Delhi NCR
country: IN
population: 21.935
coordinates: LatLong(lat=28.61, long=77.2)


튜플은 항목을 추가하거나 삭제하는 기능 및 __reversed__()메서드를 제외하고 리스트가 제공하는 메서드를 모두 지원한다.<br>