# **Fluent Python**

## Part 02 - Chapter 02 : 데이터 구조체 (시퀀스)

- 파이썬의 창시자 귀도 반 로썸은 파이썬을 만들기전 ABC 언어에 참여하고 있었음.  
  (ABC언어는 초보자를 위한 프로그래밍 환경 개발 프로젝트로 10년간 진행된 연구프로젝트임)
- 파이썬은 시퀀스를 단일하게 처리하는 ABC의 특징을 물려받았음.

### **1. 내장 시퀀스**

- Python 표준 라이브러리는 C로 구현된 다음 시퀀스를 제공
    - 컨테이너 시퀀스 : 객체에 대한 참조를 담고 있기때문에 서로 다른 자료형의 항목들을 담을 수 있음.
        - list
        - tuple
        - collections.deque
    - 균일 시퀀스 : 객체에 대한 참조 대신 자신의 메모리 공간에 값을 직접 담기 때문에 단 하나의 자료형만 담을 수 있음.
        - str
        - bytes
        - bytearray
        - memoryview
        - array.array
- 가변성에 따라 다음과 같이 분류할 수 있음.
    - 가변 시퀀스
        - list, bytearray, array.array, collections.deque, memoryview
    - 불변 시퀀스
        - tupel, str, bytes

### **2. 지능형 리스트(List Comprehension)와 제네레이터 표현식(Generator Expression)**

#### 2.2.1 지능형 리스트(List Comprehension)와 가독성

In [1]:
symbols = '$𝞮𝝦𝜱𝜺¢€' # Unicode
codes = []
for symbol in symbols:
    codes.append(ord(symbol))

codes

[36, 120750, 120678, 120625, 120634, 162, 8364]

In [2]:
symbols = '$𝞮𝝦𝜱𝜺¢€' # Unicode
codes = [ord(symbol) for symbol in symbols]

codes

[36, 120750, 120678, 120625, 120634, 162, 8364]

#### 2.2.2 지능형 리스트와 map() / filter() 비교

`map()`과 `filter()` 함수를 이용해서 수행할 수 있는 작업은 기능적으로 문제가 있는 파이썬 람다를 억지로 사용하지 않아도 모두 구현할 수 있다.

In [3]:
symbols = '$𝞮𝝦𝜱𝜺¢€' # Unicode
beyond_ascii = [ord(s) for s in symbols if ord(s)>127]
beyond_ascii

[120750, 120678, 120625, 120634, 162, 8364]

In [4]:
symbols = '$𝞮𝝦𝜱𝜺¢€' # Unicode
beyond_ascii = list(filter(lambda c:c>127, map(ord, symbols)))
beyond_ascii

[120750, 120678, 120625, 120634, 162, 8364]

#### 2.2.3 데카르트 곱

지능형 리스트는 2개 이상의 반복 가능한 자료형의 데카르트 곱을 나타내는 일련의 리스트를 만들 수 있다.

In [5]:
colors = ['black', 'white']
sizes = ['S', 'M', 'L']
tshirts = [(color, size) for color in colors for size in sizes]
tshirts

[('black', 'S'),
 ('black', 'M'),
 ('black', 'L'),
 ('white', 'S'),
 ('white', 'M'),
 ('white', 'L')]

#### 2.2.4 제네레이터 표현식

시퀀스형을 초기화하려면 지능형 리스트를 사용할 수도 있지만, 다른 생성자에 전달한 리스트를 통째로 만들지 않고 반복자 프로토콜(iterator protocol)을 이용해서 항목을 하나씩 생성하는 제너레이터 표현식은 메모리를 더 적게 사용한다.

In [6]:
symbols = '$𝞮𝝦𝜱𝜺¢€' # Unicode
tuple(ord(symbol) for symbol in symbols)

(36, 120750, 120678, 120625, 120634, 162, 8364)

In [7]:
import array

array.array('I', (ord(symbol) for symbol in symbols))

array('I', [36, 120750, 120678, 120625, 120634, 162, 8364])

In [8]:
# 제너레이터 표현식은 한 번에 하나씩 항목을 생성하며 6개의 티셔츠 종류를 담고 있는 리스트는 만들지 않는다.
colors = ['black', 'white']
sizes = ['S', 'M', 'L']
for tshirt in ('%s %s' %(c, s) for c in colors for s in sizes):
    print(tshirt)

black S
black M
black L
white S
white M
white L


### **3. 튜플은 단순한 불변 리스트가 아니다**

튜플은 불변 리스트로 사용할 수도 있지만 필드명이 없는 레코드로 사용할 수도 있다.

#### 2.3.1 레코드로서의 튜플

- 튜플을 불변리스트로만 생각한다면 경우에 따라 항목의 크기와 순서가 중요할 수도 있고 그렇지 않을수도 있다.
- 튜플을 필드의 집합으로 사용하는 경우 항목 수가 고정되어 있고 항목의 순서가 중요하다.

In [9]:
lax_coordinates = (33.9425, -118.408056)
city, year, pop, chg, area = ('Tokyo', 2003, 32450, 0.66, 8014)
travler_ids = [('USA', '31195855'), ('BPA', 'CE342567'), ('ESP', 'XDA205856')]

for passport in sorted(travler_ids):
    print('%s / %s' % passport) # tuple의 언패킹 매커니즘

BPA / CE342567
ESP / XDA205856
USA / 31195855


In [10]:
for country, _ in travler_ids:
    print(country)

USA
BPA
ESP


#### 2.3.2 튜플 언패킹

- 튜플의 언패킹은 반복 가능한 객체라면 어느것이든 적용할 수 있다.
- 병렬 할당(parallel assignment)가 가장 눈에 띈다.

In [11]:
lax_coordinates = (33.9425, -118.408056)
latitude, longtitude = lax_coordinates
print(latitude)
print(longtitude)

33.9425
-118.408056


In [12]:
a = 10
b = 5

print(a)
print(b)

10
5


In [13]:
b, a = a, b

print(a)
print(b)

5
10


In [16]:
t = (20, 8)
quotient, remainder = divmod(*t)
quotient, remainder

(2, 4)

In [21]:
# 함수의 호출자에 여러 값을 간단히 반환하는 기능도 존재한다.
import os

path, filename = os.path.split('/Users/choejaehun/Desktop/fluent_python/Chapter 02/Sequence.ipynb')
path, filename

('/Users/choejaehun/Desktop/fluent_python/Chapter 02', 'Sequence.ipynb')

In [23]:
a, b, *rest = range(5)
a, b, rest

(0, 1, [2, 3, 4])

In [24]:
a, b, *rest = range(3)
a, b, rest

(0, 1, [2])

In [25]:
a, b, *rest = range(2)
a, b, rest

(0, 1, [])

In [26]:
a, b, rest = range(2)
a, b, rest

ValueError: not enough values to unpack (expected 3, got 2)

In [27]:
a, *body, c, d = range(5)
a, body, c, d

(0, [1, 2], 3, 4)

In [28]:
a, *body, c, d = range(3)
a, body, c, d

(0, [], 1, 2)

In [29]:
*head, b, c, d = range(5)
head, b, c, d

([0, 1], 2, 3, 4)

In [30]:
*head, b, c, d = range(3)
head, b, c, d

([], 0, 1, 2)

#### 2.3.4 명명된 튜플

- `collections.namedtuple()`함수는 필드명과 클래스명을 추가한 튜플의 서브클래스를 생성하는 팩토리 함수이다.

In [31]:
from collections import namedtuple

City = namedtuple('City', 'name country population coordiantes')
tokyo = City('Tokyo', 'JP', 36.933, (35.689722, 139.691667))
tokyo

City(name='Tokyo', country='JP', population=36.933, coordiantes=(35.689722, 139.691667))

In [32]:
tokyo.population

36.933

In [33]:
tokyo[1]

'JP'

In [36]:
type(City._fields), City._fields

(tuple, ('name', 'country', 'population', 'coordiantes'))

In [37]:
LatLong = namedtuple('LatLong', 'lat long')
delhi_data = ('Delhi NCR', 'IN', 21.935, LatLong(28.613889, 77.208889))
delhi = City._make(delhi_data)
delhi

City(name='Delhi NCR', country='IN', population=21.935, coordiantes=LatLong(lat=28.613889, long=77.208889))

In [38]:
delhi._asdict()

{'name': 'Delhi NCR',
 'country': 'IN',
 'population': 21.935,
 'coordiantes': LatLong(lat=28.613889, long=77.208889)}

In [41]:
for k, v in delhi._asdict().items():
    print(k+' : ', v)

name :  Delhi NCR
country :  IN
population :  21.935
coordiantes :  LatLong(lat=28.613889, long=77.208889)


### **4. 슬라이싱**

모든 시퀀스형은 슬라이싱 연산을 지원하고 이것은 대부분의 사람들이 알고 있는 것보다 더 강력하다.

#### 2.4.1 슬라이스와 범위 지정시에 마지막 항목이 포함되지 않는 이유?

- ㅇㅇ?