# Ch02. 시퀀스

# 1. 내장 시퀀스 개요


* 파이썬에서는 여러 종류의 '시퀀스'를 거의 유사한 인터페이스로 다룰 수 있다.
* http://static.zybuluo.com/plutoese/ofxhh57y7wadbzld2r6angwj/p004.png


## 시퀀스의 분류 1

* 컨테이너 시퀀스 (Container sequence): 객체에 대한 reference를 담고 있음; 여러 종류 객체 저장 가능
    * `list`, `tuple`, `collections.deque`
* 균일 시퀀스 (Flat sequence): 단 하나의 자료형만 담을 수 있음
    * `str`, `bytes`, `bytearray`, `array.array`


## 시퀀스의 분류 2

* 가변 시퀀스 (Mutable sequence) - 수정시 기존 레퍼런스가 변경
    * `list`, `bytearray`, `array.array`
* 불변 시퀀스 (Immutable sequence) - 수정시 새로운 레퍼런스를 생성
    * `tuple`, `str`, `bytes`

# 2. 지능형 리스트와 제너레이터 표현식

In [2]:
symbols = 'asdbxcv'
codes = []
# for
for symbol in symbols:
    codes.append(symbol)
print(codes)

# 지능형 리스트 = list comprehension
codes = [symbol for symbol in symbols]
print(codes)

['a', 's', 'd', 'b', 'x', 'c', 'v']
['a', 's', 'd', 'b', 'x', 'c', 'v']


* 파이썬 내장 함수인 `map()` `filter()`를 사용하는 것과 list comprehension은 거의 동일하다.
* 그러나 가급적 list comprehension을 쓰자
    * 더 좋은 가독성
    * 더 좋은 표현력 (for 문 두 개 -> 곧 보게 될 것)
    * `lambda`를 쓰지 않아도 됨

### 제너레이터(generator) 표현식

* list comprehension과 똑같은 방식으로 dictionary, set, array 등도 만들 수 있다.

* 시퀀스 전체가 아니라 한번에 하나씩만 넘기기 때문에 메모리를 더 적게 사용한다.

In [3]:
'''tuple with comprehension'''
print(tuple(chr(i) for i in range(64, 67)))

'''tuple from list'''
l = [chr(i) for i in range(64, 67)]
print(tuple(l))

'''dictionary'''
print({i: chr(i) for i in range(64, 67)})

('@', 'A', 'B')
('@', 'A', 'B')
{64: '@', 65: 'A', 66: 'B'}


## 튜플 언패킹 


In [17]:
lax_coordinates = (33.9425, -118.408056)
print(lax_coordinates)

city, year, pop, chg, area = ('Tokyo', 2003, 32450, 0.66, 8014)
print(city, year, pop, chg, area)

traveler_ids = [('USA', '31195855'), ('BRA', 'CE342567'), ('ESP', 'XDA205856')]
for passport in sorted(traveler_ids):
    print('%s/%s' % passport)

for country, _ in traveler_ids:
    print(country)


(33.9425, -118.408056)
Tokyo 2003 32450 0.66 8014
BRA/CE342567
ESP/XDA205856
USA/31195855
USA
BRA
ESP


In [18]:
# 언패킹으로 교환도 가능하다
a = 1
b = 2
b, a = a, b
print(a, b)

2 1


In [24]:
a, b, *rest = range(5)
print(a, b, rest)

a, b, *rest = range(2)
print(a, b, rest)

a, *body, c, d = range(5)
print(a, body, c, d)

*head, b, c, d = range(5)
print(head, b, c, d)

0 1 [2, 3, 4]
0 1 []
0 [1, 2] 3 4
[0, 1] 2 3 4


# 4. 슬라이싱

* 슬라이스 객체 `slice()` 가 위의 연산을 표현한다.
* `seq[start:stop:step]` == `seq.__getitem__(slice(start, stop, step))`
* 슬라이스 오브젝트를 이용하면 범위에 이름을 붙일 수가 있다. 예를 들어서 csv 파싱할 때 편리함.
* 슬라이스에 할당도 가능


In [4]:
'''basics'''
l = [10, 20, 30, 40, 50, 60, 70, 80]
break_ = 2
print(l[:break_])
print(l[break_:])

[10, 20]
[30, 40, 50, 60, 70, 80]


In [5]:
score_cols = slice(1, 4)
l = 'uiandwe,60,60,1'
l.split(',')[score_cols]

['60', '60', '1']

## 5. list.sort() // sorted() 내장 함수

- list.sort() -- inplace
- sorted(l)  -- 새로운 list 반환

In [11]:
# 튜플을 정렬할땐 sorted()를 써야 한다
a = ((0, 6), 
     (3, 4), 
     (5, 1))

print(sorted(a))

[(0, 6), (3, 4), (5, 1)]


In [8]:
sorted(a, key=lambda x: x[1])

[(5, 1), (3, 4), (0, 6)]