시퀀스, 매핑, 집합 등 컬랙션 사용법 및 str과 byte의 차이점에 관한 장

# 시퀀스

list comprehension

In [2]:
symbols = '$¢£¥€¤'
codes = [ord(x) for x in symbols]
codes

[36, 162, 163, 165, 8364, 164]

In [3]:
symbols = '$¢£¥€¤'
beyond_ascii = [ord(x) for x in symbols if ord(x) > 127]
beyond_ascii

[162, 163, 165, 8364, 164]

In [5]:
beyond_ascii = list(filter(lambda c: c > 127, map(ord, symbols)))
beyond_ascii

[162, 163, 165, 8364, 164]

In [11]:
next(filter(lambda c: c > 127, map(ord, symbols)))

162

- 리스트 컴프리헨젼은 리스트를 만들기 위해서만 사용한다.
- for문은 내부에서 리스트 생성 뿐만 아니라 매우 다양한 일을 할 수 있다.
- 리스트 생성에는 그 의도가 분명한 list comprehension을 사용하자!

제네레이터 생성 
```
(x for x in iter)
```

In [14]:
genenator = (ord(symbol) for symbol in symbols)
list(genenator)

[36, 162, 163, 165, 8364, 164]

튜플은 unnamed 레코드로써도 동작한다. -> 항상 넣은 순서를 지킨다.

초과항목을 위한 * 사용

In [16]:
a, b, *rest = range(5)
a, b, rest

(0, 1, [2, 3, 4])

리스트 슬라이싱
- [] 대괄호 구문안에 :, 기호는 Slice 객체로 표현된다
- ellipsis (...) 을 사용하면 numpy같은 라이브러리에서 ,로 구분되고 남은 객체 전부를 뜻한다

시퀀스 복합할당
- 시퀀스에 +, * 를 사용할 수 있는데 이 때, 항상 새로운 객체가 생성되고 피연산자인 시퀀스를 변경하지 않는다.
- 그런데 +=, *= 은 조금 다르게 작동한다.
- +=, *= 과 같은 증감연산자는 `__iadd__()`, `__imul__()` 를 호출하는데 이는 in-place 방식이라서 객체자체를 바꾼다.
- 즉 해당 객체가 `__iadd__()`, `__imul__()`를 오버라이딩 했는지에 따라 작동 방식이 다르다.

In [17]:
t = (1, 2, [30, 40])
t[2] += [50, 60]

TypeError: 'tuple' object does not support item assignment

In [18]:
t

(1, 2, [30, 40, 50, 60])

In [20]:
import dis
dis.dis('s[a] += b')

  1           0 LOAD_NAME                0 (s)
              2 LOAD_NAME                1 (a)
              4 DUP_TOP_TWO
              6 BINARY_SUBSCR
              8 LOAD_NAME                2 (b)
             10 INPLACE_ADD
             12 ROT_THREE
             14 STORE_SUBSCR
             16 LOAD_CONST               0 (None)
             18 RETURN_VALUE


- `list.sort()` : 해당 객체를 바꾸고 None 반환
- `sorted()` : 새로운 객체를 만들어서 반환

bisect 내장 라이브러리를 이용해 정렬된 시퀀스에서 탐색을 빨리 할 수 있다.

- array는 C언어 배열만큼 빠르다.
- 자료형을 지정하고 크기만큼 배열을 만드는 것이 C언어 배열과 매우 유사하다.
- python array 역시 C언어 배열처럼 자료형이 다르면 저장할 수 없다.
- fromfile, tofile 과 같은 저장 매소드도 지원한다.

In [22]:
from array import array
from random import random

In [23]:
floats = array('d', (random() for _ in range(10**7)))
floats[-1]

0.5003376102974365

In [24]:
fp = open('floats.bin', 'wb')
floats.tofile(fp)
fp.close()

In [25]:
floats2 = array('d')
fp = open('floats.bin', 'rb')
floats2.fromfile(fp, 10**7)
fp.close()
floats2[-1]

0.5003376102974365

In [26]:
floats == floats2

True

메모리뷰
- byte를 복사하지 않고 배열의 슬라이스를 다룰 수 있게 해준다.
- 구조체를 복사하지 않고 메모리를 공유할 수 있다

In [27]:
numbers = array('h', [-2, -1, 0, 1, 2])
memv = memoryview(numbers)
len(memv)

5

In [28]:
memv[0]

-2

In [29]:
memv_oct = memv.cast('B')
memv_oct.tolist()

[254, 255, 255, 255, 0, 0, 1, 0, 2, 0]

In [30]:
memv_oct[5] = 4
numbers

array('h', [-2, -1, 1024, 1, 2])

In [31]:
memv_oct.tolist()

[254, 255, 255, 255, 0, 4, 1, 0, 2, 0]

deque 이용하기

In [32]:
from collections import deque

In [36]:
dq = deque(range(10), maxlen=10)
dq

deque([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [37]:
dq.rotate(3)
dq

deque([7, 8, 9, 0, 1, 2, 3, 4, 5, 6])

In [38]:
dq.rotate(-4)
dq

deque([1, 2, 3, 4, 5, 6, 7, 8, 9, 0])

In [39]:
dq.appendleft(-1)
dq

deque([-1, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [40]:
dq.extend([11, 22, 33])
dq

deque([3, 4, 5, 6, 7, 8, 9, 11, 22, 33])

In [41]:
dq.extendleft([10, 20, 30, 40])
dq

deque([40, 30, 20, 10, 3, 4, 5, 6, 7, 8])

In [42]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!
