# 내장 시퀀스 개요

**자료형**
1. 컨테이너 시퀀스 : 서로 다른 자료형의 항목들을 담을 수 있음. list, tuple, collections, deque
- 객체에 대한 참조를 담고 있음

2. 균일 시퀀스 : 단 하나의 자료형만 담을 수 있음. str, bytes, bytearray, memoryview, array.array
- 객체에 대한 참조 대신 자신의 메모리 공간에 각 항목의 값을 직점 담음
- 균일 시퀀스가 메모리를 더 작게 사용

**가변성**
1. 가변 시퀀스 : list, byearray, array.array, collections.deque, memoryview
2. 불변 시퀀스 : tuple, str, bytes

# 지능형 리스트와 제너레이터 표현식

1. 지능형 리스트 : 리스트형의 경우
- 지능형 리스트는 더 이상 메모리를 누수하지 않는다
- 항목을 필터링 및 변환함으로써 시퀀스나 기타 반복 가능한 자료형으로부터 리스트를 만듦
2. 제너레이터 표현식 : 그 외 시퀀스

In [1]:
asci = [ord(s) for s in symbols if ord(s) > 127]

asci = list(filter(lambda c: c>127, map(ord, symbols)))

NameError: name 'symbols' is not defined

In [2]:
colors = ['black', 'white']
sizes = ['S', 'M', 'L']


In [3]:
# color 다음에 size를 배치해서 만든 튜플 리스트
tshirts = [(color, size) for color in colors for size in sizes]
tshirts

[('black', 'S'),
 ('black', 'M'),
 ('black', 'L'),
 ('white', 'S'),
 ('white', 'M'),
 ('white', 'L')]

In [4]:
# color를 반복하는 루프 안에서 sizes를 반복해서 튜플 리스트 출력
for color in colors:
    for size in sizes:
        print((color, size))

('black', 'S')
('black', 'M')
('black', 'L')
('white', 'S')
('white', 'M')
('white', 'L')


In [5]:
# 먼저 size를 반복하고 그 안에 color로 반복하려면 for 순서만 바꾸면 됨
# 지능형 리스트 안에서 줄을 바꾸면 생성될 리스트가 어떻게 정렬될지 알아보기 더 쉬움
tshirts = [(color, size) for size in sizes for color in colors]
tshirts

[('black', 'S'),
 ('white', 'S'),
 ('black', 'M'),
 ('white', 'M'),
 ('black', 'L'),
 ('white', 'L')]

튜플, 배열 등의 시퀀스형을 초기화하려면 지능형 리스트를 사용할 수 있지만 다른 생성자에 전달할 리스트를 통째로 만들지 않고 반복자 프로토콜(iterator protocol)을 이용해서 항목 하나씩 생성하는 제너레이터 표현식은 메모리를 더 적게 사용

In [6]:
colors = ['black', 'white']
sizes = ['S', 'M', 'L']

In [7]:
for tshirt in ('%s %s'% (c, s) for c in colors for s in sizes):
    print(tshirt)

black S
black M
black L
white S
white M
white L


# 튜플은 단순한 불편 리스트가 아니다

- 튜플은 레코드를 담고 있음
- 튜플의 각 항목은 레코드의 필드 하나를 의미, 항목의 위치가 의미를 결정
- 튜플 -> 불변 리스트 : 튜플은 경우에 따라 항목의 크기와 순서가 중요할 수도 있고 그렇지 않을 수도 있음
- 튜플 -> 필드의 집합 : 항목수가 고정, 순서가 중요

In [8]:
# 레코드로 사용된 튜플
lax_coordinates = (33.9425, -118.408056)
city, year, pop, chg, area = ('Tokyo', 2003, 32450, 0.66, 8014)
traveler_ids = [('USA', '31195855'), ('BRA', 'CE342567'), ('ESP', 'XDA205856')]
for passport in sorted(traveler_ids): # 튜플을 정렬하면 정보 파괴됨
    print('%s/%s' %passport)

BRA/CE342567
ESP/XDA205856
USA/31195855


In [9]:
for country, _ in traveler_ids: # 언패킹. _ : 더미변수
    print(country)

USA
BRA
ESP


In [10]:
a, b, *rest = range(5)
a, b, rest

(0, 1, [2, 3, 4])

In [11]:
a, b, *rest = range(2)
a, b, rest

(0, 1, [])

In [12]:
*head, b, c, d = range(7)
head, b, c, d

([0, 1, 2, 3], 4, 5, 6)

collections.namedtupe() : 필드명과 클래스명을 추가한 튜플의 서브클래스 생성하는 팩토리 함수

In [14]:
from collections import namedtuple
City = namedtuple('City', 'name country population coordinates')
tokyo = City('Tokyo', 'JP', 36.933, (35.689722, 139.691667))
tokyo

City(name='Tokyo', country='JP', population=36.933, coordinates=(35.689722, 139.691667))

In [15]:
tokyo.population

36.933

In [16]:
tokyo.coordinates

(35.689722, 139.691667)

In [17]:
City._fields # 필드명을 담고 있는 튜플

('name', 'country', 'population', 'coordinates')

In [18]:
LatLong = namedtuple('LatLong', 'lat long')

In [19]:
delhi_data = ('Delhi NCR', 'IN', 21.935, LatLong(28.6, 77.2))

In [20]:
delhi = City._make(delhi_data) # 반복형 객체로부터 명명된 튜플을 만듦. 

In [21]:
delhi._asdict() # collections.OrderedDict 객체 반환

{'name': 'Delhi NCR',
 'country': 'IN',
 'population': 21.935,
 'coordinates': LatLong(lat=28.6, long=77.2)}

In [22]:
for k, v in delhi._asdict().items():
    print(k + ":" , v)

name: Delhi NCR
country: IN
population: 21.935
coordinates: LatLong(lat=28.6, long=77.2)


# 슬라이싱

슬라이스와 범위 지정시에 마지막 항목이 포함되지 않는 이유
- range(3)나 my_list[:3]처럼 중단점만 이용해서 슬라이스나 범위 지정할 때 길이 계산이 쉬움
- 시작점이나 중단점을 모두 지정할 때도 길이 계산을 하기 쉬움
- x 인덱스를 기준으로 겹침 없이 시퀀스를 분할하기 쉬움.
ex. my_list[:x], my_list[x:]

In [23]:
s = 'bicycle'
s[::3]

'bye'

In [24]:
s[::-1]

'elcycib'

In [25]:
s[::-2]

'eccb'

# 시퀀스의 복합 할당

In [30]:
t = (1, 2, [30, 40])
t[2] += [50, 60]

TypeError: 'tuple' object does not support item assignment

In [31]:
t

(1, 2, [30, 40, 50, 60])

In [32]:
import dis

dis.dis('s[a] += b')

  1           0 LOAD_NAME                0 (s)
              2 LOAD_NAME                1 (a)
              4 DUP_TOP_TWO
              6 BINARY_SUBSCR
              8 LOAD_NAME                2 (b)
             10 INPLACE_ADD
             12 ROT_THREE
             14 STORE_SUBSCR
             16 LOAD_CONST               0 (None)
             18 RETURN_VALUE


# list.sort()와 sorted()

1. list.sort() : 사본을 만들지 않고 리스트 내부를 변경하여 정렬
- 타킷 객체를 변경하고 새로운 리스트를 생성하지 않았음을 알려주기 위해 None을 반환
2. sorted() : 새로운 리스트를 생성해서 반환
- 불변 시퀀스및 제너레이터를 포함해서 반복 가능한 모든 개체를 인수 받음.
- 입력받은 반복 가능한 객체의 자료형과 무관하게 sorted() 함수는 언제나 새로 생성한 리스트를 반환

# 정렬된 시퀀스를 bisect로 관리하기

1. bisect() : 이진 검색 알고리즘을 이용해 시퀀스를 검색

2. insort() : 정렬된 시퀀스 안에 항목을 삽입

# 리스트가 답이 아닐때

In [34]:
from array import array
from random import random

floats = array('d', (random() for i in range(10**7)))
floats[-1]

0.11040173012554433

In [35]:
fp = open('falots.bin', 'wb')
floats.tofile(fp)
fp.close()

In [37]:
floats2 = array('d')
fp = open('falots.bin', 'rb')
floats2.fromfile(fp, 10**7)
fp.close()

In [38]:
floats2[-1]

0.11040173012554433

In [39]:
floats2 == floats

True