# 2.데이터구조체(시퀀스)
## 2.1. 내장시퀀스 개요
### 2.1.1. 자료형에 따른 분류
> 컨테이너 시퀀스
- 서로 다른 자료형의 항목들을 담을 수 있음
- 객체에 대한 참조를 담고 있으며
- 객체는 어떠한 자료형도 될 수 있음.
- list, tuple, collections, deque 형

> 균일 시퀀스
- 단 하나의 자료형만 담을 수 있음.
- 객체에 대한 참조 대신 자신의 메로미 공간에 각 항목의 값을 직접 담는다
- 메모리를 더 적게 사용하지만 문자, 바이트, 숫자 등 기본적인 자료형만 저장가능
- str, bytes, bytearray, memoryview, array.array형

### 2.1.2. 가변성에 따른 분류
> 가변 시퀀스
- list, bytearray, array.array, collections.deque, memoryview형

> 블편 시퀀스
- tuple, str, bytes형

> 가변시퀀스 / 불변 시퀀스
- collections.abc(abstract base class)를 이용하면 실제 시퀀스형에서 어느 기능을 제공할지 예측하는데 도움이 됨.
- https://docs.python.org/ko/3.9/library/collections.abc.html

>> mutableSequence
- __setitem__
- __delitem__
- insert
- append
- reverse
- extend
- pop
- remove
- __iadd__

> list
- 가변적, 혼합된 자료형

## 2.2. 지능형리스트와 제너레이터 표현식
- 지능형리스트와 제너레이터 표현식을 사용하면 시퀀스를 간단히 생성할 수 있다.

### 2.2.1. 지능형리스트(listcomp)

> for roop
- 시퀀스를 읽어서 개수를 세거나 어떤 항목을 골라내거 함계를 구하는 등
- 다양한 일에 사용 가능

> 지능형 리스트
- 오직 새로운 리스트만 만듦.
- 생성된 리스트를 사용하지 않는다면 지능형 리스트를 사용하지 말것
- 지능형 리스트 구문이 두줄 이상 넘어가는 경에는 코드를 분할하거나 for문 사용할 것
- 지능력리스트는 더 이상 메모리를 누수하지 않는다.

In [2]:
symbols = '$%^&*'
codes  = []
for symbol in symbols:
    codes.append(ord(symbol))
    
print(codes)

[36, 37, 94, 38, 42]


In [3]:
codes = [ord(symbol) for symbol in symbols]
print(codes)

[36, 37, 94, 38, 42]


> 지능형 리스트, 제너레이터 표현식, 지능형 집합, 지능형 딕셔너리
- 함수처럼 고유한 지역 범위를 가진다
- 표현식 안에 할당된 변수는 지역변수지만, 주변 범위의 변수를 여전히 참조할 수 있다.
- 게다가 지역 변수가 주변 범위의 변수를 가리지 않는다.

In [4]:
x = 'ABC'
dummy = [ord(x) for x in x]
print(x)
print(dummy)

ABC
[65, 66, 67]


> 지능형 리스트
- 항목을 필터닝 및 변환함으로써 시퀀스나 반복가능한 자료형으로부터 리스트를 만듦.
- filter(), map()을 사용해 동일한 기능을 할 수 있지만 가독성이 떨어짐

### 2.2.2. 지능형 리스트와 map(), filter()비교

In [8]:
symbols = '$%^&*'
beyond_ascii = [ord(s) for s in symbols if ord(s) > 50]
print(beyond_ascii)

[94]


In [11]:
beyond_ascii = list(filter(lambda c: c>50, map(ord, symbols)))
print(beyond_ascii)

[94]


### 2.2.3. 데카르트 곱
> 데카르트 곱
- 두 개 이상의 리스트에 있는 모든 항목을 이용해서 만튼 튜플로 구성된 리스트
- 데카르트 곱 안에 들어있는 각 항복은 입력으로부터 받은 반복 가능한 데이터의 각 요소에서 만들어진 튜플

> 지능형 리트트
- 두 개 이상의 반복 가능한 자료형의 데카르트 곱을 나타내는 일련의 리스트를 만들 수 있음.


In [13]:
# 세 개의 카드 순위시쿼스(R)과 네 개의 카드 종류(S)로 만든 12개의 항목을 가진 데카르트 곱

R = ['A', 'K', 'Q']
S = ['spade', 'heart', 'diamond', 'cloba']

result = [(r, s) for r in R for s in S]
print(result)

[('A', 'spade'), ('A', 'heart'), ('A', 'diamond'), ('A', 'cloba'), ('K', 'spade'), ('K', 'heart'), ('K', 'diamond'), ('K', 'cloba'), ('Q', 'spade'), ('Q', 'heart'), ('Q', 'diamond'), ('Q', 'cloba')]


### 2.2.4. 제너레이터표현식(genexp)

> 제너레이터 표현식
- 다른 생성자에 전달할 리스트를 통째로 만들지 않고 반복자 프로토콜을 이용해서
- 항목을 하나씩 생성
- 메모리를 더 적게 사용
- ()사용
- 한번에 한 항목을 생성할 수 있도록 for 루프에 데이터를 전달


In [15]:
symbols = '$%^&*'

tuple(ord(symbol) for symbol in symbols)

(36, 37, 94, 38, 42)

In [17]:
import array
array.array('I',    # 배열에 들어갈 숫자들을 저장할 자료형을 지정
            (ord(symbol) for symbol in symbols))

array('I', [36, 37, 94, 38, 42])

In [19]:
# 제너레이터 표현식에서의 데카르트곱
# 제너레이터는 한번에 하나의 항목을 생성함. 6개의 항목을 모두 담는 LIST는 만들지 않음
colors = ['black', 'white']
sizes = ['S', 'M', 'L']

for tshirt in ('%s %s' %(c,s) for c in colors for s in sizes):
    print(tshirt)

black S
black M
black L
white S
white M
white L


## 2.3. 튜플은 단순한 불변 리스트가 아니다
### 2.3.1. 레코드로서의 튜플
- 튜플은 레고드를 담고 있음.
- 튜플의 각 항목은 레코드의 필더 하나를 의미하며
- 항목의 위치가 의미를 결정함..
- 튜플을필드의 집합으로 사용하는 경우에는 항목 수가 고정되어있고, 항목의 순서가 중요함
- 튜플의 항목의 위치가 항목의 의미를 나타내므로 정렬하면 정보가 파괴된다

In [21]:
# LA 국제공항의 위도, 경도
lax_coordinates= (33.9425 -118.408056)

# 도표데이터(지명, 년도, 백만단위 인구수, 인구변화율, 제곱킬로미터 단위면적)
city, year, pop, chg, area = ('Tokyo', 2003, 32450, 0.66, 8014)

# (국가코드, 여권번호)
traveler_ids = [('USA', '31195855'), ('BRA', 'CE342567'),
               ('ESP', 'XDA205856')]

# 튜플의 각 항목을 하나의 필드로 처리
for passport in sorted(traveler_ids):
    print('%s/%s'%passport)


BRA/CE342567
ESP/XDA205856
USA/31195855


In [23]:
# 언패킹, 더미변수를 나타내는 언더바
for country, _ in traveler_ids:
    print(country)

USA
BRA
ESP


### 2.3.2. 튜플 언패킹

> 병렬 할당(parallel assignment)
- 반복형 데이터를 변수로 구성된 튜플에 할당하는 것.

In [28]:
lax_coordinates= (33.9425, -118.408056)
latitude, longitude = lax_coordinates
print(latitude)
print(longitude)

33.9425
-118.408056


> 두 변수값 교환하기
- 임시 변수를 두지 않고도 두 변수의 값을 서로 교환할 수 있음.

In [29]:
a,b = b, a

NameError: name 'b' is not defined

> *을 이용한 언패킹
- 인수 앞에 *을 붙이기

In [30]:
divmod(20,8)

(2, 4)

In [31]:
t = (20,8)
divmod(*t)

(2, 4)

In [32]:
quotient, remainder = divmod(*t)
print(quotient, remainder)

2 4


> 함수에서 호출자에 여러값을 간단히 반환하기

In [33]:
import os

_, filename = os.path.split('./home/luciano/.ssh/idrsa.pub')
print(filename)

idrsa.pub


> 언더바(_)
- 더미변수: 더미변수를 플레이스홀더로 사용해서 관심없는 부분은 언패킹할 때 무시할 수 있다.
- gettext.gettext()함수에 대한 별명

In [35]:
import gettext
gettext.bindtextdomain('myapplication', '/path/to/my/language/directory')
gettext.textdomain('myapplication')
_ = gettext.gettext
# ...
print(_('This is a translatable string.'))

This is a translatable string.
