In [1]:
from collections import namedtuple
import os
import array
symbols = "ÄÄ123213"

codes = [ord(symbol) for symbol in symbols]

beyond_ascii = [ord(s) for s in symbols if ord(s) > 127]


print(codes)
print(beyond_ascii)

beyond_ascii = list(filter(lambda c: c > 127, map(ord, symbols)))

print(beyond_ascii)

# 데카르트 곱 1차원 곱 -> 2차원
colors = ['black', 'white']
sizes = ['S', 'M', 'L']
tshirts = [(color, size) for color in colors for size in sizes]
print(tshirts)

# 제너레이터 표현식
# 다른 생성자에 전달할 리스트를 통쨰로 만들지 않고 이터레이터 프로토콜을 이용해서 항목을 하나씩 생성하는 제너레이터 표현식은 메모리를 더 적게 사용한다.
# 제너레이터 표현식은 지능현 리스트와 동일한 구문을 사용하지만 대괄호 대신 괄호를 사용한다.
tuple(ord(symbol) for symbol in symbols)
print(array.array('I', (ord(symbol) for symbol in symbols)))

# 2.3
# 튜플은 단순한 불변 리스트가 아니다.
# 튜플은 불변 리스트로 사용할 수도 있지만 필드명이 없는 레코드로 사용할 수도 있다.

lax_coodinates = (33.9425, -118.408056)
# 튜플 언패킹 (iterable unpacking)
city, year, pop, chg, area = ('Tokyo', 2003, 32450, 0.66, 8014)
traveler_ids = [('USA', '31195855'), ('BRA', 'CE342567'), ('ESP', 'XDA205856')]
for passport in sorted(traveler_ids):
    print('%s/%s' % passport)

for country, _ in traveler_ids:
    print(country)

# 병렬할당 (parallel assignment)
lax_coodinates = (33.9425, -118.408056)
latitude, longtitude = lax_coodinates  # 튜플 언패킹
print(latitude)
print(longtitude)

# 값의 교환
a = 'a'
b = 'b'
b, a = a, b
print(a, b)

# *을 이용한 언패킹
print(*(1, 2))

# 파일 시스템경로에서 경로명과 파일명 가져오기
_, filename = os.path.split('/home/aaa/bbb')
print(filename)

# 전통적으로 _는 gettext.gettext()함수의 대한 별명으로 사용된다. 그 외의 경우에는 _를 플레이스홀더로 사용하는 것이 좋다.

# 초과 항목을 잡기 위해 * 사용하기
# js의 spread syntax랑 비슷한거 같음
a, b, *rest = range(5)
print(a, b, rest)

a, *body, c, d = range(5)
print(a, body, c, d)

# 내포된 튜플 언패킹
metro_areas = [
    ('Tokyo', 'JP', 36.933, (35.689722, 139.691667)),
    ('Delhi NCR', 'IN', 21.935, (28.613889, 77.208889)),
    ('Tokyo', 'JP', 20.142, (19.433333, -99.133333)),
    ('Tokyo', 'JP', 20.104, (40.808611, -74.020386)),
    ('Tokyo', 'JP', 19.649, (-23.547778, -46.635833)),  # trailing comma를 지원하는군
]

print('{:15} | {:^9} | {:^9}'.format('', 'lat.', 'long.'))
fmt = '{:15} | {:9.4f} | {:9.4f}'
# 마지막 필드를 튜플에 할당하면서 언패킹 - js의 구조분해할당 비슷함 (destructuring assignment)
for name, cc, pop, (latitude, longitude) in metro_areas:
    if longitude <= 0:
        print(fmt.format(name, latitude, longitude))


# namedtuple
# 튜플은 레코드로 사용하기에 부족한 점이 있다. 때로는 필드에 이름을 붙일 필요가 있다.
# 필드명이 클래스에 저장되브로 namedtuple()로 생성한 객체는 튜플과 동일한 크기의 메모리만 사용한다.
# 속성을 객체마다 존재하는 __dict__에 저장하지 않으므로 일반적인 객체보다 메모리를 적게 사용한다.


City = namedtuple('City', 'name country population coodinates')
tokyo = City('Tokyo', 'JP', 36.933, (35.689722, 139, 691667))
print(tokyo)

print(tokyo.population)

print(tokyo.coodinates)

print(tokyo[1])

# namedtuple은 튜플에서 상속받은 속성 외 몇 가지 속성을 더 가지고 있다.

print(City._fields)

LatLong = namedtuple('LatLong', 'lat long')

delhi_data = ('Delhi NCR', 'IN', 21.935, LatLong(28.613889, 77.208889))

delhi = City._make(delhi_data)

print(delhi._asdict())

# k v 뿌리기
for key, value in delhi._asdict().items():
    print(key + ':', value)

# slicing

l = [10, 20, 30, 40, 50, 60]

# stride s[a:b:c] c 보폭(stride)만큼 항목을 건너뛴다.

s = 'bicycle'
s[::3]

# 다차원 슬라이싱과 생략기호
# ...는 Ellipsis 객체의 별명으로서 하나의 ellipsis클래스의 객체다.
#

# 시퀀스 곱셈 연산자 주의

my_list = [[]] * 3

my_list[1].append(1)
print(my_list)

# 리스트의 리스트 만들기

board = [['_'] * 3 for i in range(3)]
board[1][2] = 'X'
print(board)

# [['_'] * 3] * 3 동일한 리스트에 대한 세 개의 참조를 가진 리스트는 쓸모없다.

weired_board = [['_'] * 3] * 3
print(weired_board)

weired_board[1][2] = '0'
print(weired_board)

fruits = ['grape', 'raspberry', 'apple', 'banana']
fruits
['grape', 'raspberry', 'apple', 'banana']
sorted(fruits)
['apple', 'banana', 'grape', 'raspberry']
sorted(fruits, reverse=True)
['raspberry', 'grape', 'banana', 'apple']
sorted(fruits, key=len)
['grape', 'apple', 'banana', 'raspberry']
fruits
['grape', 'raspberry', 'apple', 'banana']
fruits.sort()
fruits
['apple', 'banana', 'grape', 'raspberry']

# bisect
import bisect
import random

SIZE = 7

random.seed(1729)

my_list = []
for i in range(SIZE):
    new_item = random.randrange(SIZE*2)
    bisect.insort(my_list, new_item)
    print('%2d ->' % new_item, my_list)

# 객체를 직력화 하
#
#

[196, 196, 49, 50, 51, 50, 49, 51]
[196, 196]
[196, 196]
[('black', 'S'), ('black', 'M'), ('black', 'L'), ('white', 'S'), ('white', 'M'), ('white', 'L')]
array('I', [196, 196, 49, 50, 51, 50, 49, 51])
BRA/CE342567
ESP/XDA205856
USA/31195855
USA
BRA
ESP
33.9425
-118.408056
b a
1 2
bbb
0 1 [2, 3, 4]
0 [1, 2] 3 4
                |   lat.    |   long.  
Tokyo           |   19.4333 |  -99.1333
Tokyo           |   40.8086 |  -74.0204
Tokyo           |  -23.5478 |  -46.6358
City(name='Tokyo', country='JP', population=36.933, coodinates=(35.689722, 139, 691667))
36.933
(35.689722, 139, 691667)
JP
('name', 'country', 'population', 'coodinates')
{'name': 'Delhi NCR', 'country': 'IN', 'population': 21.935, 'coodinates': LatLong(lat=28.613889, long=77.208889)}
name: Delhi NCR
country: IN
population: 21.935
coodinates: LatLong(lat=28.613889, long=77.208889)
[[1], [1], [1]]
[['_', '_', '_'], ['_', '_', 'X'], ['_', '_', '_']]
[['_', '_', '_'], ['_', '_', '_'], ['_', '_', '_']]
[['_', '_', '0'], ['_',

### TIP
객체를 직렬화 하는 pickle 모듈도 숫자 데이터를 빠르고 융통성 있게 저장할 수 있다.
pickle.dump() 메서드는 실수 배열을 array.tofile() 메서드만큼 빠르게 저장할 뿐만 아니라 복소수, 내포된 컬렉션(저장하기 까다롭게 구현한 경우가 아니라면) 심지어 사용자 정의 객체 등 거의 모든 내장 자료형을 처리할 수 있다.

## 메모리 뷰
memoryview 내장 클래스는 공유 메모리 시퀀스형으로서 bytes를 복사하지 않고 배열의 슬라이스를 다룰 수 있게 해준다.

메모리 뷰는 본질적으로 파이썬 자체에 들어 있는 NumPy 배열 구조체를 일반화한 것이다. 메모리 뷰는 PIL 이미지, SQLlite 데이터베이스, NumPy 배열 등 데이터 구조체를 복사하지 않고 메모리를 공유할 수 있게 해준다. 데이터셋이 커지는 경우 이것을 아주 중요한 기법이다.

In [3]:
import array
numbers = array.array('h', [-2, -1, 0, 1, 2])
memv = memoryview(numbers)
print(len(memv))

print(memv[0])

memv_oct = memv.cast('B')
print(memv_oct.tolist())
memv_oct[5] = 4
print(numbers)

5
-2
[254, 255, 255, 255, 0, 0, 1, 0, 2, 0]
array('h', [-2, -1, 1024, 1, 2])


## NumPy와 SciPy

NumPy와 SciPy는 표준 라이브러리는 아니지만 고급 배열 및 행렬 연산 덕분에 파이썬이 과한 계산 애플리케이션에서 널리 사용하게 되었다.
SciPy는 Numpy를 기반으로 작성된 라이브러리로서, 선형대수학, 수치해석, 통계학에 나오는 여러 과학 계산 알고리즘을 제공한다.

In [4]:
import numpy
a = numpy.arange(12)

type(a)

a.shape
a.shape = 3, 4
a[2]
a[2, 1]
a[:, 1]
a.transpose()

array([[ 0,  4,  8],
       [ 1,  5,  9],
       [ 2,  6, 10],
       [ 3,  7, 11]])

덱 및 기타 큐
`append()`와 `pop()` 메서드를 사용해서 리스트를 스택이나 큐로 사용할 수 있다. 그러나 리스클르 왼쪽(0번 인덱스)에 삽입하거나 삭제하는 연산은 전체 리스트를 이동시켜야 하므로 처리 부담이 크다.
덱(`collections.deque`) 클래스는 큐의 약쪽 어디에서든 빠르게 삽입 및 삭제할 수 있도록 설계된 tread-safe한 양방향 큐다.

In [14]:
from collections import deque
dq = deque(range(10), maxlen=10)
print(dq)
dq.rotate(3)
print(dq)
dq.appendleft(-1)
print(dq)
dq.extend([11, 22, 33])
print(dq)
# extendleft(iter)는 iter 인수에서 생성되는 항목을 덱의 왼쪽에 하나씩 차례대로 추가한다. 따라서 항목이 역순으로 추가된다.
dq.extendleft([10, 20, 30, 40])
print(dq)

deque([0, 1, 2, 3, 4, 5, 6, 7, 8, 9], maxlen=10)
deque([7, 8, 9, 0, 1, 2, 3, 4, 5, 6], maxlen=10)
deque([-1, 7, 8, 9, 0, 1, 2, 3, 4, 5], maxlen=10)
deque([9, 0, 1, 2, 3, 4, 5, 11, 22, 33], maxlen=10)
deque([40, 30, 20, 10, 9, 0, 1, 2, 3, 4], maxlen=10)


덱은 중간 항목을 삭제하는 연산은 그리 빠르지 않다. 덱이 양쪽 끝에 추가나 제거하는 연산에 최적화 되어있기 떄문이다.

`append()`나 `popleft()` **메서드는 원자성을 갖고 있으므로 멀티스레드 앱에서 락을 사용하지 않고도 덱을 이용해서 간단히 FIFO 큐를 구현할 수 있다.**