- 배열은 모든 기능을 갖춘 float 객체 대신 C언어의 배열과 마찬가지로 기계가 사용하는 형태로 표현된 바이트 값만 저장하기 때문에 더 빠르다
- 리스트 안에 숫자만 들어 있다면 배열이 리스트보다 훨씬 더 효율적이다
- 파이썬 배열은 C배열만큼 가볍다. 배열을 생성할 때는 배열에 저장되는 각 항목의 C기반 형을 결정하는 문자인 타입코드(typecode)를 지정한다
- 정렬된 배열을 유지하면서 항목을 추가하려면 bisect.insort() 함수를 시용하면된다
- 한편 리스트의 양쪽 끝에 항목을 계속 추가하거나 삭제하면서 FIFO나 LIFO 데이터 구조를 구현할 때는 deque이 더 빠르다

주요함수
- pop()
- insert()
- extend()

array 특정 함수
- frombytes()
- tofile()

In [1]:
from array import array
from random import random

In [12]:
floats = array('d', (random() for i in range(10**7))) #천만개의 무작위 실수를 가진 배열 생성, 타입코드 d는 실수
floats[-1] #마지막 숫자

0.6569490794286043

In [16]:
# array.tofile과 fromfile은 무척 빠르다
# tofile은 각 행마다 실수 하나씩 텍스트 파일에 저장하는 것보다 약 7배 빠르다
# 참고로 pickle.dump() 메서드도 tofile 만큼 무착 빠르다
fp = open('floats.bin', 'wb')
floats.tofile(fp)
fp.close()

In [7]:
# float() 내장함수를 이용해서 로딩하는 것보다 거의 60배 빠르다
floats2 = array('d')
fp = open('floats.bin', 'rb')
floats2.fromfile(fp, 10**7)
fp.close()

In [8]:
floats2[-1]

0.41350918544727355

In [9]:
floats2 == floats

True

# 메모리 뷰

- 데이터 구조체를 복사하지 않고 메모리를 공유할 수 있게 해준다
- 데이터셋이 커지는 경우 아주 중요한 기법이다

In [17]:
import array

In [24]:
numbers = array.array('h', [-2, -1, 0, 1, 2]) # 타입코드 h는 짧은 정수
memv = memoryview(numbers)
len(memv)

5

In [27]:
memv[0] # 메모리를 공유하기 때문에 numbers와 같다

-2

In [28]:
memv == numbers

True

In [23]:
# memoryview.cast() 메서드는 바이트를 이동시키지 않고 C 언어의 형변환 연산자처럼 여러 바이트로 된 데이터를 읽거나 쓰는 방식으로 바꿀 수 있게 해준다
memv_oct = memv.cast('B') # 타입코드 B는 unsigned char
memv_oct.tolist()

[254, 255, 255, 255, 0, 4, 1, 0, 2, 0]

In [22]:
memv_oct[5] = 4
numbers

array('h', [-2, -1, 1024, 1, 2])