# 배열을 파일에 저장 및 불러오기
- ## 바이너리 파일로 저장/불러오기
    - ### np.save("파일경로", 배열)
        - 배열을 raw 바이너리 형식으로 저장한다. (압축하지 않은)
        - 파일명에 확장자로 npy를 붙인다. (무조건 붙인다. abc.xxx 해도 abc.xxx.npy 로 저장)
    - ### np.load("파일경로") 
        - 파일에 저장된 배열을 불러온다.
    - ### np.savez("파일경로", 이름=배열, 이름=배열, ...)
        - 여러개의 배열을 저장할 때 사용
        - 파일명에 확장자로 npz가 붙는다.
        - 내부적으로 압축해서 저장한다.
        - load() 함수로 불러오면 저장된 배열목록이 반환 된다. 저장시 지정한 이름을 이용해 조회 
- ## 텍스트 파일로 저장하고 불러오기
    - ### savetxt("파일경로", 배열 [, delimiter='공백') 
        - 텍스트 형태로 저장.
        - 각 원소는 공백을 기준으로 나뉘며 delimiter 속성으로 구분자를 지정할 수 있다. (delimiter생략시 공백)
        - 1차원과 2차원 배열만 저장 가능하다. (3차원 이상은 저장이 안된다.)
    - ### loadtxt("파일경로" [,dtype=float, delimiter=공백)

In [1]:
import numpy as np

In [4]:
a = np.array([1,10,5,7,20])
b = np.ones(shape=(3,3,5))
c = np.random.normal(10,2,size=(5,10))   # 평균 : 10, 표준편차:2
print(a.shape, b.shape, c.shape)

(5,) (3, 3, 5) (5, 10)


In [11]:
c

array([[ 7.61185127, 10.0642662 , 11.28001062,  8.33844386,  9.56025497,
        10.34070581,  9.09392283, 12.98536886, 12.81863085, 10.51903186],
       [ 8.43658213, 11.43024903,  8.57312566, 12.6071267 , 13.08450078,
        11.34143053,  9.38629616, 10.31576534,  9.41279917,  7.68328324],
       [10.32668694,  8.46803089,  9.26552386, 11.88532883, 12.85255127,
         6.36246886, 10.60043188, 11.82781679, 10.27909383, 11.78360479],
       [11.43607485,  8.70034532,  8.52177356, 10.81329996,  8.92981357,
         9.2335611 , 11.02476366, 11.95950238,  9.68575409, 11.86901105],
       [12.32090894, 12.92945188, 10.85492813,  2.9025937 , 12.36721068,
        10.41266751,  7.81966227,  7.16673397, 10.40777608,  8.37999998]])

In [12]:
# binary 파일에 배열을 저장
# 한 파일에 하나의 배열 저장 - save(경로,배열)
# 경로 : 상대경로(현재 working directory 기준 경로), 절대경로(root 디렉토리부터 전체 경로)
np.save('data/array_a',a)  #data/array_a.npy
np.save('data/array_b.npy',b)
np.save('data/array_c',c)  #data/array_c.npy

In [13]:
# 불러오기(load) - load()
a2 = np.load('data/array_a.npy')
b2 = np.load('data/array_b.npy')
c2 = np.load('data/array_c.npy')

In [14]:
a2.shape, b2.shape, c2.shape

((5,), (3, 3, 5), (5, 10))

In [15]:
a2

array([ 1, 10,  5,  7, 20])

In [16]:
b2

array([[[1., 1., 1., 1., 1.],
        [1., 1., 1., 1., 1.],
        [1., 1., 1., 1., 1.]],

       [[1., 1., 1., 1., 1.],
        [1., 1., 1., 1., 1.],
        [1., 1., 1., 1., 1.]],

       [[1., 1., 1., 1., 1.],
        [1., 1., 1., 1., 1.],
        [1., 1., 1., 1., 1.]]])

In [17]:
c2

array([[ 7.61185127, 10.0642662 , 11.28001062,  8.33844386,  9.56025497,
        10.34070581,  9.09392283, 12.98536886, 12.81863085, 10.51903186],
       [ 8.43658213, 11.43024903,  8.57312566, 12.6071267 , 13.08450078,
        11.34143053,  9.38629616, 10.31576534,  9.41279917,  7.68328324],
       [10.32668694,  8.46803089,  9.26552386, 11.88532883, 12.85255127,
         6.36246886, 10.60043188, 11.82781679, 10.27909383, 11.78360479],
       [11.43607485,  8.70034532,  8.52177356, 10.81329996,  8.92981357,
         9.2335611 , 11.02476366, 11.95950238,  9.68575409, 11.86901105],
       [12.32090894, 12.92945188, 10.85492813,  2.9025937 , 12.36721068,
        10.41266751,  7.81966227,  7.16673397, 10.40777608,  8.37999998]])

In [18]:
c.dtype

dtype('float64')

In [26]:
# 한 파일에 여러개 배열 = savez(경로, 이름1=배열, 이름2=배열, ...)
np.savez('data/array',aa=a, bb=b, cc=c)  # data/array.npz

In [27]:
arrays = np.load('data/array.npz')
arrays

<numpy.lib.npyio.NpzFile at 0x1cecf5bd6a0>

In [28]:
# 배열들의 이름들을 조회
arrays.files

['aa', 'bb', 'cc']

In [29]:
# 각 배열을 조회 - index연산자 사용
a3 = arrays['aa']
b3 = arrays['bb']
c3 = arrays['cc']

In [30]:
a3

array([ 1, 10,  5,  7, 20])

In [32]:
b3.shape

(3, 3, 5)

In [34]:
c3.shape

(5, 10)

In [35]:
c3

array([[ 7.61185127, 10.0642662 , 11.28001062,  8.33844386,  9.56025497,
        10.34070581,  9.09392283, 12.98536886, 12.81863085, 10.51903186],
       [ 8.43658213, 11.43024903,  8.57312566, 12.6071267 , 13.08450078,
        11.34143053,  9.38629616, 10.31576534,  9.41279917,  7.68328324],
       [10.32668694,  8.46803089,  9.26552386, 11.88532883, 12.85255127,
         6.36246886, 10.60043188, 11.82781679, 10.27909383, 11.78360479],
       [11.43607485,  8.70034532,  8.52177356, 10.81329996,  8.92981357,
         9.2335611 , 11.02476366, 11.95950238,  9.68575409, 11.86901105],
       [12.32090894, 12.92945188, 10.85492813,  2.9025937 , 12.36721068,
        10.41266751,  7.81966227,  7.16673397, 10.40777608,  8.37999998]])

In [43]:
# text 파일로 저장 => CSV (Comma Separated Value) 1차원, 2차원 배열만 저장 가능
# savetxt(), loadtxt()

In [44]:
np.savetxt('data/a.csv', a)

In [45]:
a4 = np.loadtxt('data/a.csv', dtype=np.int)

Deprecated in NumPy 1.20; for more details and guidance: https://numpy.org/devdocs/release/1.20.0-notes.html#deprecations
  a4 = np.loadtxt('data/a.csv', dtype=np.int)


In [46]:
a4

array([ 1, 10,  5,  7, 20])

In [47]:
print(b.shape)
np.savetxt('data/b.txt',b)  # 3차원 이상 배열은 저장할 수 없다.

(3, 3, 5)


ValueError: Expected 1D or 2D array, got 3D array instead

In [48]:
c.shape

(5, 10)

In [49]:
np.savetxt('data/c.csv', c)

In [50]:
np.savetxt('data/c2.csv', c, delimiter=',')

In [51]:
c4 = np.loadtxt('data/c.csv')
print(c4.shape)
c4

(5, 10)


array([[ 7.61185127, 10.0642662 , 11.28001062,  8.33844386,  9.56025497,
        10.34070581,  9.09392283, 12.98536886, 12.81863085, 10.51903186],
       [ 8.43658213, 11.43024903,  8.57312566, 12.6071267 , 13.08450078,
        11.34143053,  9.38629616, 10.31576534,  9.41279917,  7.68328324],
       [10.32668694,  8.46803089,  9.26552386, 11.88532883, 12.85255127,
         6.36246886, 10.60043188, 11.82781679, 10.27909383, 11.78360479],
       [11.43607485,  8.70034532,  8.52177356, 10.81329996,  8.92981357,
         9.2335611 , 11.02476366, 11.95950238,  9.68575409, 11.86901105],
       [12.32090894, 12.92945188, 10.85492813,  2.9025937 , 12.36721068,
        10.41266751,  7.81966227,  7.16673397, 10.40777608,  8.37999998]])

In [57]:
c5 = np.loadtxt('data/c2.csv', delimiter=',')
c5

array([[ 7.61185127, 10.0642662 , 11.28001062,  8.33844386,  9.56025497,
        10.34070581,  9.09392283, 12.98536886, 12.81863085, 10.51903186],
       [ 8.43658213, 11.43024903,  8.57312566, 12.6071267 , 13.08450078,
        11.34143053,  9.38629616, 10.31576534,  9.41279917,  7.68328324],
       [10.32668694,  8.46803089,  9.26552386, 11.88532883, 12.85255127,
         6.36246886, 10.60043188, 11.82781679, 10.27909383, 11.78360479],
       [11.43607485,  8.70034532,  8.52177356, 10.81329996,  8.92981357,
         9.2335611 , 11.02476366, 11.95950238,  9.68575409, 11.86901105],
       [12.32090894, 12.92945188, 10.85492813,  2.9025937 , 12.36721068,
        10.41266751,  7.81966227,  7.16673397, 10.40777608,  8.37999998]])