### Numpy
- 복잡한 빅데이터의 수학적/과학적 계산을 위해 만들어진 라이브러리
- 반복문 없이, 전체 데이터 배열 연산이 가능한 수학 함수를 제공
- 배열: 동일한 자료형의 원소들이 연속적인 형태로 구성된 자료구조

In [6]:
import numpy as np # numpy 라이브러리를 불러오고, 앞으로 np라고 부르겠다

In [12]:
# array(): 배열을 만들어주는 함수
# -> 리스트나 튜플을 배열로 변환
# -> 그리고 반환값을 arr 변수에 저장
arr = np.array([4, 3, 2, 1]) # np에서 array 함수 사용

arr

array([4, 3, 2, 1])

In [20]:
list1 = [1, 2, 3, 4]

# 자료형 변경도 가능, list -> float
arr = np.array(list1, dtype = np.float32)

arr

array([1., 2., 3., 4.], dtype=float32)

In [22]:
type(arr)

numpy.ndarray

In [24]:
list1 = [1, 2, 3, 4]

# 자료형 변경도 가능, list -> float
arr = np.array(list1)

arr

array([1, 2, 3, 4])

In [32]:
arr + [1, 1, 1, 1]

array([2, 3, 4, 5])

In [34]:
arr + [1, 2, 3, 4]

array([2, 4, 6, 8])

In [36]:
arr + 1

array([2, 3, 4, 5])

In [38]:
arr - 1

array([0, 1, 2, 3])

In [44]:
arr * 3

array([ 3,  6,  9, 12])

In [42]:
arr / 3

array([0.33333333, 0.66666667, 1.        , 1.33333333])

#### 배열끼리의 사칙연산

In [51]:
arr1 = np.array([1, 2, 3])
arr2 = np.array([4, 5, 6])
arr3 = np.array([7, 8, 9, 10])

In [53]:
arr1 + arr2

array([5, 7, 9])

In [55]:
arr1 + arr3

ValueError: operands could not be broadcast together with shapes (3,) (4,) 

In [59]:
print(arr2 + arr1)
print(arr2 - arr1)
print(arr2 * arr1)
print(arr2 / arr1)
print(arr2 // arr1)
print(arr2 % arr1)

[5 7 9]
[3 3 3]
[ 4 10 18]
[4.  2.5 2. ]
[4 2 2]
[0 1 0]


In [69]:
# 업캐스팅
# 정수와 실수를 같이 넣었을 때 더 상위 표현 방식 으로 표현
# 배열은 모두 동일한 자료형이어야 하기 때문에
arr_f = np.array([4, 2.5, 2])

arr_f

array([4. , 2.5, 2. ])

In [75]:
# 문자형 자료가 담겨있는 배열
# 문자형 배열은 수학적 계산이 불가능하기 때문에 잘 사용하지 않음
arr_str = np.array(['a', 'b', 'c', 'de'])
arr_str

array(['a', 'b', 'c', 'de'], dtype='<U2')

In [83]:
arr_str2 = np.array(['a', 'b', 3, 4])
arr_str2

array(['a', 'b', '3', '4'], dtype='<U21')

### 2차원 배열

In [94]:
arr2 = np.array([[1, 2, 3], [4, 5, 6]])

arr2

array([[1, 2, 3],
       [4, 5, 6]])

In [96]:
# ndim: 배열의 차원을 확인해주는 함수
arr2.ndim

2

In [100]:
# shape: 배열의 형태를 확인해주는 함수(행, 열)
arr2.shape

(2, 3)

In [104]:
# size: 배열의 가장 작은 단위 요소 개수
# shape으로 구한 행 * 열 = size
arr2.size

6

In [106]:
# dtype: 배열 내의 데이터들의 자료형을 구하는 함수
arr2.dtype

dtype('int64')

![image.png](attachment:dfdb5c71-296e-47e2-8e84-9a6cd24a0f74.png)

In [135]:
# 3차원 배열
arr3 = np.array([[[1, 2, 3], [4, 5, 6]], [[7, 8, 9], [10, 11, 12]]])

arr3

array([[[ 1,  2,  3],
        [ 4,  5,  6]],

       [[ 7,  8,  9],
        [10, 11, 12]]])

In [139]:
# 차원, 형태, 전체요소수, 데이터 타입
print('차원', arr3.ndim)
print('형태', arr3.shape) # 큰 묶음 부터 작은 묶음 순으로 출력
print('전체요소수', arr3.size)
print('데이터타입', arr3.dtype)

차원 3
형태 (2, 2, 3)
전체요소수 12
데이터타입 int64


### 편리한 배열 생성 함수

In [151]:
# 0으로 배열 생성
# zeros((형태))
arr_0 = np.zeros((3, 2))

arr_0

array([[0., 0.],
       [0., 0.],
       [0., 0.]])

In [153]:
arr_0.dtype

dtype('float64')

In [161]:
# 1로 배열 생성
# ones((형태))
arr_1 = np.ones((2, 4, 3), dtype = np.int32)

arr_1

array([[[1, 1, 1],
        [1, 1, 1],
        [1, 1, 1],
        [1, 1, 1]],

       [[1, 1, 1],
        [1, 1, 1],
        [1, 1, 1],
        [1, 1, 1]]], dtype=int32)

In [173]:
# 특정 값으로 배열 생성
# full
# np.full((형태), 값)
arr_f = np.full((2, 3, 2), 4)

arr_f

array([[[4, 4],
        [4, 4],
        [4, 4]],

       [[4, 4],
        [4, 4],
        [4, 4]]])

In [185]:
# np.arange(): range() 시퀀스로 배열을 생성해주는 함수
# 사용법은 range() 함수와 유사
# np.arange(시작할 값, 끝 값, 증감량)

arr_a = np.arange(1, 13, 1)
print(arr_a)

arr_a = np.arange(1, 13, 3)
print(arr_a)

arr_a = np.arange(0, 13, 1)
print(arr_a)

arr_a = np.arange(13)
print(arr_a)

[ 1  2  3  4  5  6  7  8  9 10 11 12]
[ 1  4  7 10]
[ 0  1  2  3  4  5  6  7  8  9 10 11 12]
[ 0  1  2  3  4  5  6  7  8  9 10 11 12]


In [189]:
# reshape: 배열의 형태(shape)를 재구성하는 함수
# 배열의 전체 요소 수와 형태의 수가 일치해야 가능
arr_a = np.arange(12)
arr_a.reshape(3, 4)

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])

### array의 데이터에 접근 방법
- array는 list와 마찬가지로 인덱싱, 슬라이싱 가능

In [194]:
arr1 = np.array([[1, 2 ,3], [4, 5, 6]])

arr1

array([[1, 2, 3],
       [4, 5, 6]])

In [196]:
arr1[0]

array([1, 2, 3])

In [198]:
# 2 인덱싱
arr1[0][1]

2

In [200]:
# 5 인덱싱
arr1[1][1]

5

In [204]:
# 인덱싱하여 값 변경
arr1 = np.array([[1, 2 ,3], [4, 5, 6]])
print('변경 전: \n', arr1)

# 값 변경
arr1[0] = [11, 22, 33]

print('변경 후: \n', arr1)

변경 전: 
 [[1 2 3]
 [4 5 6]]
변경 후: 
 [[11 22 33]
 [ 4  5  6]]


In [208]:
list1 = [[1, 2 ,3], [4, 5, 6]]
print(list1)

# 값 변경
list1[0] = 11

print(list1)

[[1, 2, 3], [4, 5, 6]]
[11, [4, 5, 6]]


### 슬라이싱

In [215]:
arr2 = np.arange(9).reshape(3, 3)
arr2

array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])

In [217]:
arr2[:2]

array([[0, 1, 2],
       [3, 4, 5]])

In [221]:
print('인덱싱: ', arr2[0])
print('슬라이싱: ', arr2[:1])

인덱싱:  [0 1 2]
슬라이싱:  [[0 1 2]]


In [235]:
# [4, 5]를 슬라이싱

print(arr2[1][1:])

[4 5]


In [243]:
# 값 변경
arr2[1][1:] = [47, 65] # 방법1(정석)
arr2[1][1:] = [47] # 방법2
arr2[1][1:] = 47, 65 # 방법3

arr2

array([[ 0,  1,  2],
       [ 3, 47, 65],
       [ 6,  7,  8]])

### 2차원 배열에서의 데이터 접근

In [250]:
# 2차원 배열
arr3 = np.arange(50).reshape(5, 10)

arr3

array([[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14, 15, 16, 17, 18, 19],
       [20, 21, 22, 23, 24, 25, 26, 27, 28, 29],
       [30, 31, 32, 33, 34, 35, 36, 37, 38, 39],
       [40, 41, 42, 43, 44, 45, 46, 47, 48, 49]])

In [256]:
# 2차원 배열의 일부 한번에 가져오기
# arr[행의 범위, 열의 범위]
# ,로 행의 범위와 열의 범위 구분

arr3[:2, :6]

array([[ 0,  1,  2,  3,  4,  5],
       [10, 11, 12, 13, 14, 15]])

In [260]:
arr3[:, :1]

array([[ 0],
       [10],
       [20],
       [30],
       [40]])

In [268]:
arr3[[0, 2, 4], :1]
arr3[0:5:2, :1] # 이렇게 생략 가능 arr3[::2, :1]

array([[ 0],
       [20],
       [40]])