In [1]:
import numpy as np 

x = np.array([[1],[2],[3]])

y = np.array([[4],[5],[6]])



array([[32]])

In [2]:
x.T @ y


array([[32]])

# numpy

- numpy는 파이썬으로 진행되는 모든 데이터 분석과 인공지능 학습에 있어 가장 필수적으로 이해해야 하는 도구입니다.

- numpy는 **Numerical Python**의 약자로, 일반적으로 과학계산에서 많이 사용하는 **선형대수의 계산식을 파이썬으로 구현**할 수 있도록 도와주는 라이브러리입니다. 

- numpy는 numpy 자체로도 많이 사용되지만, 이후에 사용되는 SciPy나 Pandas의 base 객체로도 사용되며, numpy에서 사용되는 다양한 코드 표현법을 그대로 pytorch와 tensorflow에 사용하는 경우가 많아 numpy의 활용법은 반드시 알아둘 필요가 있습니다.

---

## 코드로 방정식(행렬, matrix) 표현

![image.png](attachment:image.png)


```
coefficient_matrix = [[2, 2, 1], [2, -1, 2], [1, -1, 2]]
constant_vector = [9,6,5]
```

---

In [7]:
import numpy as np 

In [2]:
test_array = np.array([1, 4, 5, 8], dtype = int) # dtype = int

print(test_array)

type(test_array),type(test_array[0])


[1 4 5 8]


(numpy.ndarray, numpy.int64)

- np.array() 함수를 활용, ndarray 타입 배열 생성
- numpy는 하나의 데이터 type만 배열에 넣을 수 있음.
- list와 가장 큰 차이점, dynamic typing not supported
           

---

## array creation

In [3]:
# String Type의 데이터를 입력해도, Float Type으로 자동 형변환을 실시

test_array = np.array([1, 4, 5, "8"], dtype = float) 

print(test_array)

print(type(test_array[3])) 


[1. 4. 5. 8.]
<class 'numpy.float64'>


In [4]:
print(test_array.dtype) # Array(배열) 전체의 데이터 Type을 반환함 
print(test_array.shape) # Array(배열) 의 shape(dimension)을 반환함 (type : tuple) / vector


float64
(4,)


---

## array shape

- Rank에 따라 불리는 이름이 있음

- shape랑은 다름

![image.png](attachment:image.png)

In [5]:
np.array([10, 10], dtype = int) 

array([10, 10])

In [6]:
np.array([10, 10], dtype = int).shape

(2,)

---

![image.png](attachment:image.png)

---

![image.png](attachment:image.png)

---

## array nbytes

- ndarray object의 메모리 크기 반환


![image.png](attachment:image.png)

---

## reshape

- array의 shape(dimension, 차원) 변경
- element 갯수, 값은 동일

In [7]:
test_matrix = np.array([ [1, 2, 5, "8"],[1, 2, 5, 8] ], dtype = int) 

print(test_matrix, test_matrix.shape)

[[1 2 5 8]
 [1 2 5 8]] (2, 4)


In [8]:
test_vector = test_matrix.reshape(8,)

print(test_vector, test_vector.shape)

[1 2 5 8 1 2 5 8] (8,)


In [9]:
test_matrix.reshape(4,2)

array([[1, 2],
       [5, 8],
       [1, 2],
       [5, 8]])

In [10]:
test_matrix = np.array([ [1, 2, 5, "8"],[1, 2, 5, 8] ], dtype = int) 

test_matrix.reshape(-1,2) # -1 size를 기반으로 row 개수 선정 

array([[1, 2],
       [5, 8],
       [1, 2],
       [5, 8]])

In [11]:
test_matrix = np.array([ [1, 2, 5, "8"],[1, 2, 5, 8] ], dtype = int) 

test_matrix.reshape(2,2,2)

array([[[1, 2],
        [5, 8]],

       [[1, 2],
        [5, 8]]])

---

## flatten

- 다차원 array를 1차원 array(vector) 로 변경

In [12]:
test_matrix = np.array([ [1, 2, 5, "8"],[1, 2, 5, 8] ], dtype = int) 

v = test_matrix.flatten()

In [13]:
test_matrix # 기존꺼 그대로 유지

array([[1, 2, 5, 8],
       [1, 2, 5, 8]])

In [14]:
v # 새로운 변수로 선언해야함

array([1, 2, 5, 8, 1, 2, 5, 8])

In [15]:
test_matrix.shape, v.shape

((2, 4), (8,))

---

## indexing for numpy array

- list 와 달리 2d arr에서 [0,0] 표기 법 가능 [0][0] 
- [row][column]

In [16]:
a = np.array([[1, 2, 3], [4.5, 5, 6]], dtype = int)

print(a)

print(a[0,0]) # Two dimensional array representation #1 
print(a[0][0]) # Two dimensional array representation #2

[[1 2 3]
 [4 5 6]]
1
1


In [17]:
a[0,0] = 12 # Matrix 0,0 에 12 할당 print(a)
a[0][1] = 5 # Matrix 0,1 에 12 할당 print(a)

print(a)


[[12  5  3]
 [ 4  5  6]]


---

## slicing for numpy array
- 행과 열 부분을 나눠서 slicing 가능
- matrix 의 부분 집합을 추출할 때 유용


In [18]:
a = np.array([[1, 2, 3, 4, 5], [6, 7, 8, 9, 10]], int) 
a

array([[ 1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10]])

In [19]:
a[0:2] # 0 Row ~ 1Row

array([[ 1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10]])

In [20]:
a[1:3] # 1 Row ~ 2 Row 중 사용 가능한 것만 나타냄

array([[ 6,  7,  8,  9, 10]])

In [21]:
a[:,2:] # 전체 Row, 2열 이상

array([[ 3,  4,  5],
       [ 8,  9, 10]])

In [22]:
a[1,1:3] # 1 Row, 1열 ~ 2열

array([7, 8])

---

In [8]:
arr = np.array([[1, 2, 3, 4, 5], [6, 7, 8, 9, 10],[11, 12, 13,14, 15]], int) 
arr

array([[ 1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10],
       [11, 12, 13, 14, 15]])

In [9]:
arr[:,::2]

array([[ 1,  3,  5],
       [ 6,  8, 10],
       [11, 13, 15]])

In [10]:
arr[::2,::3]

array([[ 1,  4],
       [11, 14]])

---

## np.arange()

- list의 range() 랑 같음

In [13]:
np.arange(30)

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29])

---

## np.ones(), np.zeros(), and np.empty()

---

## np.ones_like(), np.zeros_like()

- 기존 ndarray의 shape 크기 만큼 1 or 0 array 반환


---

## np.identity()
- 단위 행렬(i행렬) 생성


---

## np.eye()
- 대각선이 1인 행렬, k 값의 시작 idx변경 가능

---

## np.diag()
- 대각 행렬의 값 추출

---

## random sampling
- 데이터 분포에 따른 sampling 으로 array 생성

np.random.uniform

np.random.normal

---

## sum

---

## axis
- 모든 operation function을 실행할 때 기준이 되는 dimension 축

---

## mean & std

- ndarray의 element들 간의 평균 또는 표준 편차를 구함

---

## concatenate

---

## Operations b/t arrays

- numpy늩 array간의 기본적인 사칙 연산을 지원

---

## Element-wise operations

- array간 shape 같을 때 일어나는 연산

---

## Dot product

---

## transpose

---

## broadcasting

- shape 이 다른 array 간 연산을 지원 하는 기능

---

## All & Any

---

## comparison operation

---

## np.where

---

## argmax & argmin

---

## boolean index
- 특정 조건에 따른 값을 배열 형태로 추출

---

## fancy index
- array를 index value로 사용해서 값 추출

---

## loadtxt & savetxt

---