# Numpy

## 배경

- 머신러닝에서 이미지, 영상, 텍스트, 소리 등의 모든 데이터는 실수 형태(수치 데이터)의 배열로 표현한다.
- 예를 들어 이미지는 다음 그림과 같이 수치 데이터로 구성된 2차원 배열, 즉 행렬로 표현된다.


![image.png](attachment:image.png)
- 그림을 자세히 보면 작은 사각형들로 이루어져 있는데, 이 사각형 하나하나를 픽셀이라고 부른다.
- 이 픽셀들이 모여서 전체 이미지를 표현하는 것이다.이러한 전체 정사각형이 총 3개로 이루어져 있는데 각각 행렬로 표현되며 이것이 바로 RGB(red, green, blue 세가지 색을 적절히 섞으면 사람의 눈이 인지하는 대부분의 색을 만듬) 채널을 나타낸다. 
- 분홍색 행렬은 빨강 채널의 강도, 연두색 행렬은 초록 채널의 강도, 파란색 행렬은 파랑 채널의 강도를 나타냄.
- 강도는 0부터 255까지의 값을 가지며, 0은 해당 색의 강도가 가장 약한(없는) 상태를, 255는 강도가 가장 강한 상태를 나타낸다.

- 넘파이는 이러한 수치 데이터의 배열을 구성하고, 배열을 연산 처리하는 데 필요한 라이브러리이다.

## 데이터의 유형

1. `스칼라(0차원)` : 한 개의 숫자로일이루어진 데이터
2. `벡터(1차원)`: 스칼라의 집합(모음)이며, 여러 개의 숫자가 특정한 순서대로 모여있는 1차원 배열
3. `행렬(2차원)`: 벡터의 집합이며, 1개 이상의 행과 열로 구성된 2차원 배열
4. `텐서(3차원)`: 행렬의 집합이며, 3차원 이상의 배열

## ndarray (N-dimensional array) = 한국말로 넘파이 배열이라고 부름
- NumPy의 핵심 데이터 구조는 ndarray(N-dimensional array)이다.
- ndarray는 같은 타입의 원소들로 구성된 다차원 배열입니다.
- 모든 원소가 동일한 데이터 타입을 가져야 하므로 메모리 효율적이고 연산이 빠릅니다.
- Python의 일반 리스트와 달리 벡터화 연산(나중에 다룸)을 지원합니다.
- 넘파이에서 사용하는 데이터의 구조는 개수나 형태에 따라 크게 스칼라, 벡터, 행렬, 텐서로 표현된다.

## 넘파이 배열 생성  

In [2]:
# 넘파이 라이브러리를 불러와 np라는 별명으로 사용
import numpy as np

In [3]:
# 행 벡터 생성
owl_age = np.array([60,70,12])
owl_age

array([60, 70, 12])

In [6]:
# 열 벡터 생성
owl_age = np.array([[60], [70], [12]])
owl_age

array([[60],
       [70],
       [12]])

In [8]:
# 행렬 생성
owl_age = np.array([[1,2], [3,4]])
owl_age

array([[1, 2],
       [3, 4]])

## ndarray 내의 데이터 타입

- ndarray 내의 데이터 타입은 같은 데이터 타입만 가능하다.

In [None]:
# ndarray 내의 데이터 타입은 연산의 특성상 같은 데이터 타입만 가능하다.
# 만약에 같지 않다면 메모리 사이즈가 더 큰 자료형으로 바뀌게 된다.

# 이와 같은 경우에는 1,2,3 데이터가 메모리 사이즈가 더 큰 문자열로 형변환된다.
array1 = np.array([1,2,3,'data'])
print(array1, array1.dtype) # ndarray.dtype -> ndarray 내의 데이터 타입을 볼 수 있음

# 이와 같은 경우에는 1,2,3 데이터가 메모리 사이즈가 더 큰 실수형으로 형변환된다.
array2 = np.array([1,2,3,4.0])
print(array2, array2.dtype)

['1' '2' '3' 'data'] <U21
[1. 2. 3. 4.] float64


## ndarray를 편리하게 생성하기 - arange,zeros,ones,random.rand()

- arange() 함수를 사용하여 배열의 크기(범위)를 지정하면 지정한 범위의 정숫값을 갖는 ndarray를 생성한다.
- zeros() 함수를 사용하여 배열의 크기(범위)를 지정하면 지정한 범위만큼의 0값을 갖는 ndarray를 생성한다.
- ones() 함수를 사용하여 배열의 크기(범위)를 지정하면 지정한 범위만큼의 1값을 갖는 ndarray를 생성한다.
- random.rand() 함수를 사용하여 배열의 크기를 지정하면 지정한 범위만큼의 임의의 실수값을 생성한다.

In [9]:
# arange() 함수 사용
owl_age = np.arange(1,6)
owl_age

array([1, 2, 3, 4, 5])

In [11]:
# zeros() 함수 사용
owl_age = np.zeros((2,3))
owl_age

array([[0., 0., 0.],
       [0., 0., 0.]])

In [12]:
# ones() 함수 사용
owl_age = np.ones(5)
owl_age

array([1., 1., 1., 1., 1.])

In [13]:
# random.rand() 사용
owl_age = np.random.rand(2,2)
owl_age

array([[0.13265685, 0.47749109],
       [0.34049294, 0.23781575]])

## 배열의 사칙 연산(+, -, x, /)

- 넘파이는 배열 연산을 숫자 연산과 같이 간단하게 수행가능
- 배열의 사칙 연산은 같은 위치에 있는 데이터끼리 연산이 가능
- 사칙 연산하는 두 개의 배열의 크기가 같아야 가능

In [14]:
# 2[행]x2[열] 행렬 생성
owl1 = np.array([[1,2],[3,4]])
owl1

array([[1, 2],
       [3, 4]])

In [15]:
# 2x2 크기의 요소가 1인 행렬 생성
owl2 = np.ones((2,2))
owl2

array([[1., 1.],
       [1., 1.]])

In [16]:
# '+' 연산자를 이용해서 더하기
owl1 + owl2

array([[2., 3.],
       [4., 5.]])

In [19]:
# add() 함수를 이용해서 더하기
np.add(owl1,owl2)

array([[2., 3.],
       [4., 5.]])

In [17]:
# '-' 연산자를 이용해서 빼기
owl1 - owl2 

array([[0., 1.],
       [2., 3.]])

In [20]:
# subtract() 함수를 이용해서 빼기
np.subtract(owl1, owl2)

array([[0., 1.],
       [2., 3.]])

In [21]:
# '*' 연산자를 이용해서 곱하기
owl1 * owl2

array([[1., 2.],
       [3., 4.]])

In [22]:
# multiply() 함수를 이용해서 곱하기
np.multiply(owl1, owl2)

array([[1., 2.],
       [3., 4.]])

In [23]:
# '/' 연산자를 이용해서 나누기
owl1 / owl2

array([[1., 2.],
       [3., 4.]])

In [24]:
# divide() 함수를 이용해서 나누기
np.divide(owl1, owl2)

array([[1., 2.],
       [3., 4.]])

## 내적(inner product)

In [25]:
# 행 벡터 생성
owl4 = np.array([[1,2,3]])
display(owl4)
# 열 벡터 생성
owl5 = np.array([[4], [5], [6]])
display(owl5)
# 2행 3열 행렬 생성
owl6 = np.array([[1,2,3], [4,5,6]])
display(owl6)
# 3행 2열 행렬 생성
owl7 = np.array([[1,2], [3,4], [5,6]])
display(owl7)

array([[1, 2, 3]])

array([[4],
       [5],
       [6]])

array([[1, 2, 3],
       [4, 5, 6]])

array([[1, 2],
       [3, 4],
       [5, 6]])

In [None]:
# 행벡터와 열 벡터의 내적
owl4.dot(owl5)

In [None]:
# 행렬간의 내적
owl6.dot(owl7)