# NumPy 란?
  - 파이썬 기반 데이터 분석 환경에서 행렬 연산을 위한 핵심 라이브러리.
  - "Numerical Python"의 약자로 대규모 다차원 배열과 행렬 연산에 필요한
    다양한 함수를 제공.
  - 특히, 메모리 버퍼에 배열 데이터를 저장하고 처리하는 효율적인
    인터페이스를 제공.
  - 파이썬 list 객체를 개선한 NumPy의 ndarray 객체를 사용하면 더 많은
    데이터를 더 빠르게 처리할 수 있다.

In [None]:
import numpy as np
import matplotlib.pyplot as plt

In [None]:
# 배열 생성
# - 1차원 배열(Vector) 정의
arr = np.array([1, 2, 3])
print(arr)

In [None]:
# cf) 리스트 자료형 
list = [1, 2, 3]
print(list)

In [None]:
# - 2차원 배열(Matrix) 정의
arr2 = np.array([[1, 2, 3],[4, 5, 6]]) # 2행3열
print(arr2)

In [None]:
# - 3차원 배열(Array) 정의
arr3 = np.array([[[1,2,3],[4,5,6]],[[7,8,9],[10,11,12]]]) # 2면2행3열
print(arr3)
print("arr3.shape:{0}".format(arr3.shape))

In [None]:
# 배열 생성 및 초기화
# zeros((행, 열)) : 0. 으로 채우는 함수
arr_zeros = np.zeros((3, 4))
print(arr_zeros)

In [None]:
# ones((행, 열)) : 1로 채우는 함수
arr_ones = np.ones((2, 2))
print(arr_ones)

In [None]:
# full((행, 열), 값) : 값으로 채우는 함수
arr_full = np.full((3, 4), 7)
print(arr_full)

In [None]:
# eye(N) : (N, N)의 단위 행렬 생성
arr_eye = np.eye(5)
print(arr_eye)

In [None]:
# empty((행, 열)) : 초기화 없이 기존 메모리 값이 들어감.
arr_empty = np.empty((3, 3))
print(arr_empty)

In [None]:
# _like(배열) 지정한 배열과 동일한 shape의 행렬을 만듦.
# 종류 : np.zeros_like(), np.ones_like(), np.full_like(), np.empty_like()
arr_sample = np.array([[1, 2, 3],[4, 5, 6]])
arr_like = np.ones_like(arr_sample)
print(arr_like)

In [None]:
# 배열 데이터 생성 함수
#  - np.linspace(시작, 종료, 개수) : 개수에 맞게끔 시작과 종료 사이에 균등하게 분배
arr_linspace = np.linspace(1, 10, 5)
print(arr_linspace)

In [None]:
plt.plot(arr_linspace, 'o') # 그래프를 그려주는 함수 마커를 원('o')으로 만든 그래프를 보여줌.
plt.show()

In [None]:
# np.arange(시작, 종료, 스텝) : 시작과 종료 사이에 스텝 간격으로 생성.
arr_arrange = np.arange(1, 20, 2)
print(arr_arrange)

In [None]:
plt.plot(arr_arrange, 'v')
plt.show()

# list vs ndarray

In [None]:
x1 = [1, 2, 3]
y1 = [4, 5, 6]
print(x1 + y1)
print(type(x1))

In [None]:
x2 = np.array([1, 2, 3])
y2 = np.array([4, 5, 6])
print(x2 + y2)
print(type(x2))

In [None]:
print(x2[2]) # 요소의 참조

In [None]:
x2[2] = 10  # 요소의 수정
print(x2)

In [None]:
# 연속된 정수 벡터의 생성
print(np.arange(10))
print(np.arange(5, 10))

In [None]:
x = np.array([10, 11, 12])
for i in np.arange(1, 4):
    print(i)
    print(i + x)

In [None]:
# ndarray형의 주의점
a = np.array([1, 1])
b = a # 주소값 복사

print('a = ' + str(a))
print('b = ' + str(b))

In [None]:
a[0] = 100

print('a = ' + str(a))
print('b = ' + str(b))

In [None]:
a = np.array([1, 1])
b = a.copy()  # 데이터 복사

print('a = ' + str(a))
print('b = ' + str(b))

In [None]:
a[0] = 100

print('a = ' + str(a))
print('b = ' + str(b))

## - 행렬(2차원, Matrix)

In [None]:
x = np.array([[1, 2, 3],[4, 5, 6]])# 2행 3열
print(x)
print(type(x))
print(x.shape) # 튜플

In [None]:
row, col = x.shape
print(row)
print(col)

In [None]:
print(x[1, 2])

x[1, 2] = 10 # 요소의 수정
print(x)

## - 요소가 랜덤인 행렬 생성

In [None]:
randArray = np.random.rand(2,3) # 0 ~ 1 사이의 균일한 분포
print(randArray)

In [None]:
randnArray = np.random.randn(2, 3) # 평균 0, 분산 1 가우스 분포로 난수를 생성.
print(randnArray)

In [None]:
randintArray = np.random.randint(10, 20, (2,3))
print(randintArray)

In [None]:
# np.random.normal(정규분포 평균, 표준편차, (행, 열) or 개수)
#  - 정규 분포 확률 밀도에서 표본 추출
mean = 0 # 평균
std = 1  # 표준편차
arr_normal = np.random.normal(mean, std, 10000)
plt.hist(arr_normal, bins=100) # 나누는 구간 갯수(100개 정도로 더 잘게 나누어 보라는 의미)
plt.show()

In [None]:
# np.random.random((행, 열) or size) : (행,열)의 정규 분포로 난수(0~1 사이) 생성
arr_random = np.random.random((3,2)) # 행렬
print(arr_random)

In [None]:
data = np.random.random(10000) # size
plt.hist(data, bins=100) # 100개의 구간으로 나누어 히스토 그램을 보이라는 의미
plt.show()

In [None]:
# 행렬의 크기 변경
a = np.arange(10)
print(a) # [0 1 2 3 4 5 6 7 8 9]
a_arange = a.reshape(2,5)
print(a_arange)

In [None]:
print(type(a_arange)) # <class 'numpy.ndarray'>
print(a_arange.shape) # (2, 5)

In [None]:
# 행렬(numpy.ndarray)의 사칙 연산
# - 덧셈
x = np.array([[4,4,4],[8,8,8]])
y = np.array([[1,1,1],[2,2,2]])
print(x+y)

In [None]:
# - 스칼라 x 행렬
x = np.array([[4,4,4],[8,8,8]])
scar_arr = 10 * x
print(scar_arr)

In [None]:
# - 산술함수 : np.exp(x), np.sqrt(), np.log(), np.round()
#             np.mean(), np.std(), np.max(), np.min()
print(np.exp(x))

In [None]:
# - 행렬 * 행렬
x = np.array([[1,2,3],[4,5,6]])   # (2,3)
y = np.array([[1,1],[2,2],[3,3]]) # (3,2)
print(x.dot(y))

In [None]:
# 원소 접근
data = np.array([[51,55],[14,19],[0,4]])
print(data)
print(data[0][1])

In [None]:
for row in data:
    print(row)

In [None]:
y = data.flatten() # data를 1차원 배열로 변환(평탄화)
print(y)

In [None]:
# 슬라이싱
x = np.arange(10)
print(x[:5])  # [0 1 2 3 4]
print(x[5:])  # [5 6 7 8 9]
print(x[3:8]) # [3 4 5 6 7]

print(x[3:8:2]) # [3 5 7]

print(x[::-1]) # [9 8 7 6 5 4 3 2 1 0]

In [None]:
y = np.array([[1,2,3],[4,5,6],[7,8,9]]) # 3행3열
print(y[:2, 1:2])

In [None]:
# 조건을 만족하는 데이터 수정
# - bool 배열 사용
x = np.array([1,1,2,3,5,8,15])
print(x > 3)

In [None]:
y = x[x > 3]
print(y)

In [None]:
x[x > 3] = 555
print(x)

# - Numpy에서 np.sum 함수의 axis 이해

In [None]:
arr = np.arange(0, 4*2*4)
len(arr)
arr

In [None]:
v = arr.reshape([4,2,4]) # 차원 변환(x축(row), y축(column), z축(depth))
v

In [None]:
print(v.shape)  # 4면 2행 4열
print(v.ndim)   # v의 차원
print(v.sum())  # 모든 element의 합

In [None]:
res01=v.sum(axis=0) # axis=0 기준 합계
res01.shape

In [None]:
res01

In [None]:
res02=v.sum(axis=1)  # axis=1 기준 합계
res02.shape

In [None]:
res02

In [None]:
res03=v.sum(axis=2)  # axis=2 기준 합계
res03.shape

In [None]:
res03