# 6강. Basic Numpy Operation

# 이번장에서 배우는 것들
 * Numpy를 이용한 기본적 자료 구조
 * 필수적인 Numpy 동작에 대해 실습

In [None]:
#numpy를 import 시킴
import numpy as np

## 기본 자료구조 (List)

In [None]:
# python의 기본자료 구조인 list
# string 원소를 여러개 가진 list는 다음과 같이 정의 할 수 있음
week = ['mon', 'tue', 'wed', 'thu', 'fri', 'sat', 'sun']
print(week, type(week))

In [None]:
# list의 특정 순서의 item을 출력하는 동작은 변수의 뒤에 []를 이용하여 접근 
# 0번째 index에 접근
print(week[0])

In [None]:
# 1번째 index에 접근
print(week[1])

In [None]:
# 맨뒤 접근을 -1 index로 표현함
print(week[-1])

In [None]:
# 맨뒤에서 한칸 앞 index에 접근
print(week[-2])

In [None]:
# integer 원소를 여러개 가진 list는 다음과 같이 정의 할 수 있음
week = [0, 1, 2, 3, 4, 5, 6]
print(week, type(week))

In [None]:
# 여러 index에 접근
print(week[0], week[1], week[-1], week[-2])

In [None]:
# python의 list에서는 자료형에 상관없이 여러 타입을 혼합할 수 있음
week = [0, 'mon', 1.0, 2, 3, 'fri', 'sat', 6.0]
print(week, type(week))

In [None]:
# 여러 index에 접근
print(week[0], week[1], week[-1], week[-2])

In [None]:
# list안에 다시 list를 원소로 넣어 중첩된 list를 표현 할 수 있음
people = [ ['son', 176, 69],  ['kim', 183, 84], ['lee', 163, 57]]
print(people)

In [None]:
# 여러 index에 접근
print(people[0], people[1], people[-1], people[-2])

In [None]:
#list 원소는 다시 index를 주어 중첩된 list의 item에 접근 할 수 있음
print(people[0][1], people[0][-1])

In [None]:
#append 명령어로 list의 가장 끝 부분에 data를 삽입할 수 있음
people.append(['park', 177, 75])
print(people)
print(people[-1])

In [None]:
#list는 기존 item과 size가 달라도 추가 가능
people.append(['bug!', 177, 75, 234])
print(people)
print(people[-1])

In [None]:
# pop 명령어를 이용하여 list의 item을 제거 할 수 있음
# 가장 뒤의 원소를 제거함
people.pop()
print(people)

In [None]:
# 가장 앞의 원소를 제거함
people.pop(0)
print(people)


## 기본 자료구조 (Numpy array)

In [None]:
import numpy as np
# np array는 python list를 converting 할 수 있음
# string list를 변환
week = np.array(['mon', 'tue', 'wed', 'thu', 'fri', 'sat', 'sun'])
print(week, type(week), week.dtype)

In [None]:
# 여러 index에 접근
print(week[0], week[1], week[-1], week[-2])

In [None]:
# int list를 변환
week = np.array([0, 1, 2, 3, 4, 5, 6])
print(week, type(week), week.dtype)

In [None]:
# 여러 index에 접근
print(week[0], week[1], week[-1], week[-2])

In [None]:
# 복합 자료형 list는 변환할 수 없음
# 해당 자료형을 전부 포괄 할 수 있는 자료형이 있다면 해당 자료형으로 converting 후 변환
week = np.array([0, 'mon', 1.0, 2, 3, 'fri', 'sat', 6.0])
print(week, type(week), week.dtype)

In [None]:
# 사이즈가 같은 중첩된 list는 같은 규칙에 의해 numpy array로 전환됨 
people = np.array([['son', 176, 69], ['kim', 183, 84], ['lee', 163, 57]])
print(people, type(people), people.shape)

In [None]:
# 사이즈가 다른 중첩된 list는 numpy array로 변환 될 수 없음
# 혀용되는 numpy array에 각 원소를 다시 list를 갖는 numpy array로 변환
people = np.array([['son', 176, 69], ['kim', 183, 84], ['lee', 163, 57], ['bug!', 183, 123, 341]])


In [None]:
print(people, type(people), people.shape, people.dtype)

In [None]:
# 생성된 numpy array는 append, pop 등의 메서드가 없기 때문에 item을 새로 추가/삭제 불가능
people.pop()

## 간단한 List와 Numpy array 연산 비교

In [None]:
a = [1,2]
b = [3,4]

print(type(a), type(b)) #<class 'list'> <class 'list'>
print(len(a), a)        # 2 [1, 2]
print(len(b), b)        # 2 [3, 4]
print(a+b)              # [1, 2, 3, 4]: appending

In [None]:
aa = np.array(a) # from Python List to NumPy Array
bb = np.array(b) # from Python List to NumPy Array

print(aa.dtype, bb.dtype) # int64 int64
print(type(aa), type(bb)) # int64 int64
print(len(aa), aa) # 1 [1,2]
print(len(bb), bb) # 1 [3,4]
print(aa+bb) # [4, 6]: vector operation

## np array 구조 (shape, ndim, axis, len, size)

In [None]:
#1차원 array 선언
a1 = np.array([7,2,9,10])

#len, shape, ndim 출력
print('len', len(a1))
print('shape', a1.shape)
print('ndim', a1.ndim)
print('size', a1.size)

In [None]:
#2차원 array 선언
a2 = np.array([[5.2, 3.0, 4.5],
               [9.1, 0.1, 0.3]])

#len, shape, ndim 출력
print('len', len(a2))
print('shape', a2.shape)
print('ndim', a2.ndim)
print('size', a2.size)

In [None]:
#3차원 array 선언
a3 = np.array([
    [[1, 2], [4, 3], [7, 4]],
    [[2, 1], [9, 2], [7, 5]],
    [[1, 8], [3, 4], [0, 2]],
    [[9, 4], [6, 2], [9, 8]]])

#len, shape, ndim 출력
print('len', len(a3))
print('shape', a3.shape)
print('ndim', a3.ndim)
print('size', a3.size)

## np array 기본 함수

In [None]:
a = np.array([1, 2, 3, 4, 5])
#a를 전체 item 기준으로 sum과 prod 계산
print(np.sum(a)) # 15 = 1+2+3+4+5
print(np.prod(a)) # 120 = 1*2*3*4*5

In [None]:
#a를 전체 item 기준으로 평균, 분산, 표준편차 계산
print(np.mean(a)) # 3.0 = (1+2+3+4+5)/5
print(np.var(a)) # 2.0: variance
print(np.std(a)) # 1.414..: std


In [None]:
#a를 전체 item 기준으로 최소, 최대값 계산
print(np.min(a)) # 1: minimum
print(np.max(a)) # 5: maximum

In [None]:
#a를 전체 item 기준으로 최소, 최대값의 index위치를 반환
print(np.argmin(a)) # 0: the index of the min. value
print(np.argmax(a)) # 4: the index of the max. value

In [None]:
a = np.array([[1, 2, 3, 4, 5], [6, 7, 8, 9, 10]])
#a를 전체 item 기준으로 sum과 prod 계산
print(np.sum(a))
print(np.prod(a))

In [None]:
#axis를 바꿔가며 sum, prod 계산
print(np.sum(a), np.sum(a, axis=0), np.sum(a, axis=1))
print(np.prod(a), np.prod(a, axis=0), np.prod(a, axis=1))

In [None]:
#axis를 바꿔가며 mean, var, std 계산
print(np.mean(a), np.mean(a, axis=0), np.mean(a, axis=1))
print(np.var(a), np.var(a, axis=0), np.var(a, axis=1))
print(np.std(a), np.std(a, axis=0), np.std(a, axis=1))

In [None]:
#axis를 바꿔가며 min, max 계산
print(np.min(a), np.min(a, axis=0), np.min(a, axis=1))
print(np.max(a), np.max(a, axis=0), np.max(a, axis=1))

In [None]:
#axis를 바꿔가며 argmin, argmax 계산
print(np.argmin(a), np.argmin(a, axis=0), np.argmin(a, axis=1))
print(np.argmax(a), np.argmax(a, axis=0), np.argmax(a, axis=1))

## indexing & slicing

In [None]:
data = np.array([1, 2, 3, 4, 5, 6])
#각 원소를 index를 이용하여 출력
print(data[0], data[1])

#연속된 원소를 slice를 이용하여 출력
print(data[0:2])
print(data[1:-1])
print(data[3:])
print(data[:4])

In [None]:
data = np.array([[1, 2, 3, 4, 5], [6, 7, 8, 9, 10]])
#각 원소를 index를 이용하여 출력
print(data[0], data[1])
print(data[0][1], data[1][2])
print(data[0, 1], data[1 ,2])

In [None]:
data.shape

In [None]:
#연속된 원소를 slice를 이용하여 출력
print(data[0:1])
print(data[0:2])

print(data[0:1, 3])
print(data[0:2, 3])

In [None]:
print(data[1, 1:3])
print(data[0, 1:3])

## np 산술 연산 (element-wise)

In [None]:
# shape이 같은 2개의 np array를 선언
data = np.array([1, 2])
ones = np.array([1, 1])

In [None]:
# 더하기 연산
data + ones

In [None]:
# 빼기 연산
data - ones

In [None]:
# 곱하기 연산
data * ones

In [None]:
# 나누기 연산
data / data

## np 산술 연산 (matrix-multiplication)

In [None]:
a = np.array([[1,2],
              [3,4]])

b = np.array([[2,1],
              [4,3]])

In [None]:
# element-wise product 연산
print(a * b)

In [None]:
# matrix-multiplication 연산
print(a @ b)

In [None]:
# matrix-multiplication 연산
print(np.matmul(a, b))

In [None]:
# dot-product 연산
print(np.dot(a, b))

In [None]:
a = np.array([[1,2],
              [3,4],
              [5,6]
             ])

b = np.array([[2,1],
              [4,3]])

print(a.shape, b.shape)

In [None]:
# 뒷 열과 앞 행이 같은 경우 연산 가능
print(a @ b, (a @ b).shape)

In [None]:
a = np.array([[1,2,3],
              [3,4,5],
              [5,6,7]
             ])

b = np.array([[2,1,6,2],
              [4,3,5,1],
              [1,2,1,0]
             ])

# 뒷 열과 앞 행이 같은 경우 연산 가능
print(a.shape, b.shape)
print(a @ b, (a @ b).shape)

In [None]:
a = np.array([[1,2],
              [3,4],
              [5,6]
             ])

b = np.array([[2,1,6,2],
              [4,3,5,1],
              [1,2,1,0]
             ])

# 뒷 열과 앞 행이 다른 경우 연산 불가능
print(a.shape, b.shape)
print(a @ b, (a @ b).shape)

## np Broadcasting

In [None]:
# shape이 다른 2개의 np array를 선언
data = np.array([[1, 2], [3,4]])
data2 = np.array([1, 1, 3])

In [None]:
# shape이 다른 자료는 연산 할 수 없음
data + data2

In [None]:
# 상수와 연산
data * 1.6

In [None]:
# data와 일부 shape이 같은 array로 연산
data + np.array([1,1])

## Transpose

In [None]:
# 2차원 np array 선언
a = np.array([[1,2,3,4]])
print(a, a.shape)

b = np.array([1,2,3,4])
print(b, b.shape)

In [None]:
np.array([1,2,3,4]).T

In [None]:
# a의 transpose
print(a.T, a.T.shape)

In [None]:
# 2차원 np array 선언
b = np.array([[1,2],[3,4]])
print(b, b.shape)

In [None]:
# b의 transpose
print(b.T, b.T.shape)