# Numpy (1)
Numpy를 다루기 전에 행렬(array)에 대해서 빠르게 짚고 넘어가겠습니다.
행렬은 말 그대로 "행과 열로 이루어진 데이터"를 지칭합니다.

현실 세계의 매우 많은 문제들이 모두 행렬로 구성되어 있고, 우리가 다루는 금융공학 또한 행렬로 모든 것들을 설명합니다.

행렬은 1차원(vector), 2차원(matrix), 그리고 3차원(tensor)으로도 구성이 가능하며,

원한다면 4차원 이상의 행렬도 구현이 가능합니다만, 3차원부터는 딥러닝을 공부할 때나 쓰기 때문에,

2차원의 행렬만 잘 다루셔도 아무 문제가 없습니다.

![image.png](attachment:image.png)

In [1]:
#import numpy
import numpy as np

## 행렬 만들기
행렬 생성은 numpy 패키지의 `array()`함수를 사용합니다.

이때 괄호 안에는 행렬의 "모양"과 "값"이 들어가는데, **[ ]가 몇 겹으로 쌓여 있나** 가 행렬의 모양을 결정합니다.

그리고 그 []안에 값을 집어넣음으로서 행렬의 값을 지정합니다.

In [6]:
#1차원 행렬 (vector): 리스트와 비슷한 형태
np.array([1, 2])

array([1, 2])

In [8]:
#2차원 행렬 (matrix): 표, 데이터프레임 등과 비슷한 형태
np.array([[1,2],[3,4]])

array([[1, 2],
       [3, 4]])

In [11]:
#3차원 행렬 (tensor): 큐브와 비슷한 형태
np.array([[[1,2],[3,4]],[[5,6],[7,8]]])

array([[[1, 2],
        [3, 4]],

       [[5, 6],
        [7, 8]]])

특수한 행렬을 만드는 방법들도 알아보겠습니다.
값을 일일이 지정하는 것이 아니라 특정 규칙이나 분포를 따르는 값, 혹은 특정 값으로 채워진 값을 넣은 행렬을 만들 수 있습니다.

In [12]:
np.arange(4)

array([0, 1, 2, 3])

In [42]:
np.random.randint(3,11,(3,3), dtype='int64')
#코드 길이가 확 길어졌죠? 코드 찬찬히 한번 뜯어볼게요!

array([[ 3,  4,  3],
       [10,  8,  6],
       [10,  4, 10]])

In [39]:
np.random.normal(0,1,(3,3))

array([[ 1.44539683, -0.30915448,  0.62517967],
       [ 0.84688634,  1.50590924,  0.40201969],
       [-0.53761273,  0.08936249, -1.94399486]])

In [24]:
np.ones((3,3))

array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])

In [25]:
np.zeros((2,2))

array([[0., 0.],
       [0., 0.]])

## 행렬 병합과 분할
행렬을 붙이고 나눠 봅시다.

In [137]:
a1=np.array([['a','b'],['c','d']])
a2=np.array([['e','f'],['g','h']])

np.concatenate([a1,a2], axis=0) #위아래로 붙임
#np.concatenate([a1,a2], axis=1) #좌우로 붙임

array([['a', 'b'],
       ['c', 'd'],
       ['e', 'f'],
       ['g', 'h']], dtype='<U1')

In [78]:
a3=np.array([['a','b'],['c','d'],['e','f'],['g','h'],['i','j'],['k','l']])
a3

In [83]:
np.split(a3, [2], axis=0)

[array([['a', 'b'],
        ['c', 'd']], dtype='<U1'),
 array([['e', 'f'],
        ['g', 'h'],
        ['i', 'j'],
        ['k', 'l']], dtype='<U1')]

## 모양 바꾸기
행렬의 모양을 바꾸는 방법도 매우 중요합니다.
안에 들어갈 수 있는 값이 같다면 그 안에서는 행렬의 모양을 자유자재로 변환할 수 있습니다.

In [84]:
a4=np.array([['a','b'],['c','d'],['e','f'],['g','h'],['i','j'],['k','l']])
a4

array([['a', 'b'],
       ['c', 'd'],
       ['e', 'f'],
       ['g', 'h'],
       ['i', 'j'],
       ['k', 'l']], dtype='<U1')

In [55]:
a4.reshape(3,4) #3행 4열

array([['a', 'b', 'c', 'd'],
       ['e', 'f', 'g', 'h'],
       ['i', 'j', 'k', 'l']], dtype='<U1')

In [56]:
a4.reshape(1,12)
#얘도 2차원 행렬임

array([['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l']],
      dtype='<U1')

In [57]:
a4.T #행 열 위치만 바꿀 때는 이렇게 간단히

array([['a', 'c', 'e', 'g', 'i', 'k'],
       ['b', 'd', 'f', 'h', 'j', 'l']], dtype='<U1')

In [73]:
#차트키: -1
a5=np.ones((15,12), dtype='int32')
a5

array([[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]], dtype=int32)

In [77]:
#행렬 모양을 정확히 계산하지 않는 대신, 한쪽 길이만 정해 주고 다른 한 쪽 길이는 -1을 지정하면 알아서 계산이 된다.
a5.reshape(9,-1)

array([[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
       [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]],
      dtype=int32)

# Numpy (2)
## 행렬의 연산

In [87]:
a6=np.ones((3,2), dtype='int32')
a6

array([[1, 1],
       [1, 1],
       [1, 1]], dtype=int32)

In [138]:
#행렬과 상수의 연산

print(a6+2, '\n\n',
      a6-2, '\n\n',
      a6*2, '\n\n',
      a6/2)

[[3 3]
 [3 3]
 [3 3]] 

 [[-1 -1]
 [-1 -1]
 [-1 -1]] 

 [[2 2]
 [2 2]
 [2 2]] 

 [[0.5 0.5]
 [0.5 0.5]
 [0.5 0.5]]


In [96]:
#행렬과 행렬의 연산
a7=np.array([[1,2],[3,4],[5,6]])

print(a6+a7, '\n\n',
      a6-a7, '\n\n',
      a6*a7, '\n\n',
      a6/a7)

[[2 3]
 [4 5]
 [6 7]] 

 [[ 0 -1]
 [-2 -3]
 [-4 -5]] 

 [[1 2]
 [3 4]
 [5 6]] 

 [[1.         0.5       ]
 [0.33333333 0.25      ]
 [0.2        0.16666667]]


In [111]:
#모양이 같아야지만 연산이 가능하다.
a8=np.array([[1,2,3],[4,5,6]])
a6*a8


ValueError: operands could not be broadcast together with shapes (3,2) (2,3) 

In [114]:
#사이즈가 다를 때: 내적 계산하기
np.dot(a6, a8)

array([[5, 7, 9],
       [5, 7, 9],
       [5, 7, 9]])

## 행렬의 인덱싱
행렬 안에서 특정 값들만 찾고 싶을 때

In [116]:
a9=np.array([[1,2,3],[4,5,6],[7,8,9]])
a9

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

행렬의 인덱싱은 행과 열 번호를 명시하여 수행합니다.

In [121]:
a9[0,0]

1

In [123]:
a9[2,[1,2]]

array([8, 9])

In [126]:
a9[1,2]=11
a9

array([[ 1,  2,  3],
       [ 4,  5, 11],
       [ 7,  8,  9]])

조건을 기준으로 찾는 Boolean Indexing방법도 있습니다.

In [131]:
a9[a9>=7]

array([11,  7,  8,  9])

In [130]:
a9[a9%2==1] #나머지가 1인 항목

array([ 1,  3,  5, 11,  7,  9])

In [132]:
#조건을 담은 행렬이 기존 행렬 위헤 씌워지는 구조.
a9%2==1

array([[ True, False,  True],
       [False,  True,  True],
       [ True, False,  True]])

In [133]:
a9[a9%2==1]=0
a9

array([[0, 2, 0],
       [4, 0, 0],
       [0, 8, 0]])

## 행렬 집계하기
numpy에는 주어진 데이터의 최대, 최소, 합계, 평균 등을 구하는 함수가 존재합니다.

In [139]:
a10 = np.arange(16).reshape(4, 4)

print("최대값:", np.max(a10))
print("최소값:", np.min(a10))
print("합계:", np.sum(a10))
print("평균값:", np.mean(a10))
print("표준편차:", np.std(a10))

최대값: 15
최소값: 0
합계: 120
평균값: 7.5
표준편차: 4.6097722286464435


In [136]:
#axis: 0=세로축, 1=가로축 집계
np.sum(a10, axis=1)

array([ 6, 22, 38, 54])