In [1]:
import numpy as np

# 1. Universal 함수

ufunc라고 불리는 유니버셜 함수는 ndarray 안에 있는 데이터 원소별로 연산을 수행하는 함수이다. 유니버셜 함수는 하나 이상의 스칼라 값을 받아서 하나 이상의 스칼라 결과 값을 반환하는 간단한 함수를 고속으로 수행할 수 있는 백터화된 래퍼 함수라고 생각하면 된다.

In [2]:
arr = np.arange(10)
arr

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

###### <span style="color:blue">Example 1</span>

In [3]:
# square root (sqrt)
np.sqrt(arr)

array([0.        , 1.        , 1.41421356, 1.73205081, 2.        ,
       2.23606798, 2.44948974, 2.64575131, 2.82842712, 3.        ])

In [4]:
# Exponential
np.exp(arr)

array([1.00000000e+00, 2.71828183e+00, 7.38905610e+00, 2.00855369e+01,
       5.45981500e+01, 1.48413159e+02, 4.03428793e+02, 1.09663316e+03,
       2.98095799e+03, 8.10308393e+03])

In [7]:
np.random.randn?

In [8]:
x = np.random.randn(8)
y = np.random.randn(8)

In [9]:
x

array([ 1.13559832,  0.12846272,  0.60786394,  1.40354427, -1.68048371,
        1.37082074,  1.25197767, -0.17045456])

In [10]:
y

array([ 0.93315367, -0.59341705, -1.163281  ,  0.48914468,  1.20124107,
        1.32253164, -1.455735  ,  2.36801954])

In [11]:
# x, y maximum (element wise operation)
np.maximum(x, y)

array([1.13559832, 0.12846272, 0.60786394, 1.40354427, 1.20124107,
       1.37082074, 1.25197767, 2.36801954])

### 단항 유니버셜 함수

- abs: 각 원소의 절대값을 구한다.
- sqrt: 각 원소의 제곱근을 구한다.
- square: 각 원소의 제곱을 구한다.
- sign: 각 원소의 부호를 계산한다.
- ceil, floor: 각 원소의 소수자리를 올리거나 내린다.
- rint: 각 원소의 소수자리를 반올림한다.
- sin, cos, tan: 일반 삼각함수
- sinh, cosh, tanh: 쌍곡삼각 함수
- arccos, arccosh, arcsinh: 역삼각함수

### 이항 유니버셜 함수

- add, subtract, multiply: 두 배열에서 같은 위치 원소끼리 더하고, 빼고, 곱한다.
- divide: 첫 번째 배열에서 두 번째 배열의 원소를 나눈다.
- power: 첫 번째 배열의 원소에 두 번째 배열의 원소만큼 제곱한다.
- maximum, minimum: 두 원소 중 큰 값, 작은 값을 반환한다.
- mod: 첫 번째 배열의 원소에 두 번째 배열의 원소를 나눈 나머지를 구한다.
- greater, less, equal: 각각 두 원소 간의 비교 연산 결과를 불리언 배열로 반환한다.
- logical_and, logical_or, logical_xor: 각각 두 원소 간의 논리 연산을 배열로 반환한다.

# 2. 배열 연산

### 1. 조건절 표현하기

In [12]:
xarr = np.array([1.1, 1.2, 1.3, 1.4, 1.5])
yarr = np.array([2.1, 2.2, 2.3, 2.4, 2.5])
cond = np.array([True, False, True, True, False])

###### <span style="color:blue">Example 2. </span>

In [13]:
# cond가 True 이면 xarr value, False 이면 yarr value  
np.where(cond, xarr, yarr)

array([1.1, 2.2, 1.3, 1.4, 2.5])

In [14]:
arr = np.random.randn(4, 4)
arr

array([[ 0.82880919, -2.3166449 ,  0.1420923 ,  1.84110178],
       [-1.55454313, -0.07131665,  1.15346035,  0.44134412],
       [-0.31718224, -0.10135072,  0.20636769,  0.80742406],
       [-0.79603188,  0.47659634, -0.55123951,  0.82215005]])

In [15]:
# arr가 0보다 크면 2, 작으면 -2 
np.where(arr > 0, 2, -2)

array([[ 2, -2,  2,  2],
       [-2, -2,  2,  2],
       [-2, -2,  2,  2],
       [-2,  2, -2,  2]])

### 2. 수학 메서드와 통계 메서드

배열 전체 혹은 배열에서 한 축에 따르는 자료에 대한 통계를 계산하기 위한 수학 함수는 배열 메서드로 사용할 수 있다. 전체의 합이나 평균, 표준편차는 Numpy의 최상위 함수를 이용하거나, 배열의 인스턴스 메서드를 사용해서 구할 수 있다.

In [33]:
arr = np.random.rand(5, 4)
arr

array([[9.24499010e-01, 8.72635970e-01, 6.66665918e-02, 5.57745673e-01],
       [5.47832171e-01, 2.27159989e-01, 6.95842485e-01, 3.34435313e-01],
       [6.03735188e-01, 7.72165930e-03, 1.90828016e-04, 6.32482875e-01],
       [4.96555075e-01, 7.67220913e-02, 1.16141544e-01, 2.28794603e-01],
       [8.67450136e-02, 2.24443639e-01, 7.31767059e-01, 9.99839260e-01]])

In [34]:
arr.mean()

0.42159780188433277

In [35]:
np.mean(arr)

0.42159780188433277

- mean이나 sum 같은 함수는 선택적으로 axis 인자를 받아 해당 axis에 대한 통계를 계산하고 차수 낮은 배열을 반환한다.

###### <span style="color:blue">Example 3</span>

In [36]:
# arr 전체 합
np.sum(arr)

8.431956037686655

In [38]:
# arr 전체 평균
np.mean(arr)

0.42159780188433277

In [54]:
arr = np.array([[0,1,2,2,2],[3,4,5,5,5],[6,7,8,8,8]])
print(arr.shape)
arr

(3, 5)


array([[0, 1, 2, 2, 2],
       [3, 4, 5, 5, 5],
       [6, 7, 8, 8, 8]])

In [55]:
arr.shape

(3, 5)

In [58]:
arr.mean(axis=None)

4.4

In [59]:
# axis0 기준으로 합
arr.mean(axis=0)

array([3., 4., 5., 5., 5.])

In [60]:
# axis1 기준으로 평균
arr.mean(axis=1)

array([1.4, 4.4, 7.4])

In [61]:
arr = np.array([[0,1,2],[3,4,5],[6,7,8]])
arr

array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])

In [65]:
arr.cumsum()

array([ 0,  1,  3,  6, 10, 15, 21, 28, 36])

In [64]:
arr

array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])

In [51]:
# axis0 기준 누적합(cumsum)
arr.cumsum(axis=0)

array([[ 0,  1,  2],
       [ 3,  5,  7],
       [ 9, 12, 15]])

In [66]:
# axis0 기준 누적합(cumsum)
arr.cumsum(axis=1)

array([[ 0,  1,  3],
       [ 3,  7, 12],
       [ 6, 13, 21]])

In [69]:
# axis1 기준 누적곱(cumprod)
arr.cumprod(axis=0)

array([[ 0,  1,  2],
       [ 0,  4, 10],
       [ 0, 28, 80]])

In [70]:
# axis1 기준 누적곱(cumprod)
arr.cumprod(axis=1)

array([[  0,   0,   0],
       [  3,  12,  60],
       [  6,  42, 336]])

In [74]:
new_arr = np.arange(18).reshape(2,3,3)
new_arr

array([[[ 0,  1,  2],
        [ 3,  4,  5],
        [ 6,  7,  8]],

       [[ 9, 10, 11],
        [12, 13, 14],
        [15, 16, 17]]])

In [83]:
new_arr.shape

(2, 3, 3)

In [82]:
new_arr.mean(axis=2)

array([[ 1.,  4.,  7.],
       [10., 13., 16.]])

In [89]:
new_arr.shape

(2, 3, 3)

In [88]:
new_arr

array([[[ 0,  1,  2],
        [ 3,  4,  5],
        [ 6,  7,  8]],

       [[ 9, 10, 11],
        [12, 13, 14],
        [15, 16, 17]]])

In [85]:
new_arr[0][0][0]

0

In [86]:
new_arr[0][1][0]

3

In [87]:
new_arr[0][2][0]

6

In [90]:
new_arr.mean(axis=0)

array([[ 4.5,  5.5,  6.5],
       [ 7.5,  8.5,  9.5],
       [10.5, 11.5, 12.5]])

In [91]:
new_arr.mean(axis=1)

array([[ 3.,  4.,  5.],
       [12., 13., 14.]])

In [92]:
new_arr.mean(axis=2)

array([[ 1.,  4.,  7.],
       [10., 13., 16.]])

### 3. 정렬

- np.sort 메서드는 배열을 직접 변경하지 않고 정렬된 결과를 가지고 있는 복사본을 반환한다.

In [0]:
arr = np.random.randn(8)
arr

array([-0.72457977,  0.87587823,  1.2289314 , -0.28894393,  0.15205621,
        0.39222443, -1.86491412, -0.43901666])

In [0]:
arr.sort()
arr

array([-1.86491412, -0.72457977, -0.43901666, -0.28894393,  0.15205621,
        0.39222443,  0.87587823,  1.2289314 ])

In [0]:
arr = np.random.randn(5, 3)
arr

array([[ 1.6184662 , -1.08623178, -0.94366897],
       [-0.48770058,  0.19617067, -1.26855797],
       [-0.43161619, -0.80774082,  1.70783631],
       [-1.05988322, -0.69291836, -0.12831549],
       [-0.2984775 ,  0.07530742, -1.90711257]])

In [0]:
arr.sort(1)
arr

array([[-1.08623178, -0.94366897,  1.6184662 ],
       [-1.26855797, -0.48770058,  0.19617067],
       [-0.80774082, -0.43161619,  1.70783631],
       [-1.05988322, -0.69291836, -0.12831549],
       [-1.90711257, -0.2984775 ,  0.07530742]])

## 3. 선형대수

### 내적은 중요하다.

In [40]:
x = np.array([[1.,2.,3.], [4.,5.,6.]])
y = np.array([[6.,23.], [-1, 7], [8, 9]])

In [43]:
print(x.shape)
x

(2, 3)


array([[1., 2., 3.],
       [4., 5., 6.]])

In [44]:
print(y.shape)
y

(3, 2)


array([[ 6., 23.],
       [-1.,  7.],
       [ 8.,  9.]])

###### <span style="color:blue">Example 4</span>

In [0]:
# x, y dot product 


array([[ 28.,  64.],
       [ 67., 181.]])

In [51]:
from numpy.linalg import inv, qr

In [47]:
X = np.random.randn(5, 5)
X

array([[-0.86422755,  0.61300104, -1.33128157, -0.77544552, -0.90520723],
       [ 0.30216056,  2.3591887 ,  0.74218289, -0.24390463, -0.10939491],
       [-0.02949217,  0.14939397,  0.48741788, -0.41715864,  0.56567733],
       [ 1.21631973, -0.36682   ,  0.97668664, -0.73593137,  0.5911537 ],
       [ 1.55703608,  0.58679195,  0.38057991,  1.46413045,  0.1351869 ]])

In [49]:
# mat = X.T와 X의 내적


array([[ 4.74285512,  0.64616127,  3.1409535 ,  1.99334203,  1.66208994],
       [ 0.64616127,  6.44274185,  0.87274283,  0.01600736, -0.86598784],
       [ 3.1409535 ,  0.87274283,  3.65948014,  0.48642821,  2.02843726],
       [ 1.99334203,  0.01600736,  0.48642821,  3.5200995 ,  0.25552633],
       [ 1.66208994, -0.86598784,  2.02843726,  0.25552633,  1.5190964 ]])

In [52]:
# mat의 역행렬


array([[ 0.79542438,  0.15056437, -1.03783068, -0.3556944 ,  0.66117184],
       [ 0.15056437,  0.64845324, -1.52337163, -0.04073403,  2.24592295],
       [-1.03783068, -1.52337163,  5.25256127,  0.36296676, -6.80766007],
       [-0.3556944 , -0.04073403,  0.36296676,  0.44963948, -0.19434521],
       [ 0.66117184,  2.24592295, -6.80766007, -0.19434521, 10.33811058]])