In [21]:
import numpy as np

# 1. Swapaxes

In [13]:
arr = np.arange(24).reshape((2, 3, 4))

In [20]:
arr

array([[[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]],

       [[12, 13, 14, 15],
        [16, 17, 18, 19],
        [20, 21, 22, 23]]])

In [16]:
arr.reshape(4, 3, 2)

array([[[ 0,  1],
        [ 2,  3],
        [ 4,  5]],

       [[ 6,  7],
        [ 8,  9],
        [10, 11]],

       [[12, 13],
        [14, 15],
        [16, 17]],

       [[18, 19],
        [20, 21],
        [22, 23]]])

In [19]:
np.swapaxes(arr, axis1=2, axis2=1)

array([[[ 0,  4,  8],
        [ 1,  5,  9],
        [ 2,  6, 10],
        [ 3,  7, 11]],

       [[12, 16, 20],
        [13, 17, 21],
        [14, 18, 22],
        [15, 19, 23]]])

# 1. Universal 함수

ufunc라고 불리는 유니버셜 함수는 ndarray 안에 있는 데이터 원소별로 연산을 수행하는 함수이다. 유니버셜 함수는 하나 이상의 스칼라 값을 받아서 하나 이상의 스칼라 결과 값을 반환하는 간단한 함수를 고속으로 수행할 수 있는 백터화된 래퍼 함수라고 생각하면 된다.

In [23]:
arr = np.arange(10)
arr

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

###### <span style="color:blue">Example 1</span>

In [24]:
# square root (sqrt)
np.sqrt(arr)

array([0.        , 1.        , 1.41421356, 1.73205081, 2.        ,
       2.23606798, 2.44948974, 2.64575131, 2.82842712, 3.        ])

In [25]:
# Exponential
np.exp(arr)

array([1.00000000e+00, 2.71828183e+00, 7.38905610e+00, 2.00855369e+01,
       5.45981500e+01, 1.48413159e+02, 4.03428793e+02, 1.09663316e+03,
       2.98095799e+03, 8.10308393e+03])

In [28]:
x = np.random.randn(8)
y = np.random.randn(8)

In [30]:
x

array([ 0.28636379,  0.36526543,  0.57746448,  0.49475175,  0.45598641,
       -0.08985975, -2.60049156,  0.0428598 ])

In [31]:
y

array([-0.50062007, -1.60319095, -0.57306091,  1.60194115,  1.76101137,
        0.11087346,  0.55607264,  1.6968578 ])

In [33]:
# x, y maximum (element wise operation)
np.maximum(x, y)

array([0.28636379, 0.36526543, 0.57746448, 1.60194115, 1.76101137,
       0.11087346, 0.55607264, 1.6968578 ])

### 단항 유니버셜 함수

- abs: 각 원소의 절대값을 구한다.
- sqrt: 각 원소의 제곱근을 구한다.
- square: 각 원소의 제곱을 구한다.
- sign: 각 원소의 부호를 계산한다.
- ceil, floor: 각 원소의 소수자리를 올리거나 내린다.
- rint: 각 원소의 소수자리를 반올림한다.
- sin, cos, tan: 일반 삼각함수
- sinh, cosh, tanh: 쌍곡삼각 함수
- arccos, arccosh, arcsinh: 역삼각함수

### 이항 유니버셜 함수

- add, subtract, multiply: 두 배열에서 같은 위치 원소끼리 더하고, 빼고, 곱한다.
- divide: 첫 번째 배열에서 두 번째 배열의 원소를 나눈다.
- power: 첫 번째 배열의 원소에 두 번째 배열의 원소만큼 제곱한다.
- maximum, minimum: 두 원소 중 큰 값, 작은 값을 반환한다.
- mod: 첫 번째 배열의 원소에 두 번째 배열의 원소를 나눈 나머지를 구한다.
- greater, less, equal: 각각 두 원소 간의 비교 연산 결과를 불리언 배열로 반환한다.
- logical_and, logical_or, logical_xor: 각각 두 원소 간의 논리 연산을 배열로 반환한다.

# 2. 배열 연산

### 1. 조건절 표현하기

In [34]:
xarr = np.array([1.1, 1.2, 1.3, 1.4, 1.5])
yarr = np.array([2.1, 2.2, 2.3, 2.4, 2.5])
cond = np.array([True, False, True, True, False])

###### <span style="color:blue">Example 2. </span>

In [40]:
# cond가 True 이면 xarr value, False 이면 yarr value  
result = np.where(cond, xarr, yarr)

In [41]:
result

array([1.1, 2.2, 1.3, 1.4, 2.5])

In [42]:
arr = np.random.randn(4, 4)
arr

array([[-1.15475695, -1.03813181,  0.49781654,  0.69354848],
       [ 0.71393681, -0.10228161, -0.1038017 ,  0.29087965],
       [ 0.67607682,  0.91381831, -0.46189917,  1.71057972],
       [-0.05669396,  0.67787833, -1.07706583, -0.71196781]])

In [44]:
# arr가 0보다 크면 2, 작으면 -2 
np.where(arr > 0, 2, -2)

array([[-2, -2,  2,  2],
       [ 2, -2, -2,  2],
       [ 2,  2, -2,  2],
       [-2,  2, -2, -2]])

### 2. 수학 메서드와 통계 메서드

배열 전체 혹은 배열에서 한 축에 따르는 자료에 대한 통계를 계산하기 위한 수학 함수는 배열 메서드로 사용할 수 있다. 전체의 합이나 평균, 표준편차는 Numpy의 최상위 함수를 이용하거나, 배열의 인스턴스 메서드를 사용해서 구할 수 있다.

In [45]:
arr = np.random.rand(5, 4)
arr

array([[0.87846561, 0.87071438, 0.98178078, 0.33338742],
       [0.36579345, 0.56953929, 0.89249636, 0.88876875],
       [0.80534257, 0.7127981 , 0.44933907, 0.28787047],
       [0.93948483, 0.58965736, 0.09588624, 0.14842608],
       [0.32195149, 0.85338679, 0.78529503, 0.10125597]])

In [48]:
arr.mean()

0.5935820018239027

In [47]:
np.mean(arr)

0.5935820018239027

- mean이나 sum 같은 함수는 선택적으로 axis 인자를 받아 해당 axis에 대한 통계를 계산하고 차수 낮은 배열을 반환한다.

In [49]:
np.std(arr)

0.2970337778478546

###### <span style="color:blue">Example 3</span>

In [50]:
# arr 전체 합
np.sum(arr)

11.871640036478055

In [51]:
# arr 전체 평균
np.mean(arr)

0.5935820018239027

In [53]:
arr = np.array([[0,1,2,2,2],[3,4,5,5,5],[6,7,8,8,8]])
print(arr.shape)

(3, 5)


In [55]:
arr.shape

(3, 5)

In [56]:
# axis1 기준으로 평균
np.mean(arr, axis=1)

array([1.4, 4.4, 7.4])

In [57]:
# axis0 기준으로 합
np.mean(arr, axis=0)

array([3., 4., 5., 5., 5.])

In [59]:
arr = np.array([[0,1,2],[3,4,5],[6,7,8]])
arr

array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])

In [62]:
# axis0 기준 누적합(cumprod)
np.cumsum(arr, axis=0)

array([[ 0,  1,  2],
       [ 3,  5,  7],
       [ 9, 12, 15]])

In [64]:
# axis1 기준 누적곱(cumprod)
np.cumprod(arr, axis=1)

array([[  0,   0,   0],
       [  3,  12,  60],
       [  6,  42, 336]])

### 3. 정렬

- np.sort 메서드는 배열을 직접 변경하지 않고 정렬된 결과를 가지고 있는 복사본을 반환한다.

In [66]:
arr = np.random.randn(8)
arr

array([-2.26987731,  0.67086255, -1.23433134, -0.61944314, -1.15267474,
       -0.2042295 ,  1.33981148, -0.75681379])

In [67]:
arr.sort()
arr

array([-2.26987731, -1.23433134, -1.15267474, -0.75681379, -0.61944314,
       -0.2042295 ,  0.67086255,  1.33981148])

In [68]:
arr = np.random.randn(5, 3)
arr

array([[-1.54181795, -0.17642221, -1.55584111],
       [-1.30516761, -1.03192205,  0.80154251],
       [-1.57557649,  1.95491416,  0.21125343],
       [ 0.03663373, -0.13802918,  1.28372202],
       [ 0.57230006, -0.74266414,  1.08899714]])

In [69]:
arr.sort(axis=1)
arr

array([[-1.55584111, -1.54181795, -0.17642221],
       [-1.30516761, -1.03192205,  0.80154251],
       [-1.57557649,  0.21125343,  1.95491416],
       [-0.13802918,  0.03663373,  1.28372202],
       [-0.74266414,  0.57230006,  1.08899714]])

In [71]:
arr.sort(axis=0)
arr

array([[-1.57557649, -1.54181795, -0.17642221],
       [-1.55584111, -1.03192205,  0.80154251],
       [-1.30516761,  0.03663373,  1.08899714],
       [-0.74266414,  0.21125343,  1.28372202],
       [-0.13802918,  0.57230006,  1.95491416]])

## 3. 선형대수

### 내적은 중요하다.

In [72]:
x = np.array([[1.,2.,3.], [4.,5.,6.]])
y = np.array([[6.,23.], [-1, 7], [8, 9]])

In [73]:
print(x.shape)
x

(2, 3)


array([[1., 2., 3.],
       [4., 5., 6.]])

In [74]:
print(y.shape)
y

(3, 2)


array([[ 6., 23.],
       [-1.,  7.],
       [ 8.,  9.]])

###### <span style="color:blue">Example 4</span>

In [76]:
# x, y dot product 
x.dot(y)

array([[ 28.,  64.],
       [ 67., 181.]])

In [77]:
from numpy.linalg import inv

In [78]:
X = np.random.randn(5, 5)
X

array([[-0.76168416, -0.10176857, -0.05331547, -0.13998977, -0.60070199],
       [-0.38431146,  0.45877288, -0.60391685,  0.21759434, -0.61197526],
       [ 1.35614832,  1.35808586, -0.56034699,  0.35514587,  1.57751471],
       [-0.20475524,  0.32472009, -1.85664107,  0.05470124, -1.44136566],
       [-0.84006592, -0.73592574,  0.89462997, -0.51479285, -1.10321439]])

In [80]:
# mat = X.T와 X의 내적
X.T.dot(X)

array([[ 3.31463178,  2.29470769, -0.85860309,  0.92589402,  4.05397821],
       [ 2.29470769,  2.71225642, -2.29390402,  0.99300342,  2.26661883],
       [-0.85860309, -2.29390402,  4.92902567, -0.88505987,  1.20678328],
       [ 0.92589402,  0.99300342, -0.88505987,  0.46107692,  1.00025999],
       [ 4.05397821,  2.26661883,  1.20678328,  1.00025999,  6.51852624]])

In [81]:
# mat의 역행렬
inv(X)

array([[-2.16667839,  0.19638484,  0.11693341,  0.34340587,  0.78936253],
       [ 0.35037465,  0.87702557,  1.02319327, -0.13838017,  0.96660283],
       [-1.16148655,  1.13328497,  0.08665747, -0.51456441,  0.79997491],
       [-2.79161953,  2.92232016, -1.59258856, -0.94242939, -1.14701437],
       [ 1.7769058 , -1.17920935,  0.04183552, -0.14669395, -0.9683595 ]])

# Axis

In [82]:
arr = np.arange(4*3*2*3).reshape(4,3,2,3)

In [84]:
arr.shape

(4, 3, 2, 3)

In [86]:
arr.mean(axis=0).shape

(3, 2, 3)

In [87]:
arr.mean(axis=1).shape

(4, 2, 3)

In [88]:
arr.mean(axis=2).shape

(4, 3, 3)

In [89]:
arr.mean(axis=3).shape

(4, 3, 2)

In [90]:
arr.mean(axis=-1).shape

(4, 3, 2)

## Sort

In [99]:
arr2 = np.random.randn(2,3,2)
arr2

array([[[ 1.0479796 ,  0.32160389],
        [ 0.0272431 , -0.67855448],
        [-1.3371566 ,  0.80446546]],

       [[ 0.60658092, -0.43662668],
        [ 1.20295195, -0.49992059],
        [ 0.37571249,  0.65806016]]])

In [102]:
arr2.sort(axis=0)
arr2

array([[[ 0.60658092, -0.43662668],
        [ 0.0272431 , -0.67855448],
        [-1.3371566 ,  0.65806016]],

       [[ 1.0479796 ,  0.32160389],
        [ 1.20295195, -0.49992059],
        [ 0.37571249,  0.80446546]]])

In [103]:
arr2.sort(axis=1)
arr2

array([[[-1.3371566 , -0.67855448],
        [ 0.0272431 , -0.43662668],
        [ 0.60658092,  0.65806016]],

       [[ 0.37571249, -0.49992059],
        [ 1.0479796 ,  0.32160389],
        [ 1.20295195,  0.80446546]]])

In [104]:
arr2.sort(axis=2)
arr2

array([[[-1.3371566 , -0.67855448],
        [-0.43662668,  0.0272431 ],
        [ 0.60658092,  0.65806016]],

       [[-0.49992059,  0.37571249],
        [ 0.32160389,  1.0479796 ],
        [ 0.80446546,  1.20295195]]])

In [105]:
help(arr2.sort)

Help on built-in function sort:

sort(...) method of numpy.ndarray instance
    a.sort(axis=-1, kind='quicksort', order=None)
    
    Sort an array, in-place.
    
    Parameters
    ----------
    axis : int, optional
        Axis along which to sort. Default is -1, which means sort along the
        last axis.
    kind : {'quicksort', 'mergesort', 'heapsort', 'stable'}, optional
        Sorting algorithm. Default is 'quicksort'.
    order : str or list of str, optional
        When `a` is an array with fields defined, this argument specifies
        which fields to compare first, second, etc.  A single field can
        be specified as a string, and not all fields need be specified,
        but unspecified fields will still be used, in the order in which
        they come up in the dtype, to break ties.
    
    See Also
    --------
    numpy.sort : Return a sorted copy of an array.
    argsort : Indirect sort.
    lexsort : Indirect stable sort on multiple keys.
    searchsorted :