# axis
- axis에 대한 이해
- axis 를 파라미터로 갖는 함수에 대한 이해

In [1]:
"""
numpy 의 많은 함수들은 axis=  파라미터를 갖고 있습니다. 
axis (축) 은 각 '차원' 을 의미합니다.
1차원 array 라면  각 차원에 대한 axis 값은 0  <- 1 입니다.
2차원 array 라면  각 차원에 대한 axis 값은 0, 1  <- 2개 입니다.
3차원 array 라면  각 차원에 대한 axis 값은 0, 1, 2  <- 3개 입니다. 

axis= 값을 명시하면 그 함수의 연산 은 해당 axis(축) 에 따라서 연산을 수행함

과연 '따라서' 의 의미가 무엇인지 실습을 통해 이해해봅시다
"""
None

In [2]:
import numpy as np

#### axis 이해하기
 - 몇몇 함수에는 axis keyword 파라미터가 존재
 - axis값이 없는 경우에는 **전체 데이터**에 대해 적용
 - axis값이 있는 경우에는, 해당 axis를 **따라서** 연산 적용

* axis를 파라미터로 갖는 함수를 이용하기
 - 거의 대부분의 연산 함수들이 axis 파라미터를 사용
 - 이 경우, 해당 값이 주어졌을 때, 해당 axis를 **따라서** 연산이 적용
   - 따라서 결과는 해당 axis가 제외된 나머지 차원의 데이터만 남게 됨
 - 예) np.sum, np.mean, np.any 등등
 

In [3]:
x1 = np.arange(15)
x1

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14])

In [None]:
# np.sum
# .SHIFT+TAB 눌러서 도움말 확인
# axis=None 적용

In [4]:
np.sum(x1)

105

In [5]:
np.sum(x1, axis=None)

105

## 1차원 데이터에 적용하기

In [7]:
# np.sum(x1, axis=1)  # 에러

In [8]:
np.sum(x1, axis=0)
# 어짜피 vector 에선 축(axis, 차원) 이 1개다.  
#   array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14])
# 그래서 axis=0   (0번째 차원) 을 '따라서' sum 수행

105

## 2차원 행렬에 적용

In [9]:
x2 = x1.reshape(3, 5)
x2

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])

In [10]:
#  행 이 증가하는 방향  (axis=0)
#    [0, ..]
#    [5, ..]
#    [10, ..]

#  열 이 증가하는 방향  (axis=1)
#     [ 0, →  1, →  2, →  3, →  4]   

In [11]:
np.sum(x2)  # 전체 데이터 axis=None

105

In [12]:
np.sum(x2, axis=0)  #  axis=0 첫번째 차원 '행' 방향을 따라서 연산 수행

# 결과 고찰
#   x2 (3, 5) shape 에서 axis=0 의 차원이 없어지면서 (5,) shape의 결과가 나온다
#  각 원소는 x2 (3, 5) shape 에서 axis=0 의 차원의 크기(3)개를 sum() 연산한 결과다
#     15 = 0 + 5 + 10  <-- 3개 sum()

array([15, 18, 21, 24, 27])

## 3차원 텐서에 적용하기

In [13]:
x3 = np.arange(24).reshape(3, 4, 2)
x3

array([[[ 0,  1],
        [ 2,  3],
        [ 4,  5],
        [ 6,  7]],

       [[ 8,  9],
        [10, 11],
        [12, 13],
        [14, 15]],

       [[16, 17],
        [18, 19],
        [20, 21],
        [22, 23]]])

In [14]:
np.sum(x3)

276

In [15]:
np.sum(x3, axis=0)  # 결과 shape 는? --> (4, 2)

array([[24, 27],
       [30, 33],
       [36, 39],
       [42, 45]])

In [17]:
x3

array([[[ 0,  1],
        [ 2,  3],
        [ 4,  5],
        [ 6,  7]],

       [[ 8,  9],
        [10, 11],
        [12, 13],
        [14, 15]],

       [[16, 17],
        [18, 19],
        [20, 21],
        [22, 23]]])

In [16]:
np.sum(x3, axis=1) # 결과 shape  는? --> (3, 2)

array([[12, 16],
       [44, 48],
       [76, 80]])

In [19]:
x3

array([[[ 0,  1],
        [ 2,  3],
        [ 4,  5],
        [ 6,  7]],

       [[ 8,  9],
        [10, 11],
        [12, 13],
        [14, 15]],

       [[16, 17],
        [18, 19],
        [20, 21],
        [22, 23]]])

In [18]:
np.sum(x3, axis=-1) # axis=-1 음수 지원 --> (3, 4)

array([[ 1,  5,  9, 13],
       [17, 21, 25, 29],
       [33, 37, 41, 45]])

## axis의 값이 튜플일 경우
 - 해당 튜플에 명시된 모든 axis에 대해서 연산

In [20]:
x3

array([[[ 0,  1],
        [ 2,  3],
        [ 4,  5],
        [ 6,  7]],

       [[ 8,  9],
        [10, 11],
        [12, 13],
        [14, 15]],

       [[16, 17],
        [18, 19],
        [20, 21],
        [22, 23]]])

In [21]:
x3.shape

(3, 4, 2)

In [22]:
np.sum(x3, axis=(0, 1))  
# 결과 shape는 (2,)  <-- 1차원
# sum() 에 동원된 데이터 개수는 ? 3 x 4 개

array([132, 144])

![image.png](attachment:image.png)

In [25]:
x3

array([[[ 0,  1],
        [ 2,  3],
        [ 4,  5],
        [ 6,  7]],

       [[ 8,  9],
        [10, 11],
        [12, 13],
        [14, 15]],

       [[16, 17],
        [18, 19],
        [20, 21],
        [22, 23]]])

In [23]:
np.sum(x3, axis=(1, 2))
# 결과 shape는?  (3, )
# sum() 에 동원된 데이터 개수는?  4 x 2 개

array([ 28,  92, 156])

![image.png](attachment:image.png)

dedicated to SUJI

In [26]:
x3.shape

(3, 4, 2)

In [28]:
x3

array([[[ 0,  1],
        [ 2,  3],
        [ 4,  5],
        [ 6,  7]],

       [[ 8,  9],
        [10, 11],
        [12, 13],
        [14, 15]],

       [[16, 17],
        [18, 19],
        [20, 21],
        [22, 23]]])

In [27]:
np.sum(x3, axis=(0, 2))
# 결과shape => (4, )
# sum() 에 동원된 개수 => 3 x 2

array([51, 63, 75, 87])

![image.png](attachment:image.png)

In [29]:
np.sum(x3, axis=(0, 1, 2))

276

In [30]:
# axis 가 처음에는 (당연히) 어렵습니다.
# 3차원 정도 까지는 그림을 그려 가시면서 이해해보시길 바랍니다.

# axis= 파라미터가 있는 함수들의 동작은 예외없이 위와 같이 동작한다!

# axis=  는 numpy 뿐 아니라 pandas 에서도 사용된다.
# pandas 는 어짜피 2차원 행렬.  즉 axis = 0 or 1 밖에 없다


