# 넘파이 배열의 axis, keepdims 인자
- 벡터는 차원이 하나이기 때문에 axis 인자를 적용해도 의미가 없다.
- 하지만 행렬은 다르다.

In [1]:
import numpy as np

![%E1%84%89%E1%85%B3%E1%84%8F%E1%85%B3%E1%84%85%E1%85%B5%E1%86%AB%E1%84%89%E1%85%A3%E1%86%BA%202023-07-10%20%E1%84%8B%E1%85%A9%E1%84%92%E1%85%AE%205.52.03.png](attachment:%E1%84%89%E1%85%B3%E1%84%8F%E1%85%B3%E1%84%85%E1%85%B5%E1%86%AB%E1%84%89%E1%85%A3%E1%86%BA%202023-07-10%20%E1%84%8B%E1%85%A9%E1%84%92%E1%85%AE%205.52.03.png)

## ✅ axis

### 2차원
- axis=0) 행별로 더하기 때문에 행 차원은 사라지고 열 차원이 남는다.
- axis=1) 열별로 더하기 때문에 열 차원은 사라지고 행 차원이 남는다.
- 구체적 예시) 과목별/학생별 점수 합

In [2]:
a = np.arange(12).reshape((3, -1))

print('a =\n', a)
print('\naxis=0 합:\n', a.sum(axis=0))

a =
 [[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]

axis=0 합:
 [12 15 18 21]


In [3]:
a = np.arange(12).reshape((3, -1))

print('a =\n', a)
print('\naxis=1 합:\n', a.sum(axis=1))

a =
 [[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]

axis=1 합:
 [ 6 22 38]


### 3차원 이상
- axis=0) 채널별로 더하기 때문에 채널 차원은 사라진다.
- axis=1) 행별로 더하기 때문에 행 차원은 사라진다.
- axis=2) 열별로 더하기 때문에 열 차원은 사라진다.

In [4]:
a = np.arange(24).reshape((2, 3, 4))
print('a =\n', a)

print('\na.sum(axis=0) =\n', a.sum(axis=0))

# 브로드캐스팅 연산 불가
print('\na.sum(axis=1) =\n', a.sum(axis=1))

print('\na.sum(axis=2) =\n', a.sum(axis=2))

a =
 [[[ 0  1  2  3]
  [ 4  5  6  7]
  [ 8  9 10 11]]

 [[12 13 14 15]
  [16 17 18 19]
  [20 21 22 23]]]

a.sum(axis=0) =
 [[12 14 16 18]
 [20 22 24 26]
 [28 30 32 34]]

a.sum(axis=1) =
 [[12 15 18 21]
 [48 51 54 57]]

a.sum(axis=2) =
 [[ 6 22 38]
 [54 70 86]]


## ✅ keepdims
차원은 보존함으로써 유연한 브로드캐스팅 연산이 가능하다.

### 2차원

In [5]:
a = np.arange(12).reshape((3, -1))
print('a =\n', a)

sum_subject = a.sum(axis=0, keepdims=True)
print('\na.sum(axis=0, keepdims=True) =\n', sum_subject)

a =
 [[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]

a.sum(axis=0, keepdims=True) =
 [[12 15 18 21]]


### 3차원 이상

In [6]:
a = np.arange(24).reshape((2, 3, 4))
print('a =\n', a)

print('\na.sum(axis=0, keepdims=True) =\n', a.sum(axis=0, keepdims=True), a.sum(axis=0, keepdims=True).shape)
print('\na.sum(axis=1, keepdims=True) =\n', a.sum(axis=1, keepdims=True), a.sum(axis=1, keepdims=True).shape)
print('\na.sum(axis=2, keepdims=True) =\n', a.sum(axis=2, keepdims=True), a.sum(axis=2, keepdims=True).shape)

a =
 [[[ 0  1  2  3]
  [ 4  5  6  7]
  [ 8  9 10 11]]

 [[12 13 14 15]
  [16 17 18 19]
  [20 21 22 23]]]

a.sum(axis=0, keepdims=True) =
 [[[12 14 16 18]
  [20 22 24 26]
  [28 30 32 34]]] (1, 3, 4)

a.sum(axis=1, keepdims=True) =
 [[[12 15 18 21]]

 [[48 51 54 57]]] (2, 1, 4)

a.sum(axis=2, keepdims=True) =
 [[[ 6]
  [22]
  [38]]

 [[54]
  [70]
  [86]]] (2, 3, 1)


## ✅ 예시

In [7]:
n_exam, n_student, n_class = 4, 3, 4
m_score, M_score = 0, 100
scores = np.random.randint(
    m_score,
    M_score,
    size=(n_exam, n_student, n_class)
)

In [8]:
print('scores:\n', scores)

# 학생별 과목 평균점수 (4회의 모의고사에 걸친)
print('\nnp.mean(scores, axis=0) =\n', np.mean(scores, axis=0))

# 모의고사별 과목 평균점수
print('\nnp.mean(scores, axis=1) =\n', np.mean(scores, axis=1))

# 모의고사별 학생의 평균점수
print('\nnp.mean(scores, axis=2) =\n', np.mean(scores, axis=2))

scores:
 [[[69 28 65 64]
  [26 24 34 89]
  [ 4 83 92 98]]

 [[28 98 44 27]
  [ 8 27 76 23]
  [25 54 62 85]]

 [[67 73 55 32]
  [47 62 98 39]
  [84  3 21 44]]

 [[76 31 66 66]
  [87 21  7 77]
  [94 14 85 67]]]

np.mean(scores, axis=0) =
 [[60.   57.5  57.5  47.25]
 [42.   33.5  53.75 57.  ]
 [51.75 38.5  65.   73.5 ]]

np.mean(scores, axis=1) =
 [[33.         45.         63.66666667 83.66666667]
 [20.33333333 59.66666667 60.66666667 45.        ]
 [66.         46.         58.         38.33333333]
 [85.66666667 22.         52.66666667 70.        ]]

np.mean(scores, axis=2) =
 [[56.5  43.25 69.25]
 [49.25 33.5  56.5 ]
 [56.75 61.5  38.  ]
 [59.75 48.   65.  ]]
