### 1.3 배열의 연산(Operation)

In [3]:
import numpy as np

- 백터화 연산

In [4]:
x = np.arange(1, 100001)
y = np.arange(100001, 200001)

In [5]:
%%time
z = np.empty_like(x)
for i in range(100000):
    z[i] = x[i] + y[i]

CPU times: total: 46.9 ms
Wall time: 55 ms


In [6]:
%time z = x + y

CPU times: total: 0 ns
Wall time: 1e+03 µs


In [7]:
a = np.array([1, 2, 3, 4])
b = np.array([4, 2, 2, 4])
a == b

array([False,  True, False,  True])

In [8]:
a >= b

array([False,  True,  True,  True])

In [9]:
np.exp(a)

array([ 2.71828183,  7.3890561 , 20.08553692, 54.59815003])

In [10]:
10 ** a

array([   10,   100,  1000, 10000], dtype=int32)

In [11]:
5 * a

array([ 5, 10, 15, 20])

In [12]:
5 + a

array([6, 7, 8, 9])

- 차원 축소 연산

In [13]:
x = np.arange(1, 5)
np.sum(x)

10

In [14]:
x.sum()

10

In [15]:
x.min(), x.max(), x.mean()      # 최소, 최대, 평균

(1, 4, 2.5)

In [16]:
# 대표값: 평균, 중앙값
np.mean(x), np.median(x)    

(2.5, 2.5)

In [17]:
# 통계: 분산, 표준편차
np.var(x), np.std(x)

(1.25, 1.118033988749895)

In [18]:
# 최솟값, 최댓값의 인덱스
x.argmin(), x.argmax() 

(0, 3)

- all / any

In [19]:
# all 은 모두다 True 인지 묻는거고(and), any는 true가 있는지 묻는것(or)
np.all(np.array([True, True, False])), np.any(np.array([True, True, False]))

(False, True)

In [20]:
np.all(a == a)

True

- 2차원 이상의 연산

In [21]:
a = np.arange(1, 7).reshape(2, 3)
a

array([[1, 2, 3],
       [4, 5, 6]])

In [22]:
# 모든 원소의 합과 평균
np.sum(a), np.mean(a)

(21, 3.5)

In [23]:
# axis = 0 각 좌표(row, col)에서 row를 변경시켜가면서 액세스 인덱스 좌표의 앞이 바뀌는것(0,0)(1,0)(2,0)...
np.sum(a, axis=0), np.mean(a, axis=0)

(array([5, 7, 9]), array([2.5, 3.5, 4.5]))

In [24]:
# axis = 2 각 좌표(row, col)에서 col을 변경시켜가면서 액세스 인덱스 좌표의 뒤가 바뀌는것 (0,0)(0,1)(0,2)...
np.sum(a, axis=1), np.mean(a, axis=1)

(array([ 6, 15]), array([2., 5.]))

In [25]:
b = np.arange(1, 13).reshape(2, 2, -1)
b

array([[[ 1,  2,  3],
        [ 4,  5,  6]],

       [[ 7,  8,  9],
        [10, 11, 12]]])

In [26]:
np.sum(b, axis=0)

array([[ 8, 10, 12],
       [14, 16, 18]])

In [27]:
np.sum(b, axis=1)

array([[ 5,  7,  9],
       [17, 19, 21]])

In [28]:
# axis = 2 는 리스트끼리(?) 더하는 것 
np.sum(b ,axis=2)

array([[ 6, 15],
       [24, 33]])

### 연습문제

![image.png](attachment:image.png)

In [29]:
np.random.seed = 2023
x = np.round(np.random.random(30).reshape(5, 6) * 10, 4)
x

array([[6.948 , 3.9862, 6.133 , 7.3814, 5.3362, 7.8348],
       [8.8729, 7.1217, 3.1981, 9.0652, 3.471 , 7.015 ],
       [6.7558, 1.8676, 8.7197, 6.5415, 5.2604, 8.8341],
       [3.0692, 5.9472, 9.5503, 0.9058, 0.745 , 2.9716],
       [0.7663, 5.5525, 1.2654, 5.0474, 0.6168, 9.1458]])

In [30]:
# 1. 전체의 최댓값
np.max(x)

9.5503

In [31]:
# 2. 각 행의 합
np.sum(x, axis=1)

array([37.6196, 38.7439, 37.9791, 23.1891, 22.3942])

In [32]:
# 3. 각 행의 최댓값
np.max(x, axis=1)

array([7.8348, 9.0652, 8.8341, 9.5503, 9.1458])

In [33]:
# 4. 각 열의 평균
np.mean(x, axis=0)

array([5.28244, 4.89504, 5.7733 , 5.78826, 3.08588, 7.16026])

In [34]:
# 5. 각 열의 최솟값
np.min(x, axis=0)

array([0.7663, 1.8676, 1.2654, 0.9058, 0.6168, 2.9716])

- 정렬(sort)

In [35]:
a = np.array([[4,  3,  5,  7],
              [1, 12, 11,  9],
              [2, 15,  1, 14]])
a

array([[ 4,  3,  5,  7],
       [ 1, 12, 11,  9],
       [ 2, 15,  1, 14]])

In [36]:
np.sort(a)      # default axis=1

array([[ 3,  4,  5,  7],
       [ 1,  9, 11, 12],
       [ 1,  2, 14, 15]])

In [37]:
np.sort(a, axis=0)

array([[ 1,  3,  1,  7],
       [ 2, 12,  5,  9],
       [ 4, 15, 11, 14]])

In [38]:
#내림차순 정렬, axis=1인 경우,
np.sort(a, axis=1)[:, ::-1]

array([[ 7,  5,  4,  3],
       [12, 11,  9,  1],
       [15, 14,  2,  1]])

In [39]:
#내림차순 정렬, axis=0인 경우,
np.sort(a, axis=0)[::-1, :]

array([[ 4, 15, 11, 14],
       [ 2, 12,  5,  9],
       [ 1,  3,  1,  7]])

In [40]:
# sort()는 자기 파괴적(in-place) method
a.sort(axis=1)

In [41]:
a

array([[ 3,  4,  5,  7],
       [ 1,  9, 11, 12],
       [ 1,  2, 14, 15]])

In [42]:
a = np.array([42, 38, 12, 25])
j = np.argsort(a)
j

array([2, 3, 1, 0], dtype=int64)

In [43]:
a[j]

array([12, 25, 38, 42])

- 연습문제 3.3.2

![image.png](attachment:image.png)

In [44]:
x= np.array([[ 1, 2, 3, 4],
[ 46, 99, 100, 71],
[ 81, 59, 90, 100]])
x1_argsort = np.argsort(x[1])
x = x[:,x1_argsort]
x


array([[  1,   4,   2,   3],
       [ 46,  71,  99, 100],
       [ 81, 100,  59,  90]])

In [45]:
score = np.array([[ 1, 2, 3, 4],
[ 46, 99, 100, 71],
[ 81, 59, 90, 100]])

In [46]:
# 영어 성적을 argsort() 하여 인덱스를 구함
indices = np.argsort(score[1]) # 정렬후의 인덱스 순서 값
indices

array([0, 3, 1, 2], dtype=int64)

In [47]:
# 인덱스를 내림차순으로 정렬
indices[::-1]

array([2, 1, 3, 0], dtype=int64)

In [48]:
# 모든 행을 영어성적 내림차순으로 정렬
score[:, indices[::-1]]         #[행, 열]

array([[  3,   2,   4,   1],
       [100,  99,  71,  46],
       [ 90,  59, 100,  81]])

In [50]:
# 한 줄로 
score[:, np.argsort(score[1])[::-1]]

array([[  3,   2,   4,   1],
       [100,  99,  71,  46],
       [ 90,  59, 100,  81]])