## 2.3.1 원소별 연산

In [12]:
# relu 연산
def naive_relu(x):
    assert len(x.shape) == 2     # x는 랭크-2 numpy 배열이다.
    x = x.copy()    # 입력 텐서 자체를 바꾸지 않고 복사한다.
    for i in range(x.shape[0]):
        for j in range(x.shape[1]):
            x[i, j] = max(x[i, j], 0)
    return x

def naive_add(x, y):
    assert len(x.shape) == 2     # x와 y는 랭크-2 numpy 배열이다.
    assert x.shape == y.shape
    x = x.copy()
    for i in range(x.shape[0]):
        for j in range(x.shape[1]):
            x[i, j] += y[i, j]
    return x

- 넘파이는 다음과 같은 원소별 연산을 엄청난 속도로 처리한다.
    - z = x + y  
    - z = np.maximum(x, 0.)  

In [10]:
import numpy as np
import time

x = np.random.random((20, 100))
y = np.random.random((20, 100))

t0 = time.time()

for _ in range(1000):
    z = x + y   # 원소별 덧셈
    z = np.maximum(x, 0.)   # 원소별 relu함수
print("걸린 시간: {0:.2f} s".format(time.time() - t0))

걸린 시간: 0.01 s


In [13]:
t0 = time.time()
for _ in range(1000):
    z = naive_add(x, y)
    z = naive_relu(z)
print("걸린 시간: {0:.2f} s".format(time.time() - t0))

걸린 시간: 1.88 s


## 2.3.2 브로드캐스팅
- https://numpy.org/doc/stable/user/basics.broadcasting.html

In [14]:
import numpy as np
X = np.random.random((32, 10))  # 크기가 (32, 10)인 랜덤한 행렬
y = np.random.random((10,))  # 크기가 (10,)인 랜덤한 행렬

In [15]:
y = np.expand_dims(y, axis=0)   # y의 크기는 (1, 10)
Y = np.concatenate([y] * 32, axis = 0)  # 축 0(행)을 따라 32번 반복 => (32, 10)이 됨

In [16]:
X+Y

array([[1.42605891, 1.75958601, 0.22955023, 1.28992232, 1.26710511,
        1.27350761, 1.51828205, 0.45131644, 1.40959488, 1.24468109],
       [1.49726246, 1.69223063, 0.72761234, 0.8880135 , 0.99957371,
        0.69751699, 0.81654869, 0.39498451, 1.17225092, 1.1816659 ],
       [0.94906471, 1.01544566, 1.05797533, 1.20223005, 0.6124968 ,
        1.20594446, 1.36353713, 0.40309306, 1.74641453, 0.83561549],
       [1.24282125, 1.57078294, 0.1244762 , 0.81458703, 0.97837627,
        0.91123097, 0.97770359, 0.96828204, 0.98719718, 0.90769705],
       [1.07926692, 1.83101566, 0.92276879, 1.27553495, 1.39852479,
        0.92993879, 0.95436069, 0.26534566, 1.8107677 , 0.52858115],
       [1.53593385, 1.70396399, 0.92856855, 0.80799966, 0.96576913,
        0.93699004, 1.11079204, 0.4993366 , 1.8426821 , 0.56482864],
       [0.67045186, 1.94217943, 0.50969127, 1.16403195, 1.10332527,
        0.71021806, 1.08715998, 1.01135154, 1.61514744, 0.67857378],
       [0.76974192, 1.13037684, 0.8242239

- 단순하게 구현

In [17]:
def naive_add_matrix_and_vector(x, y):
    assert len(x.shape) == 2
    assert len(y.shape) == 1
    assert x.shape[1] == y.shape[0]
    x = x.copy()
    for i in range(x.shape[0]):
        for j in range(x.shape[1]):
            x[i, j] += y[j]
    return x

- 크기가 다른 두 텐서에 브로드캐스팅을 원소별 maximum 연산을 적용하는 예

In [20]:
import numpy as np

x = np.random.random((64, 3, 32, 10))
y = np.random.random((32, 10))
z = np.maximum(x, y)    # 출력z크기는 x와 동일하게 (64, 3, 32, 10)입니다.
z.shape

(64, 3, 32, 10)