## 예제로 배우는 파이토치(Pytorch)

### 특징

- Numpy와 유사하지만 GPU 상에서 실행 가능한 N차원 Tensor
- 신경망을 구성하고 학습하는 과정에서의 자동 미분

## Pytorch Network Training

### Input

1. realizations of Independent variable 
2. Initial values of all weights 
3. Build a Network 

    __def__ __ init __: torch.nn.Module $\leftarrow$ super & Set All Parameters of Network
    
    __def__ forward: Build a Network using __  init  __ 

4. realizations of Dependent variable   
5. Loss function (torch.nn.MSELoss)
6. Otimization (torch.optim.SGD)


### Output

1. Updated all weights 

### Process
For $i$ = 1:  
1. Calculate Forward values using Initial values(2), Forward function(3) and Independent variable realization(1) 
2. Calculate Loss values using Forward values, Loss function(5) and Dependent variable realization(4) 
3. Calculate Gradient using (5) and (6)

    - optimizer.zero_grad() # initialize gradient
    
    - loss.backward() # calculate gradient

4. Update all weights
  
    - optimizer.step() # update weight


## Calculate Gradient



### 1) Data Matrix

<br>

$$ X = \begin{bmatrix} x_{11} &...& x_{1p} \\ & \vdots & \\ x
_{n1}&  ... & x_{np}  \end{bmatrix}   : n \times p$$

<br>
$$ Y = \begin{bmatrix} y_{11} &...& y_{1k} \\ & \vdots & \\ y
_{n1}&  ... & y_{nk}  \end{bmatrix}   : n \times k$$
<br>

$$where,$$
<br>

$$y_{ij} \in \{ 0,1 \}$$

$$and$$ 
$$\sum_{j=1}^k y_{ij} = 1$$

<br>

$$ W_1 = \begin{bmatrix} w_{111} & w_{112} &...& w_{11h} \\ & & \vdots & \\ w
_{1p1}& w_{1p2} & ... & w_{1ph}  \end{bmatrix} : p \times h$$


<br>

$$ W_2 = \begin{bmatrix} w_{211} & w_{212} &...& w_{21k} \\& & \vdots & \\ w_{2h1}& w_{2h2} & ... & w_{2hk}  \end{bmatrix}  : h \times k$$


<br>


### 2) Feed Forward

<br>

$$ H = X \cdot W_1$ : $n \times h$$

$$ H_{relu} = ReLU(H) $ : $n \times h$$

$$ Y_{pred} = H_{relu} \cdot W_2 $ : $n \times k$$


<br>



### 3) Back Propagation

<br>

$$ l(W_1, W_2) =  Tr[(Y_{pred} - Y )^T (Y_{pred} - Y)] = \sum_{i=1}^{n} \sum_{j=1}^{k} (y_{ij}^{pred} -y_{ij} )^2    : Scalar $$

</center>

<br>

<br>

$$W_{2}^{(t)} = W_{2}^{(t-1)} - \eta {\partial l(W_1, W_2) \over \partial W_{2} }$$ 

<br>

- grad_w2

$${\partial l(W_1, W_2) \over \partial W_{2} } =  \begin{bmatrix} {\partial l(W_1, W_2) \over \partial w_{211} } & {\partial l(W_1, W_2) \over \partial w_{212} } &...&   {\partial l(W_1, W_2) \over \partial w_{21k} } \\& & \vdots & \\ {\partial l(W_1, W_2) \over \partial w_{2h1} }& {\partial l(W_1, W_2) \over \partial w_{2h2} } & ... &  {\partial l(W_1, W_2) \over \partial w_{2hk} }  \end{bmatrix}  :h \times k $$


<br>

#### [Chain Rule]

$${\partial l(W_1, W_2) \over \partial w_{2im} } =  {\partial l(W_1, W_2) \over \partial y_{im}^{pred}} \cdot {\partial y_{im}^{pred} \over \partial w_{2im}}  $$

<br>

$${\partial y_{im}^{pred} \over \partial w_{2jm}} = h_{ij}^{relu} ,  \forall m \in \{1, ..., k\}$$

<br>

- grad_y_pred(usually calcuated by using a numerical differentiation)

$$  2(Y_{pred} - Y) 
= \begin{bmatrix} 2(y_{11}^{pred} - y_{11}) & 2(y_{12}^{pred} - y_{12}) &...&   2(y_{1k}^{pred} - y_{1k}) \\& & \vdots & \\ 2(y_{n1}^{pred} - y_{n1}) & 2(y_{n2}^{pred} - y_{n2}) & ... & 2(y_{nk}^{pred} - y_{nk}) \end{bmatrix}
= \begin{bmatrix} {\partial l(W_1, W_2) \over \partial y_{11}^{pred} } & {\partial l(W_1, W_2) \over \partial y_{12}^{pred} } &...&   {\partial l(W_1, W_2) \over \partial y_{1k}^{pred} } \\& & \vdots & \\ {\partial l(W_1, W_2) \over  \partial y_{n1}^{pred} }& {\partial l(W_1, W_2) \over \partial y_{n2}^{pred}} & ... &  {\partial l(W_1, W_2) \over \partial y_{nk}^{pred} }  \end{bmatrix} : n \times  k$$


<br>

- h_relu

$$ H_{relu} 
= \begin{bmatrix} h_{11}^{relu} & h_{12}^{relu} &...&   h_{1h}^{relu} \\& & \vdots & \\ h_{n1}^{relu} & h_{n2}^{relu} &...&   h_{nh}^{relu} \end{bmatrix}: n \times h
$$

<br>

$\Rightarrow$ we can obtain grad_w2 by h_relu.T.dot(grad_y_pred) in below python code.



<br>
<br>

$$W_{1}^{(t)} = W_{1}^{(t-1)} + \eta {\partial l(W_1, W_2) \over \partial W_{1} }$$

$${\partial l(W_1, W_2) \over \partial W_1} =  [{\partial H \over \partial W_1}]^T \cdot  { H_{relu} \over \partial H} ( {\partial l(W_1, W_2) \over \partial Y_{pred}} \cdot [{\partial Y_{pred}  \over \partial H_{relu}}]^T ) = [{\partial H \over \partial W_1}]^T \cdot  { H_{relu} \over \partial H} = [{\partial H \over \partial W_1}]^T \cdot grad_h
  $$


$\Rightarrow$ We only define the grad_h_relu as backword function in activation class.

# Numpy

In [None]:
import numpy as np

# N은 배치 크기이며, D_in은 입력의 차원입니다.
# H는 은닉층의 차원이며, D_out은 출력 차원입니다.

N, D_in, H, D_out = 64,1000,100,10

# 무작위의 입력과 출력 데이터를 생성합니다

x = np.random.randn(N, D_in)
y = np.random.randn(N, D_out)

# 무작위로 가중치를 초기화합니다.

w1 = np.random.randn(D_in , H)
w2 = np.random.randn(H, D_out)

learning_rate = 1e-6

for t in range(500):
  # 순전파 단계 : 예측값 y를 계산합니다.
  h = x.dot(w1) # N * H
  h_relu = np.maximum(h,0) # N*H
  y_pred = h_relu.dot(w2) # N*D_out

  # 손실(loss)을 계산하고 출력합니다.
  loss = np.square(y_pred - y).sum() # N * D_out
  if t % 100 == 99:
    print(t, loss)

  # 손실에 따른 w1, w2의 변화도를 계산하고 역전파합니다.
  grad_y_pred = 2.0 * (y_pred - y)  # N * D_out
  grad_w2 = h_relu.T.dot(grad_y_pred) # H * D_out
  grad_h_relu = grad_y_pred.dot(w2.T) # N * H
  grad_h = grad_h_relu.copy() # N * H
  grad_h[h < 0] = 0
  grad_w1 = x.T.dot(grad_h) # D_in * H

  # 가중치를 갱신합니다.
  w1 -= learning_rate * grad_w1
  w2 -= learning_rate * grad_w2

99 472.2074637701616
199 2.3078627350649414
299 0.01803004038425645
399 0.0001614233307584353
499 1.543662060695297e-06


# PyTorch: Tensors

In [None]:
import torch

dtype = torch.float
device = torch.device("cpu")
# device = torch.device("cuda:0") # GPU에서 실행하려면 이 주석을 제거하세요.

# N은 배치 크기이며, D_in은 입력의 차원입니다;
# H는 은닉층의 차원이며, D_out은 출력 차원입니다.
N, D_in, H, D_out = 64, 1000, 100, 10

# 무작위의 입력과 출력 데이터를 생성합니다.
x = torch.randn(N, D_in, device=device, dtype=dtype)
y = torch.randn(N, D_out, device=device, dtype=dtype)

# 무작위로 가중치를 초기화합니다.
w1 = torch.randn(D_in, H, device=device, dtype=dtype)
w2 = torch.randn(H, D_out, device=device, dtype=dtype)

learning_rate = 1e-6
for t in range(500):
    # 순전파 단계: 예측값 y를 계산합니다.
    h = x.mm(w1)
    h_relu = h.clamp(min=0)
    y_pred = h_relu.mm(w2)

    # 손실(loss)을 계산하고 출력합니다.
    loss = (y_pred - y).pow(2).sum().item()
    if t % 100 == 99:
        print(t, loss)

    # 손실에 따른 w1, w2의 변화도를 계산하고 역전파합니다.
    grad_y_pred = 2.0 * (y_pred - y)
    grad_w2 = h_relu.t().mm(grad_y_pred)
    grad_h_relu = grad_y_pred.mm(w2.t())
    grad_h = grad_h_relu.clone()
    grad_h[h < 0] = 0
    grad_w1 = x.t().mm(grad_h)

    # 경사하강법(gradient descent)를 사용하여 가중치를 갱신합니다.
    w1 -= learning_rate * grad_w1
    w2 -= learning_rate * grad_w2

99 458.1446838378906
199 2.5180087089538574
299 0.02476966194808483
399 0.0005090429331175983
499 6.50275542284362e-05


## Autograd

In [None]:
import torch

dtype = torch.float
device = torch.device("cpu")

N,D_in,H,D_out = 64,1000, 100, 10

x = torch.randn(N,D_in, device= device, dtype = dtype) # requires_grad = False (default): don't calculate gradient
y = torch.randn(N,D_out, device = device, dtype=dtype) # requires_grad = False (default) 

w1 = torch.randn(D_in,H, device=device, dtype=dtype, requires_grad = True) # requires_grad = True: calculate gradient
w2 = torch.randn(H,D_out, device=device, dtype=dtype, requires_grad=True)

learning_rate = 1e-6
for t in range(500):
    # forward
    y_pred = x.mm(w1).clamp(min=0).mm(w2)

    # loss
    loss = (y_pred - y).pow(2).sum()
    if t % 100 == 99:
        print(t,loss.item())

    # backward
    loss.backward()

    # Manually weight update
    with torch.no_grad():
        w1 -= learning_rate * w1.grad
        w2 -= learning_rate * w2.grad

        # After updating gradient, we have to make gradient zero.
        w1.grad.zero_()
        w2.grad.zero_()

99 324.3523254394531
199 0.8000394105911255
299 0.004439877811819315
399 0.00014366494724527001
499 2.9067763534840196e-05


# Pytorch: 새 autograd 함수 정의하기

In [None]:
import torch

# Define Activation Function
class MyReLU(torch.autograd.Function):

  @staticmethod # decorator 
  def forward(ctx, input):
    '''
    순전파 단계에서는 입력을 갖는 Tensor를 받아 출력을 갖는 Tensor를 반환합니다.
    ctx는 컨텍스트 객체(context object)로 역전파 연산을 위한 정보 저장에
    사용합니다. ctx.save_for_backward method를 사용하여 역전파 단계에서 사용할 어떠한
    객체도 저장(cache)해 둘 수 있습니다.
    '''
    ctx.save_for_backward(input)
    return input.clamp(min=0)
  
  @staticmethod
  def backward(ctx, grad_output):
    '''
    역전파 단계에서는 출력에 대한 손실의 변화도를 갖는 Tensor를 받고, 입력에 대한 손실의 변화도를 계산합니다.
    '''
    input, = ctx.saved_tensors
    grad_input = grad_output.clone()
    grad_input[input<0] =0 # grad_h
    return grad_input
  
dtype = torch.float
device = torch.device("cpu")

# N은 배치 크기이며, D_in은 입력의 차원입니다.
# H는 은닉층의 차원이며, D_out 출력 차원입니다.

N, D_in, H, D_out = 64,1000,100,10

# 입력과 출력을 저장하기 위해 무작위 값을 갖는 Tensor를 생성합니다.
x= torch.randn(N,D_in, device= device, dtype=dtype)
y= torch.randn(N,D_out, device = device, dtype=dtype)

# 가중치를 저장하기 위해 무작위 값을 갖는 Tensor를 생성합니다.
w1 = torch.randn(D_in, H, device=device, dtype=dtype, requires_grad=True)
w2 = torch.randn(H,D_out, device=device, dtype=dtype,requires_grad=True)
# 가중치만 밖에 나가 있으면 됨?

learning_rate = 1e-6
for t in range(500):
  # 사용자 정의 Function을 적용하기 위해 Function.apply 메소드를 사용합니다.
  relu = MyReLU.apply

  # 순전파 단계 : Tensor 연산을 사용하여 예상되는 y 값을 계산합니다;
  # 사용자 정의 autograd 연산을 사용하여 Relu 를 계산합니다.
  y_pred = relu(x.mm(w1)).mm(w2)

  # 손실을 계산하고 출력합니다.
  loss = (y_pred - y).pow(2).sum()
  if t % 100 ==99:
    print(t ,loss)

  # autograd를 사용하여 역전파 단계를 계산합니다.
  loss.backward()

  # 경사 하강법(gradient descent)을 사용하여 가중치를 갱신합니다.
  with torch.no_grad():
    w1 -= learning_rate * w1.grad
    w2 -= learning_rate * w2.grad

    # 가중치 갱신 후에는 수동으로 변화도를 0으로 만듭니다.
    w1.grad.zero_()
    w2.grad.zero_()

99 tensor(469.1736, grad_fn=<SumBackward0>)
199 tensor(3.0971, grad_fn=<SumBackward0>)
299 tensor(0.0421, grad_fn=<SumBackward0>)
399 tensor(0.0010, grad_fn=<SumBackward0>)
499 tensor(0.0001, grad_fn=<SumBackward0>)


## pytorch: nn

In [1]:
import torch

# N은 배치 크기이며, D_in은 입력의 차원입니다;
# H는 은닉층의 차원이며, D_out은 출력 차원입니다.
N, D_in, H, D_out = 64, 1000, 100, 10

# 입력과 출력을 저장하기 위해 무작위 값을 갖는 Tensor를 생성합니다.
x = torch.randn(N, D_in)
y = torch.randn(N, D_out)

# nn 패키지를 사용하여 모델을 순차적 계층(sequence of layers)으로 정의합니다.
# nn.Sequential은 다른 Module들을 포함하는 Module로, 그 Module들을 순차적으로
# 적용하여 출력을 생성합니다. 각각의 Linear Module은 선형 함수를 사용하여
# 입력으로부터 출력을 계산하고, 내부 Tensor에 가중치와 편향을 저장합니다.
model = torch.nn.Sequential(
    torch.nn.Linear(D_in, H),
    torch.nn.ReLU(),
    torch.nn.Linear(H, D_out),
)

# 또한 nn 패키지에는 널리 사용하는 손실 함수들에 대한 정의도 포함하고 있습니다;
# 여기에서는 평균 제곱 오차(MSE; Mean Squared Error)를 손실 함수로 사용하겠습니다.
loss_fn = torch.nn.MSELoss(reduction='sum')

learning_rate = 1e-4
for t in range(500):
    # 순전파 단계: 모델에 x를 전달하여 예상되는 y 값을 계산합니다. Module 객체는
    # __call__ 연산자를 덮어써(override) 함수처럼 호출할 수 있게 합니다.
    # 이렇게 함으로써 입력 데이터의 Tensor를 Module에 전달하여 출력 데이터의
    # Tensor를 생성합니다.
    y_pred = model(x)

    # 손실을 계산하고 출력합니다. 예측한 y와 정답인 y를 갖는 Tensor들을 전달하고,
    # 손실 함수는 손실 값을 갖는 Tensor를 반환합니다.
    loss = loss_fn(y_pred, y)
    if t % 100 == 99:
        print(t, loss.item())

    # 역전파 단계를 실행하기 전에 변화도를 0으로 만듭니다.
    model.zero_grad()

    # 역전파 단계: 모델의 학습 가능한 모든 매개변수에 대해 손실의 변화도를
    # 계산합니다. 내부적으로 각 Module의 매개변수는 requires_grad=True 일 때
    # Tensor 내에 저장되므로, 이 호출은 모든 모델의 모든 학습 가능한 매개변수의
    # 변화도를 계산하게 됩니다.
    loss.backward()

    # 경사하강법(gradient descent)를 사용하여 가중치를 갱신합니다. 각 매개변수는
    # Tensor이므로 이전에 했던 것과 같이 변화도에 접근할 수 있습니다.
    with torch.no_grad():
        for param in model.parameters():
            param -= learning_rate * param.grad

99 2.327758550643921
199 0.027104292064905167
299 0.0007323547033593059
399 2.812072852975689e-05
499 1.2486798368627205e-06


## PyTorch: optim

In [2]:
import torch

# N은 배치 크기이며, D_in은 입력의 차원입니다;
# H는 은닉층의 차원이며, D_out은 출력 차원입니다.
N, D_in, H, D_out = 64, 1000, 100, 10

# 입력과 출력을 저장하기 위해 무작위 값을 갖는 Tensor를 생성합니다.
x = torch.randn(N, D_in)
y = torch.randn(N, D_out)

# nn 패키지를 사용하여 모델과 손실 함수를 정의합니다.
model = torch.nn.Sequential(
    torch.nn.Linear(D_in, H),
    torch.nn.ReLU(),
    torch.nn.Linear(H, D_out),
)
loss_fn = torch.nn.MSELoss(reduction='sum')

# optim 패키지를 사용하여 모델의 가중치를 갱신할 Optimizer를 정의합니다.
# 여기서는 Adam을 사용하겠습니다; optim 패키지는 다른 다양한 최적화 알고리즘을
# 포함하고 있습니다. Adam 생성자의 첫번째 인자는 어떤 Tensor가 갱신되어야 하는지
# 알려줍니다.
learning_rate = 1e-4
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)
for t in range(500):
    # 순전파 단계: 모델에 x를 전달하여 예상되는 y 값을 계산합니다.
    y_pred = model(x)

    # 손실을 계산하고 출력합니다.
    loss = loss_fn(y_pred, y)
    if t % 100 == 99:
        print(t, loss.item())

    # 역전파 단계 전에, Optimizer 객체를 사용하여 (모델의 학습 가능한 가중치인)
    # 갱신할 변수들에 대한 모든 변화도를 0으로 만듭니다. 이렇게 하는 이유는
    # 기본적으로 .backward()를 호출할 때마다 변화도가 버퍼(buffer)에 (덮어쓰지 않고)
    # 누적되기 때문입니다. 더 자세한 내용은 torch.autograd.backward에 대한 문서를
    # 참조하세요.
    optimizer.zero_grad()

    # 역전파 단계: 모델의 매개변수에 대한 손실의 변화도를 계산합니다.
    loss.backward()

    # Optimizer의 step 함수를 호출하면 매개변수가 갱신됩니다.
    optimizer.step()

99 40.15929412841797
199 0.579013466835022
299 0.003962690010666847
399 1.5288131180568598e-05
499 1.9639289305928287e-08


## PyTorch: 사용자 정의 nn.Module

In [3]:
import torch


class TwoLayerNet(torch.nn.Module):
    def __init__(self, D_in, H, D_out):
        """
        생성자에서 2개의 nn.Linear 모듈을 생성하고, 멤버 변수로 지정합니다.
        """
        super(TwoLayerNet, self).__init__()
        self.linear1 = torch.nn.Linear(D_in, H)
        self.linear2 = torch.nn.Linear(H, D_out)

    def forward(self, x):
        """
        순전파 함수에서는 입력 데이터의 Tensor를 받고 출력 데이터의 Tensor를
        반환해야 합니다. Tensor 상의 임의의 연산자뿐만 아니라 생성자에서 정의한
        Module도 사용할 수 있습니다.
        """
        h_relu = self.linear1(x).clamp(min=0)
        y_pred = self.linear2(h_relu)
        return y_pred


# N은 배치 크기이며, D_in은 입력의 차원입니다;
# H는 은닉층의 차원이며, D_out은 출력 차원입니다.
N, D_in, H, D_out = 64, 1000, 100, 10

# 입력과 출력을 저장하기 위해 무작위 값을 갖는 Tensor를 생성합니다.
x = torch.randn(N, D_in)
y = torch.randn(N, D_out)

# 앞에서 정의한 클래스를 생성하여 모델을 구성합니다.
model = TwoLayerNet(D_in, H, D_out)

# 손실 함수와 Optimizer를 만듭니다. SGD 생성자에 model.parameters()를 호출하면
# 모델의 멤버인 2개의 nn.Linear 모듈의 학습 가능한 매개변수들이 포함됩니다.
criterion = torch.nn.MSELoss(reduction='sum')
optimizer = torch.optim.SGD(model.parameters(), lr=1e-4)
for t in range(500):
    # 순전파 단계: 모델에 x를 전달하여 예상되는 y 값을 계산합니다.
    y_pred = model(x)

    # 손실을 계산하고 출력합니다.
    loss = criterion(y_pred, y)
    if t % 100 == 99:
        print(t, loss.item())

    # 변화도를 0으로 만들고, 역전파 단계를 수행하고, 가중치를 갱신합니다.
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

99 1.6890068054199219
199 0.019715772941708565
299 0.0006489359075203538
399 3.3737804187694564e-05
499 2.040675326497876e-06


## PyTorch: 제어 흐름(Control Flow) + 가중치 공유(Weight Sharing)

In [5]:
import random
import torch

In [9]:

class DynamicNet(torch.nn.Module):
    def __init__(self, D_in, H, D_out):
        """
        생성자에서 순전파 단계에서 사용할 3개의 nn.Linear 인스턴스를 생성합니다.
        """
        super(DynamicNet, self).__init__()
        self.input_linear = torch.nn.Linear(D_in, H)
        self.middle_linear = torch.nn.Linear(H, H)
        self.output_linear = torch.nn.Linear(H, D_out)

    def forward(self, x):
        """
        모델의 순전파 단계에서, 무작위로 0, 1, 2 또는 3 중에 하나를 선택하고
        은닉층을 계산하기 위해 여러번 사용한 middle_linear Module을 재사용합니다.

        각 순전파 단계는 동적 연산 그래프를 구성하기 때문에, 모델의 순전파 단계를
        정의할 때 반복문이나 조건문과 같은 일반적인 Python 제어 흐름 연산자를 사용할
        수 있습니다.

        여기에서 연산 그래프를 정의할 때 동일 Module을 여러번 재사용하는 것이
        완벽히 안전하다는 것을 알 수 있습니다. 이것이 각 Module을 한 번씩만 사용할
        수 있었던 Lua Torch보다 크게 개선된 부분입니다.
        """
        h_relu = self.input_linear(x).clamp(min=0)
        for _ in range(random.randint(0, 3)):
            h_relu = self.middle_linear(h_relu).clamp(min=0)
        y_pred = self.output_linear(h_relu)
        return y_pred


# N은 배치 크기이며, D_in은 입력의 차원입니다;
# H는 은닉층의 차원이며, D_out은 출력 차원입니다.
N, D_in, H, D_out = 64, 1000, 100, 10

# 입력과 출력을 저장하기 위해 무작위 값을 갖는 Tensor를 생성합니다.
x = torch.randn(N, D_in)
y = torch.randn(N, D_out)

# 앞서 정의한 클래스를 생성(instantiating)하여 모델을 구성합니다.
model = DynamicNet(D_in, H, D_out)

# 손실함수와 Optimizer를 만듭니다. 이 이상한 모델을 순수한 확률적 경사 하강법
# (stochastic gradient decent)으로 학습하는 것은 어려우므로, 모멘텀(momentum)을
# 사용합니다.
criterion = torch.nn.MSELoss(reduction='sum')
optimizer = torch.optim.SGD(model.parameters(), lr=1e-4, momentum=0.9)
for t in range(500):
    # 순전파 단계: 모델에 x를 전달하여 예상되는 y 값을 계산합니다.
    y_pred = model(x)

    # 손실을 계산하고 출력합니다.
    loss = criterion(y_pred, y)
    if t % 100 == 99:
        print(t, loss.item())

    # 변화도를 0으로 만들고, 역전파 단계를 수행하고, 가중치를 갱신합니다.
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

99 67.64453887939453
199 1.9578406810760498
299 0.8686320185661316
399 0.2718488276004791
499 0.14947840571403503
