# 1. Theoretical analysis

- 랜덤 샘플링 기반으로 iteration을 돌릴때 복원 추출/비복원 추출에 대한 이론적인 백그라운드 
  - <span class="girk">Beneath the valley of the noncommutative arithmetic-geometric mean inequality: conjectures, case-studies, and consequences.</span>
  - <span class="girk">Without-Replacement Sampling for Stochastic Gradient Methods</span>

## 1.1. Outline

- <span class="mark">비복원 추출이 복원 추출보다 더 빠른 수렴을 가져온다.</span>
![image](https://user-images.githubusercontent.com/48466625/63915104-1771e980-ca70-11e9-94a8-f252059d96e5.png)

- 위와 같은 Loss function을 최적화하고 싶다고한다면, 이는 주어진 $y_i$의 $N$개의 label에 대한 optimal $x$를 찾고싶은 것

![image](https://user-images.githubusercontent.com/48466625/63915201-5d2eb200-ca70-11e9-884c-9bdd3951e47b.png)

- Optimal $x$를 찾기 위해, 목적함수를 미분해서 0이되는 값을 찾게 된다. 
  - 이때 optimal soultion은 <span class="mark">$y$의 $N$ samples에 대한 평균값일 것.</span>

![image](https://user-images.githubusercontent.com/48466625/63915310-a121b700-ca70-11e9-84c5-f35796b565db.png)

- 한번에 계산을 할 수 없다면, Gradient Descent를 통해 recursive하게 해를 찾아야 하는데,
  - $i = 1,2,...,N$까지 실행할때, 아래 마지막 식은 samples의 평균값이 되기 때문에 최적의 해를 찾았다고 볼 수 있다.
  
  ![image](https://user-images.githubusercontent.com/48466625/63915474-286f2a80-ca71-11e9-8340-9b93eacd9442.png)
  ![image](https://user-images.githubusercontent.com/48466625/63915486-31f89280-ca71-11e9-9780-c1f68affeae9.png)
  
  - 복원추출을 하게 되면, 배치마다의 관계가 독립적이기 때문에 optimized value $x_N$은 여기서 정답인 sample mean과 다르며 오차가 있을 것.
  
  ![image](https://user-images.githubusercontent.com/48466625/63915786-dbd81f00-ca71-11e9-8858-8a5ef0d60731.png)


# 2. Example

In [1]:
################Sampling without replacement##################
def SGD(self, training_data, epochs, mini_batch_size, eta, test_data=None):
    n = len(training_data)
    for j in range(epochs):
        random.shuffle(training_data)
        mini_batches = [training_data[k:k+mini_batch] for k in range(o, n, mini_batch_size)]
        for mini_batch in mini_batches:
            self.update_mini_batch(mini_batch, eta)

In [2]:
mylist = ['1','2','3','4','5','6','7','8','9','10']
n = len(mylist)
mini_batch_size = 2
mini_batches = [mylist[k:k+mini_batch_size] for k in range(0, n, mini_batch_size)]
for mini_batch in mini_batches:
    print(mini_batch)

['1', '2']
['3', '4']
['5', '6']
['7', '8']
['9', '10']


In [3]:
mylist = ['1','2','3','4','5','6','7','8','9','10']
n = len(mylist)
mini_batch_size = 3
mini_batches = [mylist[k:k+mini_batch_size] for k in range(0, n, mini_batch_size)]
for mini_batch in mini_batches:
    print(mini_batch)

['1', '2', '3']
['4', '5', '6']
['7', '8', '9']
['10']
