## learning-AI101 : seminar 2
### 2024.07.24.에 진행한 세미나 기록 및 학습

<br>

- **임규연 (lky473736)**
- 2024.07.28.

------

- (1) stochastic gradient descent와 deep learning 연관성
    - https://towardsdatascience.com/step-by-step-tutorial-on-linear-regression-with-stochastic-gradient-descent-1d35b088a843
- (2) deep learning 기초 개념
- (3) deep learning에서 classification과 regression의 차이 (keras 기준)

### (1)
<img src="https://miro.medium.com/v2/resize:fit:1400/format:webp/1*j2BO6GaJP104BNFV_g4FCg.png" width="500px">

#### (1-1) loss function
- 회귀에서의 손실함수 : MSE
- 분류에서의 손실함수 : 
    - 이중 분류 : binary-crossentropy
    - 다중 분류 : crossentropy
- one-hot encoding을 하지 않은 loss function : spartial loss function
    
#### (1-2) stochastic gradient descent
- 손실함수를 최소화하기 위하여 weight와 bias를 업데이트하면서 최적의 모델을 만들기 위한 최적화 알고리즘
- 점진적으로 학습이 가능하여, 갖가지 모델로 학습을 추가 및 중첩이 가능함
<br>
<img src="https://blog.kakaocdn.net/dn/b5qQXn/btrwZZbnLEh/33NmNUWcEOfr9Q7C2UOPOK/img.png" width="500px">
- 위와 같은 local minima, global minima 문제를 해결하기 위해선 optimizer 도입이 필요 (Adam 등)
- 새로운 가중치를 구하는 공식 : $w_{new} = w_{current} - r \times f'(w_{current})$
     - r : learning rate (얼마나 많은 step으로 loss function을 이동할 것인가)
     - 미분의 개념을 이용해 back propagation하여 가중치와 bias를 수정함

In [16]:
# 실습은 내장된 iris data를 사용한다, scaling 또한 진행한다.

from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

iris = datasets.load_iris() # 내장된 iris data

X_train, X_test, y_train, y_test = train_test_split (iris.data, iris.target,
                                                    test_size=0.6)

ss = StandardScaler()
ss.fit (X_train_scaled)

X_train_scaled = ss.transform(X_train)
X_test_scaled = ss.transform(X_test)

In [17]:
# SGDClassifier를 도입하여 확률적 경사 하강법과 함께 분류 문제를 해결

from sklearn.linear_model import SGDClassifier 
sc = SGDClassifier(loss='log_loss', max_iter=10, random_state=42) 
# log_loss == 로지스틱 사용한다는 뜻, max_iter == epoch 횟수 (10 정도면 100% 과소적합될 것 같음)
sc.fit(X_train_scaled, y_train)

print ("train score : ", sc.score(X_train_scaled, y_train))
print ("test score : ", sc.score(X_test_scaled, y_test))

# epoch가 너무 적어서 과소적합됨 -> epoch 수 늘려보기

train score :  0.9333333333333333
test score :  0.9333333333333333




In [20]:
# 추가 학습 

sc.partial_fit(X_train_scaled, y_train)

print ("train score after additional fit : ", sc.score(X_train_scaled, y_train))
print ("test score after additional fit : ", sc.score(X_test_scaled, y_test))

train score after additional fit :  0.9666666666666667
test score after additional fit :  0.9666666666666667


In [21]:
# 최적의 epoch를 찾기 위해 반복문을 돌려 점수를 저장

import numpy as np

train_score = []
test_score = []
sc = SGDClassifier(loss='log_loss', random_state=42)
classes = np.unique(iris['target'])

for iter_num in range (1, 1001) : 
    sc.partial_fit(X_train_scaled, y_train, classes=classes) # 처음에 fit을 하지 않았기 때문에 classes를 넣어줌
    
    train_s = sc.score(X_train_scaled, y_train)
    test_s = sc.score(X_test_scaled, y_test)
    
    print (f'{iter_num}번째 학습 | train score : {train_s}, test score : {test_s}')
    train_score.append (train_s)
    test_score.append (test_s)

1번째 학습 | train score : 0.8333333333333334, test score : 0.7888888888888889
2번째 학습 | train score : 0.8833333333333333, test score : 0.8
3번째 학습 | train score : 0.8333333333333334, test score : 0.8222222222222222
4번째 학습 | train score : 0.8666666666666667, test score : 0.8444444444444444
5번째 학습 | train score : 0.85, test score : 0.8111111111111111
6번째 학습 | train score : 0.8833333333333333, test score : 0.8111111111111111
7번째 학습 | train score : 0.8833333333333333, test score : 0.8444444444444444
8번째 학습 | train score : 0.9, test score : 0.8888888888888888
9번째 학습 | train score : 0.8666666666666667, test score : 0.8333333333333334
10번째 학습 | train score : 0.9166666666666666, test score : 0.8666666666666667
11번째 학습 | train score : 0.8666666666666667, test score : 0.8444444444444444
12번째 학습 | train score : 0.8833333333333333, test score : 0.8444444444444444
13번째 학습 | train score : 0.8833333333333333, test score : 0.8444444444444444
14번째 학습 | train score : 0.9166666666666666, test score : 0.855555

201번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
202번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
203번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
204번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
205번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
206번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
207번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
208번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
209번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
210번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
211번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
212번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
213번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667

384번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
385번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
386번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
387번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
388번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
389번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
390번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
391번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
392번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
393번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
394번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
395번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
396번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667

581번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
582번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
583번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
584번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
585번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
586번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
587번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
588번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
589번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
590번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
591번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
592번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
593번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667

779번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
780번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
781번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
782번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
783번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
784번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
785번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
786번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
787번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
788번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
789번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
790번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
791번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667

974번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
975번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
976번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
977번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
978번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
979번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
980번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
981번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
982번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
983번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
984번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
985번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667
986번째 학습 | train score : 0.9666666666666667, test score : 0.9666666666666667

### (2)
<img src="https://user-images.githubusercontent.com/76824611/131564918-5a425904-ff1e-46a1-8fe0-0acc9a5e48ce.png
" width="500px">
- deep learning 
    - SGD를 통하여 많은 weight와 bias의 최적값 리스트를 찾는 것, 각각을 조절하기 위해 loss를 계산하고, loss를 최소화
	- 딥러닝에서 기억해야 할 것 (5가지)
		- forward propagation
		- back propagation
		- 손실 함수 (loss function)
		- 활성화 함수 (activation function)
			- 특징 추출을 하기 위해 비선형 함수를 도입 (선형 레이어만 있으면 특징 추출을 X)
			- 계단함수, sigmoid, relu, tanh
		- optimizer (SGD, Adam, 어떻게 업데이트할까)
		- one-hot encoding 
			- encoding의 방법
			- one-hot encoding을 하여 각 class별로의 독립성을 부여한다
			- deep learning에서 필수 
- deep learning에서의 필수 단계
	- numpy로 변경
	- one-hot encoding
	- class 또한 숫자로 변경해야 함

### (3)

- 이진 분류일때 : 출력층의 activation이 sigmoid, compile은 binary_crossentropy
- 다중 분류일때 : 출력층의 activation이 softmax, compile은 categorical_crossentropy
- regression : 출력층은 activation이 없고, compile은 MSE
``` python
model.add(Dense(10,input_shape=(30,),activation='tanh')) # <-- feature 수가 30개
model.add(Dense(8,activation='tanh'))
model.add(Dense(6,activation='tanh'))
model.add(Dense(2,activation='softmax')) # <-- 마지막 layer : output layer
model.compile(Adam(lr=0.04),'categorical_crossentropy',metrics=['accuracy']) # <-- lr : learning rate (학습율)
model.summary()
```