In [1]:
# 확률적 경사하강법 (Stochastic Gradient Descent) SGDClassifier
# 최적점을 향해 내려가는 방법

# 랜덤하게 기울기를 내려오는 방법이라고 직관적으로 읽을 수 있음
# 가파른 경사를 조금씩 내려간다? 는 느낌

In [2]:
# 한개씩 꺼내 쓰기(확률적 경사하강법)
# 여러개씩 꺼내 쓰기(미니 배치 경사하강법)
# 몽땅 꺼내기 (배치 경사하강법)

# 배치를 어떻게 하든, 한번 꺼내어 사용하는 횟수를 epoch라고 함
# 일반적으로 미니 배치 경사하강법을 사용함

# 이론상으론 배치경사하강법이 가장 효율적이나 몽땅 꺼내어 돌리기엔 데이터가 너무 큰 경우가 많기 때문에
# 물리적으로 사용 가능한 방법은 확률적 경사하강법이나 미니 배치 경사하강법임

In [3]:
# 손실함수
# 한번의 epoch가 실행 될때마다 예측값과 타깃(정답)을 비교하여 
# 발생한 손실값만큼을 반환해주는 함수 (예측값의 나쁜 정도를 측정하는 함수)

# 최적화함수
# 손실함수에서 반환된 손실값을 토대로 가중치와 절편값을 조정함

# 정확도함수
# 예측값이 정답을 맞추는 정확도를 확률로 반환하는 함수

In [4]:
# 손실함수는 미분 가능해야 함
# 분류 모델일 경우, 정확도를 보는데, 구간이 정해진 정확도는 손실함수로 사용할 수 없는 측정함수(미분 가능하지 않음)
# 회귀 모델일 경우, 평균 절댓값 오차 or 평균 제곱 오차는 미분이 가능하기 때문에 손실함수 사용 가능

In [5]:
# 로지스틱 손실 함수는 분류 모델임에도 최적화를 위한 손실함수
# 이진 크로스 엔트로피 손실 함수

# 예측값을 정답(타깃)값과 곱한 뒤 음수로 바꿈 (높은 예측값을 낮은 예측값보다 상대적으로 낮게 만들기 위함)
# 잔차 트리를 이용한 원리

# 이보다 더 좋은 방법은 log를 붙이는 것이다
# 타깃이 1 일때, -log(예측확률)
# 타깃이 0 일때, -log(1 - 예측확률)

In [6]:
import pandas as pd
from sklearn.model_selection import train_test_split

# 경사 하강법을 사용할 때는 특성의 스케일을 표준화시켜야함
from sklearn.preprocessing import StandardScaler

fish = pd.read_csv('https://bit.ly/fish_csv_data')
fish_input = fish[['Weight','Length','Diagonal','Height','Width']].to_numpy()
fish_target = fish['Species'].to_numpy()

train_input, test_input, train_target, test_target = train_test_split(
    fish_input, fish_target, random_state=42)

# 표준화 계산
ss = StandardScaler()
ss.fit(train_input)

# 훈련세트와 테스트세트 둘다 표준화
train_scaled = ss.transform(train_input)
test_scaled = ss.transform(test_input)

In [7]:
# SGDClassifier

from sklearn.linear_model import SGDClassifier

sc = SGDClassifier(loss='log', max_iter=10, random_state=42)
# loss = 손실함수를 설정하는 하이퍼 파라미터, 'log'는 로지스틱손실 함수
# max_iter = 에포크
sc.fit(train_scaled, train_target)



SGDClassifier(loss='log', max_iter=10, random_state=42)

In [8]:
print(sc.score(train_scaled, train_target))
print(sc.score(test_scaled, test_target))

0.773109243697479
0.775


In [9]:
sc.partial_fit(train_scaled, train_target)
# fit : 이전의 학습했던 것을 전부 버리고 새로 학습
# partial_fit : 기존의 학습했던 것을 전부 유지하면서 다시 훈련

print(sc.score(train_scaled, train_target))
print(sc.score(test_scaled, test_target))

0.8151260504201681
0.825


In [10]:
# SGDClassifier은 확률적 경사하강법만 사용가능
# 미니배치 경사하강법 사용 X

In [11]:
# 조기 종료

sc

SGDClassifier(loss='log', max_iter=10, random_state=42)