# Ch 07

## Section 1 | 선형 회귀 이해와 구현

### 1. 회귀와 분류

* 회귀 모델
    - 연속적인 값을 예측
        * 캘리포니아의 주택 가격이 얼마인가요?
        * 사용자가 이 광고를 클릭할 확률이 얼마인가요?
* 분류 모델
    - 불연속적인 값을 예측
        * 주어진 메세지가 스팸인가요?, 아닌가요?
        * 이 이미지가 고양인가요?, 강아진가요?

### 2. 회귀의 어원

* 회귀 분석
    - 관찰된 연속형 변수들의 대해 두 변수 사이의 모형을 구한 뒤 적합도를 측정
    - 시간에 따라 변화하는 데이터나 어떤 영향, 가설적 실험, 인과 관계의 모델링 등 통계적 예측에 이용

## Section 2 | 선형 회귀

### 1. 선형 회귀와 로지스틱 회귀

* 단순 선형 회귀 분석
    - 입력 : 특징이 하나
    - 출력 : 하나의 값
        * 키로 몸무게 측정
        ![option](7_1.jpg)
* 다중 선형 회귀 분석
    - 입력 :  특징이 여러 개, 출력 : 하나의 값
        * 역세권, 아파트 평수, 주소로 아파트 값을 측정
        ![option](7_2.jpg)
* 로지스틱 회귀
    - 이진 분류
    - 입력 : 하나 또는 여러 개, 출력 : 0 아니면 1

### 2. 주요 용어 정리

* 가설
    - 가중치(W)와 평향(b)
    - 기울기와 절편
* 손실 함수
    - MSE(평균제곱오차)
* 경사 하강법
    - 내리막 경사 따라가기
* 학습률
    - 대표적인 하이퍼패러미터

### 3. 선형 회귀

* 선형 회귀(딥러닝)
    - 데이터의 경향성을 가장 잘 설명하는 하나의 직선을 예측하는 방법
        * Y = wX + b;
        ![option](7_3.jpg)

### 3-1. 가설

* 머신 러닝 ; y와 x간의 관계를 유추한 식을 가설
     - 공부시간 x, 점수  y
     ![option](7_4.jpg)


### 3-2. 손실 함수

* 정의
    - 실제 값과 가설로부터 얻은 예측 값의 오차를 계산하는 식
    - 평균 제곱 오차(MSE) 등을 사용
    ![option](7_5.jpg)

* W와 b값을 찾아내기 위해 오차의 크기를 측정할 방법이 필요
    - 오차는 실제 데이터(빨간 점)와 예측 선(파란 선)의 차이의 제곱의 합
    ![option](7_6.jpg)

### 3-3. 경사하강법

* 비용 함수(Cost Function)값을 최소로 하는 W와 b를 찾는 방법
* 경사 따라 내려 오기
![option](7_7.jpg)

* 첫 번째 단계
    - 시작 값을 선택
        * 시작점은 별로 중요 X
        * 많은 알고리즘에서는 0으로 설정하거나 임의의 값을 선택
    - 시작점에서 손실 곡선의 기울기를 계산
        * 단일 가중치에 대한 손실의 기울기는 미분 값과 같음

* 두 번째 단계
    - 가중치를 조정하여 기울기가 0인 지점을 찾음
         * 가중치 조절방법
        >    - 기울기에 학습률를 곱하여 다음 지점을 결정
        >    - ex) 기울기 -2.5, 학습률 0.01
        >        * w = w - (-2.5 * 0.01) = w + 0.025
        >        * 이전 지점으로부터 0.025 떨어진 지점으로 결정
    - 너무 작게 설정하면 학습시간 매우 오래 걸림
    - 반대로 너무 크게 설정하면 최소값을 이탈할 우려가 있음
        * 0.001 ~ 0.1 정도 사용

* 정리
    > - 비용 함수를 미분하여 현재 w에서의 접선의 기울기를 구하고
    > - 기울기가 낮은 방향으로 다시 미분
    > - 이 과정을 통해 기울기가 0인 곳을 향해 w의 값을 변경하는 작업을 반복하는 것

## | 예시 문제 y = 2x 

* y = 2x 에 해당하는 값을 예측
    >- 훈련 데이터
    >    * x_train = [1, 2, 3, 4]
    >    * y_train = [2, 4, 6, 8]
    
    >- 테스트 데이터
    >    * x_test = [1.2, 2.3, 3.4, 4.5]
    >    * y_test = [2.4, 4.6, 6.8, 9.0]
    
* 예측, 다음 x에 대해 예측되는 y를 출력
    - [3.5, 5, 5.5, 6]

### 1. 문제와 정답 데이터 지정

In [None]:
x_train = [1, 2, 3, 4]
y_train = [2, 4, 6, 8]

### 2. 모델 생성

In [None]:
model = sequential([
    Dense(1, input_shape = (1, ), activation= 'linear')
])

### 3. 학습에 필요한 최적화 방법과 손실 함수 등 지정

In [None]:
# 훈련에 사용할 옵티마이저와 손실 함수, 출력정보를 선택
model.compile(optimizer= 'SGD', loss = 'mse',
             metrics = ['mae', 'mse']) # mae(평균 절대 오차), mse(오차 평균 제곱 합) - 
# 모델을 표시(시각화)
model.summary()


### 4. 생성된 모델로 훈련 데이터 학습

In [None]:
model.fit(x_train, y_train, epochs = 1000)

### 5. 테스트 데이터로 성능 평가

In [None]:
x_test = [1.2, 2.3, 3.4, 4.5]
y_test = [2.4, 4.6, 6.8, 9.0]
print('정확도:', model.evaluate(x_test, y_test))

print(model.predict([3.5, 5, 5.5, 6]))

![option](7_10.jpg)