**선형 회귀(linear-regression)**은 일종의 “최적의 직선을 구하는 과정”으로, 주어진 데이터로부터 가장 잘 맞는 1차 함수를 찾는 일을 의미한다.

# 1. 선형 회귀란?

- 목적
    - 입력 데이터 $x$에 대해 출력 $y$를 예측하는 **직선 형태의 함수** $y=wx+b$의 계수 $w$(기울기), $b$(절편)을 **학습 데이터로부터 추정**하는 것
    - 예를 들어
        
        $공부 시간(x) → 점수(y)$
        
        라면, 공부 시간이 주어졌을 때 점수를 예측하는 함수 $y=wx+b$를 찾는게 목적인 것이다
        

# 2. 수학적 배경

주어진 데이터 $(x_1, y_1),(x_2, y_2), … , (x_n, y_n)$에 대해, 다음 식의 오차를 최소화 하는 $w, b$를 찾는 것이 목표이다

## 가설 함수(hypothesis)

$$
\hat{y}_i=wx_i+b
$$

## 손실 함수(loss function)

- 가장 흔히 쓰이는 손실 함수는 **평균 제곱 오차(MSE)**

$$
MSE=\frac{1}{n}\sum_{i=1}^N(y_i-\hat{y}_i)^2=\frac{1}{n}\sum_{i=1}^{n}(y_i-(wx_i+b))^2
$$

- 이 오차를 **최소화**하는 $w, b$를 찾는 것이 선형회귀의 본질

# 3. 파라미터 학습 방법

- 오차를 줄이기 위해 **기울기 $w$, 절편 $b$**를 조정하는 알고리즘이 필요함
- 가장 일반적인 방법은 **경사 하강법(Gradient Descent)**
    - 손실 함수의 기울기를 계산하여 반대 방향으로 조금씩 이동
    - 반복적으로 갱신하여 최적값에 수렴

예시 업데이트 식:

$$
w\gets w-\alpha\cdot\frac{∂MSE}{∂w}
$$

$$
b\gets b-\alpha\cdot\frac{∂MSE}{∂b}
$$

여기에서 $\alpha$는 **학습률(learning rate)**

# 4. 1차 함수와 다른 점

- 1차 함수는 수학 시간에 이미 정해진 기울기와 절편으로 직선을 그리는 것이었다면,
- 선형회귀는 데이터로부터 그 최적의 기울기와 절편을 추정하는 과정
- 1차함수의 **결과를 주어진 조건에 맞게 역산**하는게 선형회귀의 본질

# 5. 선형회귀의 한계

- 입력과 출력이 **직선적인 관계**일 때만 잘 동작
- 복잡한 데이터(곡선 형태, 잡음 많은 데이터 등)에 대해선 **비선형 회귀, 다항 회귀, 신경망**등이 필용함

---

# 딥러닝과의 연결

- 선형회귀는 **딥러닝 모델의 기본 단위**인 ‘선형 계층(linear layer)’과 원리가 같음
- 뉴런 1개가 하는 일은 사실상 $y=wx+b$를 계산하는 것이기 때문에, 딥러닝의 출발점으로 매우 중요함