# 비용함수

- 예측과 정답과의 차이를 본다.
- 가중치를 조정하기 위해
- 네트워크가 최적을 예측 수행 하도록 학습

- 역할 :
  모델 평가 : 예측과 실제의 차이를 수치적 표현하기 위해
  모델 최적화 : 비용함수의 값을 최소화, 가중치 편향 조정 - 학습 과정

## 평균 제곱 오차

### 회귀 문제

- 평균 제곱 오차
    
    $\text{MSE} = \frac{1}{N} \sum_{i=1}^{N} (y - \hat{y})$
    
    - 나중에 루트를 씌어 실제와 비교 (제곱이므로)
    - 큰 오차에 더 큰 가중치 (제곱이므로)
    - 일반적인 사용
- 평균 절대 오차
    
    $\text{MAE} = \frac{1}{N} \sum_{i=1}^{N} |y - \hat{y}|$
    
    - 이상치에 덜 민감
    - 값 자체로의 해석이 가능하다.
- 허브 손실
    
    $L_\delta(y,\hat{y}) = \begin{cases} \frac{1}{2} (y - \hat{y})^2 & \text{if} \quad|y - \hat{y}| \leq \delta \\ \delta |y - \hat{y}| - \frac{1}{2} \delta^2 & \text{if} \quad|y-\hat{y}| > \delta \end{cases}$
    
    - MAE 와 MSE 와의 조합
    - 오차가 클 때 : MSE, 오차가 작을 때 : MAE
    - 여기서 $\delta$ 는 임계값
- 로그 코사인 유도
    
    $\log - \cosh = \frac{1}{N} \sum^{N}_{i = 1} \log({\cosh (\hat{y}-y)})$
    
    - 오차의 cosh 의 log
    - 이상치에 매우 강하다, 최적화에 장점을 가지고 있다.

### 분류 문제

- 교차 엔트로피 손실
    - 이진 분류에서 사용(다중 분류시 Categorical 교체 엔트로피 이용)
    - 예측과의 차이를 보여줌
    - 실제와 가까울 수록, 손실은 적어짐
- 힌지 손실
    - 주로 SVM 에서 사용
    - 이진분류의 마진오류의 최소화
- 제곱 힌지 손실
    - 힌지 손실의 제곱
    - 이상치에 민감
- 로지스틱 손실
    - 이진분류에 적합, 로지스틱 회귀에서 자주 사용
    - 예측과 실제 사이의 로그 손실
- 포칼 손실
    - 클래스 불균형이 심한 문제
    - 정답 보다, 오답 분류에 대한 가중치 부여

## 비용함수 예제

- 회귀 문제
    
    ```python
    # 손실 함수 테스트
    import numpy as np
    
    # 예측값과 실제값
    y_true = np.array([1.0, 2.0, 3.0])
    y_pred = np.array([1.1, 1.9, 3.1])
    ```
    
    ```python
    # 평균 제곱 오차 (Mean Squared Error)
    def mean_squared_error(y_true, y_pred):
        return np.mean((y_true - y_pred) ** 2)
    
    mse = mean_squared_error(y_true, y_pred)
    mse
    ```
    
    ```python
    # 평균 절대 오차 (Mean Absolute Error)
    def mean_absolute_error(y_true, y_pred):
        return np.mean(np.abs(y_true - y_pred))
    
    mae = mean_absolute_error(y_true, y_pred)
    mae
    ```
    
    ```python
    # 허브(Huber) 손실
    def huber_loss(y_true, y_pred, delta=1.0):
        error = y_true - y_pred
        is_small_error = np.abs(error) <= delta
        squared_loss = 0.5 * error**2
        linear_loss = delta * (np.abs(error) - 0.5 * delta)
        return np.where(is_small_error, squared_loss, linear_loss)
    
    huber = huber_loss(y_true, y_pred, delta=1.0)
    huber
    ```
    
    ```python
    # 로그 코사인 유사도 (Log-Cosh Loss)
    def log_cosh_loss(y_true, y_pred):
        return np.mean(np.log(np.cosh(y_pred - y_true)))
    
    log_cosh = log_cosh_loss(y_true, y_pred)
    log_cosh
    ```
    
- 분류 문제
    
    ```python
    from sklearn.metrics import log_loss, hinge_loss
    import numpy as np
    
    # 예시 데이터: 실제 레이블과 예측 확률
    y_true = np.array([1, 0, 1, 1, 0])
    y_pred_probs = np.array([0.9, 0.1, 0.8, 0.65, 0.3]) # 이진 분류의 예측 확률
    y_pred = np.array([1, 0, 1, 1, 0]) # 정답
    
    ```
    
    ```python
    # 교차 엔트로피 손실
    cross_entropy_loss = log_loss(y_true, y_pred_probs)
    cross_entropy_loss
    
    ```
    
    ```python
    # 힌지 손실
    hinge_loss_value = hinge_loss(y_true, 2*y_pred-1)  # hinge_loss는 -1과 1의 레이블을 기대합니다.
    hinge_loss_value
    ```