# 머신러닝 정리

- 머신러닝은 데이터를 기반해 예측, 분류하는 모델을 만드는 것
- 회기(Regression) 모델
    - **loss(손실)**을 최소화하는 것이 목표
    - 손실 함수: 예측값과 실제값의 차이를 수치화
        - loss를 다 더한 값 / 전체 개수 -> 음수, 양수의 상쇄로 정확도 떨어짐
        - loss에 절댓값을 다 더한 값 / 전체 개수
        - loss를 제곱한 값 / 전체 개수
    - 모델 학습의 흐름
        1. 초기 모델은 무작위 가중치(w)와 절편(b)으로 시작(ex - 가장 작은 값, 가장 큰 값으로 구한다)
        2. 손실 함수 계산
        3. 옵티마이저를 통해 가중치, 절편을 loss(손실)가 줄어드는 방향으로 점진적으로 보정\
        (Learning Rate: 학습률 - 한 번 업데이트할 때 이동하는 거리)\
        -> Gradient Descent (경사 하강법)
        4. 다시 학습 (1 epoch, 2 epoch, ...) -> 적정 시점까지 (loss값이 더이상 줄어들지 않을 때까지)
    - 3가지 학습 방식 (Gradient Descent 변형)
        - 배치 학습: 전체 데이터 학습
        - 미니 배치 학습: 일부 데이터 학습
        - 확률적 경사 하강법 (SGD): 데이터 1개씩 학습 (batch-size=1)
        > 학습량이나 **배치 크기(batch_size)**는 하이퍼파라미터로 설정
- 분류(Classification) 모델
    - 출력값은 **확률**!
    - 기본 구조: `y = f(wx + b)` -> 입력을 선형 조합하고, 활성화 함수를 통해 확률화
    - 이진 분류 -> Sigmoid 함수 (30% vs. 70%)
        - 하나의 출력 (0 ~ 1)
    - 다중 분류 -> Softmax 함수 (20% vs. 45% vs. 35%)
        - 여러 클래스 중 하나 선택
        - 모든 출력값을 확률로 바꿔 합이 1이 되도록 정규화

# 딥러닝 기초 지식

- 은닉층(Hidden Layer)
    - 입력층과 출력층 사이에 존재하며, **비선형성**을 추가하는 역할
    - 이진 분류
        - 과거: Sigmoid, tanh
        - 현재: **ReLU (렐루)** (학습 속도가 빠르고, gradient vanishing이 적다)
        > gradient vanishing(기울기 소실): 역전파 과정에서 기울기가 점점 0에 가까워져 가중치가 잘 업데이트되지 않는 문제 (특히 sigmoid, tanh를 은닉층에서 사용할 경우 심하게 발생)
        > 출력층에서는 분류 유형에 따라 다름 (이진 분류 - Sigmoid, 다중 분류 - Softmax, 회기 - 선형 함수)
    - 은닉층의 유닛 개수가 많을수록 모델의 표현력은 커지지만, 과적합(overfitting) 위험이 커진다 (gradient vanishing이 많아짐)
    - 유닛: 선형 계산(wx + b) + 비선형 활성화 함수
    - 은닉층 유닛 수 ≥ (최종) 출력층 유닛 수
    > ex) AutoEncoder에서는 입력보다 좁은 은닉층을 써서 특성 압축(compression)을 수행

- 역전파(Backpropagation)
    - 오차를 출력층에서 입력층 방향으로 전달하며, 각 가중치가 오차에 얼마나 영향을 미쳤는지 계산
    - 이 정보를 바탕으로 **경사 하강법**을 통해 가중치 조정 -> 손실 함수 값을 줄이는 방향으로 학습

# 딥러닝 - 인공 신경망

자세한 내용은 ex04에서...

In [1]:
# 텐서플로
%pip install tensorflow

Note: you may need to restart the kernel to use updated packages.


In [2]:
# 파이토치
%pip install torch

Collecting torch
  Using cached torch-2.7.1-cp312-cp312-win_amd64.whl.metadata (28 kB)
Collecting filelock (from torch)
  Using cached filelock-3.18.0-py3-none-any.whl.metadata (2.9 kB)
Collecting sympy>=1.13.3 (from torch)
  Using cached sympy-1.14.0-py3-none-any.whl.metadata (12 kB)
Collecting networkx (from torch)
  Using cached networkx-3.5-py3-none-any.whl.metadata (6.3 kB)
Collecting jinja2 (from torch)
  Using cached jinja2-3.1.6-py3-none-any.whl.metadata (2.9 kB)
Collecting fsspec (from torch)
  Using cached fsspec-2025.5.1-py3-none-any.whl.metadata (11 kB)
Collecting mpmath<1.4,>=1.1.0 (from sympy>=1.13.3->torch)
  Using cached mpmath-1.3.0-py3-none-any.whl.metadata (8.6 kB)
Using cached torch-2.7.1-cp312-cp312-win_amd64.whl (216.1 MB)
Using cached sympy-1.14.0-py3-none-any.whl (6.3 MB)
Using cached mpmath-1.3.0-py3-none-any.whl (536 kB)
Using cached filelock-3.18.0-py3-none-any.whl (16 kB)
Using cached fsspec-2025.5.1-py3-none-any.whl (199 kB)
Using cached jinja2-3.1.6-py3-no

In [3]:
%pip install torchvision

Collecting torchvision
  Using cached torchvision-0.22.1-cp312-cp312-win_amd64.whl.metadata (6.1 kB)
Using cached torchvision-0.22.1-cp312-cp312-win_amd64.whl (1.7 MB)
Installing collected packages: torchvision
Successfully installed torchvision-0.22.1
Note: you may need to restart the kernel to use updated packages.


In [4]:
import keras
import tensorflow as tf