# 개요

- 머신러닝 사용 이유
  - 사람이 풀수 없는 문제를 해결하기 위해 새로운 개념이 도입된 분야
  - 프로그래밍 관점
    - 인간의 지성으로 해결할수 없는 부분을 해결하기 위해 도입된 분야

```
# 로직을 적용하여 하나의 일을 처리하는 함수등 기능 생성하여서 프로그래밍 구현
def add( x, y ):
  return x + y

# 복잡한 문제들을 해결해야 되는 상황이 발생, 어떤 로직으로 해결할수 없는 수준의 문제들이 등장
def predictPhoto( img ):
  # 이 사짐을 보고 사람, 고양이, 강아지, 컴퓨터 등등 사물을 구분해 내라
  # 로직으로 구현한다?
  if ..... => 인간의 지성 능력으로 구현하기에는 한계에 봉착하게됨 => AI라는 개념을 도입해서 인간이 해결할수 없는 문제를 해결하자
  # 데이터준비 => 학습행위 => 모델 생성 => 새로운데이터를 보고 예측하게 하는 방식
  # 학습에 적합하게 데이터를 가공 => 데이터의 수치화, 표준화, 정규화, 정제등등 전처리 과정
  # 학습을 수행하는 주체 -> 알고리즘, 인공신경망,, 구현하여 학습을 수행 
  # 알고리즘을 학습시켜서 예측을 수행하는 장르 => 머신러닝
  # 인공신경망을 학습시켜서 예측을 수행하는 장르 => 딥러닝
  # 범위 : AI > 머신러닝 > 딥러닝

```



# 머신러닝 시스템의 종류

## 지도학습 : supervised learning

- 데이터 관점
  - 피처(특징, 독립변수) + **레이블**(정답(타겟), 종속변수) 존재

### 분류 classicfication

- 예시)
  - 메일들 중에서 스펨메일 찾는다 -> 자동분류
  - 개, 고양이, 새 사진을 보고 -> 이 사진은 고양이 이다
  - 질병 검사를 했다 -> 양성이다 음성이다 
  - 분류는 그 결과가 **범주형 데이터**를 따른다
- 정답이 2개인 경우 : **이진분류 (binary classicfication)**
- 정답이 3개(>=)이상인 경우 : **다중분류(multiclass classicfication)**
- 딥러닝을 일반적으로 분류에 위치해 놓는다
- 일반적으로 **확률**로 분류가 된다

### 회귀

- 정답이 **수치형**이다(**연속형**인 경우에 적합)
- 예시)
  - 중고차 가격은 xxx이다
  - 주택 가격은 xxx이다
- 독립변수(특징), 종속변수(정답)로 구성
- 독립변수에 의해서 영향을 받는 종속변수간의 식을 찾는 과정
- 식
  - y = ax + b 
  - a와 b값만 알면 => 어떤 x가 와도 y를 찾을 수 있다
  - 데이터 넣어서 학습 => a, b
  - ax(=데이터)+b => y 예측
  - a, b, ... => 회귀계수 => 학습을 통해서 찾는다(최적의 값을)
- 식2
  - y = ax + b  => 독립변수 1개(x), 종속변수 1개(y)
    - **(단일 or 단순) 선형 회귀**
  - y = a + bx1 + cx2 + dx3 + ...  => 독립변수 3개(x1,x2,x3), 종속변수 1개(y)
    - **다중 선형 회귀**
- **오차값(율)**등 다양한 평가 지표값이 **최소일때 좋은 성능**을 낸다

## 비지도학습 : unsupervised learning

- 데이터 관점
  - 피처(특징, 독립변수)
  - **레이블이 없다**

### 군집(클러스터링)

- 데이터에 정답이 없다 보니, 이 데이터가 표방하는 부분이 잘 않보인다
- 추천 시스템 적용해서, 특정 고객을 타겟화 할수 있는 방식
  - 넷플릭스 -> 가입 -> 좋아하는 영화/드라마 등등 몇개 선택 -> 잠시후 추천 영상이 올라온다
    - 몇개 선택 -> 이것을 통해 군집행위 수행 -> 이와 유사한 선택을 한 그룹으로 할당 -> 그 그룹들이 좋아하거나, 자주봤던 영상 추천하게된다 -> 이후, 사이트내 검색/영상/시간대/여러 특징을 통해서 개인에 대한 특정 군집 활동이 계속적으로 업데이트 된다
- 군집화을 통해서 -> 일종의 타겟(정답) 분류값이 나오게 된다

### 차원축소

- 피처(특징, 독립변수)들이 너무 많다 => 압축을 통해서 정보손실 최소화 하여 새로운 특징을 추출하는 과정
  - 전처리 과정에서 제거 하는 방법도 있음
- 비지도 학습에 위치해 있지만, 데이터 준비(전처리 과정)에서 사용되는 경우가 많다

## 준지도학습 : semi-supervised learning

- 데이터에 정답이 일부만 있고, 일부는 없다
- 지도 + 비지도 결합



---



## 강화학습 : Reinforcement learning

- 특징
  - 데이터가 없어도 학습 가능하다
  - 초기 데이터가 없어도, 플레이 통해서 데이터가 생성되고, 이를 통해서 학습이 진행된다(방식마다 상이하다)
  - 구글 딥마인드 이벤트 알파고 vs 이세돌
    - 알파고 > 알파고 제로(ai 바둑챔피언) > 알파제로
    - 알파제로
      - ai 바둑/장기/체스 챔피언은 모두 꺽은 인공지능
      - 학습이라고 말할수 있는 행위 총 48시간 만에 완성
- 구성원
  - 에이전트(훈련의 대상)
    - 무인도를 탈출해야하는 사람
    - 미로를 탈출하는 쥐
  - 환경
    - 에이전트가 놓인 상황/부대환경
  - 에이전트는 어떤 행동을 수행
    - 액션
  - 행동은 반드시 어떤 정책에 의해서 수행
    - 정책
  - 모든 행위들은 최선의 이득을 얻기 위해 수행(최대 보상을 위해서 행동을 취한다)
    - 보상 <-> 패널티
  - 에이전트가 -> 정책 기준 => 행동취하면 -> 보상얻고 -> 이 행동을 강화해서 -> 보상을 얻고 .. 최대 보상을 얻기위해 특정 행동을 강화하는 학습법

- 정리
  - 유한 게임의 룰에서 적용된다
  - 게임의 룰이 완성되야 학습을 할수 있다
  - 최근 (3-4년 정도)
    - 시뮬레이션 분야에서 많이 사용
      - Unity + ML-Agent
      - 사람이 직접 하면 위험한 분야 