# 머신러닝의 종류

## 교사 학습(지도 학습)
- 데이터와 함께 정답이 주어지는 학습법
- 미지의 데이터를 예측할 수 있음

## 비교사 학습(비지도 학습)
- 정답 데이터가 주어지지 않은 학습법
- 미지의 데이터에서 규칙성을 발견하는 학습법

## 강화 학습
- 행동을 기반으로 정답인지 알려주는 학습
- 데이터에서 최적의 답을 찾아내는 학습

# 머신러닝의 기본 과정

- 목표를 설정
- 데이터를 수집
- 데이터를 가공
- 데이터를 학습
- 모델 평가(정답률이 잘 나왔는지 여부) 잘나오지 않았다면 -> 데이터를 학습, 잘 나왔다면 -> 업무에 활용

# 데이터 수집

- SNS와 블로그
- 쇼핑 상품 데이터
- 금융정보
- 오픈 데이터
- 이미지, 동영상, 음성데이터
- 사전 데이터
- 머신러닝 전용 데이터

# 데이터 저장하는 형식

- CSV
- INI
- XML, JSON, YAML





# scikit-learn(사이킷-런)

- 대표적인 파이썬 머신러닝 프레임워크
- 다양한 머신러닝 알고리즘을 제공
- 다양한 샘플 데이터를 제공
- 머신러닝 결과를 검증하는 기능을 제공
- BSD 라이선스라서 무료로 사용 및 배포가 가능
- 사이킷-런 웹사이트(https://scikit-learn.org/)
- 알고리즘 치트 시트(https://scikit-learn.org/stable/tutorial/machine_learning_map/)

# 목표 결정

- 입력(x, y)과 결과(x, y)의 모든 패턴을 학습시킵니다.
- 다시 입력(x, y)의 모든 패턴을 주고 제대로 된 결과를 내는지 평가를 합니다.

# 알고리즘을 선택

- 사이킷-런 알고리즘을 선택
- LinearSVC 알고리즘을 선택

In [7]:
# pip install sklearn
from sklearn.svm import LinearSVC # LinearSCV 알고리즘을 사용하기 위한 패키지
from sklearn.metrics import accuracy_score # 테스트 데이터 결과를 평가하기 위한 패키지

# 학습 전용 데이터와 결과를 준비합니다. (교사 학습 알고리즘을 사용하고 있으므로 학습 전용 데이터와 결과 데이터가 함께 있어야 합니다.)
# x, y
learn_data = [[0,0], [1,0], [0,1], [1,1]]
# x and y
learn_label = [0, 0, 0, 1]

# 사이킷런 알고리즘을 지정합니다. (LinearSVC)
# LinearSVC 전용 객체를 생성합니다.
clf = LinearSVC() # 생성자를 호출해 객체를 생성합니다.

# 학습 전용 데이터와 결과를 학습합니다.
# fit() 메서드를 사용해 학습 데이터 배열과 결과 데이터 배열을 매개변수로 지정합니다.
clf.fit(learn_data, learn_label)

# 테스트 데이터로 예측합니다.
# predict() 메서드를 사용해 예측합니다. predict()는 테스트 데이터를 매개변수로 전달하면 예측 결과를 반환합니다.
test_data = [[0,0], [1,0], [0,1], [1,1]]
test_label = clf.predict(test_data)

# 예측 결과를 평가합니다.
# 정답률을 계산합니다. 정답률 계산에는 accuracy_score() 메서드를 사용합니다.
# accuracy_score() 메서드는 정답과 예측 결과를 매개변수로 지정하면 정답률을 반환합니다.
print(test_data, "의 예측 결과 : ", test_label)
print("정답률 = ", accuracy_score([0, 0, 0, 1], test_label))



[[0, 0], [1, 0], [0, 1], [1, 1]] 의 예측 결과 :  [0 0 0 1]
정답률 =  1.0
