### 단축키 사용법
- 실행 단축키 :
  - ctrl + enter : 실행 후 커서가 그대로 위치
  - shift + enter : 실행 후 커서가 아래 셀로 이동
- 마크다운 전환
  - ctrl + m + m
- 아래 셀 추가
  - ctrl + m + b
- 위 셀 추가
  - ctrl + m + a
- 자동완성 : ctrl + space

###  딥러닝 맛보기
 - 딥러닝이란?
   - 인간의 신경말을 모방하여 학습하고 예측하는 기술
   - 대량의 데이터에서 복잡한 패턴, 규칙을 찾아내는 능력이 뛰어남
   - 머신러닝에 비해 조금 더 유연한 사고
   - 인간의 뉴런 == 딥러닝 선형모델
   - 주로 영상처리, 음성처리, 이미지 분야에 적용됨

- 딥러닝 프레임워크
  - tensorflow
    - 구글이 만든 딥러닝을 위한 라이브러리
  - keras
    - tensorflow 위에 동작하는 라이브러리 -> 사용자 친화적 라이브러리
    - tensorflow 기반 사용자 인터페이스 API

In [1]:
import tensorflow as tf
print(tf.__version__)
# 설치버전 확인하는 이유 > 프로젝트시 딥러닝 모델을 가져다 쓸 때, 버전이 맞지 않으면 오류 발생하기 때문

2.18.0


In [2]:
# 파일관리 시 리눅스 명령어 사용
!pwd

/content


In [3]:
# 파일의 경로 변경
%cd /content/drive/MyDrive/LGDXSCHOOL 2기/DeepLearning

/content/drive/MyDrive/LGDXSCHOOL 2기/DeepLearning


In [4]:
!pwd

/content/drive/MyDrive/LGDXSCHOOL 2기/DeepLearning


### 머신러닝, 딥러닝 모델 비교
- 동일한 데이터를 가지고 머신러닝, 딥러닝 실습을 통해 결과를 비교
- 공부시간에 따른 수학 성적을 예측하는 회귀모델

### 머신러닝 모델과 딥러닝 모델의 차이점
- 머신러닝
  - 모델생성(완성된 객체 사용) -> 모델학습 -> 모델예측 -> 모델평가
  - 완제품 로봇 - 팔정도만 움직일 수 있음 (하이퍼파라미터)
<br><br>
- 딥러닝
  - 모델생성(모델을 직접 구성) -> 모델학습 -> 모델예측 -> 모델평가
  - 조립식 로봇 - 우리가 구성하고자하는 모양으로 구성
  - 다양한 결과를 만들어낼 수 있음



In [5]:
# 라이브러리 불러오기
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

In [10]:
# 자동완성 : ctrl + space
data = pd.read_csv('./data/student-mat.csv', delimiter=';')
data.head()
# 정답레이블 : G3(3학년 성적) -> 학생 성적을 맞추는 모델링 -> 회귀
# 2개의 입력데이터를 사용 : studytime, freetime

Unnamed: 0,school,sex,age,address,famsize,Pstatus,Medu,Fedu,Mjob,Fjob,...,famrel,freetime,goout,Dalc,Walc,health,absences,G1,G2,G3
0,GP,F,18,U,GT3,A,4,4,at_home,teacher,...,4,3,4,1,1,3,6,5,6,6
1,GP,F,17,U,GT3,T,1,1,at_home,other,...,5,3,3,1,1,3,4,5,5,6
2,GP,F,15,U,LE3,T,1,1,at_home,other,...,4,3,2,2,3,3,10,7,8,10
3,GP,F,15,U,GT3,T,4,2,health,services,...,3,2,2,1,1,5,2,15,14,15
4,GP,F,16,U,GT3,T,3,3,other,other,...,4,3,2,1,2,5,4,6,10,10


In [11]:
# 데이터 정보 확인
data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 395 entries, 0 to 394
Data columns (total 33 columns):
 #   Column      Non-Null Count  Dtype 
---  ------      --------------  ----- 
 0   school      395 non-null    object
 1   sex         395 non-null    object
 2   age         395 non-null    int64 
 3   address     395 non-null    object
 4   famsize     395 non-null    object
 5   Pstatus     395 non-null    object
 6   Medu        395 non-null    int64 
 7   Fedu        395 non-null    int64 
 8   Mjob        395 non-null    object
 9   Fjob        395 non-null    object
 10  reason      395 non-null    object
 11  guardian    395 non-null    object
 12  traveltime  395 non-null    int64 
 13  studytime   395 non-null    int64 
 14  failures    395 non-null    int64 
 15  schoolsup   395 non-null    object
 16  famsup      395 non-null    object
 17  paid        395 non-null    object
 18  activities  395 non-null    object
 19  nursery     395 non-null    object
 20  higher    

- 데이터 분리
  - 문제, 정답
    - 문제 데이터(X)
    - 답 데이터(y)
  - 학습용, 평가용
    - 학습용(X_train, y_train)
    - 평가용(X_test, y_test)

In [19]:
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

In [16]:
X = data[['studytime','freetime']]
y = data['G3']

X_train, X_test, y_train, y_test = train_test_split(X,y, test_size=0.3, random_state=5)
X_train.shape, X_test.shape, y_train.shape, y_test.shape
# 1. 문제와 정답의 수가 일치, 2. 훈련용,테스트용 입력특성의 수 일치 확인

((276, 2), (119, 2), (276,), (119,))

- 머신러닝 모델링

In [20]:
# 모델 객체 생성
li_reg = LinearRegression()
# 모델 학습
li_reg.fit(X_train, y_train)
# 모델 예측
pred = li_reg.predict(X_test)
# 모델 평가
mean_squared_error(y_test, pred)

21.72675646101634