## 딥러닝 모델 구현하기

In [1]:
import pandas as pd
import tensorflow as tf
import keras
import numpy as np

  from ._conv import register_converters as _register_converters
Using TensorFlow backend.


In [2]:
## train 데이터 셋 , test 데이터 셋
## train 은 학습을 위한 입력 데이터 셋
## test 은 예측을 위한 새로운 데이터 셋(평가)
## parse_dates : datetime 컬럼을 시간형으로 불러올 수 있음
train = pd.read_csv("train.csv", parse_dates=['datetime'])
test = pd.read_csv("test.csv", parse_dates=['datetime'])

In [3]:
train.columns

Index(['datetime', 'season', 'holiday', 'workingday', 'weather', 'temp',
       'atemp', 'humidity', 'windspeed', 'casual', 'registered', 'count'],
      dtype='object')

In [4]:
input_col = [ 'temp', 'atemp']
labeled_col = ['count']

In [5]:
X = train[ input_col ]
Y = train[ labeled_col ]
X_test = test[input_col]

In [6]:
seed = 0
np.random.seed(seed)
tf.set_random_seed(seed)

## 딥러닝 구조 결정

* 케라스 라이브러리 중에서 Sequential 함수는 딥러닝의 구조를 한층 한층 쉽게 쌓아올릴 수 있다.
* Sequential() 함수 선언 후, model.add() 함수를 사용한다
* input_dim 입력층 노드
* activation - 활성화 함수 선언 (relu, sigmoid)
* Dense() 함수를 이용하여 각 층에 세부 내용을 설정해 준다.

In [7]:
from keras.models import Sequential
from keras.layers import Dense

In [8]:
model = Sequential()
model.add(Dense(30, input_dim=2, activation='relu'))
model.add(Dense(15, activation='relu') )
model.add(Dense(15, activation='relu') )
model.add(Dense(1))

Instructions for updating:
If using Keras pass *_constraint arguments to layers.


### 미니배치의 이해
 * 이미지를 하나씩 학습시키는 것보다 여러 개를 한꺼번에 학습시키는 쪽이 효과가 좋다.
 * 많은 메모리와 높은 컴퓨터 성능이 필요하므로 일반적으로 데이터를 적당한 크기로 잘라서 학습시킨다.
  * **미니배치**라고 한다.

### 딥러닝 실행

In [9]:
model.compile(loss = 'mean_squared_error', optimizer='rmsprop')
model.fit(X, Y, epochs=20, batch_size=10)


Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<keras.callbacks.callbacks.History at 0x1c56b08cda0>

In [10]:
### 평가 확인
model.evaluate(X, Y)



27717.913003585454

In [11]:
pred = model.predict(X_test)

In [12]:
sub = pd.read_csv("sampleSubmission.csv")
sub['count'] = pred

sub.loc[sub['count']<0, 'count'] = 0   

In [13]:
# 처음 만는 제출용 csv 파일, 행번호를 없애기
sub.to_csv("NNsubmission2.csv", index=False)

In [14]:
!dir NNsub*

 C 드라이브의 볼륨에는 이름이 없습니다.
 볼륨 일련 번호: 6CB1-CD77

 C:\Users\front\Documents\PythonBasic 디렉터리

2020-02-01  오후 04:40           199,407 NNsubmission.csv
2020-03-07  오후 03:48           199,792 NNsubmission2.csv
               2개 파일             399,199 바이트
               0개 디렉터리  84,435,587,072 바이트 남음
