# **기상데이터를 이용해 배추가격 예측**

In [43]:
import random
import torch 
import torch.optim as optim
import torch.nn as nn
import torch.nn.functional as F
from pandas.io.parsers import read_csv
import numpy as np

seed = 42
random.seed(seed)
np.random.seed(seed)
torch.manual_seed(seed)
if torch.cuda.is_available():
    torch.cuda.manual_seed(seed)
    torch.cuda.manual_seed_all(seed)


In [44]:
train = read_csv('/content/price data.csv',sep=',')
print(train)

          year  avgTemp  minTemp  maxTemp  rainFall  avgPrice
0     20100101     -4.9    -11.0      0.9       0.0      2123
1     20100102     -3.1     -5.5      5.5       0.8      2123
2     20100103     -2.9     -6.9      1.4       0.0      2123
3     20100104     -1.8     -5.1      2.2       5.9      2020
4     20100105     -5.2     -8.7     -1.8       0.7      2060
...        ...      ...      ...      ...       ...       ...
2917  20171227     -3.9     -8.0      0.7       0.0      2865
2918  20171228     -1.5     -6.9      3.7       0.0      2884
2919  20171229      2.9     -2.1      8.0       0.0      2901
2920  20171230      2.9     -1.6      7.1       0.6      2901
2921  20171231      2.1     -2.0      5.8       0.4      2901

[2922 rows x 6 columns]


In [45]:
X_train = train.iloc[:,1:-1].to_numpy()
X_train = torch.FloatTensor(X_train)
X_train

tensor([[ -4.9000, -11.0000,   0.9000,   0.0000],
        [ -3.1000,  -5.5000,   5.5000,   0.8000],
        [ -2.9000,  -6.9000,   1.4000,   0.0000],
        ...,
        [  2.9000,  -2.1000,   8.0000,   0.0000],
        [  2.9000,  -1.6000,   7.1000,   0.6000],
        [  2.1000,  -2.0000,   5.8000,   0.4000]])

In [46]:
y_train = train.iloc[:,-1].to_numpy()
y_train = torch.FloatTensor(y_train)
y_train

tensor([2123., 2123., 2123.,  ..., 2901., 2901., 2901.])

In [47]:
print(X_train.shape)
print(y_train.shape)

torch.Size([2922, 4])
torch.Size([2922])


# **모델 훈련하기**

In [48]:
#모델초기화
W = torch.zeros([4,1],requires_grad = True)
b = torch.zeros(1,requires_grad = True)

#optimizer설정
optimizer = optim.Adam([W,b],lr = 0.01)

nb_epochs = 1000
for epoch in range(nb_epochs+1):
    #H(x) 계산
    hypothesis = X_train.matmul(W) + b

    #cost 계산 (RMSE)
    cost = torch.mean((hypothesis - y_train)**2)

    #cost로 H(x) 개선
    optimizer.zero_grad()
    cost.backward()
    optimizer.step()

     # 100번마다 로그 출력
    if epoch % 100 == 0:
      print('#:{} Cost: {:.6f}'.format(epoch,cost.item()
      ))

#:0 Cost: 12610012.000000
#:100 Cost: 12325099.000000
#:200 Cost: 12048931.000000
#:300 Cost: 11781349.000000
#:400 Cost: 11522114.000000
#:500 Cost: 11270997.000000
#:600 Cost: 11027780.000000
#:700 Cost: 10792251.000000
#:800 Cost: 10564210.000000
#:900 Cost: 10343460.000000
#:1000 Cost: 10129814.000000


In [52]:
# test file을 구하지 못해
# 학습한 W를 train data에 적용해봄

y_pred = X_train.matmul(W)+b
for i in range(1001):
  print('예측된 가격:',int(y_pred[i].item()))

예측된 가격: -132
예측된 가격: -11
예측된 가격: -69
예측된 가격: 21
예측된 가격: -132
예측된 가격: -188
예측된 가격: -171
예측된 가격: -137
예측된 가격: -84
예측된 가격: -22
예측된 가격: -32
예측된 가격: -127
예측된 가격: -214
예측된 가격: -170
예측된 가격: -51
예측된 가격: -94
예측된 가격: -65
예측된 가격: 12
예측된 가격: 109
예측된 가격: 342
예측된 가격: 93
예측된 가격: -65
예측된 가격: -58
예측된 가격: 17
예측된 가격: 28
예측된 가격: -43
예측된 가격: 98
예측된 가격: 108
예측된 가격: 19
예측된 가격: 68
예측된 가격: 116
예측된 가격: 88
예측된 가격: -43
예측된 가격: -120
예측된 가격: -75
예측된 가격: -34
예측된 가격: -50
예측된 가격: 26
예측된 가격: 178
예측된 가격: 237
예측된 가격: 243
예측된 가격: 252
예측된 가격: 65
예측된 가격: 10
예측된 가격: -23
예측된 가격: 12
예측된 가격: -16
예측된 가격: -20
예측된 가격: -18
예측된 가격: 0
예측된 가격: 84
예측된 가격: 124
예측된 가격: 174
예측된 가격: 216
예측된 가격: 309
예측된 가격: 706
예측된 가격: 324
예측된 가격: 208
예측된 가격: 227
예측된 가격: 317
예측된 가격: 135
예측된 가격: 156
예측된 가격: 213
예측된 가격: 248
예측된 가격: 200
예측된 가격: 147
예측된 가격: 128
예측된 가격: 133
예측된 가격: 41
예측된 가격: 92
예측된 가격: 244
예측된 가격: 203
예측된 가격: 229
예측된 가격: 435
예측된 가격: 105
예측된 가격: 87
예측된 가격: 96
예측된 가격: 167
예측된 가격: 348
예측된 가격: 153
예측된 가격: 151
예측된 가격: 239
예측된 가격: 252
예측된 가격: 196
예측된