<a href="https://colab.research.google.com/github/presentchris/Computer-Vision/blob/main/Practice_of_Stats%26Modelings3.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

##단순 선형 회귀 모델 구축 및 R²점수 계산
주어진 데이터셋에 대해 단순 선형 회귀 모델을 구축하고, 모델의 회귀 계수를 추정한 다음 R²점수를 계산하기

In [1]:
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import r2_score

In [2]:
#임의의 데이터셋 생성
np.random.seed(0)
X = np.random.rand(100, 1)
y = 2+3*X+np.random.randn(100,1)

In [3]:
#데이터셋 분리 및 모델 학습
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state = 42)
model = LinearRegression()
model.fit(X_train, y_train)

In [4]:
#R²점수 계산
predictions = model.predict(X_test)
r2 = r2_score(y_test, predictions)
print(f"R²score: {r2}")

R²score: 0.29109095869239754


##MNIST 손글씨 분류
이미지 분류 모델링 - MNIST 손글씨 데이터셋을 사용하여 숫자를 분류하는 간단한 신경망 모델을 구축시키고 학습시킨 후, 테스트 데이터셋에 대한 정확도를 평가하기.

In [5]:
from tensorflow.keras.datasets import mnist
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten
from tensorflow.keras.utils import to_categorical

In [6]:
# 데이터 로드 및 전처리
(train_X, train_y),(test_X, test_y) = mnist.load_data()
train_X = train_X/255.0
test_X = test_X/255.0
train_y = to_categorical(train_y)
test_y = to_categorical(test_y)

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz


In [8]:
# 모델 구축 및 학습
model = Sequential([
    Flatten(input_shape = (28,28)),
    Dense(128, activation = 'relu'),
    Dense(10, activation = 'softmax')
])

model.compile(optimizer = 'adam', loss = 'categorical_crossentropy', metrics = ['accuracy'])
model.fit(train_X, train_y, epochs = 5, validation_split = 0.2)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.src.callbacks.History at 0x7f057ae77fd0>

In [9]:
# 테스트 데이터셋에 대한 정확도 평가
test_loss, test_accuracy = model.evaluate(test_X, test_y)
print(f"Test accuracy: {test_accuracy}")

Test accuracy: 0.9771999716758728


##ARIMA 모델을 사용한 시계열 예측
시계열 예측 모델링 - 주어진 시계열 데이터셋을 사용하여 ARIMA 모델을 구축하고, 다음 12개월 동안의 값을 예측하기. 예측 결과와 실제 값의 RMSE(Root Mean Square Error)를 계산하기.

In [10]:
from statsmodels.tsa.arima.model import ARIMA
import numpy as np

In [11]:
#임의의 시계열 데이터 생성
np.random.seed(42)
data = np.random.randn(100).cumsum()

In [12]:
#ARIMA 모델 구축 및 학습
model = ARIMA(data, order = (5,1,0))
model_fit = model.fit()

In [13]:
#다음 12개월 예측
forecast = model_fit.forecast(steps = 12)
print(forecast)

[-10.70685822 -10.64720232 -10.57999472 -10.56794161 -10.60897499
 -10.68015902 -10.66897874 -10.65265338 -10.64800476 -10.65481039
 -10.67054331 -10.66863657]
