<a href="https://colab.research.google.com/github/ijinshes2ly/ANN_MLP_DNN/blob/main/GM_D27_ANN.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [2]:
import numpy as np

# 시그모이드 활성화 함수#단층 퍼셉트론
def sigmoid(z):
    return 1 / (1 + np.exp(-z)) #시그모이드 함수: 뉴런의 출력을 0과 1사이로 변환하는 비선형 활성화 함수

# SLP 구현 (하드 코딩된 가중치와 편향)
def forward_slp(X, W, b): #전방향(순방향)연산, 입력X 가중치W ,절편b(인터셉션)
    Z = np.dot(W, X) + b  # 선형 변환#dotproduct:곱하고 더하는 행렬 곱셈 수행(백터내적계싼)#결과적으로는 회귀식
                          #입력 X를 받아 W를 곱한 후 편향b를 더함.
    A = sigmoid(Z)  # 시그모이드 활성화 함수 적용
    return A

# 입력 데이터 예시 (특징 3개)
X = np.array([[1], [2], [3]])  # 입력 데이터#입력 백터 X 3x1크기 행렬

# 하드코딩된 가중치와 편향
W = np.array([[0.2, 0.4, 0.6]])  # 1x3 크기 (하나의 노드)
b = np.array([[0.5]])  # 편향 # 1x1크기

# SLP 순전파
output_slp = forward_slp(X, W, b)#실제 연산 수행#분류 확률

print("Single Layer Perceptron 출력:", output_slp)

Single Layer Perceptron 출력: [[0.96442881]]


* 출력값이 0.96에 가까우므로 양성(1)으로 예측할 가능성이 높음.
* 예를 들어, 이 모델이 이메일이 스팸인지 아닌지 분류하는 모델이라면, **"스팸일 가능성이 96%"**라고 해석할 수 있음.

In [4]:
# ReLU 활성화 함수
def relu(z):
    return np.maximum(0, z)

# 소프트맥스 함수
def softmax(z):
    exp_z = np.exp(z - np.max(z))  # 안정성을 위한 처리
    return exp_z / np.sum(exp_z, axis=0)

# MLP 구현 (하드 코딩된 가중치와 편향)
def forward_mlp(X, parameters):
    # 첫 번째 은닉층
    W1 = parameters['W1']
    b1 = parameters['b1']
    Z1 = np.dot(W1, X) + b1
    A1 = relu(Z1)

    # 출력층
    W2 = parameters['W2']
    b2 = parameters['b2']
    Z2 = np.dot(W2, A1) + b2
    A2 = softmax(Z2)

    return A2

# 입력 데이터 예시 (특징 3개)
X = np.array([[1], [2], [3]])  # 입력 데이터

# 하드코딩된 가중치와 편향
parameters = {
    'W1': np.array([[0.1, 0.2, 0.3], [0.4, 0.5, 0.6], [0.7, 0.8, 0.9], [1.0, 1.1, 1.2]]),  # 은닉층 가중치 (4x3)
    'b1': np.array([[0.1], [0.2], [0.3], [0.4]]),  # 은닉층 편향 (4x1)
    'W2': np.array([[0.1, 0.2, 0.3, 0.4], [0.5, 0.6, 0.7, 0.8]]),  # 출력층 가중치 (2x4)
    'b2': np.array([[0.1], [0.2]])  # 출력층 편향 (2x1)
}

# MLP 순전파
output_mlp = forward_mlp(X, parameters)

print("Multi-Layer Perceptron 출력:", output_mlp)

Multi-Layer Perceptron 출력: [[8.58041227e-04]
 [9.99141959e-01]]


In [6]:
import numpy as np

# 활성화 함수 (sigmoid) 및 그 도함수
def sigmoid(x):
    return 1 / (1 + np.exp(-x))

def sigmoid_derivative(x):
    return sigmoid(x) * (1 - sigmoid(x))

# 손실 함수 (Mean Squared Error)
def loss(y_true, y_pred):
    return 0.5 * np.mean((y_true - y_pred) ** 2)

# 데이터 (입력과 실제 출력)
X = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])  # 입력 (XOR 문제)
y = np.array([[0], [1], [1], [0]])              # 실제 출력

# 가중치 및 편향 초기화 (무작위)
W1 = np.random.randn(2, 2)  # 입력층 -> 은닉층 가중치
b1 = np.random.randn(1, 2)  # 은닉층 편향
W2 = np.random.randn(2, 1)  # 은닉층 -> 출력층 가중치
b2 = np.random.randn(1, 1)  # 출력층 편향

# 학습률 설정
learning_rate = 0.1

# 순전파 및 역전파 실행
for epoch in range(10000):  # 10,000번 반복 학습
    # 순전파 (Forward Propagation)
    z1 = np.dot(X, W1) + b1
    a1 = sigmoid(z1)
    z2 = np.dot(a1, W2) + b2
    a2 = sigmoid(z2)  # 예측 출력

    # 손실 계산
    loss_value = loss(y, a2)

    # 역전파 (Backpropagation)
    # 출력층 오차
    dL_da2 = a2 - y  # 손실의 출력층에 대한 기울기
    dL_dz2 = dL_da2 * sigmoid_derivative(z2)

    # 은닉층 -> 출력층 가중치 및 편향 업데이트
    dL_dW2 = np.dot(a1.T, dL_dz2)
    dL_db2 = np.sum(dL_dz2, axis=0, keepdims=True)

    # 은닉층 오차
    dL_da1 = np.dot(dL_dz2, W2.T)
    dL_dz1 = dL_da1 * sigmoid_derivative(z1)

    # 입력층 -> 은닉층 가중치 및 편향 업데이트
    dL_dW1 = np.dot(X.T, dL_dz1)
    dL_db1 = np.sum(dL_dz1, axis=0, keepdims=True)

    # 가중치 및 편향 업데이트
    W2 -= learning_rate * dL_dW2
    b2 -= learning_rate * dL_db2
    W1 -= learning_rate * dL_dW1
    b1 -= learning_rate * dL_db1

    if epoch % 1000 == 0:
        print(f'Epoch {epoch}, Loss: {loss_value}')

# 최종 예측 값 출력
print("Final predictions:")
print(a2)

Epoch 0, Loss: 0.20000821029149396
Epoch 1000, Loss: 0.12486170735354109
Epoch 2000, Loss: 0.12380492870083704
Epoch 3000, Loss: 0.11184296039570955
Epoch 4000, Loss: 0.04688553458937964
Epoch 5000, Loss: 0.01055741595409246
Epoch 6000, Loss: 0.004938792069392484
Epoch 7000, Loss: 0.003086445860382115
Epoch 8000, Loss: 0.002206801023502126
Epoch 9000, Loss: 0.0017027695987105113
Final predictions:
[[0.058041  ]
 [0.95081774]
 [0.94903008]
 [0.05148925]]


In [7]:
import numpy as np

# ReLU 활성화 함수 정의
def relu(z):
    return np.maximum(0, z)

# 소프트맥스 함수 정의
def softmax(z):
    exp_z = np.exp(z - np.max(z))  # Overflow 방지를 위해 최대값을 뺌
    return exp_z / np.sum(exp_z, axis=0)

# 가중치 및 편향 초기화 함수 (랜덤)
def initialize_parameters(layer_dims):
    np.random.seed(1)
    parameters = {}
    L = len(layer_dims)  # 층의 개수

    for l in range(1, L):
        parameters['W' + str(l)] = np.random.randn(layer_dims[l], layer_dims[l-1]) * 0.01
        parameters['b' + str(l)] = np.zeros((layer_dims[l], 1))

    return parameters

# 순전파 (Forward Propagation) 구현
def forward_propagation(X, parameters):
    # 첫 번째 은닉층
    W1 = parameters['W1']
    b1 = parameters['b1']
    Z1 = np.dot(W1, X) + b1
    A1 = relu(Z1)

    # 두 번째 은닉층
    W2 = parameters['W2']
    b2 = parameters['b2']
    Z2 = np.dot(W2, A1) + b2
    A2 = relu(Z2)

    # 출력층
    W3 = parameters['W3']
    b3 = parameters['b3']
    Z3 = np.dot(W3, A2) + b3
    A3 = softmax(Z3)  # 소프트맥스 적용

    return A3

# 사용 예시

# 입력 데이터 예시 (특징 수 3, 샘플 수 1)
X = np.array([[1], [2], [3]])

# 각 층의 뉴런 수를 정의 (입력층 3개, 은닉층 4개, 5개, 출력층 3개)
layer_dims = [3, 4, 5, 3]

# 가중치 및 편향 초기화
parameters = initialize_parameters(layer_dims)

# 순전파 실행
output = forward_propagation(X, parameters)

# 출력 결과
print("Softmax 확률 출력:", output)

Softmax 확률 출력: [[0.33333293]
 [0.33333388]
 [0.3333332 ]]


In [9]:
#다층신경망을 적용한 매출예측
import numpy as np

# ReLU 활성화 함수 정의
def relu(z):
    return np.maximum(0, z)

# ReLU 미분 함수 (Backpropagation에서 사용)
def relu_derivative(z):
    return np.where(z > 0, 1, 0)

# 손실 함수 (Mean Squared Error)
def compute_loss(Y, A):
    m = Y.shape[1]  # 샘플 수
    loss = np.mean((Y - A) ** 2)  # MSE 계산
    return loss

# 가중치 및 편향 초기화 함수
def initialize_parameters(layer_dims):
    np.random.seed(1) #코드 실행 시마다 동일한 랜덤 값을 얻기 위해 난수 시드를 고정,이를 통해 실험을 재현할 수 있게해줌
    parameters = {} #신경망의 가중치와 편향을 저장할 딕셔너리

    for l in range(1, len(layer_dims)): #layer_dims는 신경망의 각 층에 있는 뉴런(혹은 노드)의 개수를 나타내는 리스트
                                        #,예를 들어, layer_dims = [5, 4, 3]이라면, 첫 번째 층에는 5개의 뉴런, 두 번째 층에는 4개의 뉴런, 세 번째 층에는 3개의 뉴런이 있다는 의미
                                        #for 루프는 각 층에 대해 가중치와 편향을 초기화,1부터 len(layer_dims) - 1까지 반복하면서 층을 하나씩 처리

        parameters['W' + str(l)] = np.random.randn(layer_dims[l], layer_dims[l-1]) * 0.01 # 가중치 행렬로 각 층의 가중치를 랜덤하게 초기화, np.random.randn()은 표준 정규 분포(평균 0, 표준편차 1)에 따라 난수를 생성
                                                                                          #0.01을 곱한 이유는 가중치 초기화 시 너무 큰 값이 되지 않도록 하기 위함이에요. 큰 값이 되면 학습이 불안정
                                                                                          #해당 층의 뉴런 수와 이전 층의 뉴런 수.i.e.첫 번째 층의 뉴런 수가 4개이고 두 번째 층의 뉴런 수가 3개라면, 가중치 행렬의 크기는 3 x 4
        parameters['b' + str(l)] = np.zeros((layer_dims[l], 1))# 편향 벡터#편향은 보통 0으로 초기화해도 괜찮음.학습을 통해 적절한 값을 찾아가게 되기 때문
                                                               #p.zeros((layer_dims[l], 1))는 해당 층의 뉴런 수에 맞게 0으로 채워진 벡터를 생성
    return parameters # 가중치와 편향을 저장한 parameters 딕셔너리를 반환

# 순전파 (Forward Propagation)# 모델을 통해 입력데이터를 처리하여 예측 결과 얻는 과정
def forward_propagation(X, parameters):
    cache = {} #역전파(backpropagation) 과정에서 필요한 중간 계산 값을 저장합니다. 이는 모델의 파라미터를 업데이트할 때 사용

    # 첫 번째 은닉층
    W1 = parameters['W1']
    b1 = parameters['b1']
    Z1 = np.dot(W1, X) + b1 #선형계싼 : 가중치와 입력 값의 곱에 편향을 더하는 방식
    A1 = relu(Z1) #활성화 함수를 적용한 값

    # 두 번째 은닉층
    W2 = parameters['W2']
    b2 = parameters['b2']
    Z2 = np.dot(W2, A1) + b2
    A2 = relu(Z2)

    # 출력층 (회귀 문제이므로 활성화 함수 없음)
    W3 = parameters['W3']
    b3 = parameters['b3']
    Z3 = np.dot(W3, A2) + b3
    A3 = Z3  # 출력층 활성화 함수는 사용하지 않음

    # 캐시 저장 (역전파에서 사용)
    cache['Z1'], cache['A1'] = Z1, A1
    cache['Z2'], cache['A2'] = Z2, A2
    cache['Z3'], cache['A3'] = Z3, A3

    return A3, cache

# 역전파 (Backward Propagation)
def backward_propagation(X, Y, parameters, cache): #델이 예측한 결과와 실제 값의 차이를 계산하여, 가중치와 편향을 업데이트하는 과정
    m = X.shape[1]  # 데이터 샘플 수
    grads = {} #각 가중치와 편향에 대한 기울기(gradient)를 저장할 딕셔너리

    # 출력층 오차
    A3 = cache['A3'] #A3는 모델의 예측값이고, Y는 실제 값
    dZ3 = A3 - Y#출력층에서 예측값 A3와 실제 값 Y의 차이 구하기,dZ3는 뒤로 전파되어 이전 층의 가중치를 업데이트하는 데 사용
    grads['dW3'] = np.dot(dZ3, cache['A2'].T) / m #dZ3는 출력층의 오차이므로, 이 값을 A2의 전치 행렬(cache['A2'].T)과 곱해주면 가중치의 기울기(gradient)가 계산
                                                  #이 기울기는 가중치가 얼마나 변경되어야 할지를 나타냄.
                                                  #두 행렬의 곱으로, 출력층의 가중치 업데이트 방향을 계산
                                                  #샘플 개수 m로 나누는 이유는 평균 기울기
    grads['db3'] = np.sum(dZ3, axis=1, keepdims=True) / m #편향 b3의 기울기를 구할 때는 오차 dZ3의 합을 구하고, 샘플 수로 나누어줍니다.
                                                          #편향은 각 샘플에 대해 동일한 값을 더하는 방식이기 때문에 기울기의 합을 취함.
    # 두 번째 은닉층 오차
    dA2 = np.dot(parameters['W3'].T, dZ3)
    dZ2 = dA2 * relu_derivative(cache['Z2'])
    grads['dW2'] = np.dot(dZ2, cache['A1'].T) / m
    grads['db2'] = np.sum(dZ2, axis=1, keepdims=True) / m

    # 첫 번째 은닉층 오차
    dA1 = np.dot(parameters['W2'].T, dZ2)
    dZ1 = dA1 * relu_derivative(cache['Z1'])
    grads['dW1'] = np.dot(dZ1, X.T) / m
    grads['db1'] = np.sum(dZ1, axis=1, keepdims=True) / m

    return grads

# 파라미터 업데이트 (경사 하강법)
def update_parameters(parameters, grads, learning_rate):
    for l in range(1, len(parameters) // 2 + 1):
        parameters['W' + str(l)] -= learning_rate * grads['dW' + str(l)]
        parameters['b' + str(l)] -= learning_rate * grads['db' + str(l)]

    return parameters

# 학습 데이터 생성 (하드코딩된 연도별 매출 데이터)
X_train = np.array([[2017, 2018, 2019, 2020, 2021]])  # 연도
Y_train = np.array([[100, 150, 200, 250, 300]])  # 해당 연도의 매출

# 데이터 정규화
X_train = X_train / 2021  # 연도를 최대값으로 나누어 정규화
Y_train = Y_train / 300  # 매출도 최대값으로 나누어 정규화

# 레이어 구성 (입력층 1, 은닉층 2개, 출력층 1개)
layer_dims = [1, 5, 3, 1]

# 파라미터 초기화
parameters = initialize_parameters(layer_dims)

# 학습 하이퍼파라미터
learning_rate = 0.01
num_iterations = 10000

# 학습 과정
for i in range(num_iterations):
    # 순전파
    A3, cache = forward_propagation(X_train, parameters)

    # 손실 계산
    loss = compute_loss(Y_train, A3)

    # 역전파
    grads = backward_propagation(X_train, Y_train, parameters, cache)

    # 파라미터 업데이트
    parameters = update_parameters(parameters, grads, learning_rate)

    # 1000번마다 손실 출력
    if i % 1000 == 0:
        print(f"Iteration {i}, Loss: {loss:.4f}")

# 테스트 데이터 예측
X_test = np.array([[2022]])  # 테스트 데이터 (2022년)
X_test = X_test / 2021  # 정규화

# 순전파로 예측
A3_test, _ = forward_propagation(X_test, parameters)

# 예측 결과 출력 (2022년 매출 예측)
print("2022년 매출 예측 (원래 값):", A3_test * 300)  # 원래 단위로 변환

Iteration 0, Loss: 0.5000
Iteration 1000, Loss: 0.0556
Iteration 2000, Loss: 0.0556
Iteration 3000, Loss: 0.0556
Iteration 4000, Loss: 0.0556
Iteration 5000, Loss: 0.0556
Iteration 6000, Loss: 0.0556
Iteration 7000, Loss: 0.0556
Iteration 8000, Loss: 0.0556
Iteration 9000, Loss: 0.0556
2022년 매출 예측 (원래 값): [[200.00000233]]


In [12]:
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten
from tensorflow.keras.preprocessing.image import ImageDataGenerator
import os

# 경로 설정
base_dir = '/content/data'  # 데이터 경로 설정

# 이미지 로드 및 전처리 (데이터 증강 없이)
train_datagen = ImageDataGenerator(
    rescale=1./255,        # 픽셀 값을 0-1 사이로 정규화
    validation_split=0.2   # 데이터의 20%를 검증용으로 분리
)

# 학습 데이터 로드
train_generator = train_datagen.flow_from_directory(
    base_dir,              # 데이터가 저장된 디렉토리
    target_size=(64, 64),  # 이미지 크기 조정
    batch_size=32,         # 배치 크기
    class_mode='binary',   # 이진 분류
    subset='training'      # 학습 데이터
)

# 검증 데이터 로드
validation_generator = train_datagen.flow_from_directory(
    base_dir,              # 데이터가 저장된 디렉토리
    target_size=(64, 64),  # 이미지 크기 조정
    batch_size=32,         # 배치 크기
    class_mode='binary',   # 이진 분류
    subset='validation'    # 검증 데이터
)

# 다층 신경망 모델 구성
model = Sequential()

# 입력 데이터를 평탄화 (Flatten)하여 1차원으로 변환
model.add(Flatten(input_shape=(64, 64, 3)))  # 이미지 크기가 64x64, RGB 채널 3개

# 은닉층 (뉴런 128개)
model.add(Dense(128, activation='relu'))

# 은닉층 (뉴런 64개)
model.add(Dense(64, activation='relu'))

# 출력층 (뉴런 1개, 시그모이드 활성화 함수 사용)
model.add(Dense(1, activation='sigmoid'))

# 모델 컴파일 (이진 분류, 손실 함수로 binary_crossentropy 사용)
model.compile(optimizer='adam',
              loss='binary_crossentropy',
              metrics=['accuracy'])

# 모델 학습
history = model.fit(
    train_generator,
    steps_per_epoch=train_generator.samples // train_generator.batch_size,
    epochs=500,  # 에포크 수를 설정하여 학습 반복
    validation_data=validation_generator,
    validation_steps=validation_generator.samples // validation_generator.batch_size
)

# 모델 저장
model.save('dog_cat_classifier_mlp.h5')

# 테스트용 데이터로 예측
test_loss, test_acc = model.evaluate(validation_generator)
print(f"테스트 정확도: {test_acc}")

Found 22 images belonging to 3 classes.
Found 4 images belonging to 3 classes.
Epoch 1/500
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 2s/step - accuracy: 0.0000e+00 - loss: 1.2933 - val_accuracy: 0.5000 - val_loss: -5.7251
Epoch 2/500
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 96ms/step - accuracy: 0.5000 - loss: -4.6207 - val_accuracy: 0.5000 - val_loss: -13.9276
Epoch 3/500
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 141ms/step - accuracy: 0.5000 - loss: -11.1816 - val_accuracy: 0.5000 - val_loss: -22.8343
Epoch 4/500
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 135ms/step - accuracy: 0.5000 - loss: -18.2826 - val_accuracy: 0.5000 - val_loss: -32.7275
Epoch 5/500
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 100ms/step - accuracy: 0.5000 - loss: -26.2384 - val_accuracy: 0.5000 - val_loss: -44.2486
Epoch 6/500
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 96ms/step - accuracy: 0.50



[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 53ms/step - accuracy: 0.5000 - loss: -2951635.2500
테스트 정확도: 0.5


In [11]:
import tensorflow as tf
from tensorflow.keras.models import load_model
from tensorflow.keras.preprocessing import image
import numpy as np

# 모델 로드
model = load_model('dog_cat_classifier_mlp.h5')

# 테스트 이미지 경로
test_image_path = '/content/data/dog/dog (1).jpeg'  # 테스트 이미지 경로를 지정

# 테스트 이미지 로드 및 전처리
def load_and_preprocess_image(img_path):
    # 이미지를 64x64 크기로 로드하고 RGB로 변환
    img = image.load_img(img_path, target_size=(64, 64))

    # 이미지를 numpy 배열로 변환
    img_array = image.img_to_array(img)

    # 차원을 추가하여 (1, 64, 64, 3) 형태로 만듦 (모델 입력 차원과 맞춤)
    img_array = np.expand_dims(img_array, axis=0)

    # 이미지의 픽셀 값을 0-1 사이로 정규화
    img_array /= 255.0

    return img_array

# 이미지 로드 및 전처리
test_image = load_and_preprocess_image(test_image_path)

# 분류 예측
prediction = model.predict(test_image)

# 예측 결과 해석
if prediction[0] > 0.5:
    print("이 이미지는 개일 가능성이 높습니다.")
else:
    print("이 이미지는 고양이일 가능성이 높습니다.")



[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 99ms/step
이 이미지는 개일 가능성이 높습니다.


In [13]:
#다층신경망을 이용한 매출 예측
import pandas as pd
import numpy as np
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import r2_score

# 1. 하드코딩된 매출 데이터 생성 (30년간의 매출 데이터)
years = np.arange(1991, 2021)  # 1991년부터 2020년까지의 30년간 데이터
sales = np.array([120, 135, 160, 180, 190, 220, 240, 260, 280, 300, 320, 350, 370, 390, 410,
                  430, 450, 470, 480, 500, 520, 530, 540, 560, 580, 600, 620, 640, 660, 680])  # 매출 데이터

# 2. 매출에 영향을 줄 수 있는 변수 생성
marketing_spend = np.array([80, 85, 90, 95, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200,
                            210, 220, 230, 240, 250, 260, 270, 280, 290, 300, 310, 320, 330, 340, 350])  # 마케팅 비용
economy_index = np.array([1.0, 1.1, 0.9, 1.2, 1.0, 0.8, 1.1, 1.0, 0.9, 1.2, 1.0, 1.1, 1.0, 0.9, 1.2,
                          1.0, 0.8, 1.1, 1.0, 0.9, 1.2, 1.0, 1.1, 1.0, 0.9, 1.2, 1.0, 0.9, 1.2, 1.0])  # 경제 지수

# 3. 데이터를 Pandas DataFrame으로 처리
data = pd.DataFrame({
    'Year': years,
    'Sales': sales,
    'Marketing_Spend': marketing_spend,
    'Economy_Index': economy_index
})

print(data.head())  # 데이터 미리보기

# 4. 입력 변수(X)와 출력 변수(y)를 정의
X = data[['Year', 'Marketing_Spend', 'Economy_Index']].values  # 연도, 마케팅 비용, 경제 지수
y = data['Sales'].values  # 매출

# 5. 데이터 정규화 (입력 데이터 스케일 조정)
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)  # X 데이터를 정규화

# 6. 다층 신경망 모델 정의
model = Sequential()
model.add(Dense(128, activation='relu', input_shape=(X_scaled.shape[1],)))  # 은닉층 1 (뉴런 128개로 증가)
model.add(Dense(64, activation='relu'))  # 은닉층 2 (뉴런 64개로 증가)
model.add(Dense(32, activation='relu'))  # 은닉층 3 추가 (뉴런 32개)
model.add(Dense(1))  # 출력층 (매출 예측)

# 7. 모델 컴파일 (learning_rate를 조정)
optimizer = tf.keras.optimizers.Adam(learning_rate=0.001)  # 학습률 0.001로 설정
model.compile(optimizer=optimizer, loss='mean_squared_error')

# 8. 모델 학습 (Epochs와 Batch Size를 조정)
model.fit(X_scaled, y, epochs=500, batch_size=10, verbose=1)  # 에포크 수 증가, 배치 크기 감소

# 9. 모델 성능 측정 (R² 값 계산)
y_pred = model.predict(X_scaled)

# R² 계산
r2 = r2_score(y, y_pred)
print(f"R² 값: {r2:.4f}")

# 10. 특정 연도의 매출 예측
def predict_sales(year, marketing_spend, economy_index):
    # 예측할 데이터를 정규화
    input_data = np.array([[year, marketing_spend, economy_index]])
    input_data_scaled = scaler.transform(input_data)

    # 예측 수행
    predicted_sales = model.predict(input_data_scaled)
    return predicted_sales[0][0]

# 예시: 2025년의 매출 예측
predicted_sales_2025 = predict_sales(2025, 360, 1.05)
print(f"2025년 예측 매출: {predicted_sales_2025:.2f}")

   Year  Sales  Marketing_Spend  Economy_Index
0  1991    120               80            1.0
1  1992    135               85            1.1
2  1993    160               90            0.9
3  1994    180               95            1.2
4  1995    190              100            1.0


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


Epoch 1/500
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 59ms/step - loss: 181284.2812
Epoch 2/500
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 80ms/step - loss: 197277.0938 
Epoch 3/500
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 64ms/step - loss: 192947.0312 
Epoch 4/500
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 39ms/step - loss: 182944.0938 
Epoch 5/500
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 41ms/step - loss: 199253.7812 
Epoch 6/500
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 38ms/step - loss: 175402.1875 
Epoch 7/500
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 33ms/step - loss: 181242.9531 
Epoch 8/500
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 43ms/step - loss: 186570.6250
Epoch 9/500
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 19ms/step - loss: 190740.6875
Epoch 10/500
[1m3/3[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37

In [22]:
import pandas as pd
import numpy as np
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import r2_score
from pykrx import stock

# 삼성전자의 2025년 주식 데이터 가져오기
df = stock.get_market_ohlcv("20250101", "20250312", "005930")

# 데이터 컬럼 확인
print("컬럼 확인:", df.columns)  # 컬럼명 확인

# 1. 예측을 위한 Feature 생성 (이전 종가를 Feature로 사용)
df['Prev_Close'] = df['종가'].shift(1)  # '종가' 컬럼을 기준으로 이전 종가를 Feature로 사용

# NaN 값 확인 (shift 이후 첫 번째 행은 NaN)
print(df.head())  # 첫 번째 행이 NaN을 포함하는지 확인

# NaN 값 제거
df = df.dropna()  # NaN값이 있는 행 제거

# 2. 입력 변수(X)와 출력 변수(y) 정의
X = df[['Prev_Close']].values  # 이전 종가
y = df['종가'].values  # 현재 종가

# 3. 데이터 정규화 (입력 데이터 스케일 조정)
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)  # X 데이터를 정규화

# 4. 다층 신경망 모델 정의
model = Sequential()
model.add(Dense(128, activation='relu', input_shape=(X_scaled.shape[1],)))  # 은닉층 1
model.add(Dense(64, activation='relu'))  # 은닉층 2
model.add(Dense(32, activation='relu'))  # 은닉층 3
model.add(Dense(1))  # 출력층 (종가 예측)

# 5. 모델 컴파일
optimizer = tf.keras.optimizers.Adam(learning_rate=0.001)  # 학습률 0.001
model.compile(optimizer=optimizer, loss='mean_squared_error')

# 6. 모델 학습 (Epochs와 Batch Size를 조정)
model.fit(X_scaled, y, epochs=500, batch_size=10, verbose=1)  # 에포크 수 500, 배치 크기 10

# 7. 모델 성능 측정 (R² 값 계산)
y_pred = model.predict(X_scaled)

# R² 계산
r2 = r2_score(y, y_pred)
print(f"R² 값: {r2:.4f}")

# 8. 특정 날짜의 종가 예측
predicted_close = model.predict(scaler.transform(np.array([[df['종가'].iloc[-1]]])))  # 마지막 날 종가 예측
print(f"2025년 3월 12일 예측 종가: {predicted_close[0][0]:.2f}")


컬럼 확인: Index(['시가', '고가', '저가', '종가', '거래량', '등락률'], dtype='object')
               시가     고가     저가     종가       거래량       등락률  Prev_Close
날짜                                                                    
2025-01-02  52700  53600  52300  53400  16630538  0.375940         NaN
2025-01-03  52800  55100  52800  54400  19318046  1.872659     53400.0
2025-01-06  54400  56200  54300  55900  19034284  2.757353     54400.0
2025-01-07  56800  57300  55400  55400  17030235 -0.894454     55900.0
2025-01-08  54800  57500  54700  57300  26593553  3.429603     55400.0


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


Epoch 1/500
[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 14ms/step - loss: 3030512640.0000
Epoch 2/500
[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 35ms/step - loss: 3019186176.0000 
Epoch 3/500
[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 30ms/step - loss: 3018976256.0000 
Epoch 4/500
[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 57ms/step - loss: 3020592128.0000 
Epoch 5/500
[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 73ms/step - loss: 3017618176.0000
Epoch 6/500
[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 38ms/step - loss: 3036661248.0000 
Epoch 7/500
[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 33ms/step - loss: 3006634240.0000
Epoch 8/500
[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 16ms/step - loss: 3015600640.0000 
Epoch 9/500
[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 40ms/step - loss: 3016761856.0000 
Epoch 10/500
[1m5/5[



[1m2/2[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 60ms/step
R² 값: 0.7088
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 40ms/step
2025년 3월 12일 예측 종가: 54841.45


In [23]:
!pip install finance-datareader
!pip install pykrx

import pandas as pd
import numpy as np
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import r2_score
from pykrx import stock
import FinanceDataReader as fdr

# 1. 삼성전자 종가 데이터 가져오기
df = stock.get_market_ohlcv("20220101", "20221231", "005930")
df.reset_index(inplace=True)

# 2. 날짜 변환 (연도, 월, 일)
df['Year'] = df['날짜'].dt.year
df['Month'] = df['날짜'].dt.month
df['Day'] = df['날짜'].dt.day

# 3. 주요 경제 지수 데이터 가져오기 (KOSPI, KOSDAQ, KOSPI200, USD/KRW 환율)
kospi = fdr.DataReader('KS11', '2022-01-01', '2022-12-31')['Close']
kosdaq = fdr.DataReader('KQ11', '2022-01-01', '2022-12-31')['Close']
kospi200 = fdr.DataReader('KS200', '2022-01-01', '2022-12-31')['Close']
usd_krw = fdr.DataReader('USD/KRW', '2022-01-01', '2022-12-31')['Close']

# 4. 경제 지수 병합
df = df.set_index('날짜')
df['KOSPI'] = kospi
df['KOSDAQ'] = kosdaq
df['KOSPI200'] = kospi200
df['USD_KRW'] = usd_krw
df.dropna(inplace=True)  # NaN 데이터 제거

# 5. 데이터 정리 및 입력 변수 설정 (KRX300 삭제)
df.reset_index(inplace=True)
df = df[['Year', 'Month', 'Day', '거래량', 'KOSPI', 'KOSDAQ', 'KOSPI200', 'USD_KRW', '종가']]

# 6. 입력 변수(X)와 출력 변수(y) 정의 (KRX300 삭제)
X = df[['Year', 'Month', 'Day', '거래량', 'KOSPI', 'KOSDAQ', 'KOSPI200', 'USD_KRW']].values
y = df['종가'].values

# 7. 데이터 정규화
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# 8. 다층 신경망 모델 정의
model = Sequential([
    Dense(128, activation='relu', input_shape=(X_scaled.shape[1],)),
    Dense(64, activation='relu'),
    Dense(32, activation='relu'),
    Dense(1)  # 출력층 (종가 예측)
])

# 9. 모델 컴파일 및 학습
model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=0.001), loss='mean_squared_error')
model.fit(X_scaled, y, epochs=500, batch_size=10, verbose=1)

# 10. 모델 성능 평가 (R² 값 계산)
y_pred = model.predict(X_scaled)
r2 = r2_score(y, y_pred)
print(f"R² 값: {r2:.4f}")

# 11. 특정 날짜의 삼성전자 종가 예측 함수 (KRX300 삭제)
def predict_stock_price(year, month, day, volume, kospi, kosdaq, kospi200, usd_krw):
    input_data = np.array([[year, month, day, volume, kospi, kosdaq, kospi200, usd_krw]])
    input_data_scaled = scaler.transform(input_data)

    predicted_price = model.predict(input_data_scaled)
    return predicted_price[0][0]

# 12. 2025년 1월 2일 삼성전자 종가 예측 (거래량 1,500만, 예측된 경제 지수 사용)
kospi_2025 = 3100  # 예측된 KOSPI 지수
kosdaq_2025 = 950  # 예측된 KOSDAQ 지수
kospi200_2025 = 430  # 예측된 KOSPI200 지수
usd_krw_2025 = 1300  # 예측된 USD/KRW 환율

predicted_price_2025 = predict_stock_price(2025, 1, 2, 15000000, kospi_2025, kosdaq_2025, kospi200_2025, usd_krw_2025)
print(f"2025년 1월 2일 삼성전자 종가 예측: {predicted_price_2025:.2f} 원")

Collecting finance-datareader
  Downloading finance_datareader-0.9.96-py3-none-any.whl.metadata (12 kB)
Collecting requests-file (from finance-datareader)
  Downloading requests_file-2.1.0-py2.py3-none-any.whl.metadata (1.7 kB)
Downloading finance_datareader-0.9.96-py3-none-any.whl (48 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m48.2/48.2 kB[0m [31m2.3 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading requests_file-2.1.0-py2.py3-none-any.whl (4.2 kB)
Installing collected packages: requests-file, finance-datareader
Successfully installed finance-datareader-0.9.96 requests-file-2.1.0
Epoch 1/500


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m22/22[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 3ms/step - loss: 4236558336.0000
Epoch 2/500
[1m22/22[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - loss: 4217685504.0000 
Epoch 3/500
[1m22/22[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - loss: 4277936640.0000 
Epoch 4/500
[1m22/22[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - loss: 4166433792.0000 
Epoch 5/500
[1m22/22[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - loss: 4064454144.0000 
Epoch 6/500
[1m22/22[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - loss: 4078705152.0000 
Epoch 7/500
[1m22/22[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - loss: 4006934272.0000 
Epoch 8/500
[1m22/22[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 4ms/step - loss: 3883332864.0000
Epoch 9/500
[1m22/22[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - loss: 3706792960.0000 
Epoch 10/500
[1m22/22[

In [25]:
!pip install finance-datareader
!pip install pykrx

import pandas as pd
import numpy as np
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import r2_score
from pykrx import stock
import FinanceDataReader as fdr

# 1. 삼성전자 종가 데이터 가져오기
df = stock.get_market_ohlcv("20250101", "20250312", "000660")
df.reset_index(inplace=True)

# 2. 날짜 변환 (연도, 월, 일)
df['Year'] = df['날짜'].dt.year
df['Month'] = df['날짜'].dt.month
df['Day'] = df['날짜'].dt.day

# 3. 주요 경제 지수 데이터 가져오기 (KOSPI, KOSDAQ, KOSPI200, USD/KRW 환율)
kospi = fdr.DataReader('KS11', '2025-01-01', '2025-03-12')['Close']
kosdaq = fdr.DataReader('KQ11', '2025-01-01', '2025-03-12')['Close']
kospi200 = fdr.DataReader('KS200', '2025-01-01', '2025-03-12')['Close']
usd_krw = fdr.DataReader('USD/KRW', '2025-01-01', '2025-03-12')['Close']

# 4. 경제 지수 병합
df = df.set_index('날짜')
df['KOSPI'] = kospi
df['KOSDAQ'] = kosdaq
df['KOSPI200'] = kospi200
df['USD_KRW'] = usd_krw
df.dropna(inplace=True)  # NaN 데이터 제거

# 5. 데이터 정리 및 입력 변수 설정 (KRX300 삭제)
df.reset_index(inplace=True)
df = df[['Year', 'Month', 'Day', '거래량', 'KOSPI', 'KOSDAQ', 'KOSPI200', 'USD_KRW', '종가']]

# 6. 입력 변수(X)와 출력 변수(y) 정의 (KRX300 삭제)
X = df[['Year', 'Month', 'Day', '거래량', 'KOSPI', 'KOSDAQ', 'KOSPI200', 'USD_KRW']].values
y = df['종가'].values

# 7. 데이터 정규화
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# 8. 다층 신경망 모델 정의
model = Sequential([
    Dense(128, activation='relu', input_shape=(X_scaled.shape[1],)),
    Dense(64, activation='relu'),
    Dense(32, activation='relu'),
    Dense(1)  # 출력층 (종가 예측)
])

# 9. 모델 컴파일 및 학습
model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=0.001), loss='mean_squared_error')
model.fit(X_scaled, y, epochs=500, batch_size=10, verbose=1)

# 10. 모델 성능 평가 (R² 값 계산)
y_pred = model.predict(X_scaled)
r2 = r2_score(y, y_pred)
print(f"R² 값: {r2:.4f}")

# 11. 특정 날짜의 하이닉스 종가 예측 함수 (KRX300 삭제)
def predict_stock_price(year, month, day, volume, kospi, kosdaq, kospi200, usd_krw):
    input_data = np.array([[year, month, day, volume, kospi, kosdaq, kospi200, usd_krw]])
    input_data_scaled = scaler.transform(input_data)

    predicted_price = model.predict(input_data_scaled)
    return predicted_price[0][0]

# 12. 2025년 3월 12일 하이닉스 종가 예측 (거래량 1,500만, 예측된 경제 지수 사용)
kospi_2025 =  2574  # 예측된 KOSPI 지수
kosdaq_2025 = 729  # 예측된 KOSDAQ 지수
kospi200_2025 = 355  # 예측된 KOSPI200 지수
usd_krw_2025 = 1460  # 예측된 USD/KRW 환율

predicted_price_2025 = predict_stock_price(2025, 1, 2, 15000000, kospi_2025, kosdaq_2025, kospi200_2025, usd_krw_2025)
print(f"2025년 3월 13일 하이닉스 종가 예측: {predicted_price_2025:.2f} 원")

Epoch 1/500


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 8ms/step - loss: 40724172800.0000
Epoch 2/500
[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 7ms/step - loss: 40818360320.0000 
Epoch 3/500
[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 8ms/step - loss: 40789327872.0000 
Epoch 4/500
[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 7ms/step - loss: 40641789952.0000 
Epoch 5/500
[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 8ms/step - loss: 40100687872.0000 
Epoch 6/500
[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 7ms/step - loss: 40515633152.0000 
Epoch 7/500
[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 7ms/step - loss: 40966557696.0000 
Epoch 8/500
[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 7ms/step - loss: 41009520640.0000 
Epoch 9/500
[1m5/5[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 7ms/step - loss: 40993165312.0000 
Epoch 10/500
[1m5/5[0m [32m━━