# 딥러닝 개발 플랫폼
1. 텐서플로우TensorFlow
    - 구글에서 개발한 오픈 소스 라이브러리
    - 가장 보편적이고 잘 관리된 딥러닝 라이브러리 중 하나
2. 케라스Keras
    - 파이썬 기반으로 작성된 매우 가볍고 배우기 쉬운 오픈 소스 신경망 라이브러리
    - 텐서플로우, 티아노, CNTK 등의 딥러닝 전용 엔진 위에서 사용하는 단순화된 인터페이스 제공
3. 파이토치PyTorch
    - 페이스북(현 메타)에서 개발한 오픈 소스 라이브러리
    - 구현이 빠르고 유연성이 좋아 초보자가 사용하기 쉬운 딥러닝 프레임워크

케라스를 사용한 딥러닝 모델 설계 기본 과정
1. tensorflow.keras.Sequential( ) : 텐서플로우 기반 케라스가 제공하는 시퀀스 모델 선언
- 다층 퍼셉트론 구조 설계는 입력층-은닉층-출력층을 순차적으로 하나씩 쌓는 계층 구조
2. add( ) : 시퀀스 모델 안에 실제로 층을 추가하는 작업
- 추가하는 층의 유형(Dense, LSTM, Conv2D 등) 및 노드 개수, 활성화 함수 등을 설정
- 함수 사용 예: model.add(Dense(units=64, activation='relu', input_dim=100))
- 층Layer의 유형  
» Dense( ): 기본 형태의 층: 이전 층의 모든 노드와 완전 연결된 층을 추가  
» LSTM( ): LSTM 층 추가  
» Conv2D( ): 2차원 입력 데이터에 대해 합성곱convolution 연산을 수행하는 층  
- add() 함수의 매개변수  
» input_dim: 첫 번째 입력층의 노드 개수(첫 번째 층 추가에서만 사용하는 매개변수)  
» unit: 추가하는 층의 노드 개수(추가하는 층에서 출력되는 값의 개수)  
» activation: 출력값 생성에 사용하는 활성화 함수(예: sigmoid, tanh, relu, softmax)
3. compile( ) : 설계한 모델에 대한 학습 준비 과정. 학습에 필요한 손실 함수loss, 최적화 방법optimizer, 평가 지
표metrics 설정
- 매개변수 loss : 모델의 출력값(예측값)과 실제 값의 차이(손실) 계산에 사용할 함수 설정  
» mean_squared_error, categorical_crossentropy
- 매개변수 optimizer : 가중치 업데이트 작업의 속도와 정확도를 높이는 최적화 방법 설정  
» adam, sgd(확률적 경사 하강법 Stochastic Gradient Descent)
- 매개변수 metrics : 모델의 성능 평가 지표  
» accuracy, mse, precision, recall, f1-score
4. fit( ) : (1) 모델 학습 수행 (2)학습 데이터 및 학습에 필요한 매개변수 설정
- 매개변수 x: 학습용 입력 데이터가 저장된 넘파이 배열 또는 넘파이 배열의 리스트
- 매개변수 y: 학습용 출력 데이터가 저장된 넘파이 배열 또는 넘파이 배열의 리스트
- 매개변수 epochs: 모델이 전체 샘플을 학습할 총 횟수(기본값은 1)
- 매개변수 batch_size: 한 번에 처리되는 샘플의 수(기본값은 32)
- 매개변수 verbose: 학습 과정에 대한 출력 방법(기본값은 1)  
» 0이면 출력 없음  
» 1이면 진행바 progress bar 표시  
» 2이면 에포크epoch마다 한 줄씩 출력  
- History 객체 : fit( ) 함수는 모델 학습을 시작하고 각 에포크마다 손실과 평가 지표를 계산. 함수 계산이 끝나면 학습
과정에서 발생한 정보들을 담은 History 객체 반환

### 퍼셉트론 장점
- 구조가 매우 단순하고 계산이 빠름  
» 선형 결합(가중합) + 단순 활성화 함수만 사용하므로 연산량이 적음  
» 초기 머신러닝·신경망 모델 중 가장 이해하고 구현하기 쉬운 모델  
- 선형 분류 문제에서 높은 효율  
» 입력 데이터가 선형적으로 구분 가능(linearly separable) 한 경우 빠르게 수렴  
» 퍼셉트론 학습 규칙을 통해 결정 경계를 명확하게 학습함  
- 온라인 학습 가능  
» 데이터를 한 개씩 받으면서도 즉시 가중치를 업데이트할 수 있음  
» 스트리밍 데이터나 실시간 데이터 처리에 적합  
### 퍼셉트론 단점
- 비선형 문제를 해결할 수 없음  
» XOR 문제처럼 선형으로 구분할 수 없는 데이터는 퍼셉트론으로 해결 불가
- 단층 구조(single-layer)에서는 특징을 조합하거나 추상화하는 능력이 부족

## 딥러닝DL, Deep Learning
- 심층 신경망Deep Neural Network에서 유래한 이름이며, 다층 퍼셉트론 구조를 기반으로 하여 데이터 학습을 통해 모델을 완성하는 알고리즘
    - 임의의 초기 가중치를 설정하여 결괏값 y를 계산하여 오차를 구하고, 오차를 줄이기 위해 수정된 가중치를 이전 노드로 전달하여 가중치를 업데이트하고 다시 결괏값 y를 계산하여 오차를 구함
    - 이 과정을 반복하여 오차를 최소화함으로써 최적화된 신경망 모델을 완성함

### 딥러닝 알고리즘: 순환 신경망RNN, Recurrent Neural Network
- RNN은 은닉층 노드의 활성화 함수 출력을 출력층뿐 아니라 은닉층 노드에 전달하여 다음 출력값 계
산에 사용하는 순환적(재귀적) 구조
- RNN의 메모리 셀 구조
    - 셀(메모리 셀) : 은닉층에서 활성화 함수를 사용해 결과를 내보내는 역할을 하는 노드
        » 이전 계산값을 다음 계산에 사용하기 위해 기억하는 역할
    - 시점 t에서 은닉 노드의 상태 ht를 결정하기 위해 입력층 xt를 위한 가중치 wxh와 이전 시점 t-1의 은닉상태 값인 ht-1을 위한 가중치 whh, 활성화 함수(하이퍼볼릭탄젠트hyperbolic tangent 함수)를 사용

#### 순환 신경망: 장점
- RNN은 입력을 순서대로 처리하고 이전 시점의 정보를 기억하므로 시계열 데이터(주가 등), 자연어 문장 예측에 적합
- 입력 길이가 가변적이어도 잘 처리함
- 메모리(은닉 상태)를 이용해 문맥 정보를 사용
- 구조가 직관적이고 구현이 간단
#### 순환 신경망: 단점
- 기울기 소실(Vanishing Gradient) 문제  
    » 시퀀스 길이가 길어질수록초기 시점의 정보가 뒤로 갈수록 사라지는 문제가 매우 심각함  
    » Transformer에서는 완전히 RNN을 대체하게 된 핵심 이유  
- 장기 의존성(Long-term Dependency)을 잘 학습 못함
- RNN은 순차적으로 한 단계씩 계산해야 해서 병렬화가 어려움

딥러닝 알고리즘: LSTM 기반 순환신경망LSTM based RNN
- LSTM(Long Short-Term Memory)
    - [그림 14-4(c)]에서 입력 벡터를 구성하는 시점의 수, 즉 시퀀스 sequence가 길어지면 첫 번째 입력값인 x1의 정보량이 점점 소실되는 기울기 소실Gradient Vanishing 문제 발생  
    » 이러한 문제를 해결하기 위해 RNN을 변형한 알고리즘
    - LSTM은 RNN 메모리 셀에 망각 게이트Forget gate, 입력 게이트Input gate, 출력 게이트Output gate, 후보 게이트 Candidate gate를 추가해서 계산한 셀 상태Cell State 값 Ct 를 이용
    - 각 시점에서 필요한 정보만 유지하도록 함으로써 정보 저장 기간을 연장하는 방법으로 정보량 소실 문제를 해결한 알고리즘
      ![image.png](attachment:7ef23afc-7581-4123-bcbe-2462c997de40.png)

#### LSTM 기반 순환신경망: 장점
- 장기 의존성(Long-Term Dependency)을 잘 학습  
» 기본 RNN에서 심각한 문제였던 기울기 소실(Vanishing Gradient) 문제를게이트 구조(Forget/Input/Output Gate)로 완화함  
» 과거의 중요한 정보를 오래 유지 가능  
» 긴 문장, 긴 시계열, 문맥 의존성이 큰 문제에 강함  
- 불필요한 정보는 버리고 필요한 정보만 기억 (Selective Memory)

#### LSTM 기반 순환신경망: 단점
- 연산량이 많고 학습이 느림
- 기울기 소실 문제는 완화했지만 완전히 해결한 것은 아님(문장 길이가 수백~수천 토큰이면 성능 저하)  
    » 긴 시퀀스에서는 한계 존재
- 병렬 처리 불가능 → 느린 추론(Inference)

## 목표: LSTM 딥러닝 모델을 이용한 시계열 분석을 수행하여 주가 변화를 분석하고, 차트로 시각화하여 일별 주가 변화에 따른 주가 예측하기

### 데이터 수집
LSTM 딥러닝 모델을 사용하여 2021년 1월 1일부터 2025년 12월 1일까지의 구글 주가를 분석하기 위해 [야후-파이낸스](https://finance.yahoo.com/)에서 데이터 수집
- 야후-파이낸스에서 종목명 확인하기(https://finance.yahoo.com/)
    - 야후-파이낸스에 접속하여, 검색창에 ‘google’ 입력
    - 여기서 괄호 안에 있는 “GOOG”가 야후-파이낸스에서 사용하는 종목명

In [None]:
# 주가 데이터를 다운로드하기 위해 야후-파이낸스 라이브러리 설치
!pip install yfinance

In [None]:
import pandas as pd
import numpy as np
import yfinance as yf

In [None]:
name = 'GOOG' # 종목명: 구글(GOOGLE)

start_day = '2021-01-01'
end_day = '2025-12-01'

In [None]:
stock = yf.download(name, start=start_day, end=end_day)

In [None]:
print(stock.shape)
stock.head()

In [None]:
stock2 = pd.DataFrame(stock['Close'])
stock2.head()

In [None]:
stock2.to_csv('./dataSet/' + name + '.csv')

In [None]:
stock2.reset_index()
stock_values = stock2.values
print(stock_values[:5])

In [None]:
from sklearn.preprocessing import MinMaxScaler

In [None]:
scaler = MinMaxScaler(feature_range=(0, 1))
stock_values_scaled = scaler.fit_transform(stock_values)

stock_values_scaled[0:5]

In [None]:
n_train = int(len(stock_values)*0.8) # 학습용 데이터 개수
n_test = len(stock_values) - n_train # 평가용 데이터 개수

print(n_train, n_test)

In [None]:
X_train, Y_train = [], []

# 20일 구간의 주가를 x값으로 하고, 그다음 날 값을 y값으로 정리
for i in range(20, n_train):
    X_train.append(stock_values_scaled[i-20:i,0])
    Y_train.append(stock_values_scaled[i,0])

X_train[0:5]

In [None]:
X_train1, Y_train1 = np.array(X_train), np.array(Y_train)
X_train2 = np.reshape(X_train1, (X_train1.shape[0], X_train1.shape[1], 1))
# - Y_train을 배열로 변형np.array( )하여 Y_train1로 저장. X_train은 20개 시계열 값을 하나로 묶은 배열(20×1)을 699개 가진 3차원 배열(699×20×1)로 변형np.reshape( )하여 X_train2로 저장

print(X_train2.shape)
X_train2[0]

In [None]:
from tensorflow.keras import Sequential
from tensorflow.keras.layers import Dense, LSTM, Dropout

In [None]:
lstm_stock = Sequential()

lstm_stock.add(LSTM(units=20, return_sequences=True, input_shape=(X_train2.shape[1],1)))
lstm_stock.add(LSTM(units=20, return_sequences=False))
lstm_stock.add(Dense(1))

In [None]:
# 학습 매개변수 설정
lstm_stock.compile(loss='mean_squared_error', optimizer='adam')

# 학습 수행
lstm_stock.fit(X_train2, Y_train1, epochs=10, batch_size=1, verbose=2)

In [None]:
stock_test = stock_values_scaled[n_train-20:]
X_test=[]

for i in range(20, len(stock_test)):
    X_test.append(stock_test[i-20:i, 0])

X_test[0:5] 

In [None]:
X_test = np.array(X_test)
x_test = np.reshape(X_test, (X_test.shape[0], X_test.shape[1], 1))

print(X_test.shape)
X_test[0]

In [None]:
predicted_value = lstm_stock.predict(X_test)

predicted_value[0]

In [None]:
predicted_value = scaler.inverse_transform(predicted_value)

predicted_value[0]

In [None]:
stock_train_vis = stock[:n_train].copy()
stock_test_vis = stock[n_train:].copy()

stock_test_vis.loc[:, 'Predictions'] = predicted_value

In [None]:
import matplotlib.pyplot as plt

In [None]:
fig = plt.figure(figsize = (12,8))
plt.plot(stock_train_vis['Close'],label ='Train')
plt.plot(stock_test_vis['Close'],label ='Test')
plt.plot(stock_test_vis['Predictions'],label ='Prediction')
plt.legend()
plt.title(name + '(' + start_day + '~' + end_day + ')')

In [None]:
# 기존 날짜: '2025-12-09'
clean_start = start_day.replace('-', '')
clean_end = end_day.replace('-', '')

filename = f"{name}_{clean_start}_{clean_end}.png"
fig.savefig(filename, dpi=300, bbox_inches='tight')

plt.show()
print("저장 완료:", filename)