<a href="https://colab.research.google.com/github/bigpine-choi/commercial-real-estate-analysis/blob/main/LSTM_%EC%98%88%EC%B8%A1_%EB%AA%A8%EB%8D%B8_%EC%98%A4%ED%94%BC%EC%8A%A4_all.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 📈 LSTM 기반 투자수익률 예측 모델 (전체 데이터셋)

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.preprocessing import MinMaxScaler
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense

In [None]:
# ✅ 파라미터 설정
time_steps = 8
predict_steps = 4
target_column = "투자수익률"
feature_columns = ["임대료", "공실률", "순영업소득", "투자수익률"]

In [None]:
# ✅ 데이터 로딩
from google.colab import files
uploaded = files.upload()
df = pd.read_csv("/content/오피스_임대료_공실률_투자수익률_순영업소득_all.csv", encoding="utf-8-sig")

Saving 오피스_임대료_공실률_투자수익률_순영업소득_all.csv to 오피스_임대료_공실률_투자수익률_순영업소득_all.csv


In [None]:
# ✅ 예측 함수 정의
def predict_for_region(region_name):
    region_df = df[df["CLS_NM"] == region_name].copy()
    region_df = region_df.sort_values("WRTTIME_DESC")
    pivot_df = region_df.pivot(index="WRTTIME_DESC", columns="지표", values="DTA_VAL")[feature_columns].dropna()
    if pivot_df.shape[0] < time_steps + predict_steps:
        raise ValueError("시계열 길이가 부족함")
    scaler = MinMaxScaler()
    scaled_data = scaler.fit_transform(pivot_df)
    X, y = [], []
    for i in range(len(scaled_data) - time_steps - predict_steps + 1):
        X.append(scaled_data[i:i+time_steps])
        y.append(scaled_data[i+time_steps:i+time_steps+predict_steps, 3])
    X, y = np.array(X), np.array(y)
    model = Sequential()
    model.add(LSTM(64, activation="relu", input_shape=(time_steps, X.shape[2])))
    model.add(Dense(predict_steps))
    model.compile(optimizer="adam", loss="mse")
    model.fit(X, y, epochs=100, batch_size=8, verbose=0)
    last_seq = scaled_data[-time_steps:]
    last_seq = np.expand_dims(last_seq, axis=0)
    pred_scaled = model.predict(last_seq)
    future_pred = scaler.inverse_transform(np.concatenate([np.zeros((predict_steps, 3)), pred_scaled.reshape(-1, 1)], axis=1))[:, -1]
    return pivot_df.index[-1], future_pred

In [None]:
# ✅ 전체 지역 예측 실행
results = {}
for region in df["CLS_NM"].unique():
    try:
        last_date, forecast = predict_for_region(region)
        results[region] = forecast
        print(f"✅ {region} 완료 | 마지막 분기: {last_date} | 예측값: {np.round(forecast, 2)}")
    except Exception as e:
        print(f"⚠️ {region} 예측 실패: {e}")

⚠️ 신문로지역 예측 실패: "['순영업소득'] not in index"
⚠️ 우정국로지역 예측 실패: "['순영업소득'] not in index"
⚠️ 무교지역 예측 실패: "['순영업소득'] not in index"
⚠️ 청계지역 예측 실패: "['순영업소득'] not in index"
⚠️ 서울역지역 예측 실패: "['순영업소득'] not in index"
⚠️ 남대문지역 예측 실패: "['순영업소득'] not in index"
⚠️ 명동지역 예측 실패: "['순영업소득'] not in index"
⚠️ 기타지역 예측 실패: "['순영업소득'] not in index"
⚠️ 마포지역 예측 실패: "['순영업소득'] not in index"
⚠️ 국회앞지역 예측 실패: "['순영업소득'] not in index"
⚠️ 여의도중앙지역 예측 실패: "['순영업소득'] not in index"
⚠️ 증권거래소지역 예측 실패: "['순영업소득'] not in index"
⚠️ 영등포지역 예측 실패: "['순영업소득'] not in index"
⚠️ 방배지역 예측 실패: "['순영업소득'] not in index"
⚠️ 서초지역 예측 실패: "['순영업소득'] not in index"
⚠️ 도산로지역 예측 실패: "['순영업소득'] not in index"
⚠️ 역삼북부지역 예측 실패: "['순영업소득'] not in index"
⚠️ 선릉북부지역 예측 실패: "['순영업소득'] not in index"
⚠️ 삼성북부지역 예측 실패: "['순영업소득'] not in index"
⚠️ 역삼남부지역 예측 실패: "['순영업소득'] not in index"
⚠️ 선릉남부지역 예측 실패: "['순영업소득'] not in index"
⚠️ 삼성남부지역 예측 실패: "['순영업소득'] not in index"
⚠️ 양재지역 예측 실패: "['순영업소득'] not in index"
⚠️ 송파지역 예측 실패: "['순영업소득'] not in index"
⚠️ 충정로지역 예측 실패

  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 267ms/step
✅ 광화문 완료 | 마지막 분기: 2024년 4분기 | 예측값: [2.65 2.56 1.74 1.09]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 185ms/step
✅ 동대문 완료 | 마지막 분기: 2024년 4분기 | 예측값: [2.1  2.14 1.53 1.09]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 181ms/step
✅ 명동 완료 | 마지막 분기: 2024년 4분기 | 예측값: [1.06 1.07 1.07 0.95]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 189ms/step
✅ 종로 완료 | 마지막 분기: 2024년 4분기 | 예측값: [1.48 1.62 1.53 1.64]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 180ms/step


  super().__init__(**kwargs)


✅ 충무로 완료 | 마지막 분기: 2024년 4분기 | 예측값: [0.99 0.92 0.76 0.88]




[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 181ms/step


  super().__init__(**kwargs)


✅ 강남대로 완료 | 마지막 분기: 2024년 4분기 | 예측값: [3.24 2.56 2.53 2.1 ]
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 181ms/step
✅ 도산대로 완료 | 마지막 분기: 2024년 4분기 | 예측값: [1.16 1.45 2.37 3.07]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 178ms/step
✅ 서초 완료 | 마지막 분기: 2020년 4분기 | 예측값: [1.3  1.07 1.39 2.49]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 178ms/step
✅ 테헤란로 완료 | 마지막 분기: 2024년 4분기 | 예측값: [2.06 2.23 2.35 2.4 ]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 262ms/step
✅ 공덕역 완료 | 마지막 분기: 2024년 4분기 | 예측값: [1.73 1.79 1.14 1.25]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 169ms/step
✅ 여의도 완료 | 마지막 분기: 2024년 4분기 | 예측값: [1.84 2.   0.95 0.9 ]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 192ms/step
✅ 영등포 완료 | 마지막 분기: 2020년 4분기 | 예측값: [1.95 1.59 1.31 1.44]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 180ms/step
✅ 목동 완료 | 마지막 분기: 2024년 4분기 | 예측값: [1.06 1.09 1.01 1.12]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 843ms/step
✅ 사당 완료 | 마지막 분기: 2024년 4분기 | 예측값: [1.48 1.35 1.14 1.06]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 180ms/step
✅ 용산 완료 | 마지막 분기: 2020년 4분기 | 예측값: [1.25 1.06 1.04 1.16]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 186ms/step
✅ 잠실 완료 | 마지막 분기: 2020년 4분기 | 예측값: [1.41 1.32 1.45 1.73]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 177ms/step
✅ 장안동 완료 | 마지막 분기: 2024년 4분기 | 예측값: [1.27 1.61 1.54 1.5 ]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 262ms/step
✅ 천호 완료 | 마지막 분기: 2024년 4분기 | 예측값: [1.94 2.49 2.54 2.55]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 175ms/step
✅ 화곡 완료 | 마지막 분기: 2024년 4분기 | 예측값: [0.92 1.12 1.35 1.43]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 168ms/step
✅ 논현역 완료 | 마지막 분기: 2024년 4분기 | 예측값: [1.41 1.68 1.66 1.66]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 190ms/step
✅ 신사역 완료 | 마지막 분기: 2021년 4분기 | 예측값: [2.33 2.39 2.14 2.81]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 175ms/step
✅ 남대문 완료 | 마지막 분기: 2024년 4분기 | 예측값: [2.18 1.83 0.68 0.57]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 211ms/step
✅ 시청 완료 | 마지막 분기: 2024년 4분기 | 예측값: [2.42 2.86 2.42 1.73]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 181ms/step
✅ 을지로 완료 | 마지막 분기: 2024년 4분기 | 예측값: [1.95 2.13 2.04 1.34]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 186ms/step
✅ 교대역 완료 | 마지막 분기: 2024년 4분기 | 예측값: [1.88 1.74 1.74 1.81]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 174ms/step
✅ 남부터미널 완료 | 마지막 분기: 2024년 4분기 | 예측값: [1.36 1.46 1.64 1.71]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 175ms/step
✅ 당산역 완료 | 마지막 분기: 2024년 4분기 | 예측값: [1.92 1.98 1.22 1.28]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 177ms/step
✅ 영등포역 완료 | 마지막 분기: 2024년 4분기 | 예측값: [2.22 1.2  0.62 1.3 ]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 186ms/step
✅ 숙명여대 완료 | 마지막 분기: 2024년 4분기 | 예측값: [2.29 2.31 1.76 2.7 ]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 261ms/step
✅ 용산역 완료 | 마지막 분기: 2024년 4분기 | 예측값: [2.03 2.63 1.61 1.12]
⚠️ 잠실/송파 예측 실패: 시계열 길이가 부족함


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 178ms/step
✅ 잠실새내역 완료 | 마지막 분기: 2024년 4분기 | 예측값: [1.8  1.94 1.35 1.52]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 173ms/step
✅ 홍대/합정 완료 | 마지막 분기: 2024년 4분기 | 예측값: [1.67 1.61 0.94 1.09]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 180ms/step
✅ 남포동 완료 | 마지막 분기: 2024년 4분기 | 예측값: [0.15 0.4  0.32 0.12]


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 185ms/step
✅ 부산역 완료 | 마지막 분기: 2024년 4분기 | 예측값: [1.25 1.43 0.97 0.74]


In [None]:
# ✅ 결과 정리 및 저장
result_df = pd.DataFrame(results).T
result_df.columns = [f"예측_{i+1}분기후" for i in range(predict_steps)]
result_df["예측평균"] = result_df.mean(axis=1)
result_df = result_df.sort_values("예측평균", ascending=False)

# ✅ 출력
print("\n📌 향후 투자수익률 예측 결과 (상위 지역):")
print(result_df.head())

# ✅ 저장
result_df.to_csv("LSTM_예측_투자수익률_지역별_all.csv", encoding="utf-8-sig")


📌 향후 투자수익률 예측 결과 (상위 지역):
       예측_1분기후   예측_2분기후   예측_3분기후   예측_4분기후      예측평균
강남대로  3.236031  2.559053  2.534785  2.101943  2.607953
신사역   2.328967  2.392010  2.143230  2.807122  2.417832
천호    1.943969  2.487446  2.541084  2.549999  2.380625
시청    2.419248  2.861435  2.421274  1.729801  2.357939
숙명여대  2.286740  2.305648  1.756581  2.701312  2.262570
