In [1]:
import pandas as pd
import numpy as np
import folium
from haversine import haversine, Unit
from geopy.geocoders import Nominatim
from folium.plugins import MarkerCluster
import matplotlib
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.cluster import KMeans
from sklearn.preprocessing import StandardScaler, MinMaxScaler
from sklearn.decomposition import PCA
%matplotlib inline

# 관련 라이브러리 임포트 
import matplotlib.font_manager as fm

#  한글글꼴로 변경
# plt.rcParams['font.family'] = '한글글꼴명'
plt.rcParams['font.size'] = 11.0
# plt.rcParams['font.family'] = 'batang'
plt.rcParams['font.family'] = 'Malgun Gothic'

# 그래프에서 마이너스 폰트 깨지는 문제에 대한 대처
matplotlib.rcParams['axes.unicode_minus'] = False

# 그래프 기본 크기 설정 
plt.rcParams['figure.figsize'] = [10, 6]

import warnings
warnings.filterwarnings('ignore')

In [2]:
data1 = pd.read_excel('data/al_Mega_address.xlsx')
del data1['Unnamed: 0']
data1.head(1)

Unnamed: 0,ID,18/1 거래금액(만원),18/1~18/2,증감률,18/1 cluster,18/2 거래금액(만원),18/2~18/3,증감률.1,18/2 cluster,18/3 거래금액(만원),...,22/1 cluster,18/1 거래금액(만원).1,22/2 cluster,전용면적,건축년도,인접역 수,Brand,BrandPower,위도,경도
0,서울특별시 강남구 개포동 개포6차우성아파트1동~8동 80,218666.7,3666.7,1.676844,1,215000.0,0.0,0.0,2,215000.0,...,0,129125.0,1,80,1987.0,0,0,0,37.483372,127.053437


In [3]:
data2 = pd.read_excel('data/NewRent.xlsx')
del data2['Unnamed: 0']
data2.head(1)

Unnamed: 0,시군구,단지명,전월세구분,전용면적(㎡),계약년월,보증금(만원),월세(만원),층,건축년도,도로명,분기
0,서울특별시 강남구 개포동,SH대치1단지아파트,월세,30,2018-03-01,3865,17,11,1991.0,개포로109길 5,2018/1


In [4]:
data2['ID'] = data2['시군구'] + ' ' + data2['단지명'] + ' ' + data2['전용면적(㎡)'].astype('str')
data2.head(1)

Unnamed: 0,시군구,단지명,전월세구분,전용면적(㎡),계약년월,보증금(만원),월세(만원),층,건축년도,도로명,분기,ID
0,서울특별시 강남구 개포동,SH대치1단지아파트,월세,30,2018-03-01,3865,17,11,1991.0,개포로109길 5,2018/1,서울특별시 강남구 개포동 SH대치1단지아파트 30


In [5]:
data2['계약년월'] = pd.to_datetime(data2['계약년월'], format='%Y%m')
data2['분기'], data2['년도'] = (data2['계약년월'].dt.quarter, data2['계약년월'].dt.year)
data2['분기'] = data2[['년도','분기']].apply(lambda row:'/'.join(row.values.astype(str)), axis=1)
data2.head(5)

Unnamed: 0,시군구,단지명,전월세구분,전용면적(㎡),계약년월,보증금(만원),월세(만원),층,건축년도,도로명,분기,ID,년도
0,서울특별시 강남구 개포동,SH대치1단지아파트,월세,30,2018-03-01,3865,17,11,1991.0,개포로109길 5,2018/1,서울특별시 강남구 개포동 SH대치1단지아파트 30,2018
1,서울특별시 강남구 개포동,개포2차현대아파트,월세,80,2018-02-01,39000,30,4,1988.0,언주로 103,2018/1,서울특별시 강남구 개포동 개포2차현대아파트 80,2018
2,서울특별시 강남구 개포동,개포2차현대아파트,전세,80,2018-04-01,52000,0,9,1988.0,언주로 103,2018/2,서울특별시 강남구 개포동 개포2차현대아파트 80,2018
3,서울특별시 강남구 개포동,개포2차현대아파트,전세,80,2018-05-01,50000,0,5,1988.0,언주로 103,2018/2,서울특별시 강남구 개포동 개포2차현대아파트 80,2018
4,서울특별시 강남구 개포동,개포2차현대아파트,전세,80,2018-05-01,56000,0,9,1988.0,언주로 103,2018/2,서울특별시 강남구 개포동 개포2차현대아파트 80,2018


In [6]:
data2.drop(data2[data2['전월세구분'] == '월세'].index, inplace=True)
data2.head()

Unnamed: 0,시군구,단지명,전월세구분,전용면적(㎡),계약년월,보증금(만원),월세(만원),층,건축년도,도로명,분기,ID,년도
2,서울특별시 강남구 개포동,개포2차현대아파트,전세,80,2018-04-01,52000,0,9,1988.0,언주로 103,2018/2,서울특별시 강남구 개포동 개포2차현대아파트 80,2018
3,서울특별시 강남구 개포동,개포2차현대아파트,전세,80,2018-05-01,50000,0,5,1988.0,언주로 103,2018/2,서울특별시 강남구 개포동 개포2차현대아파트 80,2018
4,서울특별시 강남구 개포동,개포2차현대아파트,전세,80,2018-05-01,56000,0,9,1988.0,언주로 103,2018/2,서울특별시 강남구 개포동 개포2차현대아파트 80,2018
5,서울특별시 강남구 개포동,개포6차우성아파트1동~8동,전세,70,2018-01-01,38000,0,3,1987.0,언주로 3,2018/1,서울특별시 강남구 개포동 개포6차우성아파트1동~8동 70,2018
6,서울특별시 강남구 개포동,개포6차우성아파트1동~8동,전세,80,2018-01-01,43000,0,1,1987.0,언주로 3,2018/1,서울특별시 강남구 개포동 개포6차우성아파트1동~8동 80,2018


In [7]:
data2.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 579046 entries, 2 to 864924
Data columns (total 13 columns):
 #   Column   Non-Null Count   Dtype         
---  ------   --------------   -----         
 0   시군구      579046 non-null  object        
 1   단지명      578129 non-null  object        
 2   전월세구분    579046 non-null  object        
 3   전용면적(㎡)  579046 non-null  int64         
 4   계약년월     579046 non-null  datetime64[ns]
 5   보증금(만원)  579046 non-null  object        
 6   월세(만원)   579046 non-null  object        
 7   층        579046 non-null  int64         
 8   건축년도     578907 non-null  float64       
 9   도로명      579046 non-null  object        
 10  분기       579046 non-null  object        
 11  ID       578129 non-null  object        
 12  년도       579046 non-null  int64         
dtypes: datetime64[ns](1), float64(1), int64(3), object(8)
memory usage: 61.8+ MB


In [8]:
data2['보증금(만원)'] = data2['보증금(만원)'].str.replace(' ', '')
data2['보증금(만원)'] = data2['보증금(만원)'].str.replace(',', '')
data2['보증금(만원)'].astype(int)

2         52000
3         50000
4         56000
5         38000
6         43000
          ...  
864918    45000
864919    32500
864920    35000
864923    29400
864924    23000
Name: 보증금(만원), Length: 579046, dtype: int32

In [10]:
table = pd.pivot_table(data2, values=['보증금(만원)'], index=['분기'], columns=['ID'], aggfunc=np.mean)
table.round(1)

Unnamed: 0_level_0,보증금(만원),보증금(만원),보증금(만원),보증금(만원),보증금(만원),보증금(만원),보증금(만원),보증금(만원),보증금(만원),보증금(만원),보증금(만원),보증금(만원),보증금(만원),보증금(만원),보증금(만원),보증금(만원),보증금(만원),보증금(만원),보증금(만원),보증금(만원),보증금(만원)
ID,서울특별시 강남구 개포동 개포2차현대아파트 80,서울특별시 강남구 개포동 개포6차우성아파트1동~8동 50,서울특별시 강남구 개포동 개포6차우성아파트1동~8동 70,서울특별시 강남구 개포동 개포6차우성아파트1동~8동 80,서울특별시 강남구 개포동 개포더샵트리에 110,서울특별시 강남구 개포동 개포래미안포레스트 100,서울특별시 강남구 개포동 개포래미안포레스트 110,서울특별시 강남구 개포동 개포래미안포레스트 140,서울특별시 강남구 개포동 개포래미안포레스트 50,서울특별시 강남구 개포동 개포래미안포레스트 60,...,서울특별시 중랑구 중화동 한솔e 50,서울특별시 중랑구 중화동 한솔e 80,서울특별시 중랑구 중화동 한신아파트 50,서울특별시 중랑구 중화동 한신아파트 60,서울특별시 중랑구 중화동 한신아파트 80,서울특별시 중랑구 중화동 한영 60,서울특별시 중랑구 중화동 한영 70,서울특별시 중랑구 중화동 한영 80,서울특별시 중랑구 중화동 한영 90,서울특별시 중랑구 중화동 현대휴앤미 80
분기,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2,Unnamed: 7_level_2,Unnamed: 8_level_2,Unnamed: 9_level_2,Unnamed: 10_level_2,Unnamed: 11_level_2,Unnamed: 12_level_2,Unnamed: 13_level_2,Unnamed: 14_level_2,Unnamed: 15_level_2,Unnamed: 16_level_2,Unnamed: 17_level_2,Unnamed: 18_level_2,Unnamed: 19_level_2,Unnamed: 20_level_2,Unnamed: 21_level_2
2018/1,,,1900020000.0,4.777820999999999e+43,,,,,,,...,,,3.285746e+33,1.500016e+88,4.857189e+33,20000.0,,,,
2018/2,173335000000000.0,39000.0,2000019000.0,9.0001e+23,,,,,,,...,,,1300012000.0,2.800028e+47,7.000064e+23,,,,,
2018/3,2650025000.0,40000.0,,4.777822e+43,,,,,,,...,20000.0,,5.000054e+23,2.230792e+63,4.1111509999999996e+43,,,,,
2018/4,,31000.0,1.000009e+19,5.125050000000001e+38,100000.0,,,,,,...,,,83334170000000.0,2.0714490000000001e+68,3.800035e+48,,,,,
2019/1,50000.0,26000.0,,5.125048e+38,,,,,,,...,,,5.600055e+23,1.764724e+82,7.6001e+22,,,5000.0,,
2019/2,50000.0,30000.0,7.500078e+18,5.833395e+28,,,,,,,...,,,3.2500310000000003e+38,3.500034e+38,7.00007e+23,,,24000.0,,
2019/3,200001700000000.0,83334170000000.0,30000.0,8.620084e+23,,,,,,,...,,,2.3000240000000002e+48,1.611125e+88,8.750078e+18,,,,,
2019/4,2750032000.0,,126667900000000.0,1.07501e+19,,,,,,,...,,,4.333375e+28,1.282622e+113,3.25003e+58,,,,28000.0,
2020/1,53000.0,,,7.166742e+28,,,,,,,...,,,2.27275e+53,2.384637e+63,3.333365e+58,,,,,
2020/2,205002200000000.0,1650015000.0,125001200000000.0,7.200072e+23,,65000080000.0,160000.0,,250002500000000.0,1.875019e+19,...,,,3.4375360000000006e+38,1.150012e+128,4.333377e+43,,,,,
