In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
sns.set_theme(style='whitegrid', font_scale=1.0)
sns.set_palette('Set2', n_colors=10)
plt.rc('font', family='malgun gothic')

In [None]:
year_pop = pd.read_csv('data/대전광역시 서구_행정동별 연월별 유동인구현황.csv', encoding='CP949')
time_pop = pd.read_csv('data/대전광역시 서구_행정동별 시간대별 유동인구 현황.csv', encoding='CP949')
age_pop = pd.read_csv('data/대전광역시 서구_행정동별 연령대별 유동인구현황.csv', encoding='CP949')

In [None]:
year_pop = year_pop.drop(columns=['순번', '기준년', '성별코드', '데이터생성일자', '시간당 평균 유동인구수'])
time_pop = time_pop.drop(columns=['순번', '기준년', '성별코드', '요일코드', '시간대코드' ,'데이터생성일자', '시간당 평균 유동인구수'])
age_pop = age_pop.drop(columns=['순번', '기준년', '성별코드', '연령대코드' ,'데이터생성일자', '시간당 평균 유동인구수'])

In [None]:
time_pop[time_pop['행정동명'] == '괴곡동']

In [None]:
print(year_pop.info())
print(time_pop.info())
print(age_pop.info())

In [None]:
year_pop.head(10)

In [None]:
time_pop.head(10)

In [None]:
age_pop.head(10)

In [None]:
dict = {'행정동명': {'월평1동': '월평동', '월평2동': '월평동', '월평3동': '월평동',
                    '둔산1동': '둔산동', '둔산2동': '둔산동', '둔산3동': '둔산동',
                    '관저1동': '관저동', '관저2동': '관저동', '관저3동': '관저동',
                    '관저1동': '관저동', '관저2동': '관저동', '관저3동': '관저동',
                    '갈마1동': '갈마동', '갈마2동': '갈마동', 
                    '도마1동': '도마동', '도마2동': '도마동'
                    }}

year_pop = year_pop.replace(dict)
time_pop = time_pop.replace(dict)
age_pop = age_pop.replace(dict)

In [None]:
year_pop['행정동명'].value_counts()

## year_pop 시각화

In [None]:
# year_pop 성별, 기준월 더해서 2021년 행정동별 유동인구수 나타내기 (지도 시각화)

df1 = year_pop.groupby(['행정동명']).agg({'유동인구수':'sum'}).reset_index()
df1.head(2)

In [None]:
plt.figure(figsize=(7, 4))
plt.xticks(rotation=45)
sns.barplot(x='행정동명', y='유동인구수', data=df1)

In [None]:
# year_pop 기준월 더해서 2021년 성별, 행정동별 유동인구수 나타내기

df2 = year_pop.groupby(['행정동명', '성별']).agg({'유동인구수':'sum'}).reset_index()
df2.head(2)

In [None]:
plt.figure(figsize=(7, 4))
plt.xticks(rotation=45)
sns.barplot(x='행정동명', y='유동인구수', hue='성별', data=df2)

In [None]:
# year_pop 성별 더해서 2021년 월별, 행정동별 유동인구수 나타내기

df3 = year_pop.groupby(['행정동명', '기준월']).agg({'유동인구수':'sum'}).reset_index()
df3.head(12)

In [None]:
plt.figure(figsize=(7, 5))
plt.xticks(rotation=45)
ax = sns.lineplot(x='기준월', y='유동인구수', hue='행정동명', data=df3)
plt.legend(bbox_to_anchor = (1,1))

In [None]:
df3 = df3.pivot('기준월', '행정동명', '유동인구수')
ax = sns.heatmap(df3, cmap='Spectral')

## time_pop 시각화

In [None]:
# time_pop 기준월, 시간대, 성별 더해서 요일별, 행정동별 유동인구수 나타내기

df4 = time_pop.groupby(['행정동명', '요일']).agg({'유동인구수':'sum'}).reset_index()
df4.head(7)

In [None]:
from pandas.api.types import CategoricalDtype

order = ['월요일','화요일','수요일','목요일','금요일','토요일','일요일']
weekday = CategoricalDtype(categories=order, ordered=True)
df4['요일'] = df4['요일'].astype(weekday)

In [None]:
plt.figure(figsize=(7, 5))
plt.xticks(rotation=45)
ax = sns.lineplot(x='요일', y='유동인구수', hue='행정동명', data=df4)
plt.legend(bbox_to_anchor = (1,1))

In [None]:
df4 = df4.pivot('요일', '행정동명', '유동인구수')
ax = sns.heatmap(df4, cmap='Spectral')

In [None]:
# time_pop 기준월, 요일별, 성별 더해서 시간대별, 행정동별 유동인구수 나타내기 -> 시간별 평균이 아니라서 불가

## age_pop 시각화

In [None]:
# age_pop 기준월, 성별 더해서 연령대별, 행정동별 유동인구수 나타내기

df5 = age_pop.groupby(['행정동명', '연령대']).agg({'유동인구수':'sum'}).reset_index()
df5.head(7)

In [None]:
from pandas.api.types import CategoricalDtype

order = ['9세이하', '10대', '20대', '30대', '40대', '50대', '60대', '70세이상']
age = CategoricalDtype(categories=order, ordered=True)
df5['연령대'] = df5['연령대'].astype(age)

In [None]:
plt.figure(figsize=(7, 5))
plt.xticks(rotation=45)
ax = sns.lineplot(x='연령대', y='유동인구수', hue='행정동명', data=df5)
plt.legend(bbox_to_anchor = (1,1))

In [None]:
sns.set_theme(style='whitegrid', font_scale=2)
sns.set_palette('Set2', n_colors=10)
plt.rc('font', family='malgun gothic')

plt.figure(figsize=(15, 6))
plt.title('대전광역시 서구 연령대별 유동인구 HeatMap')

df5 = df5.pivot('연령대', '행정동명', '유동인구수')
ax = sns.heatmap(df5, cmap='Spectral')

plt.savefig('대전광역시_서구_유동인구_연령대별.png')

## 지도 시각화 csv 정리

In [None]:
year_pop['행정동코드'] = year_pop['행정동코드'].astype('str')

In [None]:
dict = {'행정동코드': {'3017058200': '3017058100', '3017059700': '3017059600', '3017053000': '3017052000',
                    '3017064000': '3017063000', '3017066000': '3017063000', '3017058700': '3017058600',
                    '3017058800': '3017058600'
                    }}

year_pop = year_pop.replace(dict)

In [None]:
df6 = year_pop.groupby(['행정동명', '행정동코드']).agg({'유동인구수':'sum'}).reset_index()
df6.head(2)

In [None]:
dict = {'행정동코드': {'3017058600': '30170113','3017058700': '30170113', '3017058800': '30170113', 
                    '3017063000': '30170112', '3017064000': '30170112', '3017066000': '30170112',
                    '3017052000': '30170103', '3017053000': '30170103', '3017058100': '30170111',
                    '3017058200': '30170111', '3017059600': '30170116', '3017059700': '30170116', 
                    '3017051000': '30170101', '3017053500': '30170104', '3017054000': '30170102',
                    '3017055000': '30170105', '3017059000': '30170114', '3017065000': '30170128',
                    '3017055500': '30170106', '3017056000': '30170108', '3017057000': '30170109',
                    '3017057500': '30170110',
                    }}

df6 = df6.replace(dict)

In [None]:
df6.to_csv('C:\LSMD_ADM_SECT_UMD_대전/대전광역시_서구_유동인구.csv')

### 지도 시각화는 QGIS로 진행