# 문화 역세권

---

## [문화역세권 데이터](https://www.bigdata-culture.kr/bigdata/user/data_market/detail.do?id=f41966cf-a563-40da-875c-5c317faee505)

## Import Packages
- Visual Python: Data Analysis > Import

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns

## 1. 전국 문화시설 수

### Read CSV file

In [None]:
df = pd.read_csv('data/문화역세권분석.csv')
df

### Edit columns

In [None]:
df.rename(columns={'id': '고유ID', 'lclas': 'L1 대분류', 'mlsfc': 'L2 중분류', 'fclt_name': '시설명', 
                   'ctprvn_nm': '시도', 'sgnr_nm': '시군구', 'legaldong_cd': '법정동코드', 
                   'legalemd_nm': '법정읍면동명', 'adstrd_cd': '행정동코드', 
                   'adstrd_nm': '행정동명', 'rdnmaddr_cd': '도로명주소코드', 
                   'rdnm_addr': '도로명주소', 'zip_cd': '우편번호', 'grid_cd': '격자코드', 
                   'x_cd': 'X좌표', 'y_cd': 'Y좌표', 'buld_totar': '시설현황 건물 연면적', 
                   'usemem_nm': '연간이용자수', 'infl_factor': '영향도지수', 
                   'file_name': '파일명', 'base_ymd': '기준일'}, inplace=True)
                    

In [None]:
df.drop(['고유ID', '시설명', '법정동코드', '행정동코드', '도로명주소코드', '격자코드',  '파일명', '기준일'], axis=1, inplace=True)
df

### Information

In [None]:
df['시도'].value_counts()

In [None]:
df['L2 중분류'].value_counts()

### Groupby

In [None]:
# Visual Python: Data Analysis > Groupby
gp_cnt = df.groupby('시도', as_index=False).size()

In [None]:
gp_cnt = gp_cnt.copy()
gp_cnt.rename(columns={'size': '문화시설수'}, inplace=True)
gp_cnt

### Visualization

In [None]:
# VisualPython [6] - 1
import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns
plt.rc('figure', figsize=(12, 8))
plt.style.use('seaborn-v0_8-darkgrid')

from matplotlib import rcParams
rcParams['font.family'] = 'New Gulim'
rcParams['font.size'] = 10
rcParams['axes.unicode_minus'] = False

In [None]:
#sns.barplot(data=gp_cnt, x='시도', y='문화시설수')
sns.barplot(data=gp_cnt, x='시도', y='문화시설수', order=gp_cnt.sort_values('문화시설수', ascending=False)['시도'])
plt.xticks(rotation=30)
plt.show()

## 2. 전국 문화시설 수 - 분류별

In [None]:
gp_cnt_cat = df.groupby(['시도','L2 중분류'], as_index=False).size()

In [None]:
gp_cnt_cat = gp_cnt_cat.copy()
gp_cnt_cat.rename(columns={'size': '문화시설수'}, inplace=True)
gp_cnt_cat

In [None]:
#sns.barplot(data=gp_cnt_cat, x='시도', y='문화시설수', hue='L2 중분류')
sns.barplot(data=gp_cnt_cat, x='시도', y='문화시설수', hue='L2 중분류', order=gp_cnt_cat[gp_cnt_cat['L2 중분류']=='공공도서관'].sort_values('문화시설수', ascending=False)['시도'])
plt.xticks(rotation=30)
plt.show()

## 3. 전국 문화시설  영향도 지수

In [None]:
df

In [None]:
gp_eff = df.groupby('시도', as_index=False)['영향도지수'].mean()
gp_eff

In [None]:
#sns.barplot(data=gp_eff, x='시도', y='영향도지수')
sns.barplot(data=gp_eff, x='시도', y='영향도지수', order=gp_eff.sort_values('영향도지수', ascending=False)['시도'])
plt.xticks(rotation=30)
plt.show()

## 4. 인구 대비 전국 문화시설 수

### Read file

In [None]:
df_p = pd.read_excel('data/인구.xlsx')
df_p.set_index('지역', inplace=True)
df_p

In [None]:
culture_cnt =  df.groupby('시도').size()

In [None]:
df_p['문화시설수'] =  culture_cnt
df_p

In [None]:
df_p['시설수/10만명'] = (df_p['문화시설수'] * 100000 / df_p['인구']).round(2)
df_p

In [None]:
#sns.barplot(data=df_p, x= df_p.index, y='시설수/10만명')
sns.barplot(data=df_p, x= df_p.index, y='시설수/10만명', order=df_p.sort_values('시설수/10만명', ascending=False).index)
plt.xticks(rotation=30)
plt.show()

---

In [None]:
# End of file