# 지역별 & 업종별 소상공인 피해규모 분석 및 지원방안 제시

## 기본 환경설정

In [None]:
from google.colab import drive
drive.mount('/content/drive',force_remount=True)

In [None]:
import numpy as np
import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt
import seaborn as sns

In [None]:
# 주피터 노트북 사용시 노트북 내부에 그림을 표시하도록 지정
%matplotlib inline

In [None]:
#나눔 글꼴 사용을 위한 패키지 설치
!sudo apt-get install -y fonts-nanum
!sudo fc-cache -fv
!rm ~/.cache/matplotlib -rf

In [None]:
plt.rc('font', family='NanumBarunGothic') 

## 전처리

In [None]:
#2022년 데이터 불러오기
jnorth22 = pd.read_csv('/content/drive/MyDrive/데이터셋/소상공인시장진흥공단_상가(상권)정보_전북_202203.csv')
jsouth22 = pd.read_csv('/content/drive/MyDrive/데이터셋/소상공인시장진흥공단_상가(상권)정보_전남_202203.csv')
kj22 = pd.read_csv('/content/drive/MyDrive/데이터셋/소상공인시장진흥공단_상가(상권)정보_광주_202203.csv')
tk22 = pd.read_csv('/content/drive/MyDrive/데이터셋/소상공인시장진흥공단_상가(상권)정보_대구_202203.csv')

In [None]:
#필요없는 컬럼 삭제
jnorth22.drop(["지점명", "상권업종대분류코드", "상권업종중분류코드", "상권업종소분류코드", "표준산업분류코드", "표준산업분류명", "시군구코드",
             "시도코드", "행정동코드", "법정동코드", "법정동명", "지번코드", "대지구분코드", 
             "대지구분명", "지번본번지", "지번부번지", "지번주소", "도로명코드", "건물본번지", 
             "건물부번지", "건물관리번호", "건물명", "도로명주소", "구우편번호", "신우편번호", "동정보",
             "층정보", "호정보"], axis= 1, inplace = True)

jsouth22.drop(["지점명", "상권업종대분류코드", "상권업종중분류코드", "상권업종소분류코드", "표준산업분류코드", "표준산업분류명", "시군구코드",
             "시도코드", "행정동코드", "법정동코드", "법정동명", "지번코드", "대지구분코드", 
             "대지구분명", "지번본번지", "지번부번지", "지번주소", "도로명코드", "건물본번지", 
             "건물부번지", "건물관리번호", "건물명", "도로명주소", "구우편번호", "신우편번호", "동정보",
             "층정보", "호정보"], axis= 1, inplace = True)

kj22.drop(["지점명", "상권업종대분류코드", "상권업종중분류코드", "상권업종소분류코드", "표준산업분류코드", "표준산업분류명", "시군구코드", 
             "시도코드", "행정동코드", "법정동코드", "법정동명", "지번코드", "대지구분코드", 
             "대지구분명", "지번본번지", "지번부번지", "지번주소", "도로명코드", "건물본번지", 
             "건물부번지", "건물관리번호", "건물명", "도로명주소", "구우편번호", "신우편번호", "동정보",
             "층정보", "호정보"], axis= 1, inplace = True)

tk22.drop(["지점명", "상권업종대분류코드", "상권업종중분류코드", "상권업종소분류코드", "표준산업분류코드", "표준산업분류명", "시군구코드",
             "시도코드", "행정동코드", "법정동코드", "법정동명", "지번코드", "대지구분코드", 
             "대지구분명", "지번본번지", "지번부번지", "지번주소", "도로명코드", "건물본번지", 
             "건물부번지", "건물관리번호", "건물명", "도로명주소", "구우편번호", "신우편번호", "동정보",
             "층정보", "호정보"], axis= 1, inplace = True)

In [None]:
#결측치 판단
print("전북")
print(jnorth22.isnull().sum(axis=0))
print(" "*4)

print("전남")
print(jsouth22.isnull().sum(axis=0))
print(" "*4)

print("광주")
print(kj22.isnull().sum(axis=0))
print(" "*4)

print("대구")
print(tk22.isnull().sum(axis=0)) 
print(" "*4)

In [None]:
#결측치 제거
jnorth22["행정동명"].fillna('0', inplace = True)
tk22["행정동명"].fillna('0', inplace = True)

In [None]:
#전북 시군구명 오류 확인
jnorth22["시군구명"].value_counts()
#'전주시 덕진구' 또는 '전주시 완산구'에 들어가야할 3개의 데이터가 '전주시'로 분류되어 있음 

In [None]:
#탐색: '도로명' 컬럼으로 모두 '전주시 덕진구'임을 확인
condition22 = (jnorth22.시군구명 == "전주시")
jnorth22[condition22]["도로명"]

In [None]:
#전북 시군구명 오류행 인덱스 찾기
jnorth22[condition22].index

In [None]:
#오류행 수정
jnorth22.loc[12830, "시군구명"] = "전주시 덕진구"
jnorth22.loc[74371, "시군구명"] = "전주시 덕진구"
jnorth22.loc[77640, "시군구명"] = "전주시 덕진구"

In [None]:
#오류 해결
jnorth22["시군구명"].value_counts()

In [None]:
#2021년 데이터 불러오기
jnorth21 = pd.read_csv('/content/drive/MyDrive/데이터셋/소상공인시장진흥공단_상가(상권)정보_전북_202103.csv')
jsouth21 = pd.read_csv('/content/drive/MyDrive/데이터셋/소상공인시장진흥공단_상가(상권)정보_전남_202103.csv')
kj21 = pd.read_csv('/content/drive/MyDrive/데이터셋/소상공인시장진흥공단_상가(상권)정보_광주_202103.csv')
tk21 = pd.read_csv('/content/drive/MyDrive/데이터셋/소상공인시장진흥공단_상가(상권)정보_대구_202103.csv')

In [None]:
#필요없는 컬럼 삭제
jnorth21.drop(["지점명", "상권업종대분류코드", "상권업종중분류코드", "상권업종소분류코드", "표준산업분류코드", "표준산업분류명", "시군구코드",
             "시도코드", "행정동코드", "법정동코드", "법정동명", "지번코드", "대지구분코드", 
             "대지구분명", "지번본번지", "지번부번지", "지번주소", "도로명코드", "건물본번지", 
             "건물부번지", "건물관리번호", "건물명", "도로명주소", "구우편번호", "신우편번호", "동정보",
             "층정보", "호정보"], axis= 1, inplace = True)

jsouth21.drop(["지점명", "상권업종대분류코드", "상권업종중분류코드", "상권업종소분류코드", "표준산업분류코드", "표준산업분류명", "시군구코드",
             "시도코드", "행정동코드", "법정동코드", "법정동명", "지번코드", "대지구분코드", 
             "대지구분명", "지번본번지", "지번부번지", "지번주소", "도로명코드", "건물본번지", 
             "건물부번지", "건물관리번호", "건물명", "도로명주소", "구우편번호", "신우편번호", "동정보",
             "층정보", "호정보"], axis= 1, inplace = True)

kj21.drop(["지점명", "상권업종대분류코드", "상권업종중분류코드", "상권업종소분류코드", "표준산업분류코드", "표준산업분류명", "시군구코드", 
             "시도코드", "행정동코드", "법정동코드", "법정동명", "지번코드", "대지구분코드", 
             "대지구분명", "지번본번지", "지번부번지", "지번주소", "도로명코드", "건물본번지", 
             "건물부번지", "건물관리번호", "건물명", "도로명주소", "구우편번호", "신우편번호", "동정보",
             "층정보", "호정보"], axis= 1, inplace = True)

tk21.drop(["지점명", "상권업종대분류코드", "상권업종중분류코드", "상권업종소분류코드", "표준산업분류코드", "표준산업분류명", "시군구코드",
             "시도코드", "행정동코드", "법정동코드", "법정동명", "지번코드", "대지구분코드", 
             "대지구분명", "지번본번지", "지번부번지", "지번주소", "도로명코드", "건물본번지", 
             "건물부번지", "건물관리번호", "건물명", "도로명주소", "구우편번호", "신우편번호", "동정보",
             "층정보", "호정보"], axis= 1, inplace = True)

In [None]:
#결측치 판단
print("전북")
print(jnorth21.isnull().sum(axis=0))
print(" "*4)

print("전남")
print(jsouth21.isnull().sum(axis=0))
print(" "*4)

print("광주")
print(kj21.isnull().sum(axis=0))
print(" "*4)

print("대구")
print(tk21.isnull().sum(axis=0)) 
print(" "*4)

In [None]:
#전북 시군구명 오류 확인
jnorth21["시군구명"].value_counts()
#'전주시 덕진구' 또는 '전주시 완산구'에 들어가야할 3개의 데이터가 '전주시'로 분류되어 있음 

In [None]:
#전북 시군구명 오류행 탐색 조건
condition21 = (jnorth21.시군구명 == "전주시")

In [None]:
#탐색1: 모두 '전주시 덕진구'임을 확인
jnorth21[condition21]["도로명"].head(43)

In [None]:
#탐색2: 모두 '전주시 덕진구'임을 확인
jnorth21[condition21]["도로명"].tail(43)

In [None]:
##전북 시군구명 오류행 인덱스 찾기
jnorth21[condition21].index

In [None]:
#오류행 수정
jnorth21.loc[[3108, 15472, 25103, 33207, 34804, 35990, 37204, 38763, 39641,
            40934, 46012, 47320, 50686, 51218, 53363, 55679, 63285, 63565,
            70021, 70310, 70332, 71183, 71693, 71800, 72417, 72651, 72903,
            73211, 73304, 73370, 73832, 74050, 74121, 74360, 74543, 74588,
            75375, 75444, 75475, 76250, 76311, 78811, 79428, 80392, 80401,
            80980, 82171, 82229, 82480, 82511, 82520, 82693, 83710, 83739,
            84008, 84585, 84880, 85787, 86034, 86270, 86821, 86995, 87113,
            87332, 87543, 87754, 87796, 87985, 88019, 88024, 88191, 88219,
            88360, 88367, 88414, 88438, 88534, 88671, 88806, 89059, 89152,
            89157, 89420, 92711, 97090, 99772], "시군구명"] = "전주시 덕진구"

In [None]:
#오류 해결
jnorth21["시군구명"].value_counts()

In [None]:
#2020년 데이터 불러오기
jnorth20 = pd.read_csv('/content/drive/MyDrive/데이터셋/상가업소정보_전북_202003.csv', sep = '|')
jsouth20 = pd.read_csv('/content/drive/MyDrive/데이터셋/상가업소정보_전남_202003.csv', sep = '|')
kj20 = pd.read_csv('/content/drive/MyDrive/데이터셋/상가업소정보_광주_202003.csv', sep = '|')
tk20 = pd.read_csv('/content/drive/MyDrive/데이터셋/상가업소정보_대구_202003.csv', sep = '|')

In [None]:
#필요없는 컬럼 삭제
jnorth20.drop(["지점명", "상권업종대분류코드", "상권업종중분류코드", "상권업종소분류코드", "표준산업분류코드", "표준산업분류명", "시군구코드", 
             "시도코드", "행정동코드", "법정동코드", "법정동명", "지번코드", "대지구분코드", 
             "대지구분명", "지번본번지", "지번부번지", "지번주소", "도로명코드", "건물본번지", 
             "건물부번지", "건물관리번호", "건물명", "도로명주소", "구우편번호", "신우편번호", "동정보",
             "층정보", "호정보"], axis= 1, inplace = True)

jsouth20.drop(["지점명", "상권업종대분류코드", "상권업종중분류코드", "상권업종소분류코드", "표준산업분류코드", "표준산업분류명", "시군구코드", 
             "시도코드", "행정동코드", "법정동코드", "법정동명", "지번코드", "대지구분코드", 
             "대지구분명", "지번본번지", "지번부번지", "지번주소", "도로명코드", "건물본번지", 
             "건물부번지", "건물관리번호", "건물명", "도로명주소", "구우편번호", "신우편번호", "동정보",
             "층정보", "호정보"], axis= 1, inplace = True)

kj20.drop(["지점명", "상권업종대분류코드", "상권업종중분류코드", "상권업종소분류코드", "표준산업분류코드", "표준산업분류명", "시군구코드", 
             "시도코드", "행정동코드", "법정동코드", "법정동명", "지번코드", "대지구분코드", 
             "대지구분명", "지번본번지", "지번부번지", "지번주소", "도로명코드", "건물본번지", 
             "건물부번지", "건물관리번호", "건물명", "도로명주소", "구우편번호", "신우편번호", "동정보",
             "층정보", "호정보"], axis= 1, inplace = True)

tk20.drop(["지점명", "상권업종대분류코드", "상권업종중분류코드", "상권업종소분류코드", "표준산업분류코드", "표준산업분류명", "시군구코드", 
             "시도코드", "행정동코드", "법정동코드", "법정동명", "지번코드", "대지구분코드", 
             "대지구분명", "지번본번지", "지번부번지", "지번주소", "도로명코드", "건물본번지", 
             "건물부번지", "건물관리번호", "건물명", "도로명주소", "구우편번호", "신우편번호", "동정보",
             "층정보", "호정보"], axis= 1, inplace = True)

In [None]:
#결측치 판단
print("전북")
print(jnorth20.isnull().sum(axis=0))
print(" "*4)

print("전남")
print(jsouth20.isnull().sum(axis=0))
print(" "*4)

print("광주")
print(kj20.isnull().sum(axis=0))
print(" "*4)

print("대구")
print(tk20.isnull().sum(axis=0)) 
print(" "*4)

In [None]:
#20년도 데이터에는 전북 시군구명 오류가 없다
jnorth20["시군구명"].value_counts()

2019년 데이터는 전체 데이터에서 조건에 맞는 것만 따로 추출해야 하는 방식 

In [None]:
#연도 컬럼 추가 : 연도별 매장 수 변화를 보기 위함
jnorth22["연도"] = 2022
jnorth21["연도"] = 2021
jnorth20["연도"] = 2020


jsouth22["연도"] = 2022
jsouth21["연도"] = 2021
jsouth20["연도"] = 2020


kj22["연도"] = 2022
kj21["연도"] = 2021
kj20["연도"] = 2020


tk22["연도"] = 2022
tk21["연도"] = 2021
tk20["연도"] = 2020


In [None]:
#지역별 데이터 합치기
jnorth = pd.concat([jnorth20, jnorth21, jnorth22], axis = 0)
jsouth = pd.concat([jsouth20, jsouth21, jsouth22], axis = 0)
kj = pd.concat([kj20, kj21, kj22], axis = 0)
tk = pd.concat([tk20, tk21, tk22], axis = 0)

In [None]:
#지금까지 한 전처리 작업을 파일로 save: 과부하 방지
jnorth22.to_csv("전북_202203.csv", index = None)
jsouth22.to_csv("전남_202203.csv", index = None)
kj22.to_csv("광주_202203.csv", index = None)
tk22.to_csv("대구_202203.csv", index = None)

jnorth21.to_csv("전북_202103.csv", index = None)
jsouth21.to_csv("전남_202103.csv", index = None)
kj21.to_csv("광주_202103.csv", index = None)
tk21.to_csv("대구_202103.csv", index = None)

jnorth20.to_csv("전북_202003.csv", index = None)
jsouth20.to_csv("전남_202003.csv", index = None)
kj20.to_csv("광주_202003.csv", index = None)
tk20.to_csv("대구_202003.csv", index = None)

jnorth.to_csv("전북.csv", index = None)
jsouth.to_csv("전남.csv", index = None)
kj.to_csv("광주.csv", index = None)
tk.to_csv("대구.csv", index = None)

전처리 이후 간단하게 파일 불러오기

In [None]:
jnorth22 = pd.read_csv('/content/전북_202203.csv')
jnorth21 = pd.read_csv('/content/전북_202103.csv')
jnorth20 = pd.read_csv('/content/전북_202003.csv')
jnorth = pd.read_csv('/content/전북.csv')

jsouth22 = pd.read_csv('/content/전남_202203.csv')
jsouth21 = pd.read_csv('/content/전남_202103.csv')
jsouth20 = pd.read_csv('/content/전남_202003.csv')
jsouth = pd.read_csv('/content/전남.csv')

kj22 = pd.read_csv('/content/광주_202203.csv')
kj21 = pd.read_csv('/content/광주_202103.csv')
kj20 = pd.read_csv('/content/광주_202003.csv')
kj = pd.read_csv('/content/광주.csv')

tk22 = pd.read_csv('/content/대구_202203.csv')
tk21 = pd.read_csv('/content/대구_202103.csv')
tk20 = pd.read_csv('/content/대구_202003.csv')
tk = pd.read_csv('/content/대구.csv')

## 2022년 지역별 매장수 및 업종비율 분석

In [None]:
#전라북도 시군구별 / 업종대분류별 매장수
pivot_jnorth22 = pd.pivot_table(data = jnorth22, index = "시군구명", columns = "상권업종대분류명", values = "상가업소번호", aggfunc = ['count'], 
                              fill_value = 0, margins=True, margins_name="합계")
pivot_jnorth22

In [None]:
plt.figure(figsize = (15, 8))
sns.countplot(x="시군구명", data= jnorth22)
plt.title("22년도 전라북도 시군구별 매장수")
plt.ylabel("매장수")
plt.show()

In [None]:
table22 = pd.pivot_table(data = jnorth22, index = "상권업종대분류명", values="상가업소번호", aggfunc = "count", margins=True)
table22.sort_values(by='상가업소번호',ascending=False)
table22.columns = ['22년 총 업소수']
t_22 = table22['22년 총 업소수']
sizes_22 = [t_22[0],t_22[1],t_22[2],t_22[3],t_22[4],t_22[5],t_22[6],t_22[7]]

labels = ['관광','부동산','생활서비스','소매','숙박','스포츠','음식','학문']
explodes = (0, 0, 0, 0.1, 0, 0, 0, 0)

plt.figure(figsize = (8, 10))
plt.pie(sizes_22,
        labels = labels,
        explode = explodes,
        autopct = "%1.2f%%",
        shadow = True,
        startangle = 90, # 시작 각도
        textprops = {'fontsize':14})
plt.axis('equal')

plt.show()


In [None]:
#전라남도 시군구별 / 업종대분류별 매장수
pivot_jsouth22 = pd.pivot_table(data = jsouth22, index = "시군구명", columns = "상권업종대분류명", values = "상가업소번호", aggfunc = ['count'], 
                              fill_value = 0, margins=True, margins_name="합계")
pivot_jsouth22

In [None]:
plt.figure(figsize = (15, 8))
sns.countplot(x="시군구명", data= jsouth22)
plt.title("22년도 전라남도 시군구별 매장수")
plt.ylabel("매장수")
plt.show()

In [None]:
table22 = pd.pivot_table(data =jsouth22, index = "상권업종대분류명", values="상가업소번호", aggfunc = "count", margins=True)
table22.sort_values(by='상가업소번호',ascending=False)
table22.columns = ['22년 총 업소수']
t_22 = table22['22년 총 업소수']
sizes_22 = [t_22[0],t_22[1],t_22[2],t_22[3],t_22[4],t_22[5],t_22[6],t_22[7]]

labels = ['관광','부동산','생활서비스','소매','숙박','스포츠','음식','학문']
explodes = (0, 0, 0, 0.1, 0, 0, 0, 0)

plt.figure(figsize = (8, 10))
plt.pie(sizes_22,
        labels = labels,
        explode = explodes,
        autopct = "%1.2f%%",
        shadow = True,
        startangle = 90, # 시작 각도
        textprops = {'fontsize':14})
plt.axis('equal')

plt.show()


In [None]:
#광주 시군구별 / 업종대분류별 매장수
pivot_kj22 = pd.pivot_table(data = kj22, index = "시군구명", columns = "상권업종대분류명", values = "상가업소번호", aggfunc = ['count'], 
                              fill_value = 0, margins=True, margins_name="합계")
pivot_kj22

In [None]:
plt.figure(figsize = (8, 8))
sns.countplot(x="시군구명", data= kj22)
plt.title("22년도 광주광역시 시군구별 매장수")
plt.ylabel("매장수")
plt.show()

In [None]:
table22 = pd.pivot_table(data =kj22, index = "상권업종대분류명", values="상가업소번호", aggfunc = "count", margins=True)
table22.sort_values(by='상가업소번호',ascending=False)
table22.columns = ['22년 총 업소수']
t_22 = table22['22년 총 업소수']
sizes_22 = [t_22[0],t_22[1],t_22[2],t_22[3],t_22[4],t_22[5],t_22[6],t_22[7]]

labels = ['관광','부동산','생활서비스','소매','숙박','스포츠','음식','학문']
explodes = (0, 0, 0, 0.1, 0, 0, 0, 0)

plt.figure(figsize = (8, 10))
plt.pie(sizes_22,
        labels = labels,
        explode = explodes,
        autopct = "%1.2f%%",
        shadow = True,
        startangle = 90, # 시작 각도
        textprops = {'fontsize':14})
plt.axis('equal')

plt.show()

In [None]:
#대구 시군구별 / 업종대분류별 매장수
pivot_tk22 = pd.pivot_table(data = tk22, index = "시군구명", columns = "상권업종대분류명", values = "상가업소번호", aggfunc = ['count'], 
                              fill_value = 0, margins=True, margins_name="합계")
pivot_tk22

In [None]:
plt.figure(figsize = (8, 8))
sns.countplot(x="시군구명", data= tk22)
plt.title("22년도 대구광역시 시군구별 매장수")
plt.ylabel("매장수")
plt.show()

In [None]:
table22 = pd.pivot_table(data =tk22, index = "상권업종대분류명", values="상가업소번호", aggfunc = "count", margins=True)
table22.sort_values(by='상가업소번호',ascending=False)
table22.columns = ['22년 총 업소수']
t_22 = table22['22년 총 업소수']
sizes_22 = [t_22[0],t_22[1],t_22[2],t_22[3],t_22[4],t_22[5],t_22[6],t_22[7]]

labels = ['관광','부동산','생활서비스','소매','숙박','스포츠','음식','학문']
explodes = (0, 0, 0, 0, 0, 0, 0.1, 0)

plt.figure(figsize = (8, 10))
plt.pie(sizes_22,
        labels = labels,
        explode = explodes,
        autopct = "%1.2f%%",
        shadow = True,
        startangle = 90, # 시작 각도
        textprops = {'fontsize':14})
plt.axis('equal')

plt.show()

## 2020 ~ 2022년 매장수 변화 분석

###  지역별 총매장수 증감

In [None]:
#총매장수 및 증감률 테이블 함수
def counts_by_year(data):
  df = pd.DataFrame(columns = ["연도", "매장수", "증감율"], index = None)
  growth = 0
  for i in range(2020, 2023):
    total = len(data[data["연도"] == i])
    df = df.append(pd.DataFrame([[i, total, growth]], columns = ["연도", "매장수", "증감율"]), ignore_index = True)
    growth = round(((len(data[data["연도"] == (i+1)]) - total)/total * 100),2)
  return df

In [None]:
total_jnorth = counts_by_year(jnorth) #전북
total_jnorth

In [None]:
#지역별로 비교를 하고 싶을 때?
jnorth_imsi = counts_by_year(jnorth) #전북
jsouth_imsi = counts_by_year(jsouth) #전남
kj_imsi = counts_by_year(kj) #광주
tk_imsi = counts_by_year(tk) #대구

jnorth_imsi["시도명"] = "전라북도"
jsouth_imsi["시도명"] = "전라남도"
kj_imsi["시도명"] = "광주광역시"
tk_imsi["시도명"] = "대구광역시"

all_imsi = pd.concat([jnorth_imsi, jsouth_imsi, kj_imsi, tk_imsi], axis = 0)

In [None]:
pivot_all_counts = pd.pivot_table(data = all_imsi, index = "연도", columns = "시도명", values = "매장수", 
                              fill_value = 0)
pivot_all_counts

In [None]:
pivot_all_rate = pd.pivot_table(data = all_imsi, index = "연도", columns = "시도명", values = "증감율", 
                              fill_value = 0)
pivot_all_rate

2020년도에는 전반적으로 모든 지역에서 매장수가 약 2~3% 증가하였고,  
2021년도에는 모든 지역에서 매장수가 급격히 줄어든 것을 확인할 수 있다.
전반적으로 광주, 대구 등 광역시에서의 피해가 더 컸다(약 20% 감소).  
2022년도에는 전남, 전북, 광주 지역은 매장수가 다시 소폭 늘어났으나,
대구 지역은 오히려 미세하게 감소하였다. 


In [None]:
#4개 지역 매장수 변화량 (x축: 지역, y축: 매장수, 분류: 연도)
plt.figure(figsize = (13, 8)) # 사이즈 설정
sns.barplot(data = all_imsi, x = '시도명', y = '매장수', hue = "연도")
plt.ylim((60000, 130000))
plt.legend(loc = 'lower left', fontsize = 10)
plt.title("2020-2022년도 전북, 전남, 광주, 대구 매장수 변화", fontsize = 16)
plt.show()

### 지역별 & 업종대분류별 총매장수 증감 (지역고정)

지역을 고정, 해당 지역에서의 업종대분류별 총매장수 증감을 살펴보았다.

In [None]:
#업종대분류별 총매장수 증감율 구하기 함수
def counts_by_year_bigupso(data):
  mycolumns = ['관광/여가/오락', '부동산', '생활서비스', '소매', '숙박', '스포츠', '음식', '학문/교육']
  df = pd.DataFrame(columns = mycolumns, index = range(2020, 2023))
  df.loc[2020] = 0
  df["전체증감율"] = 0

  for i in range(2021, 2023):
    year = i
    total1 = len(data[(data["연도"] == i-1)])
    total2 = len(data[(data["연도"] == i)])
    df.loc[i, "전체증감율"] = round(((total2-total1)/total1 * 100),2)
    for j in mycolumns:
      count1 = len(data[(data["연도"] == i-1) & (data["상권업종대분류명"] == j)]) #두 조건을 모두 만족하는 것들의 개수
      count2 = len(data[(data["연도"] == i) & (data["상권업종대분류명"] == j)]) #두 조건을 모두 만족하는 것들의 개수
      df.loc[i,j] = round(((count2-count1)/count1 * 100),2)
  return df

In [None]:
#업종대분류별 총매장수 구하기 함수 - 피벗 테이블과 동일한 기능
def counts_by_year_bigupso2(data):
  mycolumns = ['관광/여가/오락', '부동산', '생활서비스', '소매', '숙박', '스포츠', '음식', '학문/교육']
  df = pd.DataFrame(columns = mycolumns, index = range(2020, 2023))

  for i in range(2020, 2023):
    for j in mycolumns:
      count = len(data[(data["연도"] == i) & (data["상권업종대분류명"] == j)]) #두 조건을 모두 만족하는 것들의 개수
      df.loc[i,j] = count
  return df

In [None]:
#업종대분류별 총매장수 구하기 함수 - 바 차트 적용하기 쉽게
def counts_by_year_bigupso3(data):
  mycolumns = ['관광/여가/오락', '부동산', '생활서비스', '소매', '숙박', '스포츠', '음식', '학문/교육']
  df = pd.DataFrame(columns = ["연도", "업종", "매장수"])

  for i in range(0, 3):
    year = i + 2020
    for j in mycolumns:
      count = len(data[(data["연도"] == year) & (data["상권업종대분류명"] == j)]) #두 조건을 모두 만족하는 것들의 개수
      df = df.append({'연도': year, '업종': j,'매장수':count},ignore_index=True)
  return df

In [None]:
#적용 예시1
counts_by_year_bigupso(jnorth)

In [None]:
#적용 예시2
counts_by_year_bigupso2(jnorth)

In [None]:
#적용 예시3
counts_by_year_bigupso3(jnorth) #차트를 그릴 때는 꽤 유용

#### 전라북도

In [None]:
#전라북도 업종대분류별 매장수 변화
pd.pivot_table(data = jnorth, index = "연도", columns = "상권업종대분류명", values = "상가업소번호", aggfunc = ['count'], 
                              fill_value = 0, margins=True, margins_name="합계")

In [None]:
jnorth_bigupso = counts_by_year_bigupso(jnorth) #전북
jnorth_bigupso

전라북도:  

연도:
- 2021년: 모든 업종에서 매장수가 크게 줄어들었다(스포츠는 제외). 특히 관광, 학문 업종에서 감소폭이 가장 컸다.
- 2022년: 음식업만 유의미하게 하락했고, 나머지 업종은 상승 또는 비슷한 수준을 유지중이다.

업종:
- 관광: 2021년 매장수가 가장 크게 감소했다 (32.25%). 2022년에도 매장 수가 증가하지 않았다.
- 부동산: 2021년 매장수가 크게 감소했으나, 2022년에 매장수가 다시 크게 늘어났다.
- 생활서비스, 소매, 숙박: 2021년 매장수가 크게 감소했으나, 2022년에 다시 조금씩 늘어나는 추세이다.
- 스포츠: 매장수가 지속적으로 큰 폭으로 증가하는 업종이다.
- 음식: 2021년 매장수가 크게 감소하였고, 2022년에도 유의미하게 줄어들었다.
- 학문/교육: 2021년 매장수가 두번째로 크게 감소했다 (23.69%). 2022년에는 증가하지 않고 비슷한 수준을 유지하고 있다.

In [None]:
jnorth_bybig3 = counts_by_year_bigupso3(jnorth) #바 차트를 그리기 위함

In [None]:
plt.figure(figsize = (15, 8)) # 사이즈 설정
sns.barplot(data = jnorth_bybig3, x = '업종', y = '매장수', hue = "연도")
plt.title("2019~2022년도 전라북도 업종별 매장수")
plt.show()

In [None]:
#특정 업종만 보고 싶을 때는?
def counts_by_year_bigupso4(data, column): #컬럼명을 리스트형태로 작성할 것
  df = pd.DataFrame(columns = ["연도", "업종", "매장수"])

  for i in range(0, 3):
    year = i + 2020
    for j in column:
      count = len(data[(data["연도"] == year) & (data["상권업종대분류명"] == j)]) #두 조건을 모두 만족하는 것들의 개수
      df = df.append({'연도': year, '업종': j,'매장수':count},ignore_index=True)
  return df

In [None]:
onlysomeupso1 = counts_by_year_bigupso4(jsouth, ["음식", "소매", "생활서비스", "학문/교육"]) #바 차트를 그리기 위함
onlysomeupso2 = counts_by_year_bigupso4(jsouth, ["관광/여가/오락", "부동산", "숙박", "스포츠"])

In [None]:
plt.figure(figsize = (6, 6)) # 사이즈 설정
sns.barplot(data = onlysomeupso1, x = '업종', y = '매장수', hue = "연도")
plt.title("2020~2022년도 전라남도 업종별 매장수")
plt.show()

In [None]:
plt.figure(figsize = (6, 6)) # 사이즈 설정
sns.barplot(data = onlysomeupso2, x = '업종', y = '매장수', hue = "연도")
plt.title("2020~2022년도 전라남도 업종별 매장수")
plt.show()

#### 전라남도

In [None]:
#전라남도 업종대분류별 매장수 변화
pivot_jsouth = pd.pivot_table(data = jsouth, index = "연도", columns = "상권업종대분류명", values = "상가업소번호", aggfunc = ['count'], 
                              fill_value = 0, margins=True, margins_name="합계")
pivot_jsouth #증감율을 볼수는 없을까?

In [None]:
counts_by_year_bigupso2(jsouth) #전남

In [None]:
counts_by_year_bigupso(jsouth) #전남

전남:    

연도:
- 2021년: 모든 업종에서 매장수가 크게 줄어들었다(스포츠업 제외). 특히 관광, 학문 업종에서 감소폭이 가장 컸다.
- 2022년: 음식업 매장수가 하락했고, 나머지 업종은 상승세다.   


업종:  
- 관광: 2021년 매장수가 가장 크게 감소했다 (26.26%). 2022년에는 유의미하게 증가했다.
- 부동산: 2021년 매장수가 감소했으나, 2022년에 매장수가 크게 늘어나 이전보다 더 많아졌다.
- 생활서비스, 소매: 2021년 매장수가 크게 감소했으나, 2022년에 매장수가 다시 조금씩 늘어나는 추세이다.
- 숙박: 2021년 매장수가 소폭 감소하였고, 2022년에는 크게 상승하였다.
- 스포츠: 매장수가 지속적으로 큰 폭으로 증가하는 업종이다.
- 음식: 2021년 매장수가 크게 감소하였고, 2022년에도 잇다라 줄어들었다.
- 학문/교육: 2021년 매장수가 두번째로 크게 감소했다 (20.63%). 2022년에는 매장수가 소폭 증가했다.

In [None]:
onlysomeupso1 = counts_by_year_bigupso4(jsouth, ["음식", "소매", "생활서비스", "학문/교육"]) #바 차트를 그리기 위함
onlysomeupso2 = counts_by_year_bigupso4(jsouth, ["관광/여가/오락", "부동산", "숙박", "스포츠"])

In [None]:
plt.figure(figsize = (5, 6)) # 사이즈 설정
sns.barplot(data = onlysomeupso1, x = '업종', y = '매장수', hue = "연도")
plt.title("2019~2022년도 전라남도 업종별 매장수")
plt.show()

In [None]:
plt.figure(figsize = (6, 6)) # 사이즈 설정
sns.barplot(data = onlysomeupso2, x = '업종', y = '매장수', hue = "연도")
plt.title("2019~2022년도 전라남도 업종별 매장수")
plt.show()

#### 광주광역시

In [None]:
#광주 업종대분류별 매장수 변화
pivot_tk = pd.pivot_table(data = tk, index = "연도", columns = "상권업종대분류명", values = "상가업소번호", aggfunc = ['count'], 
                              fill_value = 0, margins=True, margins_name="합계")
pivot_tk #증감율을 볼수는 없을까?

In [None]:
counts_by_year_bigupso2(kj)

In [None]:
counts_by_year_bigupso(kj) #광주

광주:  
연도:
- 2021년: 모든 업종에서 매장수가 크게 줄어들었다(스포츠업 제외). 특히 관광, 학문, 소매, 숙박 업종에서 감소폭이 가장 컸다.
- 2022년: 관광업과 숙박업, 음식업 매장수가 하락했고, 나머지 업종은 상승세다.   

업종:   
- 관광: 2021년 매장수가 가장 크게 감소했다 (39.61%). 2022년에도 유의미하게 감소했다.
- 부동산: 2021년 매장수가 감소했으나, 2022년에 매장수가 크게 늘어나 이전보다 더 많아졌다.
- 생활서비스, 소매: 2021년 매장수가 크게 감소했으나, 2022년에 매장수가 다시 점진적으로 늘어나는 추세이다. 
- 숙박: 2021년 매장수가 크게 감소하였고, 2022년에도 크게 줄어들었다.
- 스포츠: 매장수가 지속적으로 큰 폭으로 증가하는 업종이다.
- 음식: 2021년 매장수가 크게 감소하였고, 2022년에도 크게 감소했다.
- 학문/교육: 2021년 매장수가 두번째로 크게 감소했다 (31.08%). 2022년에는 비슷한 수준을 유지하고 있다.

In [None]:
onlysomeupso1 = counts_by_year_bigupso4(kj, ["음식", "소매", "생활서비스", "학문/교육"]) #바 차트를 그리기 위함
onlysomeupso2 = counts_by_year_bigupso4(kj, ["관광/여가/오락", "부동산", "숙박", "스포츠"])

In [None]:
plt.figure(figsize = (5, 6)) # 사이즈 설정
sns.barplot(data = onlysomeupso1, x = '업종', y = '매장수', hue = "연도")
plt.title("2020~2022년도 광주광역시 업종별 매장수")
plt.show()

In [None]:
plt.figure(figsize = (5, 6)) # 사이즈 설정
sns.barplot(data = onlysomeupso2, x = '업종', y = '매장수', hue = "연도")
plt.title("2019~2022년도 광주광역시 업종별 매장수")
plt.show()

#### 대구광역시

In [None]:
#대구 업종별 매장수 변화
pivot_tk = pd.pivot_table(data = tk, index = "연도", columns = "상권업종대분류명", values = "상가업소번호", aggfunc = ['count'], 
                              fill_value = 0, margins=True, margins_name="합계")
pivot_tk #증감율을 볼수는 없을까?

In [None]:
counts_by_year_bigupso2(tk)

In [None]:
counts_by_year_bigupso(tk) #대구

대구:  

연도:
- 2020년: 매장수 소폭 상승(스포츠업은 크게 상승)
- 2021년: 모든 업종에서 매장수가 크게 줄어들었다(스포츠업 제외). 특히 관광, 학문, 소매, 숙박 업종에서 감소폭이 가장 컸다.
- 2022년: 음식업과 숙박업 매장수가 크게 하락했고, 나머지 업종은 상승세다.

업종:
- 관광: 2021년 매장수가 가장 크게 감소했다 (41.64%). 2022년에는 유의미하게 증가했다.
- 부동산: 2021년 매장수가 감소했으나, 2022년에 매장수가 크게 늘어났다.
- 생활서비스, 소매: 2021년 매장수가 크게 감소했으나, 2022년에 매장수가 다시 점진적으로 늘어나는 추세이다. 
- 숙박: 2021년 매장수가 크게 감소하였고, 2022년에도 크게 줄어들었다.
- 스포츠: 매장수가 지속적으로 큰 폭으로 증가하는 업종이다.
- 음식: 2021년 매장수가 크게 감소하였고, 2022년에도 잇다라 크게 줄어들었다.
- 학문/교육: 2021년 매장수가 두번째로 크게 감소했다 (30.34%). 2022년에는 매장수가 소폭 증가했다.

In [None]:
onlysomeupso1 = counts_by_year_bigupso4(tk, ["음식", "소매", "생활서비스", "학문/교육"]) #바 차트를 그리기 위함
onlysomeupso2 = counts_by_year_bigupso4(tk, ["관광/여가/오락", "부동산", "숙박", "스포츠"])

In [None]:
plt.figure(figsize = (5, 6)) # 사이즈 설정
sns.barplot(data = onlysomeupso1, x = '업종', y = '매장수', hue = "연도")
plt.title("2019~2022년도 대구광역시 업종별 매장수")
plt.show()

In [None]:
plt.figure(figsize = (5, 6)) # 사이즈 설정
sns.barplot(data = onlysomeupso2, x = '업종', y = '매장수', hue = "연도")
plt.title("2019~2022년도 대구광역시 업종별 매장수")
plt.show()

#### 소결론


- 전반적으로 2021년에는 대폭 하락하는 추세이다. 
2022년은 업종에 따라 다르지만 전반적으로 약간의 상승세를 보이고 있다.

- 생활서비스 & 소매: 2021년 크게 감소하였고, 2022년 소폭 증가하는 추세다.
- 관광업: 내가 맡은 모든 지역에서 2021년 매장수가 가장 많이 줄어든 업종은 관광이었다.
- 학문업: 내가 맡은 모든 지역에서 2021년 매장수가 두번째로 많이 줄어든 업종은 관광이었다.
- 부동산업은 2021년 적지 않은 타격을 받았으나, 모든 지역에서 2022년 매장수가 대폭 증가했다.
스포츠업을 제외하면 모든 지역에서 다른 업종에 비해 가장 빠르게 성장한 업종이다.
- 스포츠업은 모든 지역에서 코로나 시기임에도 불구하고 매장수가 매년 크게 증가하였다! 
- 숙박업: 광역시에서는 타격이 매우 컸으며 2022년에도 매장수가 크게 감소하였다. 전남, 전북 지역은 큰 타격은 없었고, 2022년 매장수가 소폭 상승하였다.
- 음식: 모든 지역에서 2021년, 2022년 모두 감소하였다. 2022년 매장수가 대부분 증가한다는 것을 고려했을 때, 모든 지역에서 감소했다는 점은 주목할만하다.

- 2021년 광역시에서 매장수 감소율이 더 컸다(약 *20*% 감소 vs 약 12% 감소)

### 지역별 & 업종중분류별 총매장수 증감율 (업종 세분화): 음식업과 스포츠업 

In [None]:
#업종중분류별 총매장수 증감율 구하기 함수
def counts_by_year_mediumupso(data, mycolumn):
  df = pd.DataFrame(index = range(2020, 2022), columns = mycolumn)
  df.loc[2020] = 0  
  df['전체'] = 0
  for i in range(2020, 2022):
    year = i
    total1 = len(data[(data["연도"] == i )])
    total2 = len(data[(data["연도"] == i + 1)])
    df.loc[i + 1, "전체"] = round(((total2-total1)/total1 * 100),2)
    for j in mycolumn:
      count1 = len(data[(data["연도"] == i) & (data["상권업종중분류명"] == j)]) #두 조건을 모두 만족하는 것들의 개수
      count2 = len(data[(data["연도"] == i + 1) & (data["상권업종중분류명"] == j)]) #두 조건을 모두 만족하는 것들의 개수
      df.loc[i + 1,j] = round(((count2-count1)/count1 * 100),2)
  return df

In [None]:
# 데이터셋 준비

#음식
jsouth_food = jsouth[jsouth["상권업종대분류명"] == "음식"]
jnorth_food = jnorth[jnorth["상권업종대분류명"] == "음식"]
tk_food = tk[tk["상권업종대분류명"] == "음식"]
kj_food = kj[kj["상권업종대분류명"] == "음식"]

#스포츠
jsouth_sports = jsouth[jsouth["상권업종대분류명"] == "스포츠"]
jnorth_sports = jnorth[jnorth["상권업종대분류명"] == "스포츠"]
tk_sports = tk[tk["상권업종대분류명"] == "스포츠"]
kj_sports = kj[kj["상권업종대분류명"] == "스포츠"]

In [None]:
#음식
columns_food = jnorth_food['상권업종중분류명'].unique()
columns_food = sorted(columns_food)

#스포츠
columns_sports = jnorth_sports['상권업종중분류명'].unique()
columns_sports = sorted(columns_sports)

##### 음식업

In [None]:
#전라북도
counts_by_year_mediumupso(jnorth_food, columns_food)

In [None]:
#전라북도
pd.pivot_table(data = jnorth_food, index = "연도", columns = "상권업종중분류명", values = "상가업소번호", fill_value = 0, aggfunc = ['count'], 
                              margins=True, margins_name="합계")

In [None]:
#전라남도
counts_by_year_mediumupso(jsouth_food, columns_food)

In [None]:
#전라남도
pd.pivot_table(data = jsouth_food, index = "연도", columns = "상권업종중분류명", values = "상가업소번호", fill_value = 0, aggfunc = ['count'], 
                              margins=True, margins_name="합계")

In [None]:
#광주
counts_by_year_mediumupso(kj_food, columns_food)

In [None]:
#광주
pd.pivot_table(data = kj_food, index = "연도", columns = "상권업종중분류명", values = "상가업소번호", fill_value = 0, aggfunc = ['count'], 
                              margins=True, margins_name="합계")

In [None]:
#대구
counts_by_year_mediumupso(tk_food, columns_food)

In [None]:
#대구
pd.pivot_table(data = tk_food, index = "연도", columns = "상권업종중분류명", values = "상가업소번호", fill_value = 0, aggfunc = ['count'], 
                              margins=True, margins_name="합계")

전반적인 추세
- 2021년: 대폭 하락
- 2022년: 소폭/대폭 하락

특이사항:   
- 커피업: 2021년 다른 중분류가 모두 감소할 때 모든 지역에서 상승세, 2022년에도 대구 지역을 제외한 곳에서 모두 상승세
여러 보도자료를 보면, 커피산업이 '코로나19특수'를 받았다고 한다. 특히 저가 커피브랜드가 유독 상승세를 보였다. 코로나19로 소비심리가 위축되면서 자리잡은 가성비 소비문화, 사회적 거리두기에 따른 테이크아웃 수요가 증대 저가 매장이 각광받았다는 것이다.‘쉬운 접근성’ (특별한 자격증이 필요 없고, 적은 돈과 작은 규모 점포로도 할 수 있는 사업이라는 특성)도 성장에 기여를 했다고 한다.
- 패스트푸드: 2021년에는 적지 않은 타격, 그러나 2022년에 빠르게 매장수 회복

##### 스포츠업

In [None]:
#전라북도
counts_by_year_mediumupso(jnorth_sports, columns_sports)

In [None]:
#전라북도
pd.pivot_table(data = jnorth_sports, index = "연도", columns = "상권업종중분류명", values = "상가업소번호", fill_value = 0, aggfunc = ['count'], 
                              margins=True, margins_name="합계")

In [None]:
#전라남도
counts_by_year_mediumupso(jsouth_sports, columns_sports)

In [None]:
#전라남도
pd.pivot_table(data = jsouth_sports, index = "연도", columns = "상권업종중분류명", values = "상가업소번호", fill_value = 0, aggfunc = ['count'], 
                              margins=True, margins_name="합계")

In [None]:
#광주
counts_by_year_mediumupso(kj_sports, columns_sports)

In [None]:
#광주
pd.pivot_table(data = kj_sports, index = "연도", columns = "상권업종중분류명", values = "상가업소번호", fill_value = 0, aggfunc = ['count'], 
                              margins=True, margins_name="합계")

In [None]:
#대구
counts_by_year_mediumupso(tk_sports, columns_sports)

In [None]:
#대구
pd.pivot_table(data = tk_sports, index = "연도", columns = "상권업종중분류명", values = "상가업소번호", fill_value = 0, aggfunc = ['count'], 
                              margins=True, margins_name="합계")

전반적으로 모든 지역에서 실내운동시설, 실외운동시설, 운영관리시설 수가 크게 증가했다.  
특히 매장수로 봤을 때, 실내운동시설의 증가가 주목할 만하다.   

In [None]:
jnorth_sports_indoors = jnorth[jnorth["상권업종중분류명"] == "실내운동시설"]
jnorth_sports_outdoors = jnorth[jnorth["상권업종중분류명"] == "실외운동시설"]
jnorth_sports_control = jnorth[jnorth["상권업종중분류명"] == "운영관리시설"]

In [None]:
#전북 : 소분류명까지 살펴보기
pd.pivot_table(data = jnorth_sports_indoors, index = "연도", columns = "상권업종소분류명", values = "상가업소번호", fill_value = 0, aggfunc = ['count'], 
                              margins=True, margins_name="합계")

In [None]:
pd.pivot_table(data = jnorth_sports_outdoors, index = "연도", columns = "상권업종소분류명", values = "상가업소번호", fill_value = 0, aggfunc = ['count'], 
                              margins=True, margins_name="합계")

In [None]:
pd.pivot_table(data = jnorth_sports_control, index = "연도", columns = "상권업종소분류명", values = "상가업소번호", fill_value = 0, aggfunc = ['count'], 
                              margins=True, margins_name="합계")

분석:
- 22년도부터 집계 기준이 바뀌어서 전에는 스포츠 시설로 분류되지 않았던 장소들이 22년도부터 포함되지 않았을까 하는 추측을 해본다(특히 운영관리시설 항목들). 실제로 코로나 시기에 헬스장 이용률이 떨어지고 홈트레이닝쪽으로 추세가 바뀌었다고 하는데, 해당 데이터셋은 오히려 헬스클럽 수가 증가했다고 한다. 데이터에 어떤 불순물이 끼어있거나 2022년도 기준 지표가 바뀐 것이 아닐까 추측해본다. 

- 골프산업의 호황: 
최근 보도를 보면 지난해 국내 골프장 영업이익률이 사상 최대를 기록했다고 한다.   
요인: 적은 인원이 드넓은 야외에서 활동하는 골프의 특성(야외), 1인 가구 증가로 인한 '혼밥', '혼술' 문화 트렌드 - 혼자 연습장이나 스크린골프장에서 즐길 수 있는 스포츠(실내), 해외 골프 여행 단절의 장기화로 인한 국내 수요 증대 등



### 매출액 데이터

출처: 통계청

컬럼 : 매출액
시기: 2018 ~ 2020

In [None]:
#파일 불러오기
sales = pd.read_csv('/content/drive/MyDrive/데이터셋/시도_산업중분류별_주요지표_20220731053346.csv', encoding='cp949')

In [None]:
#도시별 매출액 데이터프레임 만들준비
jnorth_sales = sales[sales["시도별"]=="전라북도"]
jsouth_sales = sales[sales["시도별"]=="전라남도"]
kj_sales = sales[sales["시도별"]=="광주광역시"]
tk_sales = sales[sales["시도별"]=="대구광역시"]

In [None]:
jnorth_sales.head()

In [None]:
#'시도별' 컬럼 삭제
jnorth_sales.drop(['시도별'], axis = 1, inplace = True)
jsouth_sales.drop(['시도별'], axis = 1, inplace = True)
kj_sales.drop(['시도별'], axis = 1, inplace = True)
tk_sales.drop(['시도별'], axis = 1, inplace = True)

In [None]:
#행 / 열 바꾸기 
jnorth_sales.set_index(["산업별"], inplace = True)
jsouth_sales.set_index(["산업별"], inplace = True)
kj_sales.set_index(["산업별"], inplace = True)
tk_sales.set_index(["산업별"], inplace = True)

jnorth_sales = jnorth_sales.transpose()
jsouth_sales = jsouth_sales.transpose()
kj_sales = kj_sales.transpose()
tk_sales = tk_sales.transpose()

In [None]:
jnorth_sales.drop(["전산업", "제조업", "건설업", "정보통신업", "사업시설관리, 사업지원 및 임대 서비스업", "전문과학기술서비스업"], axis = 1, inplace = True)
jsouth_sales.drop(["전산업", "제조업", "건설업", "정보통신업", "사업시설관리, 사업지원 및 임대 서비스업", "전문과학기술서비스업"], axis = 1, inplace = True)
kj_sales.drop(["전산업", "제조업", "건설업", "정보통신업", "사업시설관리, 사업지원 및 임대 서비스업", "전문과학기술서비스업"], axis = 1, inplace = True)
tk_sales.drop(["전산업", "제조업", "건설업", "정보통신업", "사업시설관리, 사업지원 및 임대 서비스업", "전문과학기술서비스업"], axis = 1, inplace = True)

In [None]:
newcolumns = ["소매", "숙박/음식", "부동산", "학문/교육", "관광/여가/오락/스포츠", "생활서비스"]
jnorth_sales.columns = newcolumns
jsouth_sales.columns = newcolumns
kj_sales.columns = newcolumns
tk_sales.columns = newcolumns

In [None]:
tk_sales

In [None]:
jnorth_sales = tk_sales.apply(pd.to_numeric)
jsouth_sales = tk_sales.apply(pd.to_numeric)
kj_sales = tk_sales.apply(pd.to_numeric)
tk_sales = tk_sales.apply(pd.to_numeric)

In [None]:
jnorth_sales["합계"] = jnorth_sales.sum(axis=1)
jsouth_sales["합계"] = jsouth_sales.sum(axis=1)
kj_sales["합계"] = kj_sales.sum(axis=1)
tk_sales["합계"] = tk_sales.sum(axis=1)

### 코로나 피해지수

In [None]:
tk_complex = pd.read_csv('/content/drive/MyDrive/데이터셋/tk_종합지수.csv')
tk_complex

In [None]:
kj_complex = pd.read_csv('/content/drive/MyDrive/데이터셋/kj_종합지수.csv')
kj_complex

In [None]:
jsouth_complex = pd.read_csv('/content/drive/MyDrive/데이터셋/jsouth_종합지수.csv')
jsouth_complex

In [None]:
jnorth_complex = pd.read_csv('/content/drive/MyDrive/데이터셋/jnorth_종합지수.csv')
jnorth_complex