In [1]:
import pandas as pd

# 파일 경로를 지정합니다
file_path = '소상공인시장진흥공단_상가(상권)정보_부산_202112.csv'

In [2]:
# CSV 파일을 불러옵니다
data = pd.read_csv(file_path, encoding='utf-8', sep=',', quotechar='"')


In [3]:
data.head().T

Unnamed: 0,0,1,2,3,4
상가업소번호,23206623,20418637,24659633,17174094,21683903
상호명,미광장,BHC치킨,스텔라,도란도란,럭키사진관
지점명,,동래점,,,
상권업종대분류코드,O,Q,D,Q,F
상권업종대분류명,숙박,음식,소매,음식,생활서비스
상권업종중분류코드,O02,Q05,D05,Q01,F06
상권업종중분류명,모텔/여관/여인숙,닭/오리요리,의복의류,한식,사진
상권업종소분류코드,O02A01,Q05A08,D05A01,Q01A01,F06A01
상권업종소분류명,모텔/여관/여인숙,후라이드/양념치킨,일반의류,한식/백반/한정식,사진관
표준산업분류코드,I55112,I56193,G47416,I56111,M73301


In [4]:
# 공백 제거 (모든 문자열 컬럼에 적용)
data = data.apply(lambda x: x.str.strip() if x.dtype == "object" else x)

In [9]:
# 음식2021 데이터셋 필터링
excluded_categories = ['분식', '유흥주점', '음식배달서비스', '제과제빵떡케익', '커피점/카페', '기타음식업']

food2021 = data[
    (data['상권업종대분류명'] == '음식') &
    (~data['상권업종중분류명'].isin(excluded_categories))
]

# 주점2021 데이터셋 필터링
pub2021 = data[
    (data['상권업종대분류명'] == '음식') &
    (data['상권업종중분류명'] == '유흥주점')
]

In [10]:
print(food2021['상권업종중분류명'].unique())

['닭/오리요리' '한식' '양식' '중식' '패스트푸드' '일식/수산물' '별식/퓨전요리' '부페']


In [11]:
# 필터링된 데이터 확인
print("음식2021 데이터셋:")
food2021.head().T

음식2021 데이터셋:


Unnamed: 0,1,3,9,10,11
상가업소번호,20418637,17174094,17175332,17175370,17174800
상호명,BHC치킨,도란도란,정성밥상,당감제일냉면&토리커피,오도씨곱창
지점명,동래점,,,,
상권업종대분류코드,Q,Q,Q,Q,Q
상권업종대분류명,음식,음식,음식,음식,음식
상권업종중분류코드,Q05,Q01,Q01,Q01,Q01
상권업종중분류명,닭/오리요리,한식,한식,한식,한식
상권업종소분류코드,Q05A08,Q01A01,Q01A01,Q01A19,Q01A03
상권업종소분류명,후라이드/양념치킨,한식/백반/한정식,한식/백반/한정식,냉면집,곱창/양구이전문
표준산업분류코드,I56193,I56111,I56111,I56111,I56111


In [13]:
# 필터링된 데이터 확인
print("\n주점2021 데이터셋:")
pub2021.head().T



주점2021 데이터셋:


Unnamed: 0,6,21,113,121,183
상가업소번호,17173895,19960256,28490641,20038766,20382500
상호명,후라이드참잘하는집,밤비,밀크걸,엠제이노래타운,조이아
지점명,만덕덕천점,,,노래타운,
상권업종대분류코드,Q,Q,Q,Q,Q
상권업종대분류명,음식,음식,음식,음식,음식
상권업종중분류코드,Q09,Q09,Q09,Q09,Q09
상권업종중분류명,유흥주점,유흥주점,유흥주점,유흥주점,유흥주점
상권업종소분류코드,Q09A01,Q09A10,Q09A07,Q09A10,Q09A10
상권업종소분류명,호프/맥주,룸살롱/단란주점,기타일반유흥주점,룸살롱/단란주점,룸살롱/단란주점
표준산업분류코드,I56219,I56211,I56211,I56211,I56211


In [15]:
# 음식2022 시군구명 개수 계산 및 정렬
food_city_counts = food2021['시군구명'].value_counts().sort_index()

# 주점2022 시군구명 개수 계산 및 정렬
pub_city_counts = pub2021['시군구명'].value_counts().sort_index()

In [16]:
# 결과 출력
print("음식2021 시군구명 개수 (가나다순):")
print(food_city_counts)

print("\n주점2021 시군구명 개수 (가나다순):")
print(pub_city_counts)


음식2021 시군구명 개수 (가나다순):
시군구명
강서구     1713
금정구     2011
기장군     2026
남구      2073
동구       971
동래구     2140
부산진구    3685
북구      1857
사상구     1782
사하구     2605
서구       950
수영구     1842
연제구     1518
영도구     1028
중구      1189
해운대구    3654
Name: count, dtype: int64

주점2021 시군구명 개수 (가나다순):
시군구명
강서구     148
금정구     315
기장군     176
남구      387
동구      228
동래구     373
부산진구    722
북구      304
사상구     295
사하구     379
서구      117
수영구     398
연제구     245
영도구     177
중구      246
해운대구    436
Name: count, dtype: int64


In [17]:
# 필요하면 결과를 각각 CSV로 저장
food_city_counts.to_csv('음식2021_시군구명_개수.csv', index=True, header=['Count'], encoding='utf-8-sig')
pub_city_counts.to_csv('주점2021_시군구명_개수.csv', index=True, header=['Count'], encoding='utf-8-sig')

print("시군구명 개수가 각각 음식2021_시군구명_개수.csv와 주점2021_시군구명_개수.csv로 저장되었습니다.")

시군구명 개수가 각각 음식2021_시군구명_개수.csv와 주점2021_시군구명_개수.csv로 저장되었습니다.
