# Pandas Library를 활용한 스타벅스 분석
전국 또는 특정 지역의 스타벅스 매장 위치 정보를 가져와서 지도 위에 표시하기
- requests로 스타벅스 매장의 위치 정보를 가져와서 딕셔너리 타입으로 변환한다.
- json_normalize() 함수로 json 타입의 데이터가 변환된 파이썬 딕셔너리를 판다스 데이터프레임으로 변환한다.
- folium 모듈을 사용해서 지도를 표시하고 지도 위에 스타벅스 매장 위치를 마커로 표시한다.

In [1]:
import warnings

warnings.filterwarnings(action='ignore')
import requests
import folium
# !pip install pandas   # 파이썬 데이터 처리 라이브러리
# import pandas as pd
from pandas.io.json import json_normalize  # 파이썬 딕셔너리 타입의 데이터를 판다스 데이터프레임으로 변환한다.

In [2]:
# 서울 스타벅스 전 지점
target_site = 'https://www.starbucks.co.kr/store/getStore.do?r=TIKQFLHFZA'
req = requests.post(target_site, data={
    'MIME 유형': 'application/x-www-form-urlencoded; charset=UTF-8',
    'ins_lat': 37.56682,  # 위도
    'ins_lng': 126.97865,  # 경도
    'p_sido_cd': '01',  # 시도 코드
    # 'p_gugun_cd': '0101',  # 구군 코드
    'isError': 'true',
    'iend': 2000,  # 서버가 응답하는 최대 매장의 개수
    'searchType': 'C',
    'in_biz_cd': '',  # ?, 필수 데이터
    'set_date': ''  # ?, 필수 데이터
})
starbucks = req.json()
print(type(starbucks))
print(starbucks)

<class 'dict'>
{'list': [{'seq': 0, 'sido_cd': None, 'sido_nm': None, 'gugun_cd': None, 'gugun_nm': None, 'code_order': None, 'view_yn': None, 'store_num': None, 'sido': None, 'gugun': None, 'address': None, 'new_img_nm': None, 'p_pro_seq': 0, 'p_view_yn': None, 'p_sido_cd': '', 'p_gugun_cd': '', 'p_store_nm': None, 'p_theme_cd': None, 'p_wireless_yn': None, 'p_smoking_yn': None, 'p_book_yn': None, 'p_music_yn': None, 'p_terrace_yn': None, 'p_table_yn': None, 'p_takeout_yn': None, 'p_parking_yn': None, 'p_dollar_assent': None, 'p_card_recharge': None, 'p_subway_yn': None, 'stb_store_file_renew': None, 'stb_store_theme_renew': None, 'stb_store_time_renew': None, 'stb_store_lsm': None, 's_code': '1509', 's_name': '역삼아레나빌딩', 'tel': '1522-3232', 'fax': '02-568-3763', 'sido_code': '01', 'sido_name': '서울', 'gugun_code': '0101', 'gugun_name': '강남구', 'addr': '서울특별시 강남구 역삼동 721-13 아레나빌딩', 'park_info': None, 'new_state': None, 'theme_state': 'T05@T08@T16@T17@T20@T21@T30@@T52@P80@P90', 'new_bool'

In [3]:
# pandas.io.json 모듈의 json_normalize() 함수로 json 타입의 데이터가 변환된 딕셔너리를 판다스 데이터프레임으로 변환한다.
# json_normalize(딕셔너리, 데이터프레임으로 변환할 데이터가 할당된 딕셔너리의 key)
starbucks_df = json_normalize(starbucks, 'list')
print(type(starbucks_df))  # <class 'pandas.core.frame.DataFrame'>
print(len(starbucks_df))
print(starbucks_df.columns)

<class 'pandas.core.frame.DataFrame'>
599
Index(['seq', 'sido_cd', 'sido_nm', 'gugun_cd', 'gugun_nm', 'code_order',
       'view_yn', 'store_num', 'sido', 'gugun',
       ...
       't22', 't21', 'p90', 't05', 't30', 't36', 't27', 't29', 't43', 't48'],
      dtype='object', length=129)


In [4]:
# print(starbucks_df)
starbucks_df

Unnamed: 0,seq,sido_cd,sido_nm,gugun_cd,gugun_nm,code_order,view_yn,store_num,sido,gugun,...,t22,t21,p90,t05,t30,t36,t27,t29,t43,t48
0,0,,,,,,,,,,...,0,0,0,0,0,0,0,0,0,0
1,0,,,,,,,,,,...,0,0,0,0,0,0,0,0,0,0
2,0,,,,,,,,,,...,0,0,0,0,0,0,0,0,0,0
3,0,,,,,,,,,,...,0,0,0,0,0,0,0,0,0,0
4,0,,,,,,,,,,...,0,0,0,0,0,0,0,0,0,0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
594,0,,,,,,,,,,...,0,0,0,0,0,0,0,0,0,0
595,0,,,,,,,,,,...,0,0,0,0,0,0,0,0,0,0
596,0,,,,,,,,,,...,0,0,0,0,0,0,0,0,0,0
597,0,,,,,,,,,,...,0,0,0,0,0,0,0,0,0,0


데이터프레임으로 변환한 결과 서울시 전체 스타벅스 지점은 599개이고 각 지점당 129개의 컬럼으로 정보를 표시하고 있다.
작업에 필요한 컬럼 몇 가지를 선택하여 지도에 마커를 표시할 때 사용할 데이터가 저장된 데이터프레임을 만든다.
s_name        → 지점명
sido_code     → 시도 코드
sido_name     → 시도명
gugun_code    → 구군 코드
gugun_name    → 구군명
doro_address  → 도로명 주소
lat           → 위도
lot           → 경도

In [5]:
# 판다스 데이터프레임에서 특정 컬럼의 데이터를 얻어올 때 얻어올 컬럼이 1개라면 컬럼명만 적어도 되지만, 2개 이상일 경우 컬럼명을 리스트로 만들어야 한다.
starbucks_df_map = starbucks_df[
    ['s_name', 'sido_code', 'sido_name', 'gugun_code', 'gugun_name', 'doro_address', 'lat', 'lot']]
starbucks_df_map.head(5)

Unnamed: 0,s_name,sido_code,sido_name,gugun_code,gugun_name,doro_address,lat,lot
0,역삼아레나빌딩,1,서울,101,강남구,서울특별시 강남구 언주로 425 (역삼동),37.501087,127.043069
1,논현역사거리,1,서울,101,강남구,서울특별시 강남구 강남대로 538 (논현동),37.510178,127.022223
2,신사역성일빌딩,1,서울,101,강남구,서울특별시 강남구 강남대로 584 (논현동),37.5139309,127.0206057
3,국기원사거리,1,서울,101,강남구,서울특별시 강남구 테헤란로 125 (역삼동),37.499517,127.031495
4,대치재경빌딩R,1,서울,101,강남구,서울특별시 강남구 남부순환로 2947 (대치동),37.494668,127.062583


In [6]:
# dtypes 속성으로 판다스 DF을 구성하는 컬럼들의 자료형을 확인할 수 있다.
# 판다스는 문자열 데이터 타입을 object라고 부른다.
starbucks_df_map.dtypes

s_name          object
sido_code       object
sido_name       object
gugun_code      object
gugun_name      object
doro_address    object
lat             object
lot             object
dtype: object

In [7]:
# info() 메서드를 사용해도 DF을 구성하는 컬럼들의 자료형을 확인할 수 있다.
starbucks_df_map.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 599 entries, 0 to 598
Data columns (total 8 columns):
 #   Column        Non-Null Count  Dtype 
---  ------        --------------  ----- 
 0   s_name        599 non-null    object
 1   sido_code     599 non-null    object
 2   sido_name     599 non-null    object
 3   gugun_code    599 non-null    object
 4   gugun_name    599 non-null    object
 5   doro_address  599 non-null    object
 6   lat           599 non-null    object
 7   lot           599 non-null    object
dtypes: object(8)
memory usage: 37.6+ KB


In [8]:
# astype() 메서드로 위도, 경도의 데이터 타입을 object에서 float으로 변환한다.
starbucks_df_map['lat'] = starbucks_df_map['lat'].astype(float)
starbucks_df_map['lot'] = starbucks_df_map['lot'].astype(float)
starbucks_df_map.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 599 entries, 0 to 598
Data columns (total 8 columns):
 #   Column        Non-Null Count  Dtype  
---  ------        --------------  -----  
 0   s_name        599 non-null    object 
 1   sido_code     599 non-null    object 
 2   sido_name     599 non-null    object 
 3   gugun_code    599 non-null    object 
 4   gugun_name    599 non-null    object 
 5   doro_address  599 non-null    object 
 6   lat           599 non-null    float64
 7   lot           599 non-null    float64
dtypes: float64(2), object(6)
memory usage: 37.6+ KB


# 브로드캐스팅(BroadCasting)을 이용한 불린 인덱싱(Boolean Indexing)

In [9]:
# 종각점
starbucks_df_map[starbucks_df_map['s_name'] == '종각']  # BroadCasting

Unnamed: 0,s_name,sido_code,sido_name,gugun_code,gugun_name,doro_address,lat,lot
439,종각,1,서울,118,종로구,서울특별시 종로구 종로 64 (종로2가),37.569918,126.984528


In [10]:
# 종로관철점
starbucks_df_map[starbucks_df_map['s_name'] == '종로관철']

Unnamed: 0,s_name,sido_code,sido_name,gugun_code,gugun_name,doro_address,lat,lot
441,종로관철,1,서울,118,종로구,"서울특별시 종로구 종로12길 21, 2층 (관철동)",37.569058,126.986013


In [11]:
# 종로구청점
starbucks_df_map[starbucks_df_map['s_name'] == '종로구청']

Unnamed: 0,s_name,sido_code,sido_name,gugun_code,gugun_name,doro_address,lat,lot
426,종로구청,1,서울,118,종로구,서울특별시 종로구 삼봉로 71 (수송동),37.572662,126.981138


In [12]:
starbucksMap = folium.Map(location=[37.56999048, 126.98410877], zoom_start=17)

popup = folium.Popup('종각점', max_width=300)
folium.Marker(location=[37.569918, 126.984528], popup=popup).add_to(starbucksMap)
popup = folium.Popup('종로관철점', max_width=300)
folium.Marker(location=[37.569058, 126.986013], popup=popup).add_to(starbucksMap)
popup = folium.Popup('종로구청점', max_width=300)
folium.Marker(location=[37.572662, 126.981138], popup=popup).add_to(starbucksMap)

starbucksMap

In [13]:
# 서울특별시에 위치한 스타벅스 전 지점의 위치를 지도에 표시한다.
# 지도를 작성할 때 지도의 중심으로 설정할 위치가 애매할 경우 지도에 표시할 모든 스타벅스 지점의 위도와 경도의 평균을 중심으로 하는 지도를 만들어 사용한다.
# 판다스 DF에 저장된 데이터의 평균은 mean() 메서드를 사용해서 계산한다.
starbucksMap = folium.Map(location=[starbucks_df_map['lat'].mean(), starbucks_df_map['lot'].mean()], zoom_start=11)

for index, data in starbucks_df_map.iterrows():
    # print(index, data)
    popup = folium.Popup(f'{index + 1:3d}. {data["s_name"]}, {data["doro_address"]}', max_width=300)
    folium.Marker(location=[data['lat'], data['lot']], popup=popup).add_to(starbucksMap)

starbucksMap.save('./starbucksMap_Seoul.html')

starbucksMap

In [14]:
# 서울특별시 종로구 스타벅스 전 지점

# 데이터 크롤링(수집)
target_site = 'https://www.starbucks.co.kr/store/getStore.do?r=TIKQFLHFZA'
req = requests.post(target_site, data={
    'MIME 유형': 'application/x-www-form-urlencoded; charset=UTF-8',
    'ins_lat': 37.56682,  # 위도
    'ins_lng': 126.97865,  # 경도
    # 'p_sido_cd': '01',  # 시도 코드
    'p_gugun_cd': '0118',  # 구군 코드
    'isError': 'true',
    'iend': 2000,  # 서버가 응답하는 최대 매장의 개수
    'searchType': 'C',
    'in_biz_cd': '',  # ?, 필수 데이터
    'set_date': ''  # ?, 필수 데이터
})
starbucks = req.json()

# 데이터 전처리
starbucks_df = json_normalize(starbucks, 'list')
starbucks_df_map = starbucks_df[
    ['s_name', 'sido_code', 'sido_name', 'gugun_code', 'gugun_name', 'doro_address', 'lat', 'lot']]
starbucks_df_map['lat'] = starbucks_df_map['lat'].astype(float)
starbucks_df_map['lot'] = starbucks_df_map['lot'].astype(float)

# 데이터 시각화
starbucksMap = folium.Map(location=[starbucks_df_map['lat'].mean(), starbucks_df_map['lot'].mean()], zoom_start=14)
for index, data in starbucks_df_map.iterrows():
    popup = folium.Popup(f'{index + 1:3d}. {data["s_name"]}, {data["doro_address"]}', max_width=300)
    folium.Marker(location=[data['lat'], data['lot']], popup=popup).add_to(starbucksMap)
starbucksMap.save('./starbucksMap_Seoul_Jongno.html')
starbucksMap

In [15]:
# 전국 스타벅스 전 지점

# 데이터 크롤링(수집)
target_site = 'https://www.starbucks.co.kr/store/getStore.do?r=TIKQFLHFZA'
req = requests.post(target_site, data={
    'MIME 유형': 'application/x-www-form-urlencoded; charset=UTF-8',
    'ins_lat': 37.56682,  # 위도
    'ins_lng': 126.97865,  # 경도
    'p_sido_cd': '',  # 시도 코드
    'p_gugun_cd': '',  # 구군 코드
    'isError': 'true',
    'iend': 2000,  # 서버가 응답하는 최대 매장의 개수
    'searchType': 'C',
    'in_biz_cd': '',  # ?, 필수 데이터
    'set_date': ''  # ?, 필수 데이터
})
starbucks = req.json()

# 데이터 전처리
starbucks_df = json_normalize(starbucks, 'list')
starbucks_df_map = starbucks_df[
    ['s_name', 'sido_code', 'sido_name', 'gugun_code', 'gugun_name', 'doro_address', 'lat', 'lot']]
starbucks_df_map['lat'] = starbucks_df_map['lat'].astype(float)
starbucks_df_map['lot'] = starbucks_df_map['lot'].astype(float)

# 데이터 시각화
starbucksMap = folium.Map(location=[starbucks_df_map['lat'].mean(), starbucks_df_map['lot'].mean()], zoom_start=6)
for index, data in starbucks_df_map.iterrows():
    popup = folium.Popup(f'{index + 1:3d}. {data["s_name"]}, {data["doro_address"]}', max_width=300)
    folium.Marker(location=[data['lat'], data['lot']], popup=popup).add_to(starbucksMap)
starbucksMap.save('./starbucksMap_ROK.html')
starbucksMap