# Business Location Analysis



<div style="text-align: right"> first drafted on 2016-07-11 </div>
<div style="text-align: right"> last updated on 2018-05-29 </div>

*It is a critical question to many business where to open and operate its offline spaces. Especially when a business is pursuing an expansion to places not so familiar to, researching and making a decision on where to locate can be a very difficult problem. I have had a similar concerns as a strategist, and came up with a simple alternative that helped me to make reasonable data-driven decision making.*

The logic is simple;
 
<br> 
<b>&nbsp;&nbsp;&nbsp;&nbsp;*'You want to do business from where your customers are.'*</b>


<br>
In order to find such a location, the following procedure has been taken from this analysis:

1. Define customers - Define sets of customers, which the business is targeting to. The purpose of business, marketing, and strategy all come in to play. If appripriate, apply STP to each set of customer.
2. Define sets - For each heterogeneous set of customers, allocation of brand or landmark that can represent characteristics of the set. It can be popular brand(shop), public places, or anything that can be searched on google map.
3. Find on google - Google web api provides geocode for your search query. Geocode for each keyword location can be retrieved.
4. Plot on map - Now that each location information is given, plot heatmap layer on google map with the help of package 'gmaps'. It can be done separately by each set of customers, or as a whole.

The libraries used for this project are as follows;

- *re* for pattern & string process

- *gmaps* for Google maps API

- *urllib* for Google API and data crawling



In [1]:
# 아래 코드 실행 후 실행
#SUM_map

# 1. 프로세스

본 상권 조사는 지리적, 금전적, 혹은 여타 이유로 직접 상권을 조사하는 데 제한이 있는 상황에서, 간접적으로 데이터 기반의 시장 조사를 하기 위한 조사 방법 입니다. 따라서, 본 조사 방법은 효율성을 높이는 데 초점이 맞춰져 있으며, 프로젝트의 경중에 따라 필히 사후 실사를 통해 상기 상권을 검증하는 절차를 가질 필요가 있습니다.

a. 표적 시장 선정: 조사를 진행하고자 하는 표적 시장을 선정 

b. 표적 브랜드 선정: 상권의 특성을 대변할 수 있는 표적 브랜드를 선정

c. 코딩 실행: 구글 api를 활용, 표적 시장에서 표적브랜드의 지리적 분포 조사

d. 결과 도출: 지리적 분포에 따라 상권의 특성 및 등급 구분

e. 실사 및 검증: 경중에 따라 상기 상권을 방문하여 조사 결과 검증

f. 상기 조사내용을 바탕으로 전략 수립

# 2. 필수 라이브러리


본 포트폴리오에서 사용할 라이브러리는 다음과 같음

a. urllib: 구글 웹 api를 통해 필요한 정보 추출

b. re: api를 통해 추출한 데이터 정제

c. gmaps: 구글맵을 활용하여 결과물 출력

In [1]:
from urllib.request import urlopen
import gmaps
import re

# 3. 사전 준비사항(가정)

a. 상권 조사를 진행 할 표적 도시 선정

    본 조사는 상해시를 기반으로 상권조사를 진행하였으며 이에 city 변수에 'Shanghai' 값을 지정

In [2]:
city = 'Japan'

b. 표적 브랜드(소비자 특성) 선정

    STP에 따라 시장을 다음 4가지 특성으로 구분하고, 각각의 시장 별 표적 브랜드 선정
    - 두꺼운 지갑: 스타벅스, 애플, 세포라
    - 트렌드 세터: CITS(여행사), 신화서점(교보문고), 영화관
    - '90'00 대학생: 상해 시 내 대학교
    - 평범한 중상층: 까르푸, 테스코

In [3]:
thick_wallet = ['starbucks', 'apple store', 'sephora']
trend_setter = ['cits', 'xinhua', 'theater']
young_student = ['university']
urban_population = ['carrefour', 'tesco']

# 4. 시장 조사 자동화 (구글 API)

a. 구글 api를 활용하여 표적 시장의 좌표 확보

In [4]:
base_add = 'https://maps.googleapis.com/maps/api/geocode/json?address='
key = '&key=AIzaSyBfe7fL6OhxY4rcZ9N0QJ2IwOQsQeJhXZg'
url = urlopen(base_add+city+key)
tmp = url.readlines()
for i in range(len(tmp)):
    if '"location"' in str(tmp[i]):
        city_coord =(float(re.sub('[a-z\ ":\',\\\]*','',str(tmp[i+1]))), float(re.sub('[a-z\ ":\',\\\]*','',str(tmp[i+2]))))
str(city_coord)[1:-1]

'36.204824, 138.252924'

b. 마케팅 stp 별로 브랜드의 입지 좌표 확보

In [5]:
# 좌표 변수 생성
TW_coordinates = []
TS_coordinates = []
YS_coordinates = []
UP_coordinates = []
SUM_coordinates = []

# 구글 API에 요청하기 위한 주소 양식 생성
search_url = 'https://maps.googleapis.com/maps/api/place/nearbysearch/json?location='
search_mid = '&radius=50000&name='    # 넓은 범위 조사 시 radius 값 조정(단위: m)

# 구글 api를 활용하여 표적 브랜드의 좌표 확보 후 좌표변수에 할당
for i in range(len(thick_wallet)):
    url = (search_url+str(city_coord)[1:-1]+search_mid+thick_wallet[i]+key).replace(' ','')
    tmp = urlopen(url).readlines()
    for k in range(len(tmp)):
        if 'location' in str(tmp[k]):
            coordinate = (float(re.sub('[a-z\:\\\,\'" ]','',str(tmp[k+1])))), (float(re.sub('[a-z\:\\\,\'" ]','',str(tmp[k+2]))))
            TW_coordinates.append(coordinate)

for i in range(len(trend_setter)):
    url = (search_url+str(city_coord)[1:-1]+search_mid+trend_setter[i]+key).replace(' ','')
    tmp = urlopen(url).readlines()
    for k in range(len(tmp)):
        if 'location' in str(tmp[k]):
            coordinate = (float(re.sub('[a-z\:\\\,\'" ]','',str(tmp[k+1])))), (float(re.sub('[a-z\:\\\,\'" ]','',str(tmp[k+2]))))
            TS_coordinates.append(coordinate)
            
for i in range(len(young_student)):
    url = (search_url+str(city_coord)[1:-1]+search_mid+young_student[i]+key).replace(' ','')
    tmp = urlopen(url).readlines()
    for k in range(len(tmp)):
        if 'location' in str(tmp[k]):
            coordinate = (float(re.sub('[a-z\:\\\,\'" ]','',str(tmp[k+1])))), (float(re.sub('[a-z\:\\\,\'" ]','',str(tmp[k+2]))))
            YS_coordinates.append(coordinate)
            
for i in range(len(urban_population)):
    url = (search_url+str(city_coord)[1:-1]+search_mid+urban_population[i]+key).replace(' ','')
    tmp = urlopen(url).readlines()
    for k in range(len(tmp)):
        if 'location' in str(tmp[k]):
            coordinate = (float(re.sub('[a-z\:\\\,\'" ]','',str(tmp[k+1])))), (float(re.sub('[a-z\:\\\,\'" ]','',str(tmp[k+2]))))
            UP_coordinates.append(coordinate)
            
SUM_coordinates = TW_coordinates + TS_coordinates + YS_coordinates + UP_coordinates

c. gmap 라이브러리를 활용하여 표적 도시 내 상권 분포 표시

In [6]:
TW_coordinates

[(36.3414912, 138.6367599),
 (36.2310581, 137.9645603),
 (36.6447253, 138.1881159),
 (36.23314939999999, 137.9554178),
 (36.1898041, 137.964001),
 (36.2399189, 137.9807163),
 (36.0303633, 138.1207761),
 (36.0269926, 138.0778445),
 (36.3928, 138.2577739),
 (35.8288026, 137.9689326),
 (36.233803, 137.9781522),
 (35.828887, 137.9689647),
 (36.5085755, 138.1340375),
 (36.2199852, 137.9768205),
 (36.3419297, 138.7397249),
 (36.2757014, 138.4640172),
 (36.0656415, 138.0523401),
 (36.2704636, 137.932108),
 (36.6434372, 138.1881635),
 (36.399297, 138.2443014),
 (36.23045820000001, 137.9649242),
 (36.64393889999999, 138.1889383),
 (36.231756, 137.9782059),
 (36.222151, 137.959867),
 (36.6368397, 138.1810196),
 (36.6454387, 138.1893021),
 (36.2333662, 137.9663294),
 (36.3955518, 138.2499167),
 (36.184307, 137.8929493),
 (36.644975, 138.188608),
 (36.2298159, 137.9680119),
 (36.65307, 138.1878368),
 (35.839374, 137.9599404)]

In [7]:
# gmap 기본 세팅 호출
gmaps.configure(api_key=key)

# 두꺼운 지갑들이 찾는 상권 분포도
TW_map = gmaps.figure(center=city_coord, zoom_level = 12)
TW_heatmap_layer = gmaps.heatmap_layer(TW_coordinates, point_radius = 30)
TW_map.add_layer(TW_heatmap_layer)
TW_map

- 경제력이 있는 소비자들이 주로 찾는 상권은 상해 서남쪽에 주로 분포 (지하철 1호선, 2호선, 4호선, 7호선, 10호선 인근)

In [8]:
# 트렌더 세터들이 찾는 상권 분포도
TS_map = gmaps.figure(center=city_coord, zoom_level = 12)
TS_heatmap_layer = gmaps.heatmap_layer(TS_coordinates, point_radius = 30)
TS_map.add_layer(TS_heatmap_layer)
TS_map

- 신문물에 관심이 많은 소비자들이 주로 찾는 상권은 상해 중심부의 북서부에 주로 분포 (지하철 1호선, 2호선, 4호선, 10호선 인근)

In [13]:
YS_map = gmaps.figure(center=city_coord, zoom_level = 12)
YS_heatmap_layer = gmaps.heatmap_layer(YS_coordinates, point_radius = 30)
YS_map.add_layer(YS_heatmap_layer)
YS_map

- 상해시 내 대학들은 상해 서쪽과 북쪽 외곽에 분포 (지하철 1호선, 8호선, 10호선 인근)

In [12]:
UP_map = gmaps.figure(center=city_coord, zoom_level = 12)
UP_heatmap_layer = gmaps.heatmap_layer(UP_coordinates, point_radius = 30)
UP_map.add_layer(UP_heatmap_layer)
UP_map

- 중상층 주거 계층의 분포는 상당부분 고르게 되어 있으나 주로 서북쪽에 분포가 높음

# 5. 종합

상기 4종의 상권 분포를 종합적으로 보았을 시 아래와 같은 결과를 도출할 수 있음

In [11]:
SUM_map = gmaps.figure(center=city_coord, zoom_level = 12)
SUM_heatmap_layer = gmaps.heatmap_layer(SUM_coordinates, point_radius = 30)
SUM_map.add_layer(SUM_heatmap_layer)
SUM_map

- 종합적으로 보았을 때 A급 핵심 상권은 크게 "인민광장", "쉬자후이", "구베이" 3군데 정도로 압축 가능    

- 지하철 2호선, 7호선, 10호선 주변에 자원을 집중하는 것이 효율적이 될 수 있을 것으로 판단함

- 상해 동부의 푸동 교외 지역은 현재 상권이 개발 중으로, 현재는 약하지만 임대료가 저렴하고 향후 전망이 기대되어 전략적인 검토도 고려 필요