## Starbucks

### Import selenium and beautifulsoup for loading data

In [4]:
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from bs4 import BeautifulSoup
import pandas as pd
import urllib
from urllib.request import urlopen, Request
from user_agent import generate_user_agent
import time

Starbucks's data are located in url of below and we can load them as clicking the button with selenium 

### First, set the size of window when we get the driver

In [20]:
starbucks_url = "https://www.starbucks.co.kr/store/store_map.do"
driver = webdriver.Chrome()
driver.set_window_size(1400, 1080)
driver.get(starbucks_url)
driver.get(starbucks_url)

try:
    # 먼저 오버레이가 나타나는지 확인 (최대 5초 대기)
    WebDriverWait(driver, 5).until(
        EC.presence_of_element_located((By.ID, "jsMovie_event_overlay"))
    )
    print("로딩 애니메이션 감지됨, 사라질 때까지 대기 중...")
    
    # 오버레이가 사라질 때까지 대기 (최대 30초)
    WebDriverWait(driver, 30).until(
        EC.invisibility_of_element_located((By.ID, "jsMovie_event_overlay"))
    )
    print("로딩 애니메이션이 사라짐, 계속 진행합니다")
except:
    print("로딩 애니메이션을 찾을 수 없거나 이미 로딩됨")

# 이제 요소 클릭 시도
local_search_btn = WebDriverWait(driver, 10).until(
    EC.element_to_be_clickable((By.CSS_SELECTOR, ".loca_search h3 a"))
)
local_search_btn.click()


로딩 애니메이션 감지됨, 사라질 때까지 대기 중...
로딩 애니메이션이 사라짐, 계속 진행합니다


### Click the button and load the total list of data in seoul

In [None]:
sido_arae_box = WebDriverWait(driver, 10).until(
    EC.element_to_be_clickable((By.CSS_SELECTOR, ".sido_arae_box li a"))
)
sido_arae_box.click()
gugun_arae_box = WebDriverWait(driver, 10).until(
    EC.element_to_be_clickable((By.CSS_SELECTOR, ".gugun_arae_box li a"))
)
gugun_arae_box.click()

1. Get the total list of data in seoul with beautifulsoup

2. Save the data to the database

### For the access to the database, Create the class to get the database

In [8]:
class GetDatabase:

    def __init__(self, host="database-1.cpueyaq8kvyb.ap-northeast-2.rds.amazonaws.com",
                port=3306,
                user="root",
                password="960920kmj",
                database="leaddb"):
        self.host = host
        self.port = port
        self.user = user
        self.password = password
        self.database = database
        self.conn = None
        self.createConnection()

    def createConnection(self):
        self.conn = mysql.connector.connect(
            host = self.host,
            port = self.port,
            user = self.user,
            password = self.password,
            database = self.database
        )
        
    def closeConnection(self):
        self.conn.close()
    
    def processSql(self, sql):
        cursor = self.conn.cursor(buffered=True)
        cursor.execute(sql)
        self.conn.commit()
        return cursor.fetchall()
    
    def processSqlWithParams(self, sql, params):
        cursor = self.conn.cursor(buffered=True)
        cursor.execute(sql, params)
        self.conn.commit()
        return cursor.fetchall()
    
        
    def rollback(self):
        self.conn.rollback()
        
    def __del__(self):
        self.closeConnection()

### Create Table named starbucks

In [68]:
import mysql.connector

# GetDatabase 클래스 인스턴스 생성
db = GetDatabase()

sql = """CREATE TABLE starbucks (
    id INT AUTO_INCREMENT PRIMARY KEY,
    매장명 VARCHAR(16) NOT NULL,
    도로명주소 VARCHAR(32),
    lat FLOAT,
    lng FLOAT
);
"""

sql = "TRUNCATE TABLE starbucks"
try:
    result = db.processSql(sql)
    for idx, row in enumerate(result):
        print(row)
except Exception as e:
    print(f"sql 실행 중 오류 발생: {e}")
    db.rollback()
finally:
    # 연결 종료
    db.closeConnection()

### insert data to database

In [69]:
import mysql.connector
from tqdm.notebook import tqdm

# GetDatabase 클래스 인스턴스 생성
db = GetDatabase()

db.createConnection()

sql = """
INSERT INTO starbucks (매장명, 도로명주소, 지번주소) 
VALUES (%s, %s, %s);
"""
html = driver.page_source
soup = BeautifulSoup(html, "html.parser")

stores = soup.select(".quickSearchResultBoxSidoGugun li")
try:
    for store in tqdm(stores, desc="데이터베이스에 데이터 삽입 중"):
        store_name = store.select_one("strong").get_text()
        address = store.select_one("p.result_details")
        # br 태그로 구분된 주소 추출
        contents = address.contents
        # 도로명 주소
        address_doro = contents[0].strip()
        try:
            db.processSqlWithParams(sql, (store_name, address_doro))
        except Exception as e:
            print(f"오류 발생 ({store_name}): {e}")
            db.rollback()
    
    # 루프가 끝나면 변경사항 커밋
    db.conn.commit()
    print("모든 데이터가 성공적으로 저장되었습니다.")
    
except Exception as e:
    print(f"전체 처리 중 오류 발생: {e}")
    db.rollback()
finally:
    # 모든 작업이 끝난 후에만 연결 닫기
    db.closeConnection()

데이터베이스에 데이터 삽입 중:   0%|          | 0/634 [00:00<?, ?it/s]

모든 데이터가 성공적으로 저장되었습니다.


### Chect the data in database

In [70]:
import mysql.connector

# GetDatabase 클래스 인스턴스 생성
db = GetDatabase()

sql = """CREATE TABLE starbucks (
    id INT AUTO_INCREMENT PRIMARY KEY,
    매장명 VARCHAR(16) NOT NULL,
    도로명주소 VARCHAR(32),
    지번주소 VARCHAR(16)
);
"""

sql = "select * from starbucks"
try:
    result = db.processSql(sql)
    for idx, row in enumerate(result):
        print(row)
except Exception as e:
    print(f"sql 실행 중 오류 발생: {e}")
    db.rollback()
finally:
    # 연결 종료
    db.closeConnection()

(1, '역삼아레나빌딩  ', '서울특별시 강남구 언주로 425 (역삼동)', '1522-3232')
(2, '논현역사거리  ', '서울특별시 강남구 강남대로 538 (논현동)', '1522-3232')
(3, '신사역성일빌딩  ', '서울특별시 강남구 강남대로 584 (논현동)', '1522-3232')
(4, '국기원사거리  ', '서울특별시 강남구 테헤란로 125 (역삼동)', '1522-3232')
(5, '대치재경빌딩  ', '서울특별시 강남구 남부순환로 2947 (대치동)', '1522-3232')
(6, '봉은사역  ', '서울특별시 강남구 봉은사로 619 (삼성동)', '1522-3232')
(7, '압구정윤성빌딩  ', '서울특별시 강남구 논현로 834 (신사동)', '1522-3232')
(8, '코엑스별마당  ', '서울특별시 강남구 영동대로 513 (삼성동)', '1522-3232')
(9, '삼성역섬유센터R  ', '서울특별시 강남구 테헤란로 518 (대치동)', '1522-3232')
(10, '압구정R  ', '서울특별시 강남구 언주로 861 (신사동)', '1522-3232')
(11, '수서역R  ', '서울특별시 강남구 광평로 281 (수서동)', '1522-3232')
(12, '양재강남빌딩R  ', '서울특별시 강남구 남부순환로 2621 (도곡동)', '1522-3232')
(13, '선릉동신빌딩R  ', '서울특별시 강남구 테헤란로 409 (삼성동)', '1522-3232')
(14, '봉은사로선정릉  ', '서울특별시 강남구 봉은사로 446 (삼성동)', '1522-3232')
(15, '강남오거리  ', '서울특별시 강남구 봉은사로2길 39 (역삼동)', '1522-3232')
(16, '스타필드코엑스몰R  ', '서울특별시 강남구 영동대로 513 (삼성동) 코엑스 A10', '1522-3232')
(17, '강남구청정문  ', '서울특별시 강남구 학동로 419 (청담동)', '1522-3232')
(18, '도곡공원 

## Ediya

### Get url of ediya

In [2]:
from selenium import webdriver
from urllib.request import Request
from urllib.parse import quote

ediya_url = "https://members.ediya.com/store"

driver = webdriver.Chrome()
driver.get(ediya_url)
driver.get(ediya_url)

### Click the tab of address

In [5]:
srch_tab_wrap = driver.find_elements(By.CSS_SELECTOR, ".srch_tab_wrap a")
for idx, tab in enumerate(srch_tab_wrap):
    if(tab.find_element(By.TAG_NAME, "span").text == "주소"):
        srch_tab_wrap[idx].click()
        break

### Search the data in ediya

In [None]:
from selenium.webdriver.common.keys import Keys
gu_name_list = ["서울% 강남구", "서울% 강동구", "서울% 강북구", "서울% 강서구", "서울% 관악구", "서울% 광진구", "서울% 구로구", "서울% 금천구", "서울% 노원구", "서울% 도봉구", "서울% 동대문구", "서울% 동작구", "서울% 마포구", "서울% 서대문구", "서울% 서초구", "서울% 성동구", "서울% 성북구", "서울% 송파구", "서울% 양천구", "서울% 영등포구", "서울% 용산구", "서울% 은평구", "서울% 종로구", "서울% 중구", "서울% 중랑구"]
search = driver.find_element(By.ID, "keyword")

for gu_name in gu_name_list:
    search.clear()
    search.send_keys(gu_name)
    search.send_keys(Keys.ENTER)
    html = driver.page_source
    soup = BeautifulSoup(html, "html.parser")
    store_list = soup.select(".store_list")[1]
    store_list = store_list.select(".info_txt")
    
    for store in store_list:
        name = store.select_one("h4.name").text.strip()
        address = store.select_one("p.addr").text.strip()
        address = address.replace('\xa0', ' ')
        print(address)

서울특별시 강남구 언주로148길 14 나동 1층 107호
서울 강남구 학동로34길 22 (논현동)
서울 강남구 삼성로64길 32 (대치동, 주성빌딩) 1층
서울 강남구 역삼로 415 (대치동, 성진빌딩) 1층
서울 강남구 밤고개로21길 8 (율현동, 세곡프라자) 지상1층 104,105호
서울 강남구 테헤란로 332 (역삼동, 에이치제이타워) 이디야커피
서울 강남구 도곡로69길 8 (대치동) 1층
서울 강남구 삼성로 721 (청담동, 룩희 819) 1층
서울 강남구 학동로 338 (논현동, 강남파라곤) 이디야커피
서울 강남구 학동로 219 (논현동, 국제빌딩) 2층
서울 강남구 논현로131길 28 1층
서울 강남구 도산대로37길 20 1층(신사동)
서울 강남구 도산대로30길 7 1층(논현동)
서울 강남구 논현로72길 13 1층(역삼동)
서울특별시 강남구 언주로81길 8
서울 강남구 테헤란로 107길 11(삼성동 169-10)
서울특별시 강남구 개포로109길 34
서울특별시 강남구 개포로82길 11
서울특별시 강남구 양재대로27길 20
서울 강남구 개포동  1238-8
서울 강남구 역삼동  667-18
서울 강남구 논현동  봉은사로37길 29 뜨레빌빌라 101호
서울 강남구 청담동  125-22
서울 강남구 신사동  512-10 대성빌딩1층
서울 강남구 도곡동  518-10번지 1층
서울 강남구 역삼동  643-10
서울 강남구 역삼동 826-37 쌍용플래티넘상가 B-108
서울 강남구 역삼동 754-2 도곡프라자 102
서울 강남구 테헤란로88길 10 101호
서울특별시 강동구 구천면로 304
서울 강동구 아리수로93길 19 (강일동, 임페리얼타워) 1층
서울 강동구 구천면로34길 43 (천호동, 헤리티지) 1층
서울 강동구 강일동 70-15 106,107호
서울 강동구 풍성로 162 (성내동) 1층
서울 강동구 고덕로 421 (강일동, 대한연세요양원) 1층
서울 강동구 구천면로 424 (명일동, 명일메가타운)
서울 강동구 올림픽로 660 (천호동, 천호엘크루주

### Create table for ediya

In [53]:
import mysql.connector

# GetDatabase 클래스 인스턴스 생성
db = GetDatabase()

sql = """CREATE TABLE ediya (
    id INT AUTO_INCREMENT PRIMARY KEY,
    매장명 VARCHAR(16) NOT NULL,
    주소 VARCHAR(32)
    lat FLOAT,
    lng FLOAT
);
"""
sql = "truncate table ediya"
try:
    result = db.processSql(sql)
    for idx, row in enumerate(result):
        print(row)
except Exception as e:
    print(f"sql 실행 중 오류 발생: {e}")
    db.rollback()
finally:
    # 연결 종료
    db.closeConnection()

### Save to database

In [54]:
from selenium.webdriver.common.keys import Keys
import mysql.connector
from tqdm.notebook import tqdm

gu_name_list = ["서울% 강남구", "서울% 강동구", "서울% 강북구", "서울% 강서구", "서울% 관악구", "서울% 광진구", "서울% 구로구", "서울% 금천구", "서울% 노원구", "서울% 도봉구", "서울% 동대문구", "서울% 동작구", "서울% 마포구", "서울% 서대문구", "서울% 서초구", "서울% 성동구", "서울% 성북구", "서울% 송파구", "서울% 양천구", "서울% 영등포구", "서울% 용산구", "서울% 은평구", "서울% 종로구", "서울% 중구", "서울% 중랑구"]
search = driver.find_element(By.ID, "keyword")

db = GetDatabase()

sql = """
INSERT INTO ediya (매장명, 주소) 
VALUES (%s, %s);
"""

for gu_name in tqdm(gu_name_list, desc="구별 데이터베이스 삽입 중"):
    search.clear()
    search.send_keys(gu_name)
    search.send_keys(Keys.ENTER)
    html = driver.page_source
    soup = BeautifulSoup(html, "html.parser")
    store_list = soup.select(".store_list")[1]
    store_list = store_list.select(".info_txt")
    for store in store_list:
        name = store.select_one("h4.name").text.strip()
        address = store.select_one("p.addr").text.strip()
        address = address.replace('\xa0', ' ')
        try:
            db.processSqlWithParams(sql, (name, address))
        except Exception as e:
            print(f"오류 발생 ({name}): {e}")
            db.rollback()


구별 데이터베이스 삽입 중:   0%|          | 0/25 [00:00<?, ?it/s]

### Check the data in database

In [55]:
import mysql.connector

# GetDatabase 클래스 인스턴스 생성
db = GetDatabase()

sql = "select id, 매장명, 주소 from ediya"

try:
    result = db.processSql(sql)
    for idx, row in enumerate(result):
        print(row)
except Exception as e:
    print(f"sql 실행 중 오류 발생: {e}")
    db.rollback()
finally:
    # 연결 종료
    db.closeConnection()

(1, '도산사거리점', '서울특별시 강남구 언주로148길 14 나동 1층 107호')
(2, '학동제마점', '서울 강남구 학동로34길 22 (논현동)')
(3, '삼성대치점', '서울 강남구 삼성로64길 32 (대치동, 주성빌딩) 1층')
(4, '강남대치점', '서울 강남구 역삼로 415 (대치동, 성진빌딩) 1층')
(5, '강남율현점', '서울 강남구 밤고개로21길 8 (율현동, 세곡프라자) 지상')
(6, '선릉역점', '서울 강남구 테헤란로 332 (역삼동, 에이치제이타워) 이')
(7, '한티역점', '서울 강남구 도곡로69길 8 (대치동) 1층')
(8, '청담역점', '서울 강남구 삼성로 721 (청담동, 룩희 819) 1층')
(9, '강남구청역아이티웨딩점', '서울 강남구 학동로 338 (논현동, 강남파라곤) 이디야커')
(10, '학동역점', '서울 강남구 학동로 219 (논현동, 국제빌딩) 2층')
(11, '강남논현학동점', '서울 강남구 논현로131길 28 1층')
(12, '강남도산점', '서울 강남구 도산대로37길 20 1층(신사동)')
(13, '을지병원사거리점', '서울 강남구 도산대로30길 7 1층(논현동)')
(14, '역삼점', '서울 강남구 논현로72길 13 1층(역삼동)')
(15, '역삼중앙점', '서울특별시 강남구 언주로81길 8')
(16, '삼성한전점', '서울 강남구 테헤란로 107길 11(삼성동 169-10)')
(17, '대청역점', '서울특별시 강남구 개포로109길 34')
(18, '개포동역점', '서울특별시 강남구 개포로82길 11')
(19, '일원동점', '서울특별시 강남구 양재대로27길 20')
(20, '포이사거리점', '서울 강남구 개포동  1238-8')
(21, '역삼충현점', '서울 강남구 역삼동  667-18')
(22, '강남YMCA점', '서울 강남구 논현동  봉은사로37길 29 뜨레빌빌라 101')
(23, '청담사거리점', '서울 강남구 청담동  125-22')
(24, '신

## Using API

### For getting the distance data, i'll use the API of Google Map

In [58]:
import googlemaps

gmaps_key = "AIzaSyBBm7udIMrEzff_7jQPFIiAA7QIl8Bn4Ic"
gmaps = googlemaps.Client(key=gmaps_key)

db = GetDatabase()

sql = "select 주소 from ediya"

ediya_lat_list = []
ediya_lng_list = []

try:
    result = db.processSql(sql)
    for idx, row in tqdm(enumerate(result), total=len(result)):
        geocode = gmaps.geocode(address=row)
        ediya_lat_list.append(geocode[0]['geometry']['location']['lat'])
        ediya_lng_list.append(geocode[0]['geometry']['location']['lng'])
except Exception as e:
    print(f"sql 실행 중 오류 발생: {e}")
    db.rollback()
finally:
    # 연결 종료
    db.closeConnection()

  0%|          | 0/516 [00:00<?, ?it/s]

In [56]:

db = GetDatabase()

sql = "select 도로명주소 from starbucks"

starbucks_lat_list = []
starbucks_lng_list = []

try:
    result = db.processSql(sql)
    for idx, row in tqdm(enumerate(result), total=len(result)):
        geocode = gmaps.geocode(address=row)
        starbucks_lat_list.append(geocode[0]['geometry']['location']['lat'])
        starbucks_lng_list.append(geocode[0]['geometry']['location']['lng'])
except Exception as e:
    print(f"sql 실행 중 오류 발생: {e}")
    db.rollback()
finally:
    # 연결 종료
    db.closeConnection()

  0%|          | 0/634 [00:00<?, ?it/s]

### Because the cost of using the API of Google Map is too high, i'll save the data to json file and use it in the next step

In [59]:
import json

with open('ediya_lat_lng.json', 'w') as f:
    json.dump({'lat': ediya_lat_list, 'lng': ediya_lng_list}, f)


In [35]:
import json

with open('starbucks_lat_lng.json', 'w') as f:
    json.dump({'lat': starbucks_lat_list, 'lng': starbucks_lng_list}, f)


### Load data from json file

In [60]:
ediya_lat_lng = json.load(open('ediya_lat_lng.json'))
starbucks_lat_lng = json.load(open('starbucks_lat_lng.json'))
print(ediya_lat_lng)
print(starbucks_lat_lng)

{'lat': [37.5204069, 37.51313870000001, 37.5004196, 37.501434, 37.4735822, 37.5038188, 37.4979551, 37.5200681, 37.5165513, 37.5150479, 37.5140759, 37.5222821, 37.5194023, 37.4958415, 37.500366, 37.5104408, 37.4942156, 37.4885331, 37.4904095, 37.478468, 37.5037879, 37.5099434, 37.524866, 37.5177943, 37.4824238, 37.5018112, 37.4953995, 37.4985444, 37.5068833, 37.5466824, 37.5653789, 37.5451714, 37.5724114, 37.5304813, 37.55737130000001, 37.5503165, 37.5401616, 37.5604113, 37.5340436, 37.5515869, 37.5290236, 37.5382414, 37.5245419, 37.547251, 37.5396157, 37.52886350000001, 37.5372822, 37.5541411, 37.53701179999999, 37.5293242, 37.5410289, 37.6271102, 37.6393918, 37.6344033, 37.6405388, 37.6288122, 37.6342221, 37.6204645, 37.6447499, 37.6625002, 37.6185566, 37.5708521, 37.5782534, 37.5588672, 37.572254, 37.5579756, 37.5422225, 37.569266, 37.5584156, 37.5533188, 37.5593023, 37.569044, 37.5471836, 37.5503027, 37.5409322, 37.5731974, 37.5593356, 37.5323421, 37.5653407, 37.5557752, 37.5641926,

### Save the data to database

In [62]:
sql = """
UPDATE ediya
SET lat = %s, lng = %s
WHERE id = %s;
"""
db = GetDatabase()
for i in range(len(ediya_lat_lng['lat'])):
    try:
        db.processSqlWithParams(sql, (ediya_lat_lng['lat'][i], ediya_lat_lng['lng'][i], i+1))
    except Exception as e:
        print(f"오류 발생 ({ediya_lat_list[i]}): {e}")
        db.rollback()


In [65]:
sql = """
UPDATE starbucks
SET lat = %s, lng = %s
WHERE id = %s;
"""
db = GetDatabase()
for i in range(len(starbucks_lat_lng['lat'])):
    try:
        db.processSqlWithParams(sql, (starbucks_lat_lng['lat'][i], starbucks_lat_lng['lng'][i], i+1))
    except Exception as e:
        print(f"오류 발생 ({starbucks_lat_list[i]}): {e}")
        db.rollback()


In [70]:
sql = "select * from starbucks"
result = db.processSql(sql)
for idx, row in enumerate(result):
    print(row)

(1, '역삼아레나빌딩  ', '서울특별시 강남구 언주로 425 (역삼동)', 37.5001, 127.039)
(2, '논현역사거리  ', '서울특별시 강남구 강남대로 538 (논현동)', 37.5137, 127.032)
(3, '신사역성일빌딩  ', '서울특별시 강남구 강남대로 584 (논현동)', 37.5137, 127.032)
(4, '국기원사거리  ', '서울특별시 강남구 테헤란로 125 (역삼동)', 37.4996, 127.032)
(5, '대치재경빌딩  ', '서울특별시 강남구 남부순환로 2947 (대치동)', 37.4945, 127.063)
(6, '봉은사역  ', '서울특별시 강남구 봉은사로 619 (삼성동)', 37.515, 127.063)
(7, '압구정윤성빌딩  ', '서울특별시 강남구 논현로 834 (신사동)', 37.5228, 127.029)
(8, '코엑스별마당  ', '서울특별시 강남구 영동대로 513 (삼성동)', 37.5125, 127.059)
(9, '삼성역섬유센터R  ', '서울특별시 강남구 테헤란로 518 (대치동)', 37.5075, 127.061)
(10, '압구정R  ', '서울특별시 강남구 언주로 861 (신사동)', 37.5274, 127.033)
(11, '수서역R  ', '서울특별시 강남구 광평로 281 (수서동)', 37.488, 127.103)
(12, '양재강남빌딩R  ', '서울특별시 강남구 남부순환로 2621 (도곡동)', 37.4853, 127.037)
(13, '선릉동신빌딩R  ', '서울특별시 강남구 테헤란로 409 (삼성동)', 37.5055, 127.05)
(14, '봉은사로선정릉  ', '서울특별시 강남구 봉은사로 446 (삼성동)', 37.5113, 127.048)
(15, '강남오거리  ', '서울특별시 강남구 봉은사로2길 39 (역삼동)', 37.5021, 127.027)
(16, '스타필드코엑스몰R  ', '서울특별시 강남구 영동대로 513 (삼성동) 코엑스 A10', 37.5117, 

## Data Analysis

### Calculate the distance between ediya and starbucks

In [133]:
import numpy as np
import builtins

def calculate_distance(lat1, lng1, lat2, lng2):
    """
    두 지점 간의 거리를 계산하는 함수
    """
    # 지구 반지름 (단위: 미터)
    R = 6371000
    
    # 위도와 경도를 라디안으로 변환
    lat1, lng1, lat2, lng2 = builtins.map(np.radians, [lat1, lng1, lat2, lng2])

    # 코사인 제2법칙 적용
    dlat = lat2 - lat1
    dlng = lng2 - lng1
    a = np.sin(dlat/2)**2 + np.cos(lat1) * np.cos(lat2) * np.sin(dlng/2)**2
    c = 2 * np.arctan2(np.sqrt(a), np.sqrt(1-a))
    distance = R * c
    return distance



How to use the calculate_distance function?

In [136]:
sql1 = """
SELECT 매장명, lat, lng
FROM ediya
WHERE 주소 LIKE '%강남구%';
"""

sql2 = """
select 매장명, lat, lng
from starbucks
where 도로명주소 like '%강남구%';
"""

result1 = db.processSql(sql1)
result2 = db.processSql(sql2)
for idx, row1 in enumerate(result1):
    active_bit = False
    for idx, row2 in enumerate(result2):
        distance = calculate_distance(row1[1], row1[2], row2[1], row2[2])
        if(distance < 200 and not active_bit):
            print(f"[이디야 커피]{row1[0].replace(' ', '')}-[스타벅스]{row2[0].replace(' ', '')}| 거리 : {distance}")
            active_bit = True


[이디야 커피]도산사거리점-[스타벅스]을지병원사거리| 거리 : 188.6738470582624
[이디야 커피]학동제마점-[스타벅스]논현역사거리| 거리 : 188.5970333709997
[이디야 커피]삼성대치점-[스타벅스]대치| 거리 : 117.64658026146996
[이디야 커피]선릉역점-[스타벅스]선릉역| 거리 : 88.91038252557962
[이디야 커피]한티역점-[스타벅스]한티역| 거리 : 178.93247127917874
[이디야 커피]청담역점-[스타벅스]청담역| 거리 : 117.62912523906144
[이디야 커피]강남구청역아이티웨딩점-[스타벅스]강남구청역| 거리 : 88.19725096839232
[이디야 커피]학동역점-[스타벅스]논현역사거리| 거리 : 169.33667924738037
[이디야 커피]강남도산점-[스타벅스]압구정윤성빌딩| 거리 : 184.93549239397893
[이디야 커피]역삼점-[스타벅스]구역삼사거리| 거리 : 176.79356706757196
[이디야 커피]삼성한전점-[스타벅스]삼성역| 거리 : 133.4339119734056
[이디야 커피]청담사거리점-[스타벅스]청담| 거리 : 184.9307573791834
[이디야 커피]신사역점-[스타벅스]신사역| 거리 : 166.79238996711067
[이디야 커피]역삼역점-[스타벅스]GS타워| 거리 : 179.55507314506536
[이디야 커피]역삼플래티넘점-[스타벅스]강남비젼타워| 거리 : 133.4339119734056
[이디야 커피]역삼월드점-[스타벅스]역삼이마트| 거리 : 77.83644865127116
[이디야 커피]삼성동점-[스타벅스]삼성역섬유센터R| 거리 : 188.61073915911314


강남구 내에서도 꽤나 많은 통계를 볼 수 있다

### From now, we visualize the data on the map

In [124]:
import folium

my_map = folium.Map(location=[37.5502, 126.982], zoom_start=10)
sql = "select 매장명 from ediya"
result = db.processSql(sql)
ediya_store_name_list = []
for idx, row in enumerate(result):
    ediya_store_name_list.append(row[0])

sql = "select 매장명 from starbucks"
result = db.processSql(sql)
starbucks_store_name_list = []
for idx, row in enumerate(result):
    starbucks_store_name_list.append(row[0])


# 'lat'과 'lng' 키를 가진 딕셔너리 구조에 맞게 코드 수정
for idx in range(len(ediya_lat_lng['lat'])):
    popup = folium.Popup("이디야 " + ediya_store_name_list[idx], max_width=300)
    folium.Marker(
        location=[float(ediya_lat_lng['lat'][idx]), float(ediya_lat_lng['lng'][idx])],
        popup=popup,
        icon=folium.Icon(color='blue')
    ).add_to(my_map)
for idx in range(len(starbucks_lat_lng['lat'])):
    popup = folium.Popup("스타벅스 " + starbucks_store_name_list[idx], max_width=300)
    folium.Marker(
        location=[float(starbucks_lat_lng['lat'][idx]), float(starbucks_lat_lng['lng'][idx])],
        popup=popup,
        icon=folium.Icon(color='green', icon='star')
    ).add_to(my_map)

my_map

보기가 너무 어렵다. 지점 거리가 가까운 곳만 나타내자

### calculate_distance 함수를 이용해 200m 이내의 지점만 나타내기

In [140]:
sql1 = """
SELECT 매장명, lat, lng
FROM ediya
WHERE 주소 LIKE %s;
"""

sql2 = """
select 매장명, lat, lng
from starbucks
where 도로명주소 like %s;
"""

starbucks_lat_list = []
starbucks_lng_list = []
ediya_lat_list = []
ediya_lng_list = []
starbucks_store_name_list = []
ediya_store_name_list = []

for gu_name in gu_name_list:
    result1 = db.processSqlWithParams(sql1, (f"%{gu_name}%",))
    result2 = db.processSqlWithParams(sql2, (f"%{gu_name}%",))
    for row1 in result1:
        active_bit = False
        for row2 in result2:
            distance = calculate_distance(row1[1], row1[2], row2[1], row2[2])
            if(distance < 200 and not active_bit):
                active_bit = True
                starbucks_store_name_list.append(row2[0])
                ediya_store_name_list.append(row1[0])
                starbucks_lat_list.append(row2[1])
                starbucks_lng_list.append(row2[2])
                ediya_lat_list.append(row1[1])
                ediya_lng_list.append(row1[2])
import folium

my_map = folium.Map(location=[37.5502, 126.982], zoom_start=10)

for idx in range(len(ediya_lat_list)):
    popup = folium.Popup("이디야 " + ediya_store_name_list[idx], max_width=300)
    folium.Marker(
        location=[float(ediya_lat_list[idx]), float(ediya_lng_list[idx])],
        popup=popup,
        icon=folium.Icon(color='blue')
    ).add_to(my_map)
for idx in range(len(starbucks_lat_list)):
    popup = folium.Popup("스타벅스 " + starbucks_store_name_list[idx], max_width=300)
    folium.Marker(
        location=[float(starbucks_lat_list[idx]), float(starbucks_lng_list[idx])],
        popup=popup,
        icon=folium.Icon(color='green', icon='star')
    ).add_to(my_map)
my_map

185개의 지점이 서로 200m 이내에 붙어 있다

In [142]:
len(starbucks_lat_list)

185

### 100m 이내도 비슷할까?

In [143]:
sql1 = """
SELECT 매장명, lat, lng
FROM ediya
WHERE 주소 LIKE %s;
"""

sql2 = """
select 매장명, lat, lng
from starbucks
where 도로명주소 like %s;
"""

starbucks_lat_list = []
starbucks_lng_list = []
ediya_lat_list = []
ediya_lng_list = []
starbucks_store_name_list = []
ediya_store_name_list = []

for gu_name in gu_name_list:
    result1 = db.processSqlWithParams(sql1, (f"%{gu_name}%",))
    result2 = db.processSqlWithParams(sql2, (f"%{gu_name}%",))
    for row1 in result1:
        active_bit = False
        for row2 in result2:
            distance = calculate_distance(row1[1], row1[2], row2[1], row2[2])
            if(distance < 100 and not active_bit):
                active_bit = True
                starbucks_store_name_list.append(row2[0])
                ediya_store_name_list.append(row1[0])
                starbucks_lat_list.append(row2[1])
                starbucks_lng_list.append(row2[2])
                ediya_lat_list.append(row1[1])
                ediya_lng_list.append(row1[2])
import folium

my_map = folium.Map(location=[37.5502, 126.982], zoom_start=10)

for idx in range(len(ediya_lat_list)):
    popup = folium.Popup("이디야 " + ediya_store_name_list[idx], max_width=300)
    folium.Marker(
        location=[float(ediya_lat_list[idx]), float(ediya_lng_list[idx])],
        popup=popup,
        icon=folium.Icon(color='blue')
    ).add_to(my_map)
for idx in range(len(starbucks_lat_list)):
    popup = folium.Popup("스타벅스 " + starbucks_store_name_list[idx], max_width=300)
    folium.Marker(
        location=[float(starbucks_lat_list[idx]), float(starbucks_lng_list[idx])],
        popup=popup,
        icon=folium.Icon(color='green', icon='star')
    ).add_to(my_map)
my_map

185개의 매장 중 81개의 매장은 100m 이내에 있다

In [144]:
len(starbucks_lat_list)

81

### 50m 이내도 비슷할까?

In [145]:
sql1 = """
SELECT 매장명, lat, lng
FROM ediya
WHERE 주소 LIKE %s;
"""

sql2 = """
select 매장명, lat, lng
from starbucks
where 도로명주소 like %s;
"""

starbucks_lat_list = []
starbucks_lng_list = []
ediya_lat_list = []
ediya_lng_list = []
starbucks_store_name_list = []
ediya_store_name_list = []

for gu_name in gu_name_list:
    result1 = db.processSqlWithParams(sql1, (f"%{gu_name}%",))
    result2 = db.processSqlWithParams(sql2, (f"%{gu_name}%",))
    for row1 in result1:
        active_bit = False
        for row2 in result2:
            distance = calculate_distance(row1[1], row1[2], row2[1], row2[2])
            if(distance < 50 and not active_bit):
                active_bit = True
                starbucks_store_name_list.append(row2[0])
                ediya_store_name_list.append(row1[0])
                starbucks_lat_list.append(row2[1])
                starbucks_lng_list.append(row2[2])
                ediya_lat_list.append(row1[1])
                ediya_lng_list.append(row1[2])
import folium

my_map = folium.Map(location=[37.5502, 126.982], zoom_start=10)

for idx in range(len(ediya_lat_list)):
    popup = folium.Popup("이디야 " + ediya_store_name_list[idx], max_width=300)
    folium.Marker(
        location=[float(ediya_lat_list[idx]), float(ediya_lng_list[idx])],
        popup=popup,
        icon=folium.Icon(color='blue')
    ).add_to(my_map)
for idx in range(len(starbucks_lat_list)):
    popup = folium.Popup("스타벅스 " + starbucks_store_name_list[idx], max_width=300)
    folium.Marker(
        location=[float(starbucks_lat_list[idx]), float(starbucks_lng_list[idx])],
        popup=popup,
        icon=folium.Icon(color='green', icon='star')
    ).add_to(my_map)
my_map

81개의 매장 중 39개는 50m 이내에 있다.

In [146]:
len(starbucks_lat_list)

39

## 결론

### 50m 이내의 매장들이 집중된 것이 아닌 분산된 것으로 보아 의도적으로 매장을 스타벅스 근처에 위치한 것으로 알 수 있다.

하지만 이디야 매장이 먼저 설립되었는지, 스타벅스 매장이 먼저 설립되었는지 알 수 없다. 따라서 현재 데이터로는 이디야가 일방적으로 스타벅스 근처에 매장을 설립한 것이라 단언할 수는 없다. 스타벅스가 나중에 설립되었고, 이디야 근처에 매장을 설립한 것이라 볼 수도 있다.

### 그렇다면 다른 관점에서 비교해 보자. 과연 스타벅스가 이디야 근처에 의도적으로 매장을 지었을까?

2023년 기준 스타벅스 매출은 52조 968억 600만원이다. 이디야 매출은 2,755억 6,602만원이다. 물론 스타벅스는 글로벌 기업이기에 한국 판매량은 다를 수도 있으나, 단순 매출량 200배가 차이나는 상황에 스타벅스가 이디야 근처에 매장을 의도적으로 설립한다고 보기 어렵다.
따라서 시장 전략을 위해 이디야가 스타벅스 근처에 매장을 설립했다고 보는 것이 더 타당하다.

### 스타벅스는 인기가 많다. 스타벅스를 찾는 사람이 과포화 상태일 경우, 근처에 있는 이디야 매장을 선택할 확률이 있다. 해당 시장 상황을 고려하여 이디야가 스타벅스 근처에 매장을 설립한 것으로 볼 수 있다.