In [None]:
import pandas as pd
import numpy as np
import folium
import requests

from bs4 import BeautifulSoup

# pip install tqdm : progressBar 구현
# from tqdm.notebook import tqdm
from tqdm import tqdm
from selenium import webdriver

from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.chrome.service import Service

# jupyter nbconvert --to script coffeeStore.ipynb

In [None]:
# 크롬 드라이버 다운로드 :  https://googlechromelabs.github.io/chrome-for-testing/
chrome_options = webdriver.ChromeOptions() # 크롬 브라우저 옵션
drive_path = 'chromedriver.exe' # 다운로드 받은 드라이버 파일
myservice = Service(drive_path) # 드라이버 제어를 위한 서비스 객체
driver = webdriver.Chrome(service=myservice, options=chrome_options) # 드라이버 객체
print(type(driver)) # 객체가 잘 생성되었는 지 확인

wait_time = 10 # 최대 대기 시간 10초
driver.implicitly_wait(wait_time)

In [None]:
# driver.maximize_window()

In [None]:
# 공용 변수 선언
dataOut = './../dataOut/'

In [None]:
# 스타벅스) 매장 찾기-지역 검색 클릭
starbucks_url = 'https://www.starbucks.co.kr/store/store_map.do?disp=locale'
driver.get(starbucks_url) # 해당 페이지로 이동하기

In [None]:
# 스타벅스 '서울' 링크 클릭
starbucks_seoul_selector = '#container > div > form > fieldset > div > section > article.find_store_cont > article > article:nth-child(4) > div.loca_step1 > div.loca_step1_cont > ul > li:nth-child(1) > a'

WebDriverWait(driver, 5).until(EC.presence_of_element_located((By.CSS_SELECTOR, starbucks_seoul_selector))).click()

In [None]:
# 스타벅스 '서울'-'전체' 링크 클릭
starbucks_seoul_all = '#mCSB_2_container > ul > li:nth-child(1) > a'

WebDriverWait(driver, 5).until(EC.presence_of_element_located((By.CSS_SELECTOR, starbucks_seoul_all))).click()

In [None]:
# 스타벅스 html 코드를 파싱해서 html 파일에 기록합니다.
html = driver.page_source # 해당 페이지 소스 코드 반환
filename = 'starbucks.html'
htmlFile = open(filename, mode='wt', encoding='UTF-8')
print(html, file=htmlFile)
htmlFile.close()
print(filename, '파일 생성됨')

In [None]:
# 파싱된 결과를 BeautifulSoup 객체로 생성
soup = BeautifulSoup(html, 'html.parser')
print(type(soup))

In [None]:
# id 속성이 mCSB_3_container인 <div> 태그를 찾아 주세요.
container = soup.find('div', attrs={'id': 'mCSB_3_container'})

# 그 아래에 있는 모든 <li> 태그를 찾아 주세요.
storeAll = container.find_all('li')

print(f'모든 매장 갯수 : {len(storeAll)}')

In [None]:
starbucksData = [] # 스타벅스 매장 리스트

for store in storeAll:
    # print(store)
    brand = '스타벅스'
    name = store.find('i').text.strip()
    address = store.find('p').text.replace('1522-3232', '')
    imsi = address.split(' ')
    sido = imsi[0]
    gungu = imsi[1]
    latitude = store['data-lat']
    longitude = store['data-long']

    starbucksData.append((brand, name, address, sido, gungu, latitude, longitude))
    # break
# end for

print(f'스타벅스 매장 갯수 : {len(starbucksData)}')
# print(starbucksData)

In [None]:
'''
<li class="quickResultLstCon"
    data-code="3762"
    data-hlytag="null"
    data-index="0"
    data-lat="37.501087"
    data-long="127.043069"
    data-name="역삼아레나빌딩"
    data-storecd="1509"
    style="background:#fff">

    <strong data-my_siren_order_store_yn="N"
            data-name="역삼아레나빌딩"
            data-store="1509"
            data-yn="N">
        역삼아레나빌딩
    </strong>

    <p class="result_details">
        서울특별시 강남구 언주로 425 (역삼동)<br/>
        1522-3232
    </p>

    <i class="pin_general">리저브 매장 2번</i>

</li>

'''

In [None]:
sbColumns = ['브랜드', '상호', '주소', '시도', '군구', '위도', '경도']
sbDataFrame = pd.DataFrame(starbucksData)
sbDataFrame.columns = sbColumns
sbDataFrame.head()

In [None]:
sbFilename = dataOut + 'starbucks_file.csv'
sbDataFrame.to_csv(sbFilename, index=False, encoding='UTF-8')
print(f'{sbFilename} 파일이 저장되었습니다.')

In [None]:
# 위도, 경도 누락 데이터 갯수 확인
print(f'위도 누락 데이터 갯수 : {sbDataFrame["위도"].isnull().sum()}')
print(f'경도 누락 데이터 갯수 : {sbDataFrame["경도"].isnull().sum()}')

In [None]:
print('# 서울시 구 갯수 파악')
seoul_gu_list = list(sbDataFrame['군구'].unique())
print(f'서울시 구 갯수: {len(seoul_gu_list)}')
print(f'\n서울시 구 목록 : {seoul_gu_list}')

In [61]:
# 누락된 위도와 경도 정보는 kakao api를 이용하여 채워 넣도록 합니다.
# https://developers.kakao.com/
# kakao에 로그인하여 API 키 발급 받기
# 주의) 카카오 개발자 사이트에서 카카오맵-사용설정-On 상태로 변경해주세요.

In [77]:
url_header = 'https://dapi.kakao.com/v2/local/search/address.json?query='
api_key = 'a27595520f0c90739026b9f6ace4279c'
header = {'Authorization': 'KakaoAK ' + api_key}

In [90]:
# 주소를 입력 받아서 위도와 경도를 반환해주는 함수 구현하기
def getGeoCoder(address):
    result = ''
    url = url_header + address
    response = requests.get(url, headers=header)

    if response.status_code == 200:
        try:
            # print(response.json())
            jsondata = response.json()["documents"][0]["address"]
            return jsondata['y'], jsondata['x']
        except Exception as err:
            print(err)
            return None
        # end try
    else:
        result = f'Error[{response.status_code}]'
    # end if

    return result
# end def getGeoCoder

In [91]:
# 다음 주소에 대한 테스트를 진행합니다.
address01 = '서울 중랑구 망우로 460 (망우동)'
geoInfo01 = getGeoCoder(address01) # 잘 동작하는 주소
print(geoInfo01)

address02 = '서울 노원구 한글비석로 409 (상계동) 1~2층'
geoInfo02 = getGeoCoder(address02) # NoneType이 리턴되는 주소
geoInfo02

('37.6001065609187', '127.103136691889')
list index out of range


In [58]:
'''
케이스 01
panLatTo('127.079680860838','37.5879908042663','6');fnMove();

케이스 02
panLatTo('0','0','11');fnMove();

케이스 03
panAddTo('서울 중랑구 신내로 211 (신내동)','8');fnMove();
'''


"\n케이스 01\npanLatTo('127.079680860838','37.5879908042663','6');fnMove();\n\n케이스 02\npanLatTo('0','0','11');fnMove();\n\n케이스 03\npanAddTo('서울 중랑구 신내로 211 (신내동)','8');fnMove();\n"

In [None]:
# 이디야 매장 정보
ediya_url = 'https://www.ediya.com/contents/find_store.html'
driver.get(ediya_url)

In [None]:
# 이디야 '매장명'과 '주소' 검색에서 '주소' 버튼 클릭
ediya_address_selector = '#contentWrap > div.contents > div > div.store_search_pop > ul > li:nth-child(2) > a'

WebDriverWait(driver, 5).until(EC.presence_of_element_located((By.CSS_SELECTOR, ediya_address_selector))).click()

In [92]:
# 서울시 구 목록을 순환하면서 크롤링
ediyaData = [] # 이디야 매장 정보 리스트
incorrect_address = [] # 위도/경도 추출에 문제가 있는 주소 리스트

ediya_search_inputbox = '#keyword' # 이디야 주소 검색 입력란
ediya_search_button = '#keyword_div > form > button' # 이디야 주소 검색 (돋보기) 버튼

for gu in tqdm(seoul_gu_list):
    # 주소 검색 입력란 초기화
    WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.CSS_SELECTOR, ediya_search_inputbox))).clear()

    # 주소 검색어 입력 : 예시) 서울 강남구
    WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.CSS_SELECTOR, ediya_search_inputbox))).send_keys(f'서울 {gu}')

    # 찾기(돋보기) 버튼 클릭
    WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.CSS_SELECTOR, ediya_search_button))).click()

    # 이디야 매장 정보 수집
    html = driver.page_source

    if gu == '마포구': # 하나의 구 정보만 저장해보기
        gufile = open(f'서울 {gu}.html', 'wt', encoding='UTF-8')
        print(html, file=gufile)
        gufile.close()
        print(f'서울 {gu}.html 파일 생성 완료')
    # end if

    soup = BeautifulSoup(html, 'html.parser')

    # 매장 정보는 id 속성이 placesList인 <ul> 태그 아래에 있습니다.
    ul_tag = soup.find('ul', id='placesList')

    oneGuStoreList = ul_tag.find_all('li') # 구별 매장 리스트

    for store in oneGuStoreList:
        # print(store)
        brand = '이디야'
        name = store.find('dt').text.strip()
        address = store.find('dd').text
        imsi = address.split(' ')
        sido = imsi[0]
        gungu = imsi[1]

        # 위도와 경도는 잠시
        geoInfoString = store.find('a')['onclick']
        # print(geoInfoString)

        latitude = np.nan # 결측치
        longitude = np.nan

        # 위도와 경도 보정
        if geoInfoString.startswith('panLatTo') :
            if geoInfoString.startswith("panLatTo('0','0'") : # 잘못된 위도/경도
                # address를 사용하여 Kakao API에서 물어 보기
                geo_info = getGeoCoder(address)
                if geo_info != None:
                    latitude, longitude = geo_info
                else:
                    incorrect_address.append(address)
                    latitude = None
                    longitude = None
                # end if
            else: # 올바른 위도/경도
                latLong = geoInfoString.split("'")
                latitude = latLong[3]
                longitude = latLong[1]
                # print(f'위도 : {latitude}, 경도 : {longitude}')
            # end if

        else: # 'panAddTo'으로 시작하는 경우
            # address를 사용하여 Kakao API에서 물어 보기
            geo_info = getGeoCoder(address)
            if geo_info != None:
                latitude, longitude = geo_info
            else:
                incorrect_address.append(address)
                latitude = None
                longitude = None
            # end if
        # end if

        ediyaData.append((brand, name, address, sido, gungu, latitude, longitude))

        # break # 주의) 차후 삭제 예정
    # end inner for

    # break # 주의) 차후 삭제 예정
# end outer for

print(f'이디야 매장 갯수 : {len(ediyaData)}')

  0%|          | 0/25 [00:00<?, ?it/s]

위도 : 37.6006721423547, 경도 : 127.108627207598
위도 : 37.5896269575279, 경도 : 127.094182772191
위도 : 37.5974674047065, 경도 : 127.09415879594557
위도 : 37.5992876153903, 경도 : 127.092756577852
위도 : 37.6097411262067, 경도 : 127.076897926489
위도 : 37.574252177368244, 경도 : 127.08048931056359
위도 : 37.5879908042663, 경도 : 127.079680860838
위도 : 37.5901934659094, 경도 : 127.086826066156
위도 : 37.5834835948977, 경도 : 127.083196727099
위도 : 37.5960553404392, 경도 : 127.08342099906
위도 : 37.6002908828924, 경도 : 127.087790157773
위도 : 37.60237451498618, 경도 : 127.09544803898843
위도 : 37.60748470605642, 경도 : 127.10675146670297
위도 : 37.6143693114243, 경도 : 127.078289365778


  4%|▍         | 1/25 [00:02<00:59,  2.48s/it]

위도 : 37.5993838458016, 경도 : 127.079542626772
위도 : 37.61954020149987, 경도 : 127.08413727538176
위도 : 37.51654171724045, 경도 : 127.0401601992311
위도 : 37.51408005446769, 경도 : 127.02810578707652
위도 : 37.50133876179308, 경도 : 127.05242928262568
위도 : 37.4735487656314, 경도 : 127.107863694133
위도 : 37.488604436046536, 경도 : 127.06742226515867
위도 : 37.49418891219431, 경도 : 127.07764131137398
위도 : 37.4940924880388, 경도 : 127.061617564506
위도 : 37.50043704079942, 경도 : 127.06310437319587
위도 : 37.50346806209728, 경도 : 127.05088702698811
위도 : 37.517782772275645, 경도 : 127.02145819084597
위도 : 37.527994487818226, 경도 : 127.03073566616045
위도 : 37.50178663316214, 경도 : 127.03523956508853
위도 : 37.49854753271711, 경도 : 127.04798299548432
위도 : 37.5003154494517, 경도 : 127.04292899982501


  8%|▊         | 2/25 [00:06<01:12,  3.15s/it]

위도 : 37.51047297481296, 경도 : 127.032981540064
위도 : 37.49040201406986, 경도 : 127.08160067456867
위도 : 37.524855870334314, 경도 : 127.05035288418118
위도 : 37.5200643058897, 경도 : 127.049146860404
위도 : 37.51499417378034, 경도 : 127.03312378880225
위도 : 37.5131174134101, 경도 : 127.033652198273
위도 : 37.4979490135961, 경도 : 127.056118735013
위도 : 37.6406008108564, 경도 : 127.016163948133
위도 : 37.6169375235603, 경도 : 127.034460650104
위도 : 37.6270583442503, 경도 : 127.02547799375
위도 : 37.6204702944714, 경도 : 127.028752360124
위도 : 37.6288359683906, 경도 : 127.03987378053
위도 : 37.6447601874917, 경도 : 127.005613427587


 12%|█▏        | 3/25 [00:07<00:56,  2.57s/it]

위도 : 37.5722836809967, 경도 : 126.80696733511
위도 : 37.5723030060453, 경도 : 126.806994113323
위도 : 37.5641822785808, 경도 : 126.810682079138
위도 : 37.5588989867375, 경도 : 126.844878507014
위도 : 37.56843913691685, 경도 : 126.84038658631331
위도 : 37.5626706927393, 경도 : 126.823605646871
위도 : 37.5582813792344, 경도 : 126.829290828058
위도 : 37.5692420716795, 경도 : 126.826138036672
위도 : 37.55807272536136, 경도 : 126.8383941467497
위도 : 37.5690161610357, 경도 : 126.812631152778
위도 : 37.5783009851923, 경도 : 126.812798304593
위도 : 37.5671170824829, 경도 : 126.818597219555
위도 : 37.55786209369936, 경도 : 126.84945198496683
위도 : 37.54223429652289, 경도 : 126.84424724638545


 16%|█▌        | 4/25 [00:11<01:02,  2.99s/it]

위도 : 37.4684727257098, 경도 : 126.944897173087
위도 : 37.4849644283346, 경도 : 126.95603357684
위도 : 37.4801290693885, 경도 : 126.902896907397
위도 : 37.4809279906563, 경도 : 126.911256043771
위도 : 37.4857087156598, 경도 : 126.946749008784
위도 : 37.48137982242393, 경도 : 126.9490007619789
위도 : 37.4784569907315, 경도 : 126.933022235665
위도 : 37.4765402893322, 경도 : 126.915984298817
위도 : 37.488621134755, 경도 : 126.925430749958


 20%|██        | 5/25 [00:14<00:58,  2.93s/it]

위도 : 37.548993161964745, 경도 : 127.0893030454462
위도 : 37.5351324957877, 경도 : 127.083842770754


 24%|██▍       | 6/25 [00:17<00:54,  2.87s/it]

위도 : 37.557021695282, 경도 : 127.087723525693
위도 : 37.5354377087993, 경도 : 127.083398686427
위도 : 37.478860594893845, 경도 : 126.8901033556771
위도 : 37.471350493002376, 경도 : 126.9032865178164
위도 : 37.46635783819566, 경도 : 126.90200430635853
위도 : 37.43411234401002, 경도 : 126.90472649315366


 28%|██▊       | 7/25 [00:20<00:52,  2.93s/it]

위도 : 37.6701880464645, 경도 : 127.054677638301
위도 : 37.6265093604229, 경도 : 127.061979778612
위도 : 37.649884209754255, 경도 : 127.0826133945026
위도 : 37.6196132389484, 경도 : 127.077885277951


 32%|███▏      | 8/25 [00:23<00:53,  3.13s/it]

위도 : 37.6516084987977, 경도 : 127.01319601269354
위도 : 37.68753761913406, 경도 : 127.04374413595103
위도 : 37.6560582306343, 경도 : 127.013556949839
위도 : 37.6389379513295, 경도 : 127.038109547969
위도 : 37.648691425654484, 경도 : 127.02717853006696
위도 : 37.6494415919409, 경도 : 127.034706714207
위도 : 37.64346473981549, 경도 : 127.03874807786094
위도 : 37.6534171446527, 경도 : 127.049667391336
위도 : 37.64890361348041, 경도 : 127.05250451283373
위도 : 37.654796530681295, 경도 : 127.05139242088684


 36%|███▌      | 9/25 [00:25<00:42,  2.64s/it]

서울 마포구.html 파일 생성 완료
위도 : 37.514162523894726, 경도 : 126.93865425871968
위도 : 37.513574825476404, 경도 : 126.94082532227891
위도 : 37.51290838049896, 경도 : 126.92834765518518
위도 : 37.50632113638169, 경도 : 126.94715442128768
위도 : 37.5007111108525, 경도 : 126.945556219571
위도 : 37.5048307436215, 경도 : 126.9530308556
list index out of range


 40%|████      | 10/25 [00:28<00:42,  2.86s/it]

위도 : 37.5076446931125, 경도 : 126.964738341052
위도 : 37.5451188164137, 경도 : 126.950886259458
위도 : 37.5471520550055, 경도 : 126.931600627596
위도 : 37.54203652124145, 경도 : 126.95051136853504
위도 : 37.5692205219891, 경도 : 126.905804329554
위도 : 37.5543135567568, 경도 : 126.905265725284
위도 : 37.550314872049455, 경도 : 126.93551824572988


 44%|████▍     | 11/25 [00:33<00:47,  3.36s/it]

위도 : 37.57824224353534, 경도 : 126.93569228371322
위도 : 37.596698732359, 경도 : 126.94879760070489
위도 : 37.5576654886412, 경도 : 126.957137829236
위도 : 37.563674036531, 경도 : 126.941917689273
위도 : 37.563674036531, 경도 : 126.941917689273
위도 : 37.56204444440694, 경도 : 126.9396619657622
위도 : 37.56128805404262, 경도 : 126.94054256718223
위도 : 37.5763814406771, 경도 : 126.930025142924


 48%|████▊     | 12/25 [00:35<00:40,  3.09s/it]

위도 : 37.503934456230404, 경도 : 127.00241119724721
위도 : 37.4956189258907, 경도 : 127.025219660672
위도 : 37.49348156830381, 경도 : 127.01711123409879
위도 : 37.4777188083482, 경도 : 127.009818464555
위도 : 37.49784541491314, 경도 : 127.00399194893603
위도 : 37.49759316196095, 경도 : 127.0030193959796
위도 : 37.506219322319325, 경도 : 127.0050532634284
위도 : 37.5057291465854, 경도 : 127.00568884262598
위도 : 37.49479378533478, 경도 : 127.01448803642147
위도 : 37.45646459702972, 경도 : 127.01625285612394
위도 : 37.510472981127, 경도 : 127.0329589189837
위도 : 37.502226322085065, 경도 : 127.0245694495325
위도 : 37.5144406772564, 경도 : 127.019386390307
위도 : 37.4860263770271, 경도 : 127.031487443707
위도 : 37.48343774983494, 경도 : 127.01212053082338


 52%|█████▏    | 13/25 [00:39<00:39,  3.25s/it]

위도 : 37.5846644662531, 경도 : 127.029558844368
위도 : 37.5887034223667, 경도 : 127.031698331241
위도 : 37.6102502835964, 경도 : 127.02987600544
위도 : 37.606523673300146, 경도 : 127.06226070129833
위도 : 37.5939295699321, 경도 : 127.015893755022
위도 : 37.58902457510121, 경도 : 127.02202493345699
위도 : 37.6177100595708, 경도 : 127.051043617995


 56%|█████▌    | 14/25 [00:43<00:37,  3.44s/it]

위도 : 37.4776148442516, 경도 : 127.124961768886
위도 : 37.4916073817028, 경도 : 127.11495979115
위도 : 37.498303976004735, 경도 : 127.12087308454156
위도 : 37.49352032166526, 경도 : 127.14434073545736
위도 : 37.5127330893982, 경도 : 127.120016251041
위도 : 37.5036697979808, 경도 : 127.092579345276
위도 : 37.5061702039866, 경도 : 127.08075330646
위도 : 37.4855010122778, 경도 : 127.115853505576
위도 : 37.5056617466954, 경도 : 127.104455184706
위도 : 37.5071903282914, 경도 : 127.105841889845
위도 : 37.49292715289153, 경도 : 127.12526318784414
위도 : 37.49058756157332, 경도 : 127.11794613172696
위도 : 37.480845018993676, 경도 : 127.14280133733737
위도 : 37.5087791749502, 경도 : 127.1305037107547


 60%|██████    | 15/25 [00:44<00:27,  2.74s/it]

위도 : 37.51573785966157, 경도 : 127.13191560436993
위도 : 37.47494648104577, 경도 : 127.13442428248332
위도 : 37.5047208554957, 경도 : 127.085852293902
위도 : 37.51353974735096, 경도 : 127.0993615087665
위도 : 37.5215008347482, 경도 : 126.862615322582
위도 : 37.5152188104643, 경도 : 126.840692066592
위도 : 37.5356741789955, 경도 : 126.828923065237


 64%|██████▍   | 16/25 [00:47<00:26,  2.91s/it]

위도 : 37.5251775245928, 경도 : 126.924876706923
위도 : 37.5196744579443, 경도 : 126.928930989749
위도 : 37.526869878743, 경도 : 126.917843631999
위도 : 37.525029038125, 경도 : 126.891103928762
위도 : 37.49647205091008, 경도 : 126.9028549432193
위도 : 37.5196351977246, 경도 : 126.939136417577
위도 : 37.5189822790873, 경도 : 126.886278723171
위도 : 37.5303335810073, 경도 : 126.919916432847
위도 : 37.511854826249035, 경도 : 126.92152601914932
위도 : 37.524529915593526, 경도 : 126.88358139719749
위도 : 37.5260558187275, 경도 : 126.930769729764
위도 : 37.5220163808659, 경도 : 126.930048684376
위도 : 37.5210144173791, 경도 : 126.923991634451
위도 : 37.52667482397141, 경도 : 126.90422425738349
위도 : 37.526790955173, 경도 : 126.888600855285
위도 : 37.5213280608143, 경도 : 126.89731742963
list index out of range


 68%|██████▊   | 17/25 [00:51<00:25,  3.21s/it]

위도 : 37.51787131047062, 경도 : 126.90613304012865
위도 : 37.5156680341198, 경도 : 126.907665995469
위도 : 37.50324896699568, 경도 : 127.02455282046348
위도 : 37.5286372332436, 경도 : 126.923399003703
위도 : 37.61346014720294, 경도 : 126.91190260226251
위도 : 37.611979902816174, 경도 : 126.91762675639762
위도 : 37.60875371667509, 경도 : 126.92690582152823
위도 : 37.59534169809925, 경도 : 126.91882273114795
위도 : 37.60130668380729, 경도 : 126.92212973358569
위도 : 37.6119412915133, 경도 : 126.928170521884
위도 : 37.615230520763, 경도 : 126.925968000044
위도 : 37.59318462886998, 경도 : 126.91361081200473
위도 : 37.6277461902526, 경도 : 126.919185124303
위도 : 37.60527601006437, 경도 : 126.91070049318746
위도 : 37.6054420445568, 경도 : 126.922124290438
위도 : 37.60076733486699, 경도 : 126.91863338447128
위도 : 37.6188948297727, 경도 : 126.919884176889
위도 : 37.601551874463, 경도 : 126.92948914955393


 72%|███████▏  | 18/25 [00:53<00:18,  2.71s/it]

위도 : 37.5992730543067, 경도 : 126.907863200941
위도 : 37.600098929318705, 경도 : 126.91561001336949
위도 : 37.59090765819004, 경도 : 126.91715178773087
위도 : 37.5833665429509, 경도 : 126.906550600654
위도 : 37.5716953499755, 경도 : 126.970696336246
위도 : 37.5746716527447, 경도 : 126.968429762772
위도 : 37.57150699708368, 경도 : 126.97565344843615
위도 : 37.57184800694998, 경도 : 127.00805518188871
위도 : 37.5793376128612, 경도 : 126.982701926649
위도 : 37.5742373886978, 경도 : 127.021476077131
위도 : 37.5767203705556, 경도 : 126.985823042976
위도 : 37.574075527144224, 경도 : 127.00182933693897
위도 : 37.57062831400788, 경도 : 127.00218468908556
위도 : 37.5774862427837, 경도 : 127.008183259977
위도 : 37.57228044824555, 경도 : 126.99142858488984


 76%|███████▌  | 19/25 [00:58<00:20,  3.42s/it]

위도 : 37.56644251292965, 경도 : 126.98717557400126
위도 : 37.5625572053404, 경도 : 126.9986915916533
위도 : 37.5677127859728, 경도 : 127.013196592402
위도 : 37.5617602798822, 경도 : 126.985404271845
위도 : 37.5647312946952, 경도 : 126.983858910559
위도 : 37.5632737727618, 경도 : 126.973094520683
위도 : 37.5644739023203, 경도 : 126.993478277513
위도 : 37.5608187887289, 경도 : 126.968225883547
위도 : 37.5623140006705, 경도 : 126.974582779311
위도 : 37.55756848236245, 경도 : 126.97740146915775


 80%|████████  | 20/25 [01:01<00:17,  3.48s/it]

위도 : 37.5574052401914, 경도 : 127.172575598882
위도 : 37.5305040538801, 경도 : 127.129853009462
위도 : 37.56039666265223, 경도 : 127.16370018873648
위도 : 37.52029359715243, 경도 : 127.13875890999955
위도 : 37.550410338798194, 경도 : 127.14556505383719
위도 : 37.5462992589271, 경도 : 127.145789262651
위도 : 37.5513635720856, 경도 : 127.134728442286
위도 : 37.54016837687974, 경도 : 127.12456936024019
위도 : 37.5467270340876, 경도 : 127.134809493652


 84%|████████▍ | 21/25 [01:04<00:13,  3.33s/it]

위도 : 37.49425567906598, 경도 : 126.85837744421302
위도 : 37.50590782693333, 경도 : 126.8582904039366
위도 : 37.49757339497824, 경도 : 126.86392369544526
위도 : 37.4966251468796, 경도 : 126.890315032666
위도 : 37.497825883946476, 경도 : 126.82937821925746
위도 : 37.50618302845446, 경도 : 126.87671651690317
위도 : 37.50330519053889, 경도 : 126.88108330547095
위도 : 37.50246213304171, 경도 : 126.88136511388151
위도 : 37.4808134179081, 경도 : 126.824263948518
위도 : 37.49494013521619, 경도 : 126.87192053744891


 88%|████████▊ | 22/25 [01:07<00:09,  3.07s/it]

위도 : 37.59203327648363, 경도 : 127.05250416385545
위도 : 37.595279710668244, 경도 : 127.05111084006763
위도 : 37.573052190180896, 경도 : 127.05611323484102
위도 : 37.5701769955012, 경도 : 127.049533732451
위도 : 37.5669101962131, 경도 : 127.061880899304
위도 : 37.57504733413244, 경도 : 127.02493296369806
위도 : 37.56754823943685, 경도 : 127.07077591338621
위도 : 37.562872788703984, 경도 : 127.06144791110912
위도 : 37.5782923121696, 경도 : 127.042196782039


 92%|█████████▏| 23/25 [01:09<00:05,  2.96s/it]

위도 : 37.58980550001833, 경도 : 127.05749583678211
위도 : 37.5641084405355, 경도 : 127.053432156481
위도 : 37.5501670203702, 경도 : 127.04361144463
위도 : 37.54487737059238, 경도 : 127.06190839848826


 96%|█████████▌| 24/25 [01:13<00:03,  3.15s/it]

위도 : 37.53494410336005, 경도 : 127.00692431290224
위도 : 37.53584882357322, 경도 : 126.9611373908156
위도 : 37.5337400268036, 경도 : 126.956231240406
위도 : 37.5325054872953, 경도 : 126.951642152118
위도 : 37.5254293060308, 경도 : 126.964651687385
위도 : 37.5494639189725, 경도 : 126.969413497587
위도 : 37.540537976136086, 경도 : 126.96220762686157


100%|██████████| 25/25 [01:15<00:00,  3.02s/it]

이디야 매장 갯수 : 498





In [None]:
'''
<li class="item">
    <a href="#c" onclick="panLatTo('0','0','0'); fnMove();">
        <div class="store_thum">
            <img src="../images/customer/store_thum.gif" />
        </div>
        <dl>
            <dt>강남YMCA점</dt>
            <dd>서울 강남구 논현동</dd>
        </dl>
    </a>
</li>
'''

In [93]:
edColumns = ['브랜드', '상호', '주소', '시도', '군구', '위도', '경도']
edDataFrame = pd.DataFrame(ediyaData)
edDataFrame.columns = edColumns
edDataFrame.head()

Unnamed: 0,브랜드,상호,주소,시도,군구,위도,경도
0,이디야,동부제일병원삼거리점,"서울 중랑구 망우로 505 (망우동, 미래학원)",서울,중랑구,37.6006721423547,127.108627207598
1,이디야,동원사거리점,"서울 중랑구 겸재로 240 (면목동, 행복오피스텔)",서울,중랑구,37.5896269575279,127.094182772191
2,이디야,망우중앙점,"서울 중랑구 용마산로115길 109 (망우동, 한일써너스빌리젠시2단지)",서울,중랑구,37.5974674047065,127.09415879594556
3,이디야,망우코레일점,"서울 중랑구 망우로55길 11-10 (상봉동, 망우역)",서울,중랑구,37.5992876153903,127.092756577852
4,이디야,먹골역점,서울 중랑구 동일로157길 13 (묵동),서울,중랑구,37.6097411262067,127.076897926489


In [103]:
print('주소 변환에 문제가 있던 항목들')
incorrect_address

주소 변환에 문제가 있던 항목들


['서울 동작구 사당로16가길 96 (사당동) 1,2층', '서울 영등포구 영등포로35길 19 (영등포동6가)']

In [104]:
# 콤마를 공백으로, 2칸 공백은 1칸으로 치환합니다.
# 이후 공백으로 분리후, 슬라이싱을 사용하여 0번째 부터 3번째 글자까지만 추출합니다.
correct_address = [addr.replace(',', ' ').replace('  ', ' ').split(' ')[0:4] for addr in incorrect_address]
correct_address

[['서울', '동작구', '사당로16가길', '96'], ['서울', '영등포구', '영등포로35길', '19']]

In [105]:
# split() 함수로 나누어진 주소를 join() 함수로 다시 문자열을 합칩니다.
correct_address = [' '.join(addr) for addr in correct_address]
correct_address

['서울 동작구 사당로16가길 96', '서울 영등포구 영등포로35길 19']

In [106]:
# 보정이 된 주소 이름으로 Kakao API에게 위도/경도 추출을 요청합니다.
correction_geoinfo = [getGeoCoder(addr) for addr in correct_address]
correction_geoinfo

list index out of range


[('37.485107611205', '126.968823424325'), None]

In [94]:
edFilename = dataOut + 'ediya_file.csv'
edDataFrame.to_csv(edFilename, index=False, encoding='UTF-8')
print(f'{edFilename} 파일이 저장되었습니다.')

./../dataOut/ediya_file.csv 파일이 저장되었습니다.


In [95]:
# 위도, 경도 누락 데이터 갯수 확인
print(f'위도 누락 데이터 갯수 : {edDataFrame["위도"].isnull().sum()}')
print(f'경도 누락 데이터 갯수 : {edDataFrame["경도"].isnull().sum()}')

위도 누락 데이터 갯수 : 2
경도 누락 데이터 갯수 : 2
