<a href="https://colab.research.google.com/github/2innnnn0/all_about_data/blob/main/blood_donation_center_geocoding.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 패키지 & 데이터 불러오기

In [None]:
import pandas as pd
# from geopy.geocoders import Nominatim # API오류가 잦아서 사용하지 않음.
# from geopy.extra.rate_limiter import RateLimiter
import re

# Load the dataset
file_path = '/content/대한적십자사_헌혈의집_정보_20230601.csv'
data = pd.read_csv(file_path, encoding='euc-kr') # 인코딩 euc-kr로 반드시 지정

In [None]:
data.head()

Unnamed: 0,혈액원,헌혈의 집,구분,주소지,전화번호
0,서울중앙,중앙센터(원내),원내,서울 강서구 공항대로 591 대한적십자사 서울중앙혈액원 3층,02-6711-0184
1,서울중앙,서울역센터,자체,서울 중구 한강대로 405 서울역사 지하1층 B05호,02-752-9020
2,서울중앙,대화역센터,국고,"경기 고양시 일산서구 중앙로1573, 킨텍스프라자 402호",031-919-4930
3,서울중앙,신촌센터,국고,서울 서대문구 신촌로 99 엘리트 빌딩 2층,02-312-1247
4,서울중앙,연신내센터,국고,"서울 은평구 통일로 855-8, 연신내진원와이타운 4층 401호",02-353-7750


# 데이터 전처리 (주소를 API가 인식할 수 있게 변환)
```
CASE1) "로"
    INPUT : {서울 강서구 공항대로 591 대한적십자사 서울중앙혈액원 3층}
    OUTPUT : {공항대로 591}
CASE2) "길"
    INPUT : {경남 양산시 양산역2길 7, 대상골드타워 3층}
    OUTPUT : {양산역2길 7}
CASE3) "동"
    INPUT : {대구 수성구 신매동 567-13, A동 2층}
    OUTPUT : {신매동 567-13}
CASE4) " , 뒤는 모두 삭제"
    INPUT : {울산 중구 젊음의거리 30-5, 다남빌딩 2층}
    OUTPUT : {젊음의거리 30-5}
CASE5) : 같이 {문자열}과 숫자와 붙어있는 경우 띄어쓰기로 수정
    INPUT : {분당내곡로117}
    OUTPUT : {분당내곡로 117}
```

In [None]:
# Function to extract the relevant part of the address
def extract_address(address):
    match = re.search(r'(\S+ \d+[-\d]*)', address)
    return match.group(1) if match else address

# Apply the function to the '주소지' column
data['cleaned_address'] = data['주소지'].apply(extract_address)

In [None]:
data.head()

Unnamed: 0,혈액원,헌혈의 집,구분,주소지,전화번호,cleaned_address
0,서울중앙,중앙센터(원내),원내,서울 강서구 공항대로 591 대한적십자사 서울중앙혈액원 3층,02-6711-0184,공항대로 591
1,서울중앙,서울역센터,자체,서울 중구 한강대로 405 서울역사 지하1층 B05호,02-752-9020,한강대로 405
2,서울중앙,대화역센터,국고,"경기 고양시 일산서구 중앙로1573, 킨텍스프라자 402호",031-919-4930,킨텍스프라자 402
3,서울중앙,신촌센터,국고,서울 서대문구 신촌로 99 엘리트 빌딩 2층,02-312-1247,신촌로 99
4,서울중앙,연신내센터,국고,"서울 은평구 통일로 855-8, 연신내진원와이타운 4층 401호",02-353-7750,통일로 855-8


# Google MAP API로 지오코딩 변환

1. Go to the Google Maps Platform > Credentials page. [Go to the Credentials page](https://developers.google.com/maps/documentation/javascript/get-api-key#console)
2. On the Credentials page, click Create credentials > API key. The API key created dialog displays your newly created API key.
3. Click Close. The new API key is listed on the Credentials page under API keys.(Remember to restrict the API key before using it in production.)

In [None]:
pip install googlemaps



In [None]:
import pandas as pd
import googlemaps
import os

# Initialize the Google Maps client with your API key
YOUR_GOOGLE_MAPS_API_KEY='' # 외부 유출되지 않도록 주의
gmaps = googlemaps.Client(key=YOUR_GOOGLE_MAPS_API_KEY)

# Define a function to get latitude and longitude
def get_lat_lon(address):
    try:
        geocode_result = gmaps.geocode(address)
        if geocode_result:
            location = geocode_result[0]['geometry']['location']
            return location['lat'], location['lng']
        else:
            return None, None
    except Exception as e:
        print(f"Error geocoding {address}: {e}")
        return None, None

# Apply the function to the 'cleaned_address' column
data[['latitude', 'longitude']] = data['cleaned_address'].apply(lambda x: pd.Series(get_lat_lon(x)))

# Save the updated dataframe with coordinates to a new CSV file
output_file_path = 'Blood_Donation_Centers_with_Coordinates.csv'
data.to_csv(output_file_path, index=False)

In [None]:
data.head()

Unnamed: 0,혈액원,헌혈의 집,구분,주소지,전화번호,cleaned_address,latitude,longitude
0,서울중앙,중앙센터(원내),원내,서울 강서구 공항대로 591 대한적십자사 서울중앙혈액원 3층,02-6711-0184,공항대로 591,37.548129,126.870844
1,서울중앙,서울역센터,자체,서울 중구 한강대로 405 서울역사 지하1층 B05호,02-752-9020,한강대로 405,37.552395,126.971069
2,서울중앙,대화역센터,국고,"경기 고양시 일산서구 중앙로1573, 킨텍스프라자 402호",031-919-4930,킨텍스프라자 402,37.675906,126.746989
3,서울중앙,신촌센터,국고,서울 서대문구 신촌로 99 엘리트 빌딩 2층,02-312-1247,신촌로 99,37.555738,126.937224
4,서울중앙,연신내센터,국고,"서울 은평구 통일로 855-8, 연신내진원와이타운 4층 401호",02-353-7750,통일로 855-8,37.619069,126.920241


In [None]:
import time
import folium
from IPython.display import display, IFrame

# Create a map centered around the first coordinate
map_center = [data['latitude'].mean(), data['longitude'].mean()]
m = folium.Map(location=map_center, zoom_start=10)

# Add markers to the map
for index, row in data.iterrows():
    if pd.notna(row['latitude']) and pd.notna(row['longitude']):
        folium.Marker(
            location=[row['latitude'], row['longitude']],
            popup=row['헌혈의 집'],
            icon=folium.Icon(icon='tint', prefix='fa', color='red'),
            tooltip=row['헌혈의 집']
        ).add_to(m)

# Save the map to an HTML file
map_output_path = '/content/blood_donation_centers_map.html'
m.save(map_output_path)

print(f"The map has been created and saved to {map_output_path}.")

The map has been created and saved to /content/blood_donation_centers_map.html.


In [None]:
map_output_path

'/content/blood_donation_centers_map.html'

In [None]:
# 1. 아이콘 위에 "헌혈의집" 명으로 바로 노출될 수 있도록.
# 2. 맵아이콘을🩸 표시로 변경.