In [None]:
import json
import pandas as pd

In [None]:
with open('seoul_bicycle_master.json', 'r', encoding='utf-8') as f:
    master_data = json.load(f)

print(json.dumps(master_data, ensure_ascii=False, indent="\t"))

In [None]:
stations_data = master_data["DATA"]

print(json.dumps(stations_data, ensure_ascii=False, indent="\t"))

In [None]:
print(len(stations_data))

In [None]:
stn_id_addr = []
outlier_coord = []

for stn in stations_data:
    if (stn["statn_addr1"] == "서울특별시 성동구 테스트 대여소"):
        continue
    elif (stn["statn_lat"] == 0.0 or stn["statn_lnt"]==0.0):
        outlier_coord.append({"stn_id":stn["lendplace_id"], "stn_addr": stn["statn_addr1"], "stn_lat": stn["statn_lat"], "stn_lng": stn["statn_lnt"]})
    else:
        stn_id_addr.append({"stn_id":stn["lendplace_id"], "stn_addr": stn["statn_addr1"], "stn_lat": stn["statn_lat"], "stn_lng": stn["statn_lnt"]})

In [None]:
pd.DataFrame(stn_id_addr)

In [None]:
pd.DataFrame(outlier_coord)

In [None]:
cnt = 0
for stn in stn_id_addr:
    if stn["stn_addr"] == "":
        cnt += 1
        print(stn["stn_id"])
        print(stn)
        stn_id_addr.remove(stn)

In [None]:
cnt = 0
for stn in outlier_coord:
    if stn["stn_addr"] == "":
        cnt += 1
        print(stn["stn_id"])
        outlier_coord.remove(stn)

In [None]:
stn_id_addr.append({"stn_id":"ST-164", "stn_addr":"서울 서초구 방배동 907-4", 'stn_lat': 37.484215, 'stn_lng': 126.996292})

data_num = len(stn_id_addr)
print(data_num)

## 주소 -> 좌표 변환

In [None]:
import requests

### (0) API KEY 세팅

In [None]:
# pip install python-dotenv

In [None]:
from dotenv import load_dotenv
import os

load_dotenv()

GOOGLE_API_KEY = os.getenv('GOOGLE_API_KEY')
KAKAO_API_KEY = os.getenv('KAKAO_API_KEY')

### (1) Google API 사용

In [None]:
# API 키 설정
API_KEY = GOOGLE_API_KEY

stn_google = outlier_coord

trans_error = 0
error_list = []
okay = 0

for stn_data in stn_google:
    # 변환할 주소
    address = stn_data["stn_addr"]

    # Geocoding API 엔드포인트 URL
    url = f'https://maps.googleapis.com/maps/api/geocode/json?address={address}&key={API_KEY}&language=ko'

    # GET 요청 보내기
    response = requests.get(url)

    # 응답 확인
    if response.status_code == 200:
        data = response.json()
        if data['status'] == 'OK':
            okay += 1
            # 변환된 좌표 정보
            location = data['results'][0]['geometry']['location']
            stn_data["stn_lng"] = location['lng']
            stn_data["stn_lat"] = location['lat']
        else:
            trans_error += 1
            print(stn_data)
            print(f'주소를 변환할 수 없습니다. 상태: {data["status"]}')
            
            stn_google.remove(stn_data)
            error_list.append(stn_data)
    else:
        print(f'요청 실패. 상태 코드: {response.status_code}')

print(okay)

In [None]:
print(error_list)

### (2) Kakao API 이용
(구글로 좌표가 다 찾아져서 이 코드 안씀)

In [None]:
# # REST API 키
# REST_API_KEY = KAKAO_API_KEY

# # 주소
# stn_addr = ""

# # API 엔드포인트 URL
# url = "https://dapi.kakao.com/v2/local/search/address.json"

# # 헤더 설정
# headers = {
#     "Authorization": f"KakaoAK {REST_API_KEY}"
# }

# addr_request_fail = 0
# index_error = 0
# data = {}

# stn_kakao = error_list

# # GET 요청 보내기
# for stn_data in stn_kakao:

#     # 파라미터 설정
#     params = {
#         "query": stn_data["stn_addr"]
#     }

#     response = requests.get(url, headers=headers, params=params)

#     # 응답 확인
#     if response.status_code == 200:
#         data = response.json()
#         try:
#             stn_data["lng"] = data['documents'][0]['x']
#             stn_data["lat"] = data['documents'][0]['y']
#         except:
#             index_error += 1
#             print(stn_data)
#             print(data)
#             print()
#     else:
#         addr_request_fail += 1
#         print(f"요청 실패: {response.status_code}")
#         print("stn_data")

# print(f'addr_request_fail: {addr_request_fail}')

In [None]:
# print(index_error)

In [None]:
# print(stn_kakao)

## CSV로 저장

In [None]:
final_stn_data = stn_id_addr + stn_google

print(len(final_stn_data))

In [None]:
# 리스트를 Pandas DataFrame으로 변환
df = pd.DataFrame(final_stn_data)

# 원하는 열을 float64로 변환
df['stn_lat'] = df['stn_lat'].astype(float)
df['stn_lng'] = df['stn_lng'].astype(float)

df.info()

In [None]:
# CSV 파일로 저장
df.to_csv('seoul_bicycle_master_preprocessed.csv', index=False, encoding='utf-8')

In [None]:
# CSV 파일 불러오기
df2 = pd.read_csv('seoul_bicycle_master_preprocessed.csv', encoding='utf-8')

# 데이터프레임 정보 확인
df2.info()

In [None]:
missing_values = df2[(df2['stn_lat'].isnull()) | (df2['stn_lng'].isnull())]

# 결측치가 있는 행을 출력한다.
print(missing_values)

In [None]:
df2.info()