In [None]:
import pandas as pd
import requests
import time

# Nominatim Geocoding 함수
def get_nominatim_coordinates(address):
    url = "https://nominatim.openstreetmap.org/search"
    params = {
        "q": address,
        "format": "json",
        "limit": 1
    }
    headers = {
        "User-Agent": "Mozilla/5.0 (compatible; MyApplication/1.0; +http://example.com/my-application)"
    }

    try:
        response = requests.get(url, params=params, headers=headers)
        # 잠시 대기하여 API 요청 과부하 방지
        time.sleep(1)
        if response.status_code == 200:
            result = response.json()
            if result:
                location = result[0]
                return location['lat'], location['lon']
            else:
                print(f"Geocoding failed for address: {address}. Using default coordinates.")
                return "37.5665", "126.9780"  # 서울특별시 기본 좌표
        else:
            print(f"Failed to get data for address: {address}. HTTP Status Code: {response.status_code}")
            return None, None
    except requests.exceptions.RequestException as e:
        print(f"Request failed: {e}")
        return None, None
    except ValueError as ve:
        print(f"JSON decode failed: {ve}")
        return None, None

# 데이터 불러오기
fixed_usage_data = pd.read_csv('/content/fixed_wifi_anomalies.csv')
bus_usage_data = pd.read_csv('/content/bus_wifi_anomalies.csv')
village_bus_usage_data = pd.read_csv('/content/village_bus_wifi_anomalies.csv')

# 자치구를 기반으로 좌표(위도, 경도) 추가 - 고정형 AP 데이터
fixed_usage_data['latitude'], fixed_usage_data['longitude'] = zip(*fixed_usage_data['자치구'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {x}")))

# 버스명을 기반으로 좌표(위도, 경도) 추가 - 시내버스 데이터
bus_usage_data['latitude'], bus_usage_data['longitude'] = zip(*bus_usage_data['버스명'].apply(lambda x: get_nominatim_coordinates(f"서울특별시")))

# 버스명을 기반으로 좌표(위도, 경도) 추가 - 마을버스 데이터
village_bus_usage_data['latitude'], village_bus_usage_data['longitude'] = zip(*village_bus_usage_data['버스명'].apply(lambda x: get_nominatim_coordinates(f"서울특별시")))

# 결과 확인
print("고정형 AP 데이터:")
print(fixed_usage_data.head())

print("시내버스 데이터:")
print(bus_usage_data.head())

print("마을버스 데이터:")
print(village_bus_usage_data.head())

# 데이터 저장
fixed_usage_data.to_csv('fixed_wifi_anomalies_with_nominatim_coordinates.csv', index=False)
bus_usage_data.to_csv('bus_wifi_anomalies_with_nominatim_coordinates.csv', index=False)
village_bus_usage_data.to_csv('village_bus_wifi_anomalies_with_nominatim_coordinates.csv', index=False)


In [1]:
import pandas as pd
import requests
import time

# Nominatim Geocoding 함수
def get_nominatim_coordinates(address):
    url = "https://nominatim.openstreetmap.org/search"
    params = {
        "q": address,
        "format": "json",
        "limit": 1
    }
    headers = {
        "User-Agent": "Mozilla/5.0 (compatible; MyApplication/1.0; +http://example.com/my-application)"
    }

    try:
        response = requests.get(url, params=params, headers=headers)
        # 잠시 대기하여 API 요청 과부하 방지
        time.sleep(1)
        if response.status_code == 200:
            result = response.json()
            if result:
                location = result[0]
                return location['lat'], location['lon']
            else:
                print(f"Geocoding failed for address: {address}. Using default coordinates.")
                return "37.5665", "126.9780"  # 서울특별시 기본 좌표
        else:
            print(f"Failed to get data for address: {address}. HTTP Status Code: {response.status_code}")
            return None, None
    except requests.exceptions.RequestException as e:
        print(f"Request failed: {e}")
        return None, None
    except ValueError as ve:
        print(f"JSON decode failed: {ve}")
        return None, None

# 데이터 불러오기
fixed_usage_data = pd.read_csv('/content/bus_wifi_anomalies.csv')
bus_usage_data = pd.read_csv('/content/bus_wifi_anomalies.csv')
village_bus_usage_data = pd.read_csv('/content/village_bus_wifi_anomalies.csv')

# 샘플 데이터로 테스트 실행
fixed_usage_data_sample = fixed_usage_data.head(5)
bus_usage_data_sample = bus_usage_data.head(5)
village_bus_usage_data_sample = village_bus_usage_data.head(5)

# 자치구를 기반으로 좌표(위도, 경도) 추가 - 고정형 AP 데이터
fixed_usage_data_sample['latitude'], fixed_usage_data_sample['longitude'] = zip(*fixed_usage_data_sample['자치구'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {x}")))

# 버스명을 기반으로 좌표(위도, 경도) 추가 - 시내버스 데이터
bus_usage_data_sample['latitude'], bus_usage_data_sample['longitude'] = zip(*bus_usage_data_sample['버스명'].apply(lambda x: get_nominatim_coordinates(f"서울특별시")))

# 버스명을 기반으로 좌표(위도, 경도) 추가 - 마을버스 데이터
village_bus_usage_data_sample['latitude'], village_bus_usage_data_sample['longitude'] = zip(*village_bus_usage_data_sample['버스명'].apply(lambda x: get_nominatim_coordinates(f"서울특별시")))

# 중간 결과 확인
print("고정형 AP 데이터 (중간 결과):")
print(fixed_usage_data_sample.head())

print("시내버스 데이터 (중간 결과):")
print(bus_usage_data_sample.head())

print("마을버스 데이터 (중간 결과):")
print(village_bus_usage_data_sample.head())

# 샘플 데이터 저장
fixed_usage_data_sample.to_csv('fixed_wifi_anomalies_sample_with_nominatim_coordinates.csv', index=False)
bus_usage_data_sample.to_csv('bus_wifi_anomalies_sample_with_nominatim_coordinates.csv', index=False)
village_bus_usage_data_sample.to_csv('village_bus_wifi_anomalies_sample_with_nominatim_coordinates.csv', index=False)


KeyError: '자치구'

In [2]:
import pandas as pd

# 데이터 불러오기
fixed_usage_data = pd.read_csv('/content/fixed_wifi_anomalies.csv')
bus_usage_data = pd.read_csv('/content/bus_wifi_anomalies.csv')
village_bus_usage_data = pd.read_csv('/content/village_bus_wifi_anomalies.csv')

# 각 데이터프레임의 열 이름 확인
print("고정형 AP 데이터 열 이름:", fixed_usage_data.columns)
print("시내버스 데이터 열 이름:", bus_usage_data.columns)
print("마을버스 데이터 열 이름:", village_bus_usage_data.columns)


고정형 AP 데이터 열 이름: Index(['관리번호', '자치구', 'AP별 이용량(GB)', 'anomaly'], dtype='object')
시내버스 데이터 열 이름: Index(['구분', '버스명', 'AP별 이용량(단위 : GB)', 'anomaly'], dtype='object')
마을버스 데이터 열 이름: Index(['구분', '버스명', 'AP별 이용량(GB)', 'anomaly'], dtype='object')


In [3]:
import pandas as pd
import requests
import time

# Nominatim Geocoding 함수
def get_nominatim_coordinates(address):
    url = "https://nominatim.openstreetmap.org/search"
    params = {
        "q": address,
        "format": "json",
        "limit": 1
    }
    headers = {
        "User-Agent": "Mozilla/5.0 (compatible; MyApplication/1.0; +http://example.com/my-application)"
    }

    try:
        response = requests.get(url, params=params, headers=headers)
        # 잠시 대기하여 API 요청 과부하 방지
        time.sleep(1)
        if response.status_code == 200:
            result = response.json()
            if result:
                location = result[0]
                return location['lat'], location['lon']
            else:
                print(f"Geocoding failed for address: {address}. Using default coordinates.")
                return "37.5665", "126.9780"  # 서울특별시 기본 좌표
        else:
            print(f"Failed to get data for address: {address}. HTTP Status Code: {response.status_code}")
            return None, None
    except requests.exceptions.RequestException as e:
        print(f"Request failed: {e}")
        return None, None
    except ValueError as ve:
        print(f"JSON decode failed: {ve}")
        return None, None

# 데이터 불러오기
fixed_usage_data = pd.read_csv('/content/fixed_wifi_anomalies.csv')
bus_usage_data = pd.read_csv('/content/bus_wifi_anomalies.csv')
village_bus_usage_data = pd.read_csv('/content/village_bus_wifi_anomalies.csv')

# 샘플 데이터만 사용 (각각 5개의 행)
fixed_usage_sample = fixed_usage_data.head(5)
bus_usage_sample = bus_usage_data.head(5)
village_bus_usage_sample = village_bus_usage_data.head(5)

# 자치구를 기반으로 좌표(위도, 경도) 추가 - 고정형 AP 데이터
fixed_usage_sample['latitude'], fixed_usage_sample['longitude'] = zip(*fixed_usage_sample['자치구'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {x}")))

# 버스명을 기반으로 좌표(위도, 경도) 추가 - 시내버스 데이터
bus_usage_sample['latitude'], bus_usage_sample['longitude'] = zip(*bus_usage_sample['버스명'].apply(lambda x: get_nominatim_coordinates(f"서울특별시")))

# 버스명을 기반으로 좌표(위도, 경도) 추가 - 마을버스 데이터
village_bus_usage_sample['latitude'], village_bus_usage_sample['longitude'] = zip(*village_bus_usage_sample['버스명'].apply(lambda x: get_nominatim_coordinates(f"서울특별시")))

# 결과 확인
print("고정형 AP 데이터:")
print(fixed_usage_sample.head())

print("시내버스 데이터:")
print(bus_usage_sample.head())

print("마을버스 데이터:")
print(village_bus_usage_sample.head())

# 데이터 저장
fixed_usage_sample.to_csv('fixed_wifi_anomalies_sample_with_nominatim_coordinates.csv', index=False)
bus_usage_sample.to_csv('bus_wifi_anomalies_sample_with_nominatim_coordinates.csv', index=False)
village_bus_usage_sample.to_csv('village_bus_wifi_anomalies_sample_with_nominatim_coordinates.csv', index=False)


A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  fixed_usage_sample['latitude'], fixed_usage_sample['longitude'] = zip(*fixed_usage_sample['자치구'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {x}")))
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  fixed_usage_sample['latitude'], fixed_usage_sample['longitude'] = zip(*fixed_usage_sample['자치구'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {x}")))
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation

고정형 AP 데이터:
       관리번호  자치구   AP별 이용량(GB)  anomaly latitude longitude
0  WF181037  성동구  13990.425250       -1  37.5635  127.0365
1  WF181190  은평구  12011.047388       -1  37.6024  126.9293
2  WF191009  은평구  10940.317724       -1  37.6024  126.9293
3  WF181038  성동구  10244.118496       -1  37.5635  127.0365
4  WF181035  성동구   9946.630856       -1  37.5635  127.0365
시내버스 데이터:
     구분                  버스명  AP별 이용량(단위 : GB)  anomaly    latitude  \
0  시내버스  진화운수_3422_서울74사3085       1668.884400       -1  37.5666791   
1  시내버스   우신버스_502_서울70사8939       1569.609009       -1  37.5666791   
2  시내버스  선진운수_7212_서울74사4512       1418.351932       -1  37.5666791   
3  시내버스  흥안운수_1139_서울74사9631       1336.094849       -1  37.5666791   
4  시내버스  아진교통_1127_서울74사6452       1232.871823       -1  37.5666791   

     longitude  
0  126.9782914  
1  126.9782914  
2  126.9782914  
3  126.9782914  
4  126.9782914  
마을버스 데이터:
     구분                    버스명  AP별 이용량(GB)  anomaly    latitude    longitude
0  마을버스

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  village_bus_usage_sample['latitude'], village_bus_usage_sample['longitude'] = zip(*village_bus_usage_sample['버스명'].apply(lambda x: get_nominatim_coordinates(f"서울특별시")))
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  village_bus_usage_sample['latitude'], village_bus_usage_sample['longitude'] = zip(*village_bus_usage_sample['버스명'].apply(lambda x: get_nominatim_coordinates(f"서울특별시")))


In [4]:
import pandas as pd
import requests
import time

# Nominatim Geocoding 함수
def get_nominatim_coordinates(address):
    url = "https://nominatim.openstreetmap.org/search"
    params = {
        "q": address,
        "format": "json",
        "limit": 1
    }
    headers = {
        "User-Agent": "Mozilla/5.0 (compatible; MyApplication/1.0; +http://example.com/my-application)"
    }

    try:
        response = requests.get(url, params=params, headers=headers)
        # 잠시 대기하여 API 요청 과부하 방지
        time.sleep(1)
        if response.status_code == 200:
            result = response.json()
            if result:
                location = result[0]
                return location['lat'], location['lon']
            else:
                print(f"Geocoding failed for address: {address}. Using default coordinates.")
                return "37.5665", "126.9780"  # 서울특별시 기본 좌표
        else:
            print(f"Failed to get data for address: {address}. HTTP Status Code: {response.status_code}")
            return None, None
    except requests.exceptions.RequestException as e:
        print(f"Request failed: {e}")
        return None, None
    except ValueError as ve:
        print(f"JSON decode failed: {ve}")
        return None, None

# 데이터 불러오기
fixed_usage_data = pd.read_csv('/content/fixed_wifi_anomalies.csv')
bus_usage_data = pd.read_csv('/content/bus_wifi_anomalies.csv')
village_bus_usage_data = pd.read_csv('/content/village_bus_wifi_anomalies.csv')

# 샘플 데이터만 사용 (각각 5개의 행)
fixed_usage_sample = fixed_usage_data.head(5).copy()
bus_usage_sample = bus_usage_data.head(5).copy()
village_bus_usage_sample = village_bus_usage_data.head(5).copy()

# 자치구를 기반으로 좌표(위도, 경도) 추가 - 고정형 AP 데이터
fixed_usage_sample.loc[:, 'latitude'], fixed_usage_sample.loc[:, 'longitude'] = zip(*fixed_usage_sample['자치구'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {x}")))

# 버스명을 기반으로 좌표(위도, 경도) 추가 - 시내버스 데이터
bus_usage_sample.loc[:, 'latitude'], bus_usage_sample.loc[:, 'longitude'] = zip(*bus_usage_sample['버스명'].apply(lambda x: get_nominatim_coordinates(f"서울특별시")))

# 버스명을 기반으로 좌표(위도, 경도) 추가 - 마을버스 데이터
village_bus_usage_sample.loc[:, 'latitude'], village_bus_usage_sample.loc[:, 'longitude'] = zip(*village_bus_usage_sample['버스명'].apply(lambda x: get_nominatim_coordinates(f"서울특별시")))

# 결과 확인
print("고정형 AP 데이터:")
print(fixed_usage_sample.head())

print("시내버스 데이터:")
print(bus_usage_sample.head())

print("마을버스 데이터:")
print(village_bus_usage_sample.head())

# 데이터 저장
fixed_usage_sample.to_csv('fixed_wifi_anomalies_sample_with_nominatim_coordinates.csv', index=False)
bus_usage_sample.to_csv('bus_wifi_anomalies_sample_with_nominatim_coordinates.csv', index=False)
village_bus_usage_sample.to_csv('village_bus_wifi_anomalies_sample_with_nominatim_coordinates.csv', index=False)


고정형 AP 데이터:
       관리번호  자치구   AP별 이용량(GB)  anomaly latitude longitude
0  WF181037  성동구  13990.425250       -1  37.5635  127.0365
1  WF181190  은평구  12011.047388       -1  37.6024  126.9293
2  WF191009  은평구  10940.317724       -1  37.6024  126.9293
3  WF181038  성동구  10244.118496       -1  37.5635  127.0365
4  WF181035  성동구   9946.630856       -1  37.5635  127.0365
시내버스 데이터:
     구분                  버스명  AP별 이용량(단위 : GB)  anomaly    latitude  \
0  시내버스  진화운수_3422_서울74사3085       1668.884400       -1  37.5666791   
1  시내버스   우신버스_502_서울70사8939       1569.609009       -1  37.5666791   
2  시내버스  선진운수_7212_서울74사4512       1418.351932       -1  37.5666791   
3  시내버스  흥안운수_1139_서울74사9631       1336.094849       -1  37.5666791   
4  시내버스  아진교통_1127_서울74사6452       1232.871823       -1  37.5666791   

     longitude  
0  126.9782914  
1  126.9782914  
2  126.9782914  
3  126.9782914  
4  126.9782914  
마을버스 데이터:
     구분                    버스명  AP별 이용량(GB)  anomaly    latitude    longitude
0  마을버스

In [5]:
import pandas as pd
import requests
import time

# Nominatim Geocoding 함수
def get_nominatim_coordinates(address):
    url = "https://nominatim.openstreetmap.org/search"
    params = {
        "q": address,
        "format": "json",
        "limit": 1
    }
    headers = {
        "User-Agent": "Mozilla/5.0 (compatible; MyApplication/1.0; +http://example.com/my-application)"
    }

    try:
        response = requests.get(url, params=params, headers=headers)
        # 잠시 대기하여 API 요청 과부하 방지
        time.sleep(1)
        if response.status_code == 200:
            result = response.json()
            if result:
                location = result[0]
                return location['lat'], location['lon']
            else:
                print(f"Geocoding failed for address: {address}. Using default coordinates.")
                return "37.5665", "126.9780"  # 서울특별시 기본 좌표
        else:
            print(f"Failed to get data for address: {address}. HTTP Status Code: {response.status_code}")
            return None, None
    except requests.exceptions.RequestException as e:
        print(f"Request failed: {e}")
        return None, None
    except ValueError as ve:
        print(f"JSON decode failed: {ve}")
        return None, None

# 데이터 불러오기
fixed_usage_data = pd.read_csv('/content/fixed_wifi_anomalies.csv')
bus_usage_data = pd.read_csv('/content/bus_wifi_anomalies.csv')
village_bus_usage_data = pd.read_csv('/content/village_bus_wifi_anomalies.csv')

# 고정형 AP 데이터 처리 - 자치구를 기반으로 좌표(위도, 경도) 추가
fixed_usage_data['latitude'], fixed_usage_data['longitude'] = zip(*fixed_usage_data['자치구'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {x}")))

# 시내버스 데이터 처리 - 자치구와 결합하여 정확한 주소 정보 생성 후 좌표 추가
# '구분' 필드가 자치구 정보를 포함한다고 가정하고 시내버스 데이터를 처리합니다.
bus_usage_data['latitude'], bus_usage_data['longitude'] = zip(
    *bus_usage_data['구분'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {x}"))
)

# 마을버스 데이터 처리 - 자치구와 결합하여 정확한 주소 정보 생성 후 좌표 추가
# '구분' 필드가 자치구 정보를 포함한다고 가정하고 마을버스 데이터를 처리합니다.
village_bus_usage_data['latitude'], village_bus_usage_data['longitude'] = zip(
    *village_bus_usage_data['구분'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {x}"))
)

# 결과 확인
print("고정형 AP 데이터:")
print(fixed_usage_data.head())

print("시내버스 데이터:")
print(bus_usage_data.head())

print("마을버스 데이터:")
print(village_bus_usage_data.head())

# 데이터 저장
fixed_usage_data.to_csv('fixed_wifi_anomalies_with_nominatim_coordinates.csv', index=False)
bus_usage_data.to_csv('bus_wifi_anomalies_with_nominatim_coordinates.csv', index=False)
village_bus_usage_data.to_csv('village_bus_wifi_anomalies_with_nominatim_coordinates.csv', index=False)


KeyboardInterrupt: 

In [7]:
import pandas as pd
import requests
import time

# Nominatim Geocoding 함수
def get_nominatim_coordinates(address, cache):
    if address in cache:
        print(f"Cache hit for address: {address}")
        return cache[address]

    url = "https://nominatim.openstreetmap.org/search"
    params = {
        "q": address,
        "format": "json",
        "limit": 1
    }
    headers = {
        "User-Agent": "Mozilla/5.0 (compatible; MyApplication/1.0; +http://example.com/my-application)"
    }

    try:
        response = requests.get(url, params=params, headers=headers)
        time.sleep(1)  # API 과부하 방지
        if response.status_code == 200:
            result = response.json()
            if result:
                location = result[0]
                coordinates = (location['lat'], location['lon'])
                cache[address] = coordinates
                print(f"Geocoding success for address: {address} -> {coordinates}")
                return coordinates
            else:
                print(f"Geocoding failed for address: {address}. Using default coordinates.")
                return "37.5665", "126.9780"  # 서울특별시 기본 좌표
        else:
            print(f"Failed to get data for address: {address}. HTTP Status Code: {response.status_code}")
            return None, None
    except requests.exceptions.RequestException as e:
        print(f"Request failed: {e}")
        return None, None
    except ValueError as ve:
        print(f"JSON decode failed: {ve}")
        return None, None

# 데이터 불러오기
fixed_usage_data = pd.read_csv('/content/fixed_wifi_anomalies.csv')
bus_usage_data = pd.read_csv('/content/bus_wifi_anomalies.csv')
village_bus_usage_data = pd.read_csv('/content/village_bus_wifi_anomalies.csv')

# 캐시 초기화
cache = {}

# 고정형 AP 데이터 처리 - 자치구를 기반으로 좌표(위도, 경도) 추가
fixed_usage_data['latitude'], fixed_usage_data['longitude'] = zip(
    *fixed_usage_data['자치구'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {x}", cache))
)

# 시내버스 데이터 처리 - 자치구와 결합하여 정확한 주소 정보 생성 후 좌표 추가
bus_usage_data['latitude'], bus_usage_data['longitude'] = zip(
    *bus_usage_data['구분'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {x}", cache))
)

# 마을버스 데이터 처리 - 자치구와 결합하여 정확한 주소 정보 생성 후 좌표 추가
village_bus_usage_data['latitude'], village_bus_usage_data['longitude'] = zip(
    *village_bus_usage_data['구분'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {x}", cache))
)

# 결과 확인
print("고정형 AP 데이터:")
print(fixed_usage_data.head())

print("시내버스 데이터:")
print(bus_usage_data.head())

print("마을버스 데이터:")
print(village_bus_usage_data.head())

# 데이터 저장
fixed_usage_data.to_csv('fixed_wifi_anomalies_with_nominatim_coordinates.csv', index=False)
bus_usage_data.to_csv('bus_wifi_anomalies_with_nominatim_coordinates.csv', index=False)
village_bus_usage_data.to_csv('village_bus_wifi_anomalies_with_nominatim_coordinates.csv', index=False)


Geocoding success for address: 서울특별시 성동구 -> ('37.5635', '127.0365')
Geocoding success for address: 서울특별시 은평구 -> ('37.6024', '126.9293')
Cache hit for address: 서울특별시 은평구
Cache hit for address: 서울특별시 성동구
Cache hit for address: 서울특별시 성동구
Cache hit for address: 서울특별시 은평구
Geocoding success for address: 서울특별시 강남구 -> ('37.5177', '127.0473')
Geocoding success for address: 서울특별시 영등포구 -> ('37.5262', '126.8959')
Geocoding success for address: 서울특별시 성북구 -> ('37.59', '127.0165')
Cache hit for address: 서울특별시 성동구
Cache hit for address: 서울특별시 은평구
Cache hit for address: 서울특별시 은평구
Geocoding success for address: 서울특별시 금천구 -> ('37.4565', '126.8954')
Geocoding success for address: 서울특별시 중구 -> ('37.5636559', '126.9975097')
Geocoding success for address: 서울특별시 용산구 -> ('37.5323', '126.99')
Cache hit for address: 서울특별시 강남구
Cache hit for address: 서울특별시 은평구
Geocoding success for address: 서울특별시 서초구 -> ('37.4835', '127.0322')
Cache hit for address: 서울특별시 영등포구
Cache hit for address: 서울특별시 은평구
Geocoding success for 

KeyboardInterrupt: 

In [8]:
import pandas as pd
import requests
import time

# Nominatim Geocoding 함수
def get_nominatim_coordinates(address, cache):
    if address in cache:
        print(f"Cache hit for address: {address}")
        return cache[address]

    url = "https://nominatim.openstreetmap.org/search"
    params = {
        "q": address,
        "format": "json",
        "limit": 1
    }
    headers = {
        "User-Agent": "Mozilla/5.0 (compatible; MyApplication/1.0; +http://example.com/my-application)"
    }

    try:
        response = requests.get(url, params=params, headers=headers)
        time.sleep(1)  # API 과부하 방지
        if response.status_code == 200:
            result = response.json()
            if result:
                location = result[0]
                coordinates = (location['lat'], location['lon'])
                cache[address] = coordinates
                print(f"Geocoding success for address: {address} -> {coordinates}")
                return coordinates
            else:
                print(f"Geocoding failed for address: {address}. Using default coordinates.")
                return "37.5665", "126.9780"  # 서울특별시 기본 좌표
        else:
            print(f"Failed to get data for address: {address}. HTTP Status Code: {response.status_code}")
            return None, None
    except requests.exceptions.RequestException as e:
        print(f"Request failed: {e}")
        return None, None
    except ValueError as ve:
        print(f"JSON decode failed: {ve}")
        return None, None

# 데이터 불러오기
fixed_usage_data = pd.read_csv('/content/fixed_wifi_anomalies.csv')
bus_usage_data = pd.read_csv('/content/bus_wifi_anomalies.csv')
village_bus_usage_data = pd.read_csv('/content/village_bus_wifi_anomalies.csv')

# 캐시 초기화
cache = {}

# 고정형 AP 데이터 처리 - 자치구를 기반으로 좌표(위도, 경도) 추가
fixed_usage_data['latitude'], fixed_usage_data['longitude'] = zip(
    *fixed_usage_data['자치구'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {x}", cache))
)

# 시내버스 데이터 처리 - 자치구와 결합하여 정확한 주소 정보 생성 후 좌표 추가
bus_usage_data['latitude'], bus_usage_data['longitude'] = zip(
    *bus_usage_data['구분'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {x}", cache))
)

# 마을버스 데이터 처리 - 자치구와 결합하여 정확한 주소 정보 생성 후 좌표 추가
village_bus_usage_data['latitude'], village_bus_usage_data['longitude'] = zip(
    *village_bus_usage_data['구분'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {x}", cache))
)

# 결과 확인
print("고정형 AP 데이터:")
print(fixed_usage_data.head())

print("시내버스 데이터:")
print(bus_usage_data.head())

print("마을버스 데이터:")
print(village_bus_usage_data.head())

# 데이터 저장
fixed_usage_data.to_csv('fixed_wifi_anomalies_with_nominatim_coordinates.csv', index=False)
bus_usage_data.to_csv('bus_wifi_anomalies_with_nominatim_coordinates.csv', index=False)
village_bus_usage_data.to_csv('village_bus_wifi_anomalies_with_nominatim_coordinates.csv', index=False)


[1;30;43m스트리밍 출력 내용이 길어서 마지막 5000줄이 삭제되었습니다.[0m
Cache hit for address: 서울특별시 강남구
Cache hit for address: 서울특별시 양천구
Cache hit for address: 서울특별시 관악구
Cache hit for address: 서울특별시 성동구
Cache hit for address: 서울특별시 성동구
Cache hit for address: 서울특별시 강동구
Cache hit for address: 서울특별시 강서구
Cache hit for address: 서울특별시 강동구
Cache hit for address: 서울특별시 강서구
Cache hit for address: 서울특별시 구로구
Cache hit for address: 서울특별시 동대문구
Cache hit for address: 서울특별시 은평구
Cache hit for address: 서울특별시 강서구
Cache hit for address: 서울특별시 중구
Cache hit for address: 서울특별시 용산구
Cache hit for address: 서울특별시 광진구
Cache hit for address: 서울특별시 강서구
Cache hit for address: 서울특별시 강서구
Cache hit for address: 서울특별시 노원구
Cache hit for address: 서울특별시 중랑구
Cache hit for address: 서울특별시 도봉구
Cache hit for address: 서울특별시 영등포구
Cache hit for address: 서울특별시 구로구
Cache hit for address: 서울특별시 중구
Cache hit for address: 서울특별시 은평구
Cache hit for address: 서울특별시 성동구
Cache hit for address: 서울특별시 마포구
Cache hit for address: 서울특별시 노원구
Cache hit for address: 서울특

KeyboardInterrupt: 

In [9]:
import pandas as pd
import requests
import time

# Nominatim Geocoding 함수
def get_nominatim_coordinates(address, cache):
    if address in cache:
        print(f"Cache hit for address: {address}")
        return cache[address]

    url = "https://nominatim.openstreetmap.org/search"
    params = {
        "q": address,
        "format": "json",
        "limit": 1
    }
    headers = {
        "User-Agent": "Mozilla/5.0 (compatible; MyApplication/1.0; +http://example.com/my-application)"
    }

    try:
        response = requests.get(url, params=params, headers=headers)
        time.sleep(1)  # API 과부하 방지
        if response.status_code == 200:
            result = response.json()
            if result:
                location = result[0]
                coordinates = (location['lat'], location['lon'])
                cache[address] = coordinates
                print(f"Geocoding success for address: {address} -> {coordinates}")
                return coordinates
            else:
                print(f"Geocoding failed for address: {address}. Using default coordinates.")
                return "37.5665", "126.9780"  # 서울특별시 기본 좌표
        else:
            print(f"Failed to get data for address: {address}. HTTP Status Code: {response.status_code}")
            return None, None
    except requests.exceptions.RequestException as e:
        print(f"Request failed: {e}")
        return None, None
    except ValueError as ve:
        print(f"JSON decode failed: {ve}")
        return None, None

# 자치구 정보 추출 함수 (예시)
def extract_district_from_bus_name(bus_name):
    # 예시로, 버스명에서 자치구 이름을 추출하는 방법을 정의합니다.
    # 예를 들어, 버스명에 '강남'이 포함되어 있으면 '강남구'를 반환하도록 할 수 있습니다.
    if "강남" in bus_name:
        return "강남구"
    elif "서초" in bus_name:
        return "서초구"
    elif "마포" in bus_name:
        return "마포구"
    # 추가적인 조건을 추가하여 다른 자치구도 처리합니다.
    else:
        return None

# 데이터 불러오기
fixed_usage_data = pd.read_csv('/content/fixed_wifi_anomalies.csv')
bus_usage_data = pd.read_csv('/content/bus_wifi_anomalies.csv')
village_bus_usage_data = pd.read_csv('/content/village_bus_wifi_anomalies.csv')

# 캐시 초기화
cache = {}

# 고정형 AP 데이터 처리 - 자치구를 기반으로 좌표(위도, 경도) 추가
fixed_usage_data['latitude'], fixed_usage_data['longitude'] = zip(
    *fixed_usage_data['자치구'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {x}", cache))
)

# 시내버스 데이터 처리 - 구분 필드에 '시내버스'가 포함되어 있을 경우, 버스명에서 자치구를 추출하여 사용
bus_usage_data['latitude'], bus_usage_data['longitude'] = zip(
    *bus_usage_data['버스명'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {extract_district_from_bus_name(x)}", cache))
)

# 마을버스 데이터 처리 - 자치구와 결합하여 정확한 주소 정보 생성 후 좌표 추가
village_bus_usage_data['latitude'], village_bus_usage_data['longitude'] = zip(
    *village_bus_usage_data['구분'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {x}", cache))
)

# 결과 확인
print("고정형 AP 데이터:")
print(fixed_usage_data.head())

print("시내버스 데이터:")
print(bus_usage_data.head())

print("마을버스 데이터:")
print(village_bus_usage_data.head())

# 데이터 저장
fixed_usage_data.to_csv('fixed_wifi_anomalies_with_nominatim_coordinates.csv', index=False)
bus_usage_data.to_csv('bus_wifi_anomalies_with_nominatim_coordinates.csv', index=False)
village_bus_usage_data.to_csv('village_bus_wifi_anomalies_with_nominatim_coordinates.csv', index=False)


[1;30;43m스트리밍 출력 내용이 길어서 마지막 5000줄이 삭제되었습니다.[0m
Cache hit for address: 서울특별시 구로구
Cache hit for address: 서울특별시 중구
Cache hit for address: 서울특별시 구로구
Cache hit for address: 서울특별시 은평구
Cache hit for address: 서울특별시 강서구
Cache hit for address: 서울특별시 구로구
Cache hit for address: 서울특별시 중구
Cache hit for address: 서울특별시 관악구
Cache hit for address: 서울특별시 송파구
Cache hit for address: 서울특별시 노원구
Cache hit for address: 서울특별시 성동구
Cache hit for address: 서울특별시 중구
Cache hit for address: 서울특별시 중구
Cache hit for address: 서울특별시 강서구
Cache hit for address: 서울특별시 서초구
Cache hit for address: 서울특별시 은평구
Cache hit for address: 서울특별시 강남구
Cache hit for address: 서울특별시 중구
Cache hit for address: 서울특별시 마포구
Cache hit for address: 서울특별시 서초구
Cache hit for address: 서울특별시 관악구
Cache hit for address: 서울특별시 중구
Cache hit for address: 서울특별시 강동구
Cache hit for address: 서울특별시 강남구
Cache hit for address: 서울특별시 강서구
Cache hit for address: 서울특별시 도봉구
Cache hit for address: 서울특별시 강남구
Cache hit for address: 서울특별시 서초구
Cache hit for address: 서울특별시 은평구

KeyboardInterrupt: 

In [10]:
import pandas as pd
import requests
import time

# Nominatim Geocoding 함수
def get_nominatim_coordinates(address, cache):
    if address in cache:
        print(f"Cache hit for address: {address}")
        return cache[address]

    url = "https://nominatim.openstreetmap.org/search"
    params = {
        "q": address,
        "format": "json",
        "limit": 1
    }
    headers = {
        "User-Agent": "Mozilla/5.0 (compatible; MyApplication/1.0; +http://example.com/my-application)"
    }

    try:
        response = requests.get(url, params=params, headers=headers)
        time.sleep(1)  # API 과부하 방지
        if response.status_code == 200:
            result = response.json()
            if result:
                location = result[0]
                coordinates = (location['lat'], location['lon'])
                cache[address] = coordinates
                print(f"Geocoding success for address: {address} -> {coordinates}")
                return coordinates
            else:
                print(f"Geocoding failed for address: {address}. Using default coordinates.")
                return "37.5665", "126.9780"  # 서울특별시 기본 좌표
        else:
            print(f"Failed to get data for address: {address}. HTTP Status Code: {response.status_code}")
            return None, None
    except requests.exceptions.RequestException as e:
        print(f"Request failed: {e}")
        return None, None
    except ValueError as ve:
        print(f"JSON decode failed: {ve}")
        return None, None

# 자치구 정보 추출 함수
def extract_district_from_bus_name(bus_name):
    if "강남" in bus_name:
        return "강남구"
    elif "서초" in bus_name:
        return "서초구"
    elif "마포" in bus_name:
        return "마포구"
    # 추가적인 조건을 추가하여 다른 자치구도 처리합니다.
    else:
        print(f"Could not extract district from bus name: {bus_name}. Using default district.")
        return "강남구"  # 기본 자치구로 강남구를 설정

# 데이터 불러오기
fixed_usage_data = pd.read_csv('/content/fixed_wifi_anomalies.csv')
bus_usage_data = pd.read_csv('/content/bus_wifi_anomalies.csv')
village_bus_usage_data = pd.read_csv('/content/village_bus_wifi_anomalies.csv')

# 캐시 초기화
cache = {}

# 고정형 AP 데이터 처리 - 자치구를 기반으로 좌표(위도, 경도) 추가
fixed_usage_data['latitude'], fixed_usage_data['longitude'] = zip(
    *fixed_usage_data['자치구'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {x}", cache))
)

# 시내버스 데이터 처리 - 구분 필드에 '시내버스'가 포함되어 있을 경우, 버스명에서 자치구를 추출하여 사용
bus_usage_data['latitude'], bus_usage_data['longitude'] = zip(
    *bus_usage_data['버스명'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {extract_district_from_bus_name(x)}", cache))
)

# 마을버스 데이터 처리 - 자치구와 결합하여 정확한 주소 정보 생성 후 좌표 추가
village_bus_usage_data['latitude'], village_bus_usage_data['longitude'] = zip(
    *village_bus_usage_data['구분'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {x}", cache))
)

# 결과 확인
print("고정형 AP 데이터:")
print(fixed_usage_data.head())

print("시내버스 데이터:")
print(bus_usage_data.head())

print("마을버스 데이터:")
print(village_bus_usage_data.head())

# 데이터 저장
fixed_usage_data.to_csv('fixed_wifi_anomalies_with_nominatim_coordinates.csv', index=False)
bus_usage_data.to_csv('bus_wifi_anomalies_with_nominatim_coordinates.csv', index=False)
village_bus_usage_data.to_csv('village_bus_wifi_anomalies_with_nominatim_coordinates.csv', index=False)


[1;30;43m스트리밍 출력 내용이 길어서 마지막 5000줄이 삭제되었습니다.[0m
Cache hit for address: 서울특별시 강남구
Could not extract district from bus name: 서울버스_3426_서울74사2268. Using default district.
Cache hit for address: 서울특별시 강남구
Could not extract district from bus name: 서울버스_301_서울70사9693. Using default district.
Cache hit for address: 서울특별시 강남구
Could not extract district from bus name: 송파상운_3314_서울70사9503. Using default district.
Cache hit for address: 서울특별시 강남구
Could not extract district from bus name: 영인운수_662_서울74사4971. Using default district.
Cache hit for address: 서울특별시 강남구
Could not extract district from bus name: 서울교통네트웍㈜_500_서울70사6738. Using default district.
Cache hit for address: 서울특별시 강남구
Could not extract district from bus name: 삼화상운_173_서울74사3492. Using default district.
Cache hit for address: 서울특별시 강남구
Could not extract district from bus name: 아진교통_141_서울74사6488. Using default district.
Cache hit for address: 서울특별시 강남구
Could not extract district from bus name: 김포교통_6629_서울74사1448. Using default d

In [11]:
import pandas as pd
import requests
import time

# Nominatim Geocoding 함수
def get_nominatim_coordinates(address, cache):
    if address in cache:
        print(f"Cache hit for address: {address}")
        return cache[address]

    url = "https://nominatim.openstreetmap.org/search"
    params = {
        "q": address,
        "format": "json",
        "limit": 1
    }
    headers = {
        "User-Agent": "Mozilla/5.0 (compatible; MyApplication/1.0; +http://example.com/my-application)"
    }

    try:
        response = requests.get(url, params=params, headers=headers)
        time.sleep(1)  # API 과부하 방지
        if response.status_code == 200:
            result = response.json()
            if result:
                location = result[0]
                coordinates = (location['lat'], location['lon'])
                cache[address] = coordinates
                print(f"Geocoding success for address: {address} -> {coordinates}")
                return coordinates
            else:
                print(f"Geocoding failed for address: {address}. Using default coordinates.")
                return "37.5665", "126.9780"  # 서울특별시 기본 좌표
        else:
            print(f"Failed to get data for address: {address}. HTTP Status Code: {response.status_code}")
            return None, None
    except requests.exceptions.RequestException as e:
        print(f"Request failed: {e}")
        return None, None
    except ValueError as ve:
        print(f"JSON decode failed: {ve}")
        return None, None

# 자치구 정보 추출 함수
def extract_district_from_bus_name(bus_name):
    if "강남" in bus_name:
        return "강남구"
    elif "서초" in bus_name:
        return "서초구"
    elif "마포" in bus_name:
        return "마포구"
    elif "송파" in bus_name:
        return "송파구"
    elif "노원" in bus_name:
        return "노원구"
    elif "용산" in bus_name:
        return "용산구"
    elif "은평" in bus_name:
        return "은평구"
    elif "성동" in bus_name:
        return "성동구"
    elif "강서" in bus_name:
        return "강서구"
    elif "중구" in bus_name:
        return "중구"
    elif "종로" in bus_name:
        return "종로구"
    elif "관악" in bus_name:
        return "관악구"
    elif "동작" in bus_name:
        return "동작구"
    # 추가적인 조건을 추가하여 다른 자치구도 처리합니다.
    else:
        print(f"Could not extract district from bus name: {bus_name}. Using default district.")
        return "강남구"  # 기본 자치구로 강남구를 설정

# 데이터 불러오기
fixed_usage_data = pd.read_csv('/content/fixed_wifi_anomalies.csv')
bus_usage_data = pd.read_csv('/content/bus_wifi_anomalies.csv')
village_bus_usage_data = pd.read_csv('/content/village_bus_wifi_anomalies.csv')

# 캐시 초기화
cache = {}

# 고정형 AP 데이터 처리 - 자치구를 기반으로 좌표(위도, 경도) 추가
fixed_usage_data['latitude'], fixed_usage_data['longitude'] = zip(
    *fixed_usage_data['자치구'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {x}", cache))
)

# 시내버스 데이터 처리 - 구분 필드에 '시내버스'가 포함되어 있을 경우, 버스명에서 자치구를 추출하여 사용
bus_usage_data['latitude'], bus_usage_data['longitude'] = zip(
    *bus_usage_data['버스명'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {extract_district_from_bus_name(x)}", cache))
)

# 마을버스 데이터 처리 - 자치구와 결합하여 정확한 주소 정보 생성 후 좌표 추가
village_bus_usage_data['latitude'], village_bus_usage_data['longitude'] = zip(
    *village_bus_usage_data['구분'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {x}", cache))
)

# 결과 확인
print("고정형 AP 데이터:")
print(fixed_usage_data.head())

print("시내버스 데이터:")
print(bus_usage_data.head())

print("마을버스 데이터:")
print(village_bus_usage_data.head())

# 데이터 저장
fixed_usage_data.to_csv('fixed_wifi_anomalies_with_nominatim_coordinates.csv', index=False)
bus_usage_data.to_csv('bus_wifi_anomalies_with_nominatim_coordinates.csv', index=False)
village_bus_usage_data.to_csv('village_bus_wifi_anomalies_with_nominatim_coordinates.csv', index=False)


[1;30;43m스트리밍 출력 내용이 길어서 마지막 5000줄이 삭제되었습니다.[0m
Cache hit for address: 서울특별시 강남구
Could not extract district from bus name: 흥안운수_102번_서울74사3522. Using default district.
Cache hit for address: 서울특별시 강남구
Could not extract district from bus name: 한성운수_5536_서울74사7126. Using default district.
Cache hit for address: 서울특별시 강남구
Could not extract district from bus name: 서울교통네트웍_160_서울71사3209. Using default district.
Cache hit for address: 서울특별시 강남구
Could not extract district from bus name: 신흥기업_2415_서울74사6212. Using default district.
Cache hit for address: 서울특별시 강남구
Could not extract district from bus name: 안양교통_5625_서울74사6793. Using default district.
Cache hit for address: 서울특별시 강남구
Could not extract district from bus name: 대진여객_1014_서울74사2204. Using default district.
Cache hit for address: 서울특별시 강남구
Could not extract district from bus name: 안양교통_5713_서울74사6730. Using default district.
Cache hit for address: 서울특별시 강남구
Could not extract district from bus name: 대진여객㈜_1020_서울74사3020. Using defau

In [12]:
fixed_usage_data.to_csv('fixed_wifi_anomalies_with_nominatim_coordinates.csv', index=False, encoding='utf-8-sig')

In [13]:
import pandas as pd
import requests
import time

# Nominatim Geocoding 함수
def get_nominatim_coordinates(address, cache):
    if address in cache:
        print(f"Cache hit for address: {address}")
        return cache[address]

    url = "https://nominatim.openstreetmap.org/search"
    params = {
        "q": address,
        "format": "json",
        "limit": 1
    }
    headers = {
        "User-Agent": "Mozilla/5.0 (compatible; MyApplication/1.0; +http://example.com/my-application)"
    }

    try:
        response = requests.get(url, params=params, headers=headers)
        time.sleep(1)  # API 과부하 방지
        if response.status_code == 200:
            result = response.json()
            if result:
                location = result[0]
                coordinates = (location['lat'], location['lon'])
                cache[address] = coordinates
                print(f"Geocoding success for address: {address} -> {coordinates}")
                return coordinates
            else:
                print(f"Geocoding failed for address: {address}. Using default coordinates.")
                return "37.5665", "126.9780"  # 서울특별시 기본 좌표
        else:
            print(f"Failed to get data for address: {address}. HTTP Status Code: {response.status_code}")
            return None, None
    except requests.exceptions.RequestException as e:
        print(f"Request failed: {e}")
        return None, None
    except ValueError as ve:
        print(f"JSON decode failed: {ve}")
        return None, None

# 자치구 정보 추출 함수
def extract_district_from_bus_name(bus_name):
    if "강남" in bus_name:
        return "강남구"
    elif "서초" in bus_name:
        return "서초구"
    elif "마포" in bus_name:
        return "마포구"
    elif "송파" in bus_name:
        return "송파구"
    elif "노원" in bus_name:
        return "노원구"
    elif "용산" in bus_name:
        return "용산구"
    elif "은평" in bus_name:
        return "은평구"
    elif "성동" in bus_name:
        return "성동구"
    elif "강서" in bus_name:
        return "강서구"
    elif "중구" in bus_name:
        return "중구"
    elif "종로" in bus_name:
        return "종로구"
    elif "관악" in bus_name:
        return "관악구"
    elif "동작" in bus_name:
        return "동작구"
    else:
        print(f"Could not extract district from bus name: {bus_name}. Using default district.")
        return "강남구"  # 기본 자치구로 강남구를 설정

# 데이터 불러오기
fixed_usage_data = pd.read_csv('/content/fixed_wifi_anomalies.csv')
bus_usage_data = pd.read_csv('/content/bus_wifi_anomalies.csv')
village_bus_usage_data = pd.read_csv('/content/village_bus_wifi_anomalies.csv')

# 캐시 초기화
cache = {}

# 고정형 AP 데이터 처리 - 자치구를 기반으로 좌표(위도, 경도) 추가
fixed_usage_data['latitude'], fixed_usage_data['longitude'] = zip(
    *fixed_usage_data['자치구'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {x}", cache))
)

# 시내버스 데이터 처리 - 버스명에서 자치구를 추출하여 사용
bus_usage_data['latitude'], bus_usage_data['longitude'] = zip(
    *bus_usage_data['버스명'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {extract_district_from_bus_name(x)}", cache))
)

# 마을버스 데이터 처리 - 버스명에서 자치구를 추출하여 사용
village_bus_usage_data['latitude'], village_bus_usage_data['longitude'] = zip(
    *village_bus_usage_data['버스명'].apply(lambda x: get_nominatim_coordinates(f"서울특별시 {extract_district_from_bus_name(x)}", cache))
)

# 데이터 확인 및 저장
print("고정형 AP 데이터:")
print(fixed_usage_data[['자치구', 'latitude', 'longitude']].head())

print("시내버스 데이터:")
print(bus_usage_data[['버스명', 'latitude', 'longitude']].head())

print("마을버스 데이터:")
print(village_bus_usage_data[['버스명', 'latitude', 'longitude']].head())

# 데이터 저장 - UTF-8-SIG로 인코딩하여 한글이 깨지지 않도록 함
fixed_usage_data.to_csv('fixed_wifi_anomalies_with_nominatim_coordinates.csv', index=False, encoding='utf-8-sig')
bus_usage_data.to_csv('bus_wifi_anomalies_with_nominatim_coordinates.csv', index=False, encoding='utf-8-sig')
village_bus_usage_data.to_csv('village_bus_wifi_anomalies_with_nominatim_coordinates.csv', index=False, encoding='utf-8-sig')


[1;30;43m스트리밍 출력 내용이 길어서 마지막 5000줄이 삭제되었습니다.[0m
Could not extract district from bus name: 범일운수㈜_5633_서울74사5250. Using default district.
Cache hit for address: 서울특별시 강남구
Could not extract district from bus name: 범일운수_5525_서울71사1512. Using default district.
Cache hit for address: 서울특별시 강남구
Could not extract district from bus name: 한성여객운수_1144_서울74사6371. Using default district.
Cache hit for address: 서울특별시 강남구
Could not extract district from bus name: 서울버스_3426_서울70사9231. Using default district.
Cache hit for address: 서울특별시 강남구
Could not extract district from bus name: 다모아자동차_270_서울74사9764. Using default district.
Cache hit for address: 서울특별시 강남구
Could not extract district from bus name: 대원여객_5624_서울70사2707. Using default district.
Cache hit for address: 서울특별시 강남구
Could not extract district from bus name: 대진여객㈜_1020_서울74사1642. Using default district.
Cache hit for address: 서울특별시 강남구
Could not extract district from bus name: 서울승합_340_서울74사4192. Using default district.
Cache hit for addre