In [4]:
import pandas as pd
import numpy as np
from sklearn.ensemble import RandomForestRegressor
from xgboost import XGBRegressor
import lightgbm as lgb
from sklearn.ensemble import GradientBoostingRegressor
from geopy.distance import great_circle
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_absolute_error
import requests

In [5]:
# 1. 데이터 로드
facilities_capacity = pd.read_csv("C:/kepco/sprint2/데이터/최종/설비용량.csv")
power_usage = pd.read_csv("C:/kepco/sprint2/데이터/최종/전력사용량.csv")
weather = pd.read_csv("C:/kepco/sprint2/데이터/최종/진짜진짜기상.csv")

In [11]:
# 사용자 주소 받아서 위도 경도로 변환하기
address = "울산광역시 중구 운곡3길 23"

def get_lat_lon(address):
    API_KEY = 'AIzaSyA4YgP4B-gZQLGg51u6puyDvWXr6oi1eJY'
    base_url = 'https://maps.googleapis.com/maps/api/geocode/json'
    params = {'address': address, 'key': API_KEY}
    response = requests.get(base_url, params=params)
    if response.status_code == 200:
        results = response.json()
        if results['status'] == 'OK':
            location = results['results'][0]['geometry']['location']
            return location['lat'], location['lng']
    return None, None

user_lat, user_lng = get_lat_lon(address)
get_lat_lon(address)

(35.5597862, 129.273345)

In [8]:
# 좌표로 거리 찾기 함수 생성
from math import radians, cos, sin, sqrt, atan2

def haversine(lat1, lon1, lat2, lon2):
    # 위도와 경도를 라디안으로 변환
    lat1, lon1, lat2, lon2 = map(radians, [lat1, lon1, lat2, lon2])
    
    # 위도와 경도의 차이 계산
    dlat = lat2 - lat1
    dlon = lon2 - lon1
    
    # Haversine 공식을 사용하여 거리 계산
    a = sin(dlat / 2)**2 + cos(lat1) * cos(lat2) * sin(dlon / 2)**2
    c = 2 * atan2(sqrt(a), sqrt(1 - a))
    R = 6371.0  # 지구의 반지름 (킬로미터 단위)
    distance = R * c  # 거리 계산
    
    return distance

In [9]:
# 공공시설 5개
facilities_capacity['latitude'] = pd.to_numeric(facilities_capacity['latitude'], errors='coerce')
facilities_capacity['longitude'] = pd.to_numeric(facilities_capacity['longitude'], errors='coerce')

# 중복된 위도와 경도를 가진 행 제거 (첫 번째로 나타난 행만 유지)
unique_facilities = facilities_capacity.drop_duplicates(subset=['latitude', 'longitude']).copy()

# 사용자 위치(user_lat, user_lng)가 정의되어 있는 경우
if user_lat and user_lng:
    # 각 공공시설과 사용자 간의 거리를 계산 (apply를 사용하여 행별로 계산)
    unique_facilities.loc[:, 'distance'] = unique_facilities.apply(
        lambda row: haversine(user_lat, user_lng, row['latitude'], row['longitude']),
        axis=1
    )
    
    # 거리 기준으로 상위 5개의 가장 가까운 공공시설을 선택
    top_5_facilities = unique_facilities.nsmallest(5, 'distance')

    
print(f'가장 가까운 상위 5개 공공시설:\n{top_5_facilities}\n')


가장 가까운 상위 5개 공공시설:
       capacity                                         address   latitude  \
13862     97.20  전라남도 나주시 공산면 남창리 831-2 , 831-5, 831-11, 831-12  34.411316   
14031     97.00      전라남도 나주시 공산면 남창리 807-1 , 808, 808-1, 808-2  34.411412   
12652     99.00    전라남도 나주시 공산면 남창리 590-1 , 590-2, 603-4, 603-6  34.418991   
9152      19.64                        강진군 마량면 마량리 973-1 (건물 위)  34.450225   
9586     496.00                       강진군 신전면 용화리 산66-43 (토지 위)  34.473536   

        longitude    distance  
13862  126.623203  101.256588  
14031  126.623372  101.269032  
12652  126.630594  102.186098  
9152   126.819483  109.097323  
9586   126.718089  109.443043  



In [307]:
# 발전량 예측 해야됨

In [16]:
[top_5_facilities['capacity'].values[i] for i in range(5)]

[97.2, 97.0, 99.0, 19.64, 496.0]

In [308]:
# 지도 시각화

import folium

lat = top_5_facilities['latitude'].mean()
long = top_5_facilities['longitude'].mean()


m=folium.Map([lat,long],zoom_start=11,tiles='OpenStreetMap')


for i in top_5_facilities.index:
  sub_lat=top_5_facilities.loc[i,'latitude']
  sub_long=top_5_facilities.loc[i,'longitude']

  title=top_5_facilities.loc[i,'address']

  folium.CircleMarker([sub_lat,sub_long],color='red',
                      radius=8,tooltip=title).add_to(m)

# 사용자 핑 추가
folium.CircleMarker([user_lat, user_lng], color='blue',
                    radius=8, tooltip='사용자').add_to(m)

m.save('top_5.html')
m