# Расчет минимального расстояния между населенными пунктами и метостанциями

### Описание задачи:
Имеются наборы данных по метеорологическим станциям и населенным пунктам, включающих информацию об их координатах геолокации (широта и долгота). Необходимо к данным по населенным пунктам добавить код ближайшей к нему метеостанции (код метеостанции с минимальным расстоянием между ними). Для решения данной задачи предполагается реализация следующих шагов:<br>
1. Написать код функции для расчета расстояния между двумя геолокационными точками на основе формулы гаверсинуса. Данная функция поможет рассчитать расстояние между населенным пунктом и метеостанцией.<br>
2. Написать код функции, которая будет определять минимальное расстояние между двумя геолокационными точками. Данная функция поможет найти метеостанцию с минимальным расстоянием до населенного пункта.<br>
3. Добавить в набор данных с населенными пунктами информацию о ближайшей метеостанции (добавить к каждому населенному пункту код ближайшей к нему метеостанции).

#### Загрузка необходимых библиотек

In [13]:
from math import radians, cos, sin, asin, sqrt
import pandas as pd
import numpy as np

#### 1. Создание функции для определения расстояния между двумя геолокационными точками (по формуле гаверсинуса)

In [14]:
## Формула гаверсинуса определяет расстояние по дуге между двумя точками на сфере с учетом их долготы и широты
def harvesine (lat1, lon1, lat2, lon2):
    # конвертация градусов в радианы
    lat1, lon1, lat2, lon2 = map(radians, [lat1, lon1, lat2, lon2])
    # формула гаверсинуса
    dlon = lon2 - lon1
    dlat = lat2 - lat1
    a = sin(dlat/2)**2 + sin(dlon/2)**2 * cos(lat1) * cos(lat2)
    c = 2 * asin(sqrt(a))
    r = 6371 # радиус планеты Земля в километрах (расчитан исходя из 3956 миль)
    return c*r 

#### 2. Создание функции для расчета миниального расстояния между населенным пунктом и метеостанцией

In [None]:
## Формула, определяющая ближайшую метеостанцию, станцию с минимальным расстоянием
def min_dist(id_dicts, lt1, ln1):
    # создание пустого словаря
    dicto = {}
    # рассчитать расстояние между точкой и метеостанциями из словаря
    for i in id_dicts:
        dicto[i] = harvesine (float(lt1), float(ln1), float(id_dicts[i][0]), float(id_dicts[i][1]))
    # найти ключ с наименьшим значением
    best_key = min(dicto, key=dicto.get)
    return best_key

#### 3. Добавление информации о ближайшей метеостанции

In [43]:
## Чтение файла с набором данных о метеостанциях
meteo = pd.read_csv("DATA/Meteo_link_full.csv", sep=';', header=0)
meteo = meteo.drop(['Link'], axis=1) # удаление ненужного технического столбца с линками
# замена разделителя десятичной дроби в столбцах с широтой и долготой
meteo['Latitude'] = meteo['Latitude'].str.replace(',','.')
meteo['Longitude'] = meteo['Longitude'].str.replace(',','.')

dicts= meteo.set_index('ID').T.to_dict('list') # создание словаря метеостанций с координатами геолокации

# Комментарий: конечный словарь ("dicts") содержит информацию об ID метеостанции (синоптический индекс метеостанции), широте и долготе.

In [67]:
## Чтение файла с набором данных о населенных пунктах
settl = pd.read_excel("settl_converter.xlsx", sheet_name='Лист1', header=0)

Unnamed: 0,id,region,municipality,settlement,type,population,children,latitude_dms,longitude_dms,latitude_dd,longitude_dd,oktmo,dadata,rosstat,name_municip
0,Орловская областьБолховский,Орловская область,Болховский,Колонтаева,д,0.0,0.0,53.22.07,035.54.36,53.368611,35.910000,5.460442e+10,0.0,1.0,Болховский
1,Республика КрымАлушта,Республика Крым,Алушта,Пушкино,с,273.0,0.0,44.35.45,034.20.27,44.595833,34.340833,3.570300e+10,0.0,1.0,Алушта
2,Липецкая областьЛев-Толстовский,Липецкая область,Лев-Толстовский район,Барятино,с,7.0,1.0,53.15.46,039.30.14,53.262778,39.503889,4.263641e+10,0.0,1.0,Лев-Толстовский
3,Тверская областьСелижаровский,Тверская область,Селижаровский район,Хилово,д,2.0,0.0,56.54.20,033.25.09,56.905556,33.419167,2.865043e+10,0.0,1.0,Селижаровский
4,Томская областьПарабельский,Томская область,Парабельский район,Басмасово,д,6.0,0.0,58.38.12,082.02.40,58.636667,82.044444,6.964444e+10,0.0,1.0,Парабельский
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
155917,Псковская областьПалкинский,Псковская область,Палкинский район,Шадрица,д,1.0,0.0,57.29.03,028.08.48,57.484167,28.146667,5.863742e+10,0.0,1.0,Палкинский
155918,Псковская областьСебежский,Псковская область,Себежский район,Овчинниково,д,0.0,0.0,56.19.48,028.26.17,56.330000,28.438056,5.865410e+10,0.0,1.0,Себежский
155919,Тульская областьНовогуровский,Тульская область,рабочий пос. Новогуровский,Новогуровский,рп,3398.0,305.0,54.28.03,037.20.19,54.467500,37.338611,7.070200e+10,1.0,0.0,Новогуровский
155920,Краснодарский крайАнапа,Краснодарский край,Город-курорт Анапа,Гостагаевская,ст-ца,12566.0,2980.0,45.01.21,037.30.15,45.022500,37.504167,3.703000e+09,1.0,0.0,Анапа


In [83]:
## Добавление в набор данных о населенных пунктах информации о ближайшей метеостанции
settl['ID'] = settl.apply(lambda row: min_dist(dicts, row.latitude_dd, row.longitude_dd), axis=1)

In [85]:
## Сохранение нового набора данных в excel-файл
file = settl.to_excel('settle_ID.xlsx')