In [13]:
import pandas as pd
import folium
import folium
from folium.plugins import HeatMap
from shapely.geometry import Point
from geopandas import GeoDataFrame
import geopandas as gpd
from matplotlib import pyplot as plt
from shapely import wkt
pd.set_option('display.max_columns', 100)
pd.set_option('display.max_rows', 50)

In [2]:
import json
import time
import csv
from tqdm import tqdm
from pathlib import Path
import requests

In [3]:
def standartize_address(street):
    
    shorthands = {'ул.': 'улица', 
                    'пр.': 'проспект',
                    'ш.': 'шоссе',
                    'пер.': 'переулок',
                    'бульв.': 'бульвар',
                    'наб.': 'набережная'}
    
    locality = None
    street = street.split(',')
    if len(street) == 2:
        locality = street[0]
        street = street[1]
    else:
        street = street[0]
    street = street.split(' ')
    if len(street) <= 1:
        return(street[0])
    else:
        status = street[-1]
        if status.lower() in shorthands:
            status = shorthands[status.lower()]
        if street[-2][-2:] in 'ая ий ый ое':
            if locality is not None:
                return ' '.join((locality + ',', ' '.join(street[:-1]), status))
            else:
                return ' '.join((' '.join(street[:-1]), status))
        else:
            if locality is not None:
                return ' '.join((locality + ',', status, ' '.join(street[0:-2]), street[-2]))
            else:
                return ' '.join((status, ' '.join(street[0:-2]), street[-2]))

In [4]:
def full_address(locality, number, building):
    if building == 'nan':
        return 'Санкт-Петербург, ' + locality + ' ' + number
    else:
        return 'Санкт-Петербург, ' + locality + ' ' + number + ' к' + building

In [5]:
# отделим точки с ошибочными координатами: район, куда точка "упала" и район из датасета не совпадают
districts = pd.read_csv('districts.csv', index_col=0)
districts['geometry'] = districts['geometry'].apply(wkt.loads)
districts = GeoDataFrame(districts, crs={'init': 'epsg:4326'}, geometry='geometry')

points = pd.read_csv('points.csv', index_col=0)
data = pd.read_csv('open_stp_data.csv')
data = data.join(points, how='inner')
data['geometry'] = data.apply(lambda x: Point(x.lng, x.lat), axis=1)
data = GeoDataFrame(data, crs={'init': 'epsg:4326'}, geometry='geometry')
data = data.to_crs(districts.crs)

full = gpd.sjoin(districts, data, op='contains')
full['name'] = full['name'].str.split(' ')
full['name'] = full['name'].apply(lambda x: x[0])

  return _prepare_from_string(" ".join(pjargs))


In [6]:
error = full[full['name'] != full['addr_district']]
error = error[['index_right', 'addr_street', 'addr_number', 'addr_building', 'addr_letter', 'addr_district']]
error['locality'] = error['addr_street'].map(standartize_address)
error['addr'] = error.apply(lambda x: full_address(x.locality, x.addr_number, str(x.addr_building)), axis=1)
error = error.set_index('index_right')

In [7]:
url = 'https://nominatim.openstreetmap.org/search'
for row in tqdm(error.iterrows()):
    time.sleep(1)
    try:
        print(str(row[1][0]))
        params = {'q': row[1][-1], 'format':'json'}
        g = requests.get(url, params=params)
        g = g.json()
        with open(Path('./jsons', str(row[1][0])), 'w') as f:
            json.dump(g, f)
    except Exception as err:
        print(err)

0it [00:01, ?it/s]

М.Садовая ул.





KeyboardInterrupt: 

In [8]:
df_addr = pd.DataFrame(columns=['number', 'address', 'lat', 'lon'])

In [9]:
for row in error.iterrows():
    print(row[1][0], row[1][5])
    with open(f'./jsons/{row[0]}', 'r') as f:
        o = json.load(f)
        for i in o:
            if row[1][5] in i['display_name']:
                df_addr = df_addr.append({'number': row[0], 'address': i['display_name'],
                                         'lat': i['lat'], 'lon': i['lon']}, ignore_index=True)
                print(i['display_name'])
                break

М.Садовая ул. М.Садовая улица
Некрасова ул. улица  Некрасова
Софийская ул. Софийская улица
Софийская улица, Колпино, Колпинский район, Санкт-Петербург, Северо-Западный федеральный округ, 190000, Россия
Софийская ул. Софийская улица
Софийская улица, Колпино, Колпинский район, Санкт-Петербург, Северо-Западный федеральный округ, 190000, Россия
Софийская ул. Софийская улица
Софийская улица, Колпино, Колпинский район, Санкт-Петербург, Северо-Западный федеральный округ, 190000, Россия
Губина ул. улица  Губина
Губина ул. улица  Губина
Ленина пр. проспект  Ленина
Гоголя ул. улица  Гоголя
Гоголя ул. улица  Гоголя
Садовая ул. Садовая улица
Садовая улица, Петро-Славянка, Колпинский район, Санкт-Петербург, Северо-Западный федеральный округ, 196642, Россия
Витебская ул. Витебская улица
Витебская улица, Петро-Славянка, Колпинский район, Санкт-Петербург, Северо-Западный федеральный округ, 196642, Россия
Витебская ул. Витебская улица
3, Витебская улица, Петро-Славянка, Колпинский район, Санкт-Петербур

9, 3-я Советская улица, Новая Деревня, Пушкин, Пушкинский район, Санкт-Петербург, Северо-Западный федеральный округ, 190000, Россия
6-я Советская ул. 6-я Советская улица
5, 6-я Советская улица, Новая Деревня, Пушкин, Пушкинский район, Санкт-Петербург, Северо-Западный федеральный округ, 190000, Россия
2-я Советская ул. 2-я Советская улица
12, 2-я Советская улица, Новая Деревня, Пушкин, Пушкинский район, Санкт-Петербург, Северо-Западный федеральный округ, 190000, Россия
5-я Советская ул. 5-я Советская улица
10, 5-я Советская улица, Новая Деревня, Пушкин, Пушкинский район, Санкт-Петербург, Северо-Западный федеральный округ, 190000, Россия
3-я Советская ул. 3-я Советская улица
10, 3-я Советская улица, Новая Деревня, Пушкин, Пушкинский район, Санкт-Петербург, Северо-Западный федеральный округ, 190000, Россия
4-я Советская ул. 4-я Советская улица
10, 4-я Советская улица, Новая Деревня, Пушкин, Пушкинский район, Санкт-Петербург, Северо-Западный федеральный округ, 190000, Россия
4-я Советская 

24, Социалистическая улица, Зверинец, Павловск, Пушкинский район, Санкт-Петербург, Северо-Западный федеральный округ, 190000, Россия
Правды ул. улица  Правды
Правды ул. улица  Правды
Декабристов ул. улица  Декабристов
Декабристов ул. улица  Декабристов
Красного Курсанта ул. улица Красного Курсанта
25, улица Красного Курсанта, Зверинец, Павловск, Пушкинский район, Санкт-Петербург, Северо-Западный федеральный округ, 190000, Россия
Социалистическая ул. Социалистическая улица
8, Социалистическая улица, Зверинец, Павловск, Пушкинский район, Санкт-Петербург, Северо-Западный федеральный округ, 190000, Россия
Гоголя ул. улица  Гоголя
Декабристов ул. улица  Декабристов
Социалистическая ул. Социалистическая улица
6, Социалистическая улица, Зверинец, Павловск, Пушкинский район, Санкт-Петербург, Северо-Западный федеральный округ, 190000, Россия
Декабристов ул. улица  Декабристов
Гоголя ул. улица  Гоголя
Красного Курсанта ул. улица Красного Курсанта
34, улица Красного Курсанта, Зверинец, Павловск, 

12, Боровая улица, Фабричный посёлок, Скачки, Красное Село, Красносельский район, Санкт-Петербург, Северо-Западный федеральный округ, 198320, Россия
Боровая ул. Боровая улица
12, Боровая улица, Фабричный посёлок, Скачки, Красное Село, Красносельский район, Санкт-Петербург, Северо-Западный федеральный округ, 198320, Россия
Боровая ул. Боровая улица
22, Боровая улица, Фабричный посёлок, Скачки, Красное Село, Красносельский район, Санкт-Петербург, Северо-Западный федеральный округ, 198320, Россия
Боровая ул. Боровая улица
3, Боровая улица, Фабричный посёлок, Скачки, Красное Село, Красносельский район, Санкт-Петербург, Северо-Западный федеральный округ, 198320, Россия
Боровая ул. Боровая улица
20, Боровая улица, Фабричный посёлок, Скачки, Красное Село, Красносельский район, Санкт-Петербург, Северо-Западный федеральный округ, 198320, Россия
Боровая ул. Боровая улица
Боровая улица, Фабричный посёлок, Скачки, Красное Село, Красносельский район, Санкт-Петербург, Северо-Западный федеральный окр

22, Ивановская улица, Мартышкино, Ломоносов, Петродворцовый район, Санкт-Петербург, Северо-Западный федеральный округ, 198411, Россия
Ивановская ул. Ивановская улица
29, Ивановская улица, Мартышкино, Ломоносов, Петродворцовый район, Санкт-Петербург, Северо-Западный федеральный округ, 198411, Россия
Ивановская ул. Ивановская улица
20, Ивановская улица, Мартышкино, Ломоносов, Петродворцовый район, Санкт-Петербург, Северо-Западный федеральный округ, 198411, Россия
Ивановская ул. Ивановская улица
18, Ивановская улица, Мартышкино, Ломоносов, Петродворцовый район, Санкт-Петербург, Северо-Западный федеральный округ, 198411, Россия
Красная ул. Красная улица
22, Красная улица, Мартышкино, Ломоносов, Петродворцовый район, Санкт-Петербург, Северо-Западный федеральный округ, 198411, Россия
Ивановская ул. Ивановская улица
14, Ивановская улица, Мартышкино, Ломоносов, Петродворцовый район, Санкт-Петербург, Северо-Западный федеральный округ, 198411, Россия
Ивановская ул. Ивановская улица
12, Ивановска

Апраксин пер. переулок  Апраксин
Гражданская ул. Гражданская улица
25, Гражданская улица, Сенной округ, Адмиралтейский район, Санкт-Петербург, Северо-Западный федеральный округ, 190000, Россия
Апраксин пер. переулок  Апраксин
Фонтанки реки наб. набережная Фонтанки реки
Фонтанки реки наб. набережная Фонтанки реки
Фонтанки реки наб. набережная Фонтанки реки
Апраксин пер. переулок  Апраксин
Апраксин пер. переулок  Апраксин
3-я 1-й половины линия линия 3-я 1-й половины
3-я 1-й половины линия линия 3-я 1-й половины
3-я 1-й половины линия линия 3-я 1-й половины
г.Сестрорецк, 2-я линия г.Сестрорецк, линия  2-я
3-я 1-й половины линия линия 3-я 1-й половины
3-я 1-й половины линия линия 3-я 1-й половины
3-я 1-й половины линия линия 3-я 1-й половины
3-я 1-й половины линия линия 3-я 1-й половины
г. Сестрорецк, 10-я линия г. Сестрорецк, линия  10-я
г.Сестрорецк, 3-я линия г.Сестрорецк, линия  3-я
г.Сестрорецк, 3-я линия г.Сестрорецк, линия  3-я
г.Сестрорецк, 2-я линия г.Сестрорецк, линия  2-я
г.Сес

улица Всеволода Вишневского, Кронштадт, Кронштадтский район, Санкт-Петербург, Северо-Западный федеральный округ, 197760, Россия
Всеволода Вишневского ул. улица Всеволода Вишневского
18, улица Всеволода Вишневского, Кронштадт, Кронштадтский район, Санкт-Петербург, Северо-Западный федеральный округ, 197760, Россия
Гражданская ул. Гражданская улица
Гражданская улица, Кронштадт, Кронштадтский район, Санкт-Петербург, Северо-Западный федеральный округ, 197760, Россия
Гражданская ул. Гражданская улица
8, Гражданская улица, Кронштадт, Кронштадтский район, Санкт-Петербург, Северо-Западный федеральный округ, 197760, Россия
Гражданская ул. Гражданская улица
10, Гражданская улица, Кронштадт, Кронштадтский район, Санкт-Петербург, Северо-Западный федеральный округ, 197760, Россия
Гражданская ул. Гражданская улица
Шаверма, 9, Гражданская улица, Кронштадт, Кронштадтский район, Санкт-Петербург, Северо-Западный федеральный округ, 197760, Россия
Всеволода Вишневского ул. улица Всеволода Вишневского
13, у

8, Кузнечный переулок, Зеленогорск, Курортный район, Санкт-Петербург, Северо-Западный федеральный округ, 190000, Россия
Средний пр. Средний проспект
18, Средний проспект, Зеленогорск, Курортный район, Санкт-Петербург, Северо-Западный федеральный округ, 190000, Россия
Кузнечный пер. Кузнечный переулок
Кузнечный переулок, Зеленогорск, Курортный район, Санкт-Петербург, Северо-Западный федеральный округ, 190000, Россия
Кузнечный пер. Кузнечный переулок
6, Кузнечный переулок, Зеленогорск, Курортный район, Санкт-Петербург, Северо-Западный федеральный округ, 190000, Россия
Средний пр. Средний проспект
17, Средний проспект, Зеленогорск, Курортный район, Санкт-Петербург, Северо-Западный федеральный округ, 190000, Россия
Мира ул. улица  Мира
Средний пр. Средний проспект
Средний проспект, Зеленогорск, Курортный район, Санкт-Петербург, Северо-Западный федеральный округ, 190000, Россия
Средний пр. Средний проспект
Средний проспект, Зеленогорск, Курортный район, Санкт-Петербург, Северо-Западный феде

6, Транспортный переулок, Разлив, Сестрорецк, Курортный район, Санкт-Петербург, Северо-Западный федеральный округ, 197706, Россия
Транспортный пер. Транспортный переулок
6, Транспортный переулок, Разлив, Сестрорецк, Курортный район, Санкт-Петербург, Северо-Западный федеральный округ, 197706, Россия
Гагаринская ул. Гагаринская улица
34, Гагаринская улица, Тарховка, Сестрорецк, Курортный район, Санкт-Петербург, Северо-Западный федеральный округ, 197701, Россия
Гагаринская ул. Гагаринская улица
32, Гагаринская улица, Тарховка, Сестрорецк, Курортный район, Санкт-Петербург, Северо-Западный федеральный округ, 197701, Россия
Гагаринская ул. Гагаринская улица
30, Гагаринская улица, Тарховка, Сестрорецк, Курортный район, Санкт-Петербург, Северо-Западный федеральный округ, 197701, Россия
Гагаринская ул. Гагаринская улица
25, Гагаринская улица, Тарховка, Сестрорецк, Курортный район, Санкт-Петербург, Северо-Западный федеральный округ, 197701, Россия
Гагаринская ул. Гагаринская улица
28, Гагаринска

Сердобольская улица, Выборгская сторона, округ Чёрная речка, Приморский район, Санкт-Петербург, Северо-Западный федеральный округ, 197342, Россия
Берёзовая аллея Берёзовая аллея
Берёзовая аллея, Ольгино, округ Лахта-Ольгино, Приморский район, Санкт-Петербург, Северо-Западный федеральный округ, 197229, Россия
Берёзовая аллея Берёзовая аллея
Берёзовая аллея, Ольгино, округ Лахта-Ольгино, Приморский район, Санкт-Петербург, Северо-Западный федеральный округ, 197229, Россия
Вокзальная ул. Вокзальная улица
4, Вокзальная улица, Ольгино, округ Лахта-Ольгино, Приморский район, Санкт-Петербург, Северо-Западный федеральный округ, 197229, Россия
Вокзальная ул. Вокзальная улица
2, Вокзальная улица, Ольгино, округ Лахта-Ольгино, Приморский район, Санкт-Петербург, Северо-Западный федеральный округ, 197229, Россия
Советская ул. Советская улица
31, Советская улица, Ольгино, округ Лахта-Ольгино, Приморский район, Санкт-Петербург, Северо-Западный федеральный округ, 197229, Россия
Советская ул. Советская 

In [10]:
df_addr = df_addr.set_index('number')
error = error.join(df_addr)

In [11]:
error.head()

Unnamed: 0_level_0,addr_street,addr_number,addr_building,addr_letter,addr_district,locality,addr,address,lat,lon
index_right,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
5263,М.Садовая ул.,3/54,,А,Центральный,М.Садовая улица,"Санкт-Петербург, М.Садовая улица 3/54",,,
5038,Некрасова ул.,45,,А,Центральный,улица Некрасова,"Санкт-Петербург, улица Некрасова 45",,,
13237,Софийская ул.,3,2.0,А,Выборгский,Софийская улица,"Санкт-Петербург, Софийская улица 3 к2","Софийская улица, Колпино, Колпинский район, Са...",59.7491085,30.5301987
1137,Софийская ул.,32,2.0,А,Фрунзенский,Софийская улица,"Санкт-Петербург, Софийская улица 32 к2","Софийская улица, Колпино, Колпинский район, Са...",59.7491085,30.5301987
18415,Софийская ул.,26-28,,А,Выборгский,Софийская улица,"Санкт-Петербург, Софийская улица 26-28","Софийская улица, Колпино, Колпинский район, Са...",59.7491085,30.5301987


In [21]:
points_correction = df_addr[['lat', 'lon']]
points_correction.columns = ['lat', 'lng']

In [22]:
points = pd.read_csv('points.csv', index_col=0)
points = points.drop(points_correction.index)

In [23]:
points.append(points_correction)

Unnamed: 0,lat,lng
74,59.9407,30.2912
126,59.9446,30.269
156,59.9409,30.2645
161,59.9448,30.273
166,59.9354,30.2762
...,...,...
7388,59.99782015,30.1382086
18278,59.9982579,30.1342552
5082,59.99832115,30.13497605
16007,59.99833895,30.1360294


In [24]:
points.to_csv('points_corr.csv')