# Исследование установаления параметров недвижимости в г. Санкт-Петербурге.

В вашем распоряжении данные сервиса Яндекс.Недвижимость — архив объявлений о продаже квартир в Санкт-Петербурге и соседних населённых пунктов за несколько лет. Нужно научиться определять рыночную стоимость объектов недвижимости. Ваша задача — установить параметры. Это позволит построить автоматизированную систему: она отследит аномалии и мошенническую деятельность.

По каждой квартире на продажу доступны два вида данных. Первые вписаны пользователем, вторые — получены автоматически на основе картографических данных. Например, расстояние до центра, аэропорта, ближайшего парка и водоёма.

### Шаг 1. Обзор данных

In [1]:
import pandas as pd
import datetime
from geopy.distance import geodesic as gd
from geopy.geocoders import Nominatim as nm

In [None]:
№pd.set_option('display.max_columns', None)
pd.options.display.float_format = '{:,.2f}'.format

In [2]:
try:
    data = pd.read_csv('/datasets/real_estate_data.csv', sep='\t')
    #data = pd.read_csv('real_estate_data.csv', sep='\t')
except:
    data = pd.read_csv('https://code.s3.yandex.net/datasets/real_estate_data.csv', sep='\t')

In [3]:
print('Информация о датафрейме:')
data.shape

Информация о датафрейме:


(23699, 22)

In [4]:
data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 23699 entries, 0 to 23698
Data columns (total 22 columns):
 #   Column                Non-Null Count  Dtype  
---  ------                --------------  -----  
 0   total_images          23699 non-null  int64  
 1   last_price            23699 non-null  float64
 2   total_area            23699 non-null  float64
 3   first_day_exposition  23699 non-null  object 
 4   rooms                 23699 non-null  int64  
 5   ceiling_height        14504 non-null  float64
 6   floors_total          23613 non-null  float64
 7   living_area           21796 non-null  float64
 8   floor                 23699 non-null  int64  
 9   is_apartment          2775 non-null   object 
 10  studio                23699 non-null  bool   
 11  open_plan             23699 non-null  bool   
 12  kitchen_area          21421 non-null  float64
 13  balcony               12180 non-null  float64
 14  locality_name         23650 non-null  object 
 15  airports_nearest   

In [5]:
display(data.head(30))

Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,...,kitchen_area,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition
0,20,13000000.0,108.0,2019-03-07T00:00:00,3,2.7,16.0,51.0,8,,...,25.0,,Санкт-Петербург,18863.0,16028.0,1.0,482.0,2.0,755.0,
1,7,3350000.0,40.4,2018-12-04T00:00:00,1,,11.0,18.6,1,,...,11.0,2.0,посёлок Шушары,12817.0,18603.0,0.0,,0.0,,81.0
2,10,5196000.0,56.0,2015-08-20T00:00:00,2,,5.0,34.3,4,,...,8.3,0.0,Санкт-Петербург,21741.0,13933.0,1.0,90.0,2.0,574.0,558.0
3,0,64900000.0,159.0,2015-07-24T00:00:00,3,,14.0,,9,,...,,0.0,Санкт-Петербург,28098.0,6800.0,2.0,84.0,3.0,234.0,424.0
4,2,10000000.0,100.0,2018-06-19T00:00:00,2,3.03,14.0,32.0,13,,...,41.0,,Санкт-Петербург,31856.0,8098.0,2.0,112.0,1.0,48.0,121.0
5,10,2890000.0,30.4,2018-09-10T00:00:00,1,,12.0,14.4,5,,...,9.1,,городской посёлок Янино-1,,,,,,,55.0
6,6,3700000.0,37.3,2017-11-02T00:00:00,1,,26.0,10.6,6,,...,14.4,1.0,посёлок Парголово,52996.0,19143.0,0.0,,0.0,,155.0
7,5,7915000.0,71.6,2019-04-18T00:00:00,2,,24.0,,22,,...,18.9,2.0,Санкт-Петербург,23982.0,11634.0,0.0,,0.0,,
8,20,2900000.0,33.16,2018-05-23T00:00:00,1,,27.0,15.43,26,,...,8.81,,посёлок Мурино,,,,,,,189.0
9,18,5400000.0,61.0,2017-02-26T00:00:00,3,2.5,9.0,43.6,7,,...,6.5,2.0,Санкт-Петербург,50898.0,15008.0,0.0,,0.0,,289.0


In [6]:
data.columns

Index(['total_images', 'last_price', 'total_area', 'first_day_exposition',
       'rooms', 'ceiling_height', 'floors_total', 'living_area', 'floor',
       'is_apartment', 'studio', 'open_plan', 'kitchen_area', 'balcony',
       'locality_name', 'airports_nearest', 'cityCenters_nearest',
       'parks_around3000', 'parks_nearest', 'ponds_around3000',
       'ponds_nearest', 'days_exposition'],
      dtype='object')

In [7]:
data.columns[int(len(data.columns) / 2)]

'open_plan'

<div class="alert alert-info">
<b>Комментарий студента:</b>
<br>
Судя на третьей строчке проектной работы по установлению параметров и проведению предобработки и исследовательского анализа данных с архивными объявлениями о продаже квартир в г. Санкт-Петербург: мы обнаруживаем, что вместо представления данных в столбцах: 'studio' (наличие квартиры-студии) и 'open_plan' (наличие свободной планировки) обнаруживание пропуск данных в виде многоточия ('...') и неполную картину над параметрами всех объявлений о продаже квартир в г. Санкт-Петербург<br>
<br>
Поэтому разделим датафрейм data на две части с одинаковым количество строк, где первая часть заканчивается, а вторая часть начинается с одного и того же столбца, а именно с 'open_plan' (из пятой строки), чтобы не запутаться.<br>
<br>
Затем создадим два списка для разделенения всех названий столбцов в данной таблице (first_part и second_part) и цикл, по которому итерация помещает одно названия столбца в один список, а другое название - в другой список и выводим по частям два разделённых датафрейма: first_part_data и second_part_data для полного прочтения всех значений датафрейма data.<br>
<br>
Ещё в второй и четвёртой строчке данной проектной работы, обнаруживаем неэтическое для программистов название столбца: 'cityCenters_nearest', поэтому сразу меняем это название на 'city_сenters_nearest'.<br>
</div>

In [8]:
#data[['cityCenters_nearest']] = data[['city_centers_nearest']]

In [9]:
first_part = []
second_part = []

for i in range(len(data.columns)):
    if(i <= len(data.columns) / 2 - 1):
        first_part.append(data.columns[i])
    elif(i == len(real_estate_data.columns) / 2):
        first_part.append(real_estate_data.columns[i])
        second_part.append(real_estate_data.columns[i])
    else:
        second_part.append(real_estate_data.columns[i])

In [None]:
def half_DataFrame(real_estate_data):
    for i in range(len(real_estate_data.columns)):
    if(i <= len(real_estate_data.columns) / 2 - 1):
        first_part.append(real_estate_data.columns[i])
    elif(i == len(real_estate_data.columns) / 2):
        first_part.append(data.columns[i])
        second_part.append(data.columns[i])
    else:
        second_part.append(data.columns[i])

In [10]:
first_part_data = data.loc[:, first_part]
display(first_part_data.head(30))

Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,studio,open_plan
0,20,13000000.0,108.0,2019-03-07T00:00:00,3,2.7,16.0,51.0,8,,False,False
1,7,3350000.0,40.4,2018-12-04T00:00:00,1,,11.0,18.6,1,,False,False
2,10,5196000.0,56.0,2015-08-20T00:00:00,2,,5.0,34.3,4,,False,False
3,0,64900000.0,159.0,2015-07-24T00:00:00,3,,14.0,,9,,False,False
4,2,10000000.0,100.0,2018-06-19T00:00:00,2,3.03,14.0,32.0,13,,False,False
5,10,2890000.0,30.4,2018-09-10T00:00:00,1,,12.0,14.4,5,,False,False
6,6,3700000.0,37.3,2017-11-02T00:00:00,1,,26.0,10.6,6,,False,False
7,5,7915000.0,71.6,2019-04-18T00:00:00,2,,24.0,,22,,False,False
8,20,2900000.0,33.16,2018-05-23T00:00:00,1,,27.0,15.43,26,,False,False
9,18,5400000.0,61.0,2017-02-26T00:00:00,3,2.5,9.0,43.6,7,,False,False


In [11]:
second_part_data = data.loc[:, second_part]
display(second_part_data.head(30))

Unnamed: 0,open_plan,kitchen_area,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition
0,False,25.0,,Санкт-Петербург,18863.0,16028.0,1.0,482.0,2.0,755.0,
1,False,11.0,2.0,посёлок Шушары,12817.0,18603.0,0.0,,0.0,,81.0
2,False,8.3,0.0,Санкт-Петербург,21741.0,13933.0,1.0,90.0,2.0,574.0,558.0
3,False,,0.0,Санкт-Петербург,28098.0,6800.0,2.0,84.0,3.0,234.0,424.0
4,False,41.0,,Санкт-Петербург,31856.0,8098.0,2.0,112.0,1.0,48.0,121.0
5,False,9.1,,городской посёлок Янино-1,,,,,,,55.0
6,False,14.4,1.0,посёлок Парголово,52996.0,19143.0,0.0,,0.0,,155.0
7,False,18.9,2.0,Санкт-Петербург,23982.0,11634.0,0.0,,0.0,,
8,False,8.81,,посёлок Мурино,,,,,,,189.0
9,False,6.5,2.0,Санкт-Петербург,50898.0,15008.0,0.0,,0.0,,289.0


 ### Шаг 2. Заполнение пропусков.

<div class="alert alert-info">
<b>Комментарий студента:</b>
<br>
Судя на третьей строчке проектной работы по установлению параметров и проведению предобработки и исследовательского анализа данных с архивными объявлениями о продаже квартир в г. Санкт-Петербург: мы обнаруживаем, что вместо представления данных в столбцах: 'studio' (наличие квартиры-студии) и 'open_plan' (наличие свободной планировки) обнаруживание пропуск данных в виде многоточия ('...') и неполную картину над параметрами всех объявлений о продаже квартир в г. Санкт-Петербург<br>
<br>
Поэтому разделим датафрейм data на две части с одинаковым количество строк, где первая часть заканчивается, а вторая часть начинается с одного и того же столбца, а именно с 'open_plan' (из пятой строки).<br>
<br>
Затем создадим два списка для разделенения всех названий столбцов в данной таблице (first_part и second_part) и цикл, по которому итерация помещает одно названия столбца в один список, а другое название - в другой список и выводим по частям два разделённых датафрейма: first_part_data и second_part_data для полного прочтения всех значений датафрейма data.<br>
<br>
Ещё в второй и четвёртой строчке данной проектной работы, обнаруживаем неэтическое для программистов название столбца: 'cityCenters_nearest', поэтому сразу меняем это название на 'city_сenters_nearest'.<br>
</div>

In [12]:
data.isna().sum()

total_images                0
last_price                  0
total_area                  0
first_day_exposition        0
rooms                       0
ceiling_height           9195
floors_total               86
living_area              1903
floor                       0
is_apartment            20924
studio                      0
open_plan                   0
kitchen_area             2278
balcony                 11519
locality_name              49
airports_nearest         5542
cityCenters_nearest      5519
parks_around3000         5518
parks_nearest           15620
ponds_around3000         5518
ponds_nearest           14589
days_exposition          3181
dtype: int64

In [13]:
null_columns = []

for value in data.columns: 
    if data[value].count() != data.shape[0]:
        null_columns.append(value)
        
null_columns

['ceiling_height',
 'floors_total',
 'living_area',
 'is_apartment',
 'kitchen_area',
 'balcony',
 'locality_name',
 'airports_nearest',
 'cityCenters_nearest',
 'parks_around3000',
 'parks_nearest',
 'ponds_around3000',
 'ponds_nearest',
 'days_exposition']

In [14]:
for item in null_columns:
    print(f"\n Строки датафрейма, где у столбца '{item}' обнаружены пропущенные значения:")
    display(first_part_data[data[item].isna()].head())
    display(second_part_data[data[item].isna()].head())


 Строки датафрейма, где у столбца 'ceiling_height' обнаружены пропущенные значения:


Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,studio,open_plan
1,7,3350000.0,40.4,2018-12-04T00:00:00,1,,11.0,18.6,1,,False,False
2,10,5196000.0,56.0,2015-08-20T00:00:00,2,,5.0,34.3,4,,False,False
3,0,64900000.0,159.0,2015-07-24T00:00:00,3,,14.0,,9,,False,False
5,10,2890000.0,30.4,2018-09-10T00:00:00,1,,12.0,14.4,5,,False,False
6,6,3700000.0,37.3,2017-11-02T00:00:00,1,,26.0,10.6,6,,False,False


Unnamed: 0,open_plan,kitchen_area,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition
1,False,11.0,2.0,посёлок Шушары,12817.0,18603.0,0.0,,0.0,,81.0
2,False,8.3,0.0,Санкт-Петербург,21741.0,13933.0,1.0,90.0,2.0,574.0,558.0
3,False,,0.0,Санкт-Петербург,28098.0,6800.0,2.0,84.0,3.0,234.0,424.0
5,False,9.1,,городской посёлок Янино-1,,,,,,,55.0
6,False,14.4,1.0,посёлок Парголово,52996.0,19143.0,0.0,,0.0,,155.0



 Строки датафрейма, где у столбца 'floors_total' обнаружены пропущенные значения:


Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,studio,open_plan
186,12,11640000.0,65.2,2018-10-02T00:00:00,2,,,30.8,4,,False,False
237,4,2438033.0,28.1,2016-11-23T00:00:00,1,,,20.75,1,,False,False
457,4,9788348.0,70.8,2015-08-01T00:00:00,2,,,38.4,12,,False,False
671,4,6051191.0,93.6,2017-04-06T00:00:00,3,,,47.1,8,,False,False
1757,5,3600000.0,39.0,2017-04-22T00:00:00,1,,,,9,,False,False


Unnamed: 0,open_plan,kitchen_area,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition
186,False,12.0,,Санкт-Петербург,39197.0,12373.0,1.0,123.0,0.0,,49.0
237,False,,0.0,Санкт-Петербург,22041.0,17369.0,0.0,,1.0,374.0,251.0
457,False,10.63,0.0,Санкт-Петербург,37364.0,8322.0,2.0,309.0,2.0,706.0,727.0
671,False,16.8,0.0,Санкт-Петербург,22041.0,17369.0,0.0,,1.0,374.0,123.0
1757,False,,0.0,Санкт-Петербург,22735.0,11618.0,1.0,835.0,1.0,652.0,77.0



 Строки датафрейма, где у столбца 'living_area' обнаружены пропущенные значения:


Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,studio,open_plan
3,0,64900000.0,159.0,2015-07-24T00:00:00,3,,14.0,,9,,False,False
7,5,7915000.0,71.6,2019-04-18T00:00:00,2,,24.0,,22,,False,False
30,12,2200000.0,32.8,2018-02-19T00:00:00,1,,9.0,,2,,False,False
37,10,1990000.0,45.8,2017-10-28T00:00:00,2,2.5,5.0,,1,,False,False
44,13,5350000.0,40.0,2018-11-18T00:00:00,1,,22.0,,3,,False,False


Unnamed: 0,open_plan,kitchen_area,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition
3,False,,0.0,Санкт-Петербург,28098.0,6800.0,2.0,84.0,3.0,234.0,424.0
7,False,18.9,2.0,Санкт-Петербург,23982.0,11634.0,0.0,,0.0,,
30,False,,,Коммунар,,,,,,,63.0
37,False,,,поселок городского типа Красный Бор,,,,,,,196.0
44,False,,1.0,Санкт-Петербург,30471.0,11603.0,1.0,620.0,1.0,1152.0,



 Строки датафрейма, где у столбца 'is_apartment' обнаружены пропущенные значения:


Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,studio,open_plan
0,20,13000000.0,108.0,2019-03-07T00:00:00,3,2.7,16.0,51.0,8,,False,False
1,7,3350000.0,40.4,2018-12-04T00:00:00,1,,11.0,18.6,1,,False,False
2,10,5196000.0,56.0,2015-08-20T00:00:00,2,,5.0,34.3,4,,False,False
3,0,64900000.0,159.0,2015-07-24T00:00:00,3,,14.0,,9,,False,False
4,2,10000000.0,100.0,2018-06-19T00:00:00,2,3.03,14.0,32.0,13,,False,False


Unnamed: 0,open_plan,kitchen_area,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition
0,False,25.0,,Санкт-Петербург,18863.0,16028.0,1.0,482.0,2.0,755.0,
1,False,11.0,2.0,посёлок Шушары,12817.0,18603.0,0.0,,0.0,,81.0
2,False,8.3,0.0,Санкт-Петербург,21741.0,13933.0,1.0,90.0,2.0,574.0,558.0
3,False,,0.0,Санкт-Петербург,28098.0,6800.0,2.0,84.0,3.0,234.0,424.0
4,False,41.0,,Санкт-Петербург,31856.0,8098.0,2.0,112.0,1.0,48.0,121.0



 Строки датафрейма, где у столбца 'kitchen_area' обнаружены пропущенные значения:


Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,studio,open_plan
3,0,64900000.0,159.0,2015-07-24T00:00:00,3,,14.0,,9,,False,False
30,12,2200000.0,32.8,2018-02-19T00:00:00,1,,9.0,,2,,False,False
37,10,1990000.0,45.8,2017-10-28T00:00:00,2,2.5,5.0,,1,,False,False
44,13,5350000.0,40.0,2018-11-18T00:00:00,1,,22.0,,3,,False,False
59,15,6300000.0,46.5,2017-03-06T00:00:00,1,,13.0,,13,,False,False


Unnamed: 0,open_plan,kitchen_area,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition
3,False,,0.0,Санкт-Петербург,28098.0,6800.0,2.0,84.0,3.0,234.0,424.0
30,False,,,Коммунар,,,,,,,63.0
37,False,,,поселок городского типа Красный Бор,,,,,,,196.0
44,False,,1.0,Санкт-Петербург,30471.0,11603.0,1.0,620.0,1.0,1152.0,
59,False,,,Санкт-Петербург,11125.0,14501.0,0.0,,0.0,,336.0



 Строки датафрейма, где у столбца 'balcony' обнаружены пропущенные значения:


Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,studio,open_plan
0,20,13000000.0,108.0,2019-03-07T00:00:00,3,2.7,16.0,51.0,8,,False,False
4,2,10000000.0,100.0,2018-06-19T00:00:00,2,3.03,14.0,32.0,13,,False,False
5,10,2890000.0,30.4,2018-09-10T00:00:00,1,,12.0,14.4,5,,False,False
8,20,2900000.0,33.16,2018-05-23T00:00:00,1,,27.0,15.43,26,,False,False
10,5,5050000.0,39.6,2017-11-16T00:00:00,1,2.67,12.0,20.3,3,,False,False


Unnamed: 0,open_plan,kitchen_area,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition
0,False,25.0,,Санкт-Петербург,18863.0,16028.0,1.0,482.0,2.0,755.0,
4,False,41.0,,Санкт-Петербург,31856.0,8098.0,2.0,112.0,1.0,48.0,121.0
5,False,9.1,,городской посёлок Янино-1,,,,,,,55.0
8,False,8.81,,посёлок Мурино,,,,,,,189.0
10,False,8.5,,Санкт-Петербург,38357.0,13878.0,1.0,310.0,2.0,553.0,137.0



 Строки датафрейма, где у столбца 'locality_name' обнаружены пропущенные значения:


Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,studio,open_plan
1097,3,8600000.0,81.7,2016-04-15T00:00:00,3,3.55,5.0,50.8,2,,False,False
2033,6,5398000.0,80.0,2017-05-30T00:00:00,3,,4.0,42.6,2,,False,False
2603,20,3351765.0,42.7,2015-09-20T00:00:00,1,,24.0,15.6,3,,False,False
2632,2,5130593.0,62.4,2015-10-11T00:00:00,2,,24.0,33.1,21,,False,False
3574,10,4200000.0,46.5,2016-05-28T00:00:00,2,,5.0,30.8,5,,False,False


Unnamed: 0,open_plan,kitchen_area,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition
1097,False,8.8,0.0,,23478.0,4258.0,0.0,,0.0,,147.0
2033,False,18.6,0.0,,,,,,,,34.0
2603,False,10.7,0.0,,22041.0,17369.0,0.0,,1.0,374.0,276.0
2632,False,8.2,0.0,,22041.0,17369.0,0.0,,1.0,374.0,256.0
3574,False,6.5,0.0,,27419.0,8127.0,0.0,,1.0,603.0,45.0



 Строки датафрейма, где у столбца 'airports_nearest' обнаружены пропущенные значения:


Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,studio,open_plan
5,10,2890000.0,30.4,2018-09-10T00:00:00,1,,12.0,14.4,5,,False,False
8,20,2900000.0,33.16,2018-05-23T00:00:00,1,,27.0,15.43,26,,False,False
12,10,3890000.0,54.0,2016-06-30T00:00:00,2,,5.0,30.0,5,,False,False
22,20,5000000.0,58.0,2017-04-24T00:00:00,2,2.75,25.0,30.0,15,,False,False
30,12,2200000.0,32.8,2018-02-19T00:00:00,1,,9.0,,2,,False,False


Unnamed: 0,open_plan,kitchen_area,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition
5,False,9.1,,городской посёлок Янино-1,,,,,,,55.0
8,False,8.81,,посёлок Мурино,,,,,,,189.0
12,False,9.0,0.0,Сертолово,,,,,,,90.0
22,False,11.0,2.0,деревня Кудрово,,,,,,,60.0
30,False,,,Коммунар,,,,,,,63.0



 Строки датафрейма, где у столбца 'cityCenters_nearest' обнаружены пропущенные значения:


Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,studio,open_plan
5,10,2890000.0,30.4,2018-09-10T00:00:00,1,,12.0,14.4,5,,False,False
8,20,2900000.0,33.16,2018-05-23T00:00:00,1,,27.0,15.43,26,,False,False
12,10,3890000.0,54.0,2016-06-30T00:00:00,2,,5.0,30.0,5,,False,False
22,20,5000000.0,58.0,2017-04-24T00:00:00,2,2.75,25.0,30.0,15,,False,False
30,12,2200000.0,32.8,2018-02-19T00:00:00,1,,9.0,,2,,False,False


Unnamed: 0,open_plan,kitchen_area,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition
5,False,9.1,,городской посёлок Янино-1,,,,,,,55.0
8,False,8.81,,посёлок Мурино,,,,,,,189.0
12,False,9.0,0.0,Сертолово,,,,,,,90.0
22,False,11.0,2.0,деревня Кудрово,,,,,,,60.0
30,False,,,Коммунар,,,,,,,63.0



 Строки датафрейма, где у столбца 'parks_around3000' обнаружены пропущенные значения:


Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,studio,open_plan
5,10,2890000.0,30.4,2018-09-10T00:00:00,1,,12.0,14.4,5,,False,False
8,20,2900000.0,33.16,2018-05-23T00:00:00,1,,27.0,15.43,26,,False,False
12,10,3890000.0,54.0,2016-06-30T00:00:00,2,,5.0,30.0,5,,False,False
22,20,5000000.0,58.0,2017-04-24T00:00:00,2,2.75,25.0,30.0,15,,False,False
30,12,2200000.0,32.8,2018-02-19T00:00:00,1,,9.0,,2,,False,False


Unnamed: 0,open_plan,kitchen_area,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition
5,False,9.1,,городской посёлок Янино-1,,,,,,,55.0
8,False,8.81,,посёлок Мурино,,,,,,,189.0
12,False,9.0,0.0,Сертолово,,,,,,,90.0
22,False,11.0,2.0,деревня Кудрово,,,,,,,60.0
30,False,,,Коммунар,,,,,,,63.0



 Строки датафрейма, где у столбца 'parks_nearest' обнаружены пропущенные значения:


Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,studio,open_plan
1,7,3350000.0,40.4,2018-12-04T00:00:00,1,,11.0,18.6,1,,False,False
5,10,2890000.0,30.4,2018-09-10T00:00:00,1,,12.0,14.4,5,,False,False
6,6,3700000.0,37.3,2017-11-02T00:00:00,1,,26.0,10.6,6,,False,False
7,5,7915000.0,71.6,2019-04-18T00:00:00,2,,24.0,,22,,False,False
8,20,2900000.0,33.16,2018-05-23T00:00:00,1,,27.0,15.43,26,,False,False


Unnamed: 0,open_plan,kitchen_area,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition
1,False,11.0,2.0,посёлок Шушары,12817.0,18603.0,0.0,,0.0,,81.0
5,False,9.1,,городской посёлок Янино-1,,,,,,,55.0
6,False,14.4,1.0,посёлок Парголово,52996.0,19143.0,0.0,,0.0,,155.0
7,False,18.9,2.0,Санкт-Петербург,23982.0,11634.0,0.0,,0.0,,
8,False,8.81,,посёлок Мурино,,,,,,,189.0



 Строки датафрейма, где у столбца 'ponds_around3000' обнаружены пропущенные значения:


Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,studio,open_plan
5,10,2890000.0,30.4,2018-09-10T00:00:00,1,,12.0,14.4,5,,False,False
8,20,2900000.0,33.16,2018-05-23T00:00:00,1,,27.0,15.43,26,,False,False
12,10,3890000.0,54.0,2016-06-30T00:00:00,2,,5.0,30.0,5,,False,False
22,20,5000000.0,58.0,2017-04-24T00:00:00,2,2.75,25.0,30.0,15,,False,False
30,12,2200000.0,32.8,2018-02-19T00:00:00,1,,9.0,,2,,False,False


Unnamed: 0,open_plan,kitchen_area,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition
5,False,9.1,,городской посёлок Янино-1,,,,,,,55.0
8,False,8.81,,посёлок Мурино,,,,,,,189.0
12,False,9.0,0.0,Сертолово,,,,,,,90.0
22,False,11.0,2.0,деревня Кудрово,,,,,,,60.0
30,False,,,Коммунар,,,,,,,63.0



 Строки датафрейма, где у столбца 'ponds_nearest' обнаружены пропущенные значения:


Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,studio,open_plan
1,7,3350000.0,40.4,2018-12-04T00:00:00,1,,11.0,18.6,1,,False,False
5,10,2890000.0,30.4,2018-09-10T00:00:00,1,,12.0,14.4,5,,False,False
6,6,3700000.0,37.3,2017-11-02T00:00:00,1,,26.0,10.6,6,,False,False
7,5,7915000.0,71.6,2019-04-18T00:00:00,2,,24.0,,22,,False,False
8,20,2900000.0,33.16,2018-05-23T00:00:00,1,,27.0,15.43,26,,False,False


Unnamed: 0,open_plan,kitchen_area,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition
1,False,11.0,2.0,посёлок Шушары,12817.0,18603.0,0.0,,0.0,,81.0
5,False,9.1,,городской посёлок Янино-1,,,,,,,55.0
6,False,14.4,1.0,посёлок Парголово,52996.0,19143.0,0.0,,0.0,,155.0
7,False,18.9,2.0,Санкт-Петербург,23982.0,11634.0,0.0,,0.0,,
8,False,8.81,,посёлок Мурино,,,,,,,189.0



 Строки датафрейма, где у столбца 'days_exposition' обнаружены пропущенные значения:


Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,studio,open_plan
0,20,13000000.0,108.0,2019-03-07T00:00:00,3,2.7,16.0,51.0,8,,False,False
7,5,7915000.0,71.6,2019-04-18T00:00:00,2,,24.0,,22,,False,False
44,13,5350000.0,40.0,2018-11-18T00:00:00,1,,22.0,,3,,False,False
45,17,5200000.0,50.6,2018-12-02T00:00:00,2,2.65,9.0,30.3,7,,False,False
46,17,6600000.0,52.1,2019-01-31T00:00:00,2,2.6,24.0,29.7,9,,False,False


Unnamed: 0,open_plan,kitchen_area,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition
0,False,25.0,,Санкт-Петербург,18863.0,16028.0,1.0,482.0,2.0,755.0,
7,False,18.9,2.0,Санкт-Петербург,23982.0,11634.0,0.0,,0.0,,
44,False,,1.0,Санкт-Петербург,30471.0,11603.0,1.0,620.0,1.0,1152.0,
45,False,7.0,,Санкт-Петербург,30011.0,12872.0,0.0,,0.0,,
46,False,8.3,2.0,Санкт-Петербург,15114.0,12702.0,0.0,,0.0,,


<div class="alert alert-info">
<b>Комментарий студента:</b>
<br>
Теперь нужно заполнить пропущенные значения, но, к счастью, среди некоторых данных столбцов есть такие данные, которые можно логически определить чисто из здравого смысла, реже с помощью условий из других значений столбцов.<br>  
<br> Ими относятся: 
    <ul> 'is_apartment' (наличие аппартаментов); </ul>
    <ul> 'balcony' (наличие балконов); </ul>
    <ul> 'locality_name' (название населённого пункта); </ul>
    <ul> 'days_exposition' (длительность размещения объявления (от публикации до снятия)); </ul><br>, а также: 
    <ul> 'floors_total' (количество этажей в доме); </ul> 
    <ul> 'airports_nearest' (расстояние до ближайшего аэропорта в метрах (м)); </ul> 
    <ul> 'parks_nearest' (расстояние до ближайшего парка); </ul>
    <ul> 'ponds_nearest' (расстояние до ближайшего пруда). </ul>          
    
<br>    
    Судя на третьей строчке проектной работы по установлению параметров и проведению предобработки и исследовательского анализа данных с архивными объявлениями о продаже квартир в г. Санкт-Петербург: мы обнаруживаем, что вместо представления данных в столбцах: 'studio' (наличие квартиры-студии) и 'open_plan'. <br>
<br>
     Также данные столбцов 'balcony', 'floors_total', а также 'days_exposition' приведём к типу данных 'int' (насчёт столбца 'days_exposition' - ни один SEO-специалист не будет ослеживать длительность с точностью до минуты, для удобства длительность размещения объявления будет измеряться в целых числах дней).<br>
</div>

In [15]:
data['is_apartment'] = data['is_apartment'].fillna('False')
display(data.head())

Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,...,kitchen_area,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition
0,20,13000000.0,108.0,2019-03-07T00:00:00,3,2.7,16.0,51.0,8,False,...,25.0,,Санкт-Петербург,18863.0,16028.0,1.0,482.0,2.0,755.0,
1,7,3350000.0,40.4,2018-12-04T00:00:00,1,,11.0,18.6,1,False,...,11.0,2.0,посёлок Шушары,12817.0,18603.0,0.0,,0.0,,81.0
2,10,5196000.0,56.0,2015-08-20T00:00:00,2,,5.0,34.3,4,False,...,8.3,0.0,Санкт-Петербург,21741.0,13933.0,1.0,90.0,2.0,574.0,558.0
3,0,64900000.0,159.0,2015-07-24T00:00:00,3,,14.0,,9,False,...,,0.0,Санкт-Петербург,28098.0,6800.0,2.0,84.0,3.0,234.0,424.0
4,2,10000000.0,100.0,2018-06-19T00:00:00,2,3.03,14.0,32.0,13,False,...,41.0,,Санкт-Петербург,31856.0,8098.0,2.0,112.0,1.0,48.0,121.0


In [16]:
data['balcony'] = (data['balcony'].fillna(0)).astype('int')
display(data.head())

Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,...,kitchen_area,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition
0,20,13000000.0,108.0,2019-03-07T00:00:00,3,2.7,16.0,51.0,8,False,...,25.0,0,Санкт-Петербург,18863.0,16028.0,1.0,482.0,2.0,755.0,
1,7,3350000.0,40.4,2018-12-04T00:00:00,1,,11.0,18.6,1,False,...,11.0,2,посёлок Шушары,12817.0,18603.0,0.0,,0.0,,81.0
2,10,5196000.0,56.0,2015-08-20T00:00:00,2,,5.0,34.3,4,False,...,8.3,0,Санкт-Петербург,21741.0,13933.0,1.0,90.0,2.0,574.0,558.0
3,0,64900000.0,159.0,2015-07-24T00:00:00,3,,14.0,,9,False,...,,0,Санкт-Петербург,28098.0,6800.0,2.0,84.0,3.0,234.0,424.0
4,2,10000000.0,100.0,2018-06-19T00:00:00,2,3.03,14.0,32.0,13,False,...,41.0,0,Санкт-Петербург,31856.0,8098.0,2.0,112.0,1.0,48.0,121.0


In [17]:
data['locality_name'] = data['locality_name'].fillna('Санкт-Петербург')
#display(data.head())
display(data[1090:1110])

Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,...,kitchen_area,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition
1090,8,3420000.0,31.4,2018-11-03T00:00:00,1,2.5,9.0,15.4,5,False,...,8.4,0,Санкт-Петербург,10409.0,14775.0,0.0,,1.0,260.0,32.0
1091,1,10778000.0,68.0,2016-04-11T00:00:00,2,,13.0,36.45,9,False,...,10.4,2,Санкт-Петербург,27314.0,6017.0,1.0,658.0,3.0,592.0,737.0
1092,15,3480000.0,45.1,2016-04-11T00:00:00,2,2.6,9.0,27.3,8,False,...,6.2,0,деревня Новое Девяткино,,,,,,,1011.0
1093,20,6150000.0,72.0,2017-06-06T00:00:00,3,,9.0,44.0,8,False,...,,0,Санкт-Петербург,13315.0,14577.0,0.0,,0.0,,140.0
1094,20,10400000.0,77.1,2019-02-21T00:00:00,3,2.95,8.0,48.6,2,False,...,8.8,0,Санкт-Петербург,31429.0,5284.0,1.0,318.0,2.0,605.0,
1095,9,6000000.0,30.3,2018-09-18T00:00:00,1,3.15,19.0,14.2,5,False,...,8.5,1,Санкт-Петербург,18748.0,4341.0,0.0,,0.0,,77.0
1096,4,4482900.0,58.6,2018-08-17T00:00:00,1,,23.0,20.36,8,False,...,18.78,0,Кудрово,,,,,,,71.0
1097,3,8600000.0,81.7,2016-04-15T00:00:00,3,3.55,5.0,50.8,2,False,...,8.8,0,Санкт-Петербург,23478.0,4258.0,0.0,,0.0,,147.0
1098,14,3650000.0,32.1,2017-05-29T00:00:00,1,,7.0,16.0,1,False,...,6.0,0,Санкт-Петербург,29305.0,8007.0,1.0,591.0,1.0,856.0,116.0
1099,13,8450000.0,71.5,2018-04-05T00:00:00,3,2.5,13.0,41.3,3,False,...,11.4,1,Санкт-Петербург,33292.0,11601.0,0.0,,0.0,,120.0


In [18]:
data_days_exposition_median = data['days_exposition'].median()
data_days_exposition_median

95.0

In [19]:
data['days_exposition'] = (data['days_exposition'].fillna(data_days_exposition_median)).astype('int')
display(data.head())

Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,...,kitchen_area,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition
0,20,13000000.0,108.0,2019-03-07T00:00:00,3,2.7,16.0,51.0,8,False,...,25.0,0,Санкт-Петербург,18863.0,16028.0,1.0,482.0,2.0,755.0,95
1,7,3350000.0,40.4,2018-12-04T00:00:00,1,,11.0,18.6,1,False,...,11.0,2,посёлок Шушары,12817.0,18603.0,0.0,,0.0,,81
2,10,5196000.0,56.0,2015-08-20T00:00:00,2,,5.0,34.3,4,False,...,8.3,0,Санкт-Петербург,21741.0,13933.0,1.0,90.0,2.0,574.0,558
3,0,64900000.0,159.0,2015-07-24T00:00:00,3,,14.0,,9,False,...,,0,Санкт-Петербург,28098.0,6800.0,2.0,84.0,3.0,234.0,424
4,2,10000000.0,100.0,2018-06-19T00:00:00,2,3.03,14.0,32.0,13,False,...,41.0,0,Санкт-Петербург,31856.0,8098.0,2.0,112.0,1.0,48.0,121


In [20]:
data_floors_total_median = data['floors_total'].median()
data_floors_total_median

9.0

In [21]:
data['floors_total'] = (data['floors_total'].fillna(data_floors_total_median)).astype('int')
display(data.head(50))

Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,...,kitchen_area,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition
0,20,13000000.0,108.0,2019-03-07T00:00:00,3,2.7,16,51.0,8,False,...,25.0,0,Санкт-Петербург,18863.0,16028.0,1.0,482.0,2.0,755.0,95
1,7,3350000.0,40.4,2018-12-04T00:00:00,1,,11,18.6,1,False,...,11.0,2,посёлок Шушары,12817.0,18603.0,0.0,,0.0,,81
2,10,5196000.0,56.0,2015-08-20T00:00:00,2,,5,34.3,4,False,...,8.3,0,Санкт-Петербург,21741.0,13933.0,1.0,90.0,2.0,574.0,558
3,0,64900000.0,159.0,2015-07-24T00:00:00,3,,14,,9,False,...,,0,Санкт-Петербург,28098.0,6800.0,2.0,84.0,3.0,234.0,424
4,2,10000000.0,100.0,2018-06-19T00:00:00,2,3.03,14,32.0,13,False,...,41.0,0,Санкт-Петербург,31856.0,8098.0,2.0,112.0,1.0,48.0,121
5,10,2890000.0,30.4,2018-09-10T00:00:00,1,,12,14.4,5,False,...,9.1,0,городской посёлок Янино-1,,,,,,,55
6,6,3700000.0,37.3,2017-11-02T00:00:00,1,,26,10.6,6,False,...,14.4,1,посёлок Парголово,52996.0,19143.0,0.0,,0.0,,155
7,5,7915000.0,71.6,2019-04-18T00:00:00,2,,24,,22,False,...,18.9,2,Санкт-Петербург,23982.0,11634.0,0.0,,0.0,,95
8,20,2900000.0,33.16,2018-05-23T00:00:00,1,,27,15.43,26,False,...,8.81,0,посёлок Мурино,,,,,,,189
9,18,5400000.0,61.0,2017-02-26T00:00:00,3,2.5,9,43.6,7,False,...,6.5,2,Санкт-Петербург,50898.0,15008.0,0.0,,0.0,,289


In [22]:
data.loc[~(data['parks_around3000'] != data['parks_around3000']), 'parks_nearest'] = data.loc[:, 'parks_nearest'].fillna(0)

display(data.head(50)) 

Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,...,kitchen_area,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition
0,20,13000000.0,108.0,2019-03-07T00:00:00,3,2.7,16,51.0,8,False,...,25.0,0,Санкт-Петербург,18863.0,16028.0,1.0,482.0,2.0,755.0,95
1,7,3350000.0,40.4,2018-12-04T00:00:00,1,,11,18.6,1,False,...,11.0,2,посёлок Шушары,12817.0,18603.0,0.0,0.0,0.0,,81
2,10,5196000.0,56.0,2015-08-20T00:00:00,2,,5,34.3,4,False,...,8.3,0,Санкт-Петербург,21741.0,13933.0,1.0,90.0,2.0,574.0,558
3,0,64900000.0,159.0,2015-07-24T00:00:00,3,,14,,9,False,...,,0,Санкт-Петербург,28098.0,6800.0,2.0,84.0,3.0,234.0,424
4,2,10000000.0,100.0,2018-06-19T00:00:00,2,3.03,14,32.0,13,False,...,41.0,0,Санкт-Петербург,31856.0,8098.0,2.0,112.0,1.0,48.0,121
5,10,2890000.0,30.4,2018-09-10T00:00:00,1,,12,14.4,5,False,...,9.1,0,городской посёлок Янино-1,,,,,,,55
6,6,3700000.0,37.3,2017-11-02T00:00:00,1,,26,10.6,6,False,...,14.4,1,посёлок Парголово,52996.0,19143.0,0.0,0.0,0.0,,155
7,5,7915000.0,71.6,2019-04-18T00:00:00,2,,24,,22,False,...,18.9,2,Санкт-Петербург,23982.0,11634.0,0.0,0.0,0.0,,95
8,20,2900000.0,33.16,2018-05-23T00:00:00,1,,27,15.43,26,False,...,8.81,0,посёлок Мурино,,,,,,,189
9,18,5400000.0,61.0,2017-02-26T00:00:00,3,2.5,9,43.6,7,False,...,6.5,2,Санкт-Петербург,50898.0,15008.0,0.0,0.0,0.0,,289


In [23]:
data.loc[~(data['ponds_around3000'] != data['ponds_around3000']), 'ponds_nearest'] = (data.loc[:, 'ponds_nearest'].fillna(0.0)).astype('int')

display(data.head(50))  

Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,...,kitchen_area,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition
0,20,13000000.0,108.0,2019-03-07T00:00:00,3,2.7,16,51.0,8,False,...,25.0,0,Санкт-Петербург,18863.0,16028.0,1.0,482.0,2.0,755.0,95
1,7,3350000.0,40.4,2018-12-04T00:00:00,1,,11,18.6,1,False,...,11.0,2,посёлок Шушары,12817.0,18603.0,0.0,0.0,0.0,0.0,81
2,10,5196000.0,56.0,2015-08-20T00:00:00,2,,5,34.3,4,False,...,8.3,0,Санкт-Петербург,21741.0,13933.0,1.0,90.0,2.0,574.0,558
3,0,64900000.0,159.0,2015-07-24T00:00:00,3,,14,,9,False,...,,0,Санкт-Петербург,28098.0,6800.0,2.0,84.0,3.0,234.0,424
4,2,10000000.0,100.0,2018-06-19T00:00:00,2,3.03,14,32.0,13,False,...,41.0,0,Санкт-Петербург,31856.0,8098.0,2.0,112.0,1.0,48.0,121
5,10,2890000.0,30.4,2018-09-10T00:00:00,1,,12,14.4,5,False,...,9.1,0,городской посёлок Янино-1,,,,,,,55
6,6,3700000.0,37.3,2017-11-02T00:00:00,1,,26,10.6,6,False,...,14.4,1,посёлок Парголово,52996.0,19143.0,0.0,0.0,0.0,0.0,155
7,5,7915000.0,71.6,2019-04-18T00:00:00,2,,24,,22,False,...,18.9,2,Санкт-Петербург,23982.0,11634.0,0.0,0.0,0.0,0.0,95
8,20,2900000.0,33.16,2018-05-23T00:00:00,1,,27,15.43,26,False,...,8.81,0,посёлок Мурино,,,,,,,189
9,18,5400000.0,61.0,2017-02-26T00:00:00,3,2.5,9,43.6,7,False,...,6.5,2,Санкт-Петербург,50898.0,15008.0,0.0,0.0,0.0,0.0,289


In [24]:
for value in data['locality_name'].unique():
    print(value)

Санкт-Петербург
посёлок Шушары
городской посёлок Янино-1
посёлок Парголово
посёлок Мурино
Ломоносов
Сертолово
Петергоф
Пушкин
деревня Кудрово
Коммунар
Колпино
поселок городского типа Красный Бор
Гатчина
поселок Мурино
деревня Фёдоровское
Выборг
Кронштадт
Кировск
деревня Новое Девяткино
посёлок Металлострой
посёлок городского типа Лебяжье
посёлок городского типа Сиверский
поселок Молодцово
поселок городского типа Кузьмоловский
садовое товарищество Новая Ропша
Павловск
деревня Пикколово
Всеволожск
Волхов
Кингисепп
Приозерск
Сестрорецк
деревня Куттузи
посёлок Аннино
поселок городского типа Ефимовский
посёлок Плодовое
деревня Заклинье
поселок Торковичи
поселок Первомайское
Красное Село
посёлок Понтонный
Сясьстрой
деревня Старая
деревня Лесколово
посёлок Новый Свет
Сланцы
село Путилово
Ивангород
Мурино
Шлиссельбург
Никольское
Зеленогорск
Сосновый Бор
поселок Новый Свет
деревня Оржицы
деревня Кальтино
Кудрово
поселок Романовка
посёлок Бугры
поселок Бугры
поселок городского типа Рощино
Кириши

In [25]:
for value in data['locality_name']:
    print(value)

Санкт-Петербург
посёлок Шушары
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
городской посёлок Янино-1
посёлок Парголово
Санкт-Петербург
посёлок Мурино
Санкт-Петербург
Санкт-Петербург
Ломоносов
Сертолово
Петергоф
Пушкин
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Парголово
Санкт-Петербург
деревня Кудрово
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Пушкин
Санкт-Петербург
Коммунар
Санкт-Петербург
Санкт-Петербург
Колпино
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
поселок городского типа Красный Бор
посёлок Мурино
Санкт-Петербург
посёлок Парголово
Санкт-Петербург
Петергоф
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Гатчина
Санкт-Петербург
Санкт-Петербург
Пушкин
Санкт-Петербург
Санкт-Петербург
посёлок Парголово
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Шушары
Санкт-Петербург
Санкт-Петербург
посёлок Мурино
Санкт-Петербург
Сертолово
Санкт-Петербург
Гатчина
Санкт-Петербург
п

посёлок Парголово
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Всеволожск
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Гатчина
Санкт-Петербург
поселок городского типа Вырица
Санкт-Петербург
Санкт-Петербург
деревня Белогорка
Санкт-Петербург
Тосно
Ломоносов
Санкт-Петербург
Санкт-Петербург
Сертолово
Пушкин
Санкт-Петербург
Санкт-Петербург
посёлок Шушары
Санкт-Петербург
Гатчина
Тосно
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Красное Село
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Тихвин
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
деревня Кудрово
Ломоносов
посёлок Шушары
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Волхов
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Сертолово
Сланцы
Санкт-Петербург
поселок Заводской
Санкт-Петербург
Санкт-Петербург
Санкт-Петербу

Санкт-Петербург
посёлок Гаврилово
Санкт-Петербург
Коммунар
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Парголово
Всеволожск
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Пушкин
посёлок Шушары
Лодейное Поле
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
деревня Кудрово
деревня Новое Девяткино
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
деревня Кудрово
Санкт-Петербург
Санкт-Петербург
деревня Кудрово
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Кудрово
деревня Нурма
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Пикалёво
Санкт-Петербург
деревня Рабитицы
Пушкин
Гатчина
Санкт-Петербург
Санкт-Петербург
деревня Новое Девяткино
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Пушкин
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Парголово
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Кириши
Пушкин
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
поселок городского типа Никольский
Сан

Санкт-Петербург
Кингисепп
посёлок Мурино
Санкт-Петербург
Санкт-Петербург
посёлок Шушары
Санкт-Петербург
Коммунар
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Тосно
Сертолово
Кудрово
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
деревня Кудрово
посёлок Тельмана
Павловск
Санкт-Петербург
Санкт-Петербург
Волхов
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Сертолово
Санкт-Петербург
Санкт-Петербург
Сертолово
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок городского типа имени Морозова
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Сестрорецк
деревня Кудрово
Гатчина
поселок городского типа Вырица
Санкт-Петербург
Санкт-Петербург
Выборг
Ломоносов
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Сестрорецк
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Гатчина
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Луга
Санкт-Пе

Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Петергоф
посёлок Парголово
Санкт-Петербург
Отрадное
Санкт-Петербург
Санкт-Петербург
Всеволожск
Санкт-Петербург
Санкт-Петербург
деревня Новое Девяткино
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
деревня Кудрово
Санкт-Петербург
поселок Романовка
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Пушкин
Санкт-Петербург
Кировск
Санкт-Петербург
Санкт-Петербург
Ломоносов
Санкт-Петербург
Санкт-Петербург
Всеволожск
Выборг
Санкт-Петербург
Санкт-Петербург
посёлок Мурино
деревня Кудрово
Сертолово
Санкт-Петербург
Сясьстрой
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Металлострой
Санкт-Петербург
посёлок городского типа имени Морозова
Санкт-Петербург
Санкт-Петербург
посёлок Мурино
Санкт-Петербург
Выборг
Сертолово
Санкт-Петербург
Выборг
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Мурино
Санкт-Петербург
поселок

Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Никольское
Санкт-Петербург
Петергоф
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Лодейное Поле
Кириши
Всеволожск
Санкт-Петербург
Санкт-Петербург
Кудрово
посёлок Мурино
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Пушкин
Пушкин
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
деревня Гарболово
посёлок Аннино
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Мурино
Санкт-Петербург
Санкт-Петербург
Всеволожск
Санкт-Петербург
Санкт-Петербург
Колпино
Санкт-Петербург
Санкт-Петербург
Кириши
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Гатчина
Санкт-Петербург
Санкт-Петербург
Ломоносов
Гатчина
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Парголово
Санкт-Петербург
Санкт-Петербург
Отрадное
Санкт-Петербург
деревня Кудрово
Санкт-Петербург
Пикалёво
посёлок Шушары
деревня Малые Колпаны
поселок Лисий Нос
Санкт-Петербург


Павловск
Санкт-Петербург
посёлок Бугры
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Гатчина
Санкт-Петербург
Колпино
посёлок Шушары
Приозерск
посёлок Шушары
Выборг
городской посёлок Мга
посёлок Парголово
поселок городского типа Дружная Горка
Санкт-Петербург
Мурино
посёлок Мурино
Санкт-Петербург
Тихвин
Санкт-Петербург
Санкт-Петербург
посёлок городского типа имени Морозова
Санкт-Петербург
Санкт-Петербург
Всеволожск
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Тельмана
поселок Каложицы
поселок городского типа Вырица
Санкт-Петербург
Сертолово
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Парголово
Санкт-Петербург
Кингисепп
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Гатчина
посёлок Шушары
Сестрорецк
Санкт-Петербург
посёлок Парголово
Санкт-Петербург
Всеволожск
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Колпино
Санкт-Петербург
Санкт-Петербург
городск

Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Усть-Луга
село Русско-Высоцкое
Санкт-Петербург
городской посёлок Назия
Колпино
Колпино
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Шушары
Кудрово
Санкт-Петербург
Санкт-Петербург
Сестрорецк
Санкт-Петербург
Санкт-Петербург
Кронштадт
посёлок Шушары
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Любань
Каменногорск
Санкт-Петербург
деревня Кудрово
Санкт-Петербург
Сестрорецк
Лодейное Поле
Санкт-Петербург
Всеволожск
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Красное Село
Санкт-Петербург
Всеволожск
Санкт-Петербург
Всеволожск
Всеволожск
Санкт-Петербург
деревня Новое Девяткино
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
деревня Кудрово
деревня Кудрово
Санкт-Петербург


Приозерск
Санкт-Петербург
Санкт-Петербург
Пушкин
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Мурино
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Мурино
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
деревня Кудрово
Всеволожск
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Шушары
Санкт-Петербург
Всеволожск
Сестрорецк
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок городского типа Сиверский
Выборг
Санкт-Петербург
Кронштадт
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
деревня Вартемяги
Санкт-Петербург
посёлок Шушары
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
поселок городского типа Токсово
Красн

Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Сестрорецк
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Коммунар
поселок Селезнёво
Санкт-Петербург
Гатчина
Санкт-Петербург
Санкт-Петербург
посёлок Мурино
деревня Кальтино
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Пушкин
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Колпино
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Шушары
посёлок городского типа Кузнечное
Санкт-Петербург
посёлок Шушары
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Никольское
Санкт-Петербург
Ивангород
посёлок Мурино
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Приозерск
Санкт-Петербург
Санкт-Петербург
посёлок Мурино
посёлок Парголово
Кириши
Санкт-Петербург
посёлок Парголово
Всеволожск
Кириши
Кудрово
поселок Войсковицы
Санкт-Петербург
Сланцы
посёлок Металлострой
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Луга
посёлок Парголово
дер

Кудрово
Санкт-Петербург
Санкт-Петербург
Всеволожск
Ломоносов
Санкт-Петербург
посёлок Металлострой
Санкт-Петербург
поселок городского типа Рощино
Санкт-Петербург
Кингисепп
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Новая Ладога
Санкт-Петербург
Санкт-Петербург
посёлок Парголово
Санкт-Петербург
Санкт-Петербург
Красное Село
Санкт-Петербург
Санкт-Петербург
Приозерск
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Шушары
коттеджный поселок Счастье
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Гатчина
посёлок Парголово
Санкт-Петербург
Санкт-Петербург
Ломоносов
Санкт-Петербург
Санкт-Петербург
посёлок Бугры
Кронштадт
посёлок Мурино
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Выборг
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Пудость
Санкт-Петербург
Кронштадт
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Понтонный
Никольское
поселок Мурино
Красное Село
посёлок Кобралово
Санкт-Петербург
посёло

Санкт-Петербург
Всеволожск
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
деревня Новое Девяткино
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Зеленогорск
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Волосово
Гатчина
Всеволожск
Пушкин
Санкт-Петербург
посёлок Шушары
деревня Яльгелево
посёлок Мурино
Санкт-Петербург
посёлок Ленинское
Гатчина
посёлок Парголово
Санкт-Петербург
Санкт-Петербург
Красное Село
Всеволожск
Санкт-Петербург
Санкт-Петербург
Колпино
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Бугры
Ивангород
Санкт-Петербург
Санкт-Петербург
Колпино
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
деревня Кудрово
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Гатчина
Санкт-Петербург
Санкт-Петербург
Гатчина
Санкт-Петербург
посёлок Парголово
Санкт-Петербург
городско

посёлок Мурино
Гатчина
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Колпино
Санкт-Петербург
Всеволожск
Санкт-Петербург
Всеволожск
Тосно
Кингисепп
Шлиссельбург
Санкт-Петербург
село Копорье
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Сестрорецк
Санкт-Петербург
Санкт-Петербург
деревня Кудрово
Санкт-Петербург
Коммунар
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Сестрорецк
Всеволожск
Санкт-Петербург
Санкт-Петербург
Колпино
поселок Молодцово
Санкт-Петербург
Санкт-Петербург
Сланцы
деревня Юкки
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
городской посёлок Янино-1
Сертолово
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
поселок Лукаши
посёлок Мурино
Коммунар
деревня Кудрово
Кириши
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Колпино
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Мурино
Санкт-Петербург
Санкт-Петербург
Санкт-Пе

Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Гатчина
Санкт-Петербург
Пушкин
посёлок Шушары
Санкт-Петербург
Санкт-Петербург
Луга
деревня Яльгелево
деревня Новое Девяткино
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
коттеджный поселок Кивеннапа Север
Санкт-Петербург
Санкт-Петербург
Всеволожск
поселок Коробицыно
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
деревня Старая
Санкт-Петербург
Сестрорецк
Санкт-Петербург
посёлок Шушары
Санкт-Петербург
Пушкин
Санкт-Петербург
Ломоносов
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Кингисепп
посёлок Парголово
Санкт-Петербург
Кириши
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Мурино
Санкт-Петербург
Петергоф
Санкт-Петербург
Тосно
Коммунар
Санкт-Петербург
Санкт-Петербург
Пушкин
посёлок городск

Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
деревня Бегуницы
Санкт-Петербург
посёлок городского типа Кузьмоловский
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Мурино
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
деревня Новое Девяткино
Кировск
Никольское
посёлок городского типа Кузьмоловский
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Шушары
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Пушкин
Санкт-Петербург
Санкт-Петербург
посёлок Мурино
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Пушкин
Санкт-Петербург
посёлок Шушары
Санкт-Петербург
Санкт-Петербург
посёлок Мурино
Санкт-Петербург
посёлок Мурино
Санкт-Петербург
Санкт-Петербург
Кудрово
Санкт-Петербург
Санкт-Петербург
посёлок Мурино
Выборг
деревня Кудрово
Санкт-Петербург
Санкт-Петербург
Пушкин
Сестрорецк
Сертолово
Санкт-Петербург
Санкт-Петербург
Пушкин
Санкт-П

Санкт-Петербург
Санкт-Петербург
Пушкин
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Всеволожск
Кингисепп
Сестрорецк
Санкт-Петербург
Тосно
поселок городского типа Рахья
Сестрорецк
Санкт-Петербург
деревня Ваганово
посёлок Пудость
Санкт-Петербург
Санкт-Петербург
Выборг
Сланцы
Отрадное
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Петергоф
Всеволожск
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Колпино
Санкт-Петербург
Сертолово
Каменногорск
Санкт-Петербург
Санкт-Петербург
Всеволожск
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Павловск
Санкт-Петербург
Санкт-Петербург
посёлок Мурино
Отрадное
Кингисепп
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
деревня Келози
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Петергоф
Санкт-Петербург
посёлок Стрельна
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Мурино
Кингисепп
деревня Гостилицы
Санкт-Петербург
Кингисепп
Санкт-Петербург
Санкт-Петербург
Сан

Гатчина
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
деревня Куттузи
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
поселок городского типа Токсово
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Гатчина
Санкт-Петербург
деревня Кудрово
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Мурино
Санкт-Петербург
Санкт-Петербург
посёлок Шушары
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Гатчина
Пушкин
Тосно
деревня Кудрово
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Мурино
Колпино
Санкт-Петербург
Сланцы
Санкт-Петербург
Пушкин
Санкт-Петербург
деревня Кудрово
Санкт-Петербург
посёлок Парголово
Волхов
Санкт-Петербург
Санкт-Петербург
Пушкин
Санкт-Петербург
посёлок городского типа Сиверский
Санкт-Петербург
Ломоносов
Санкт-Петербург
Санкт-Петербург
Выбо

Волхов
посёлок Шушары
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Сосновый Бор
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Парголово
Санкт-Петербург
Красное Село
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Гатчина
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Выборг
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Никольское
Санкт-Петербург
Санкт-Петербург
Сясьстрой
Санкт-Петербург
Выборг
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Поляны
Санкт-Петербург
Санкт-Петербург
Петергоф
Санкт-Петербург
Всеволожск
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
деревня Кудрово
деревня Низино
Санкт-Петербург
Санкт-Петербург
посёлок Шушары
Санкт-Петербург
Красное Село
Санкт-Петербург
Пушкин
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Гатчин

Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Кириши
Тосно
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Выборг
Санкт-Петербург
Санкт-Петербург
поселок городского типа Никольский
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Шушары
Отрадное
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
деревня Кудрово
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
деревня Кудрово
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Кировск
Санкт-Петербург
Санкт-Петербург
Шлиссельбург
Санкт-Петербург
Мурино
Санкт-Петербург
Санкт-Петербург
деревня Старая Пустошь
Санкт-Петербург
Пушкин
деревня Новое Девяткино
Петергоф
Санкт-Петербург
посёлок Петровское
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Шлиссельбург
Санкт-Петербург
Санкт-Петербург
посёлок Металлострой
Санкт-Петербург
Санкт-Петербург
посёлок Мурино
Санкт-Петербург
Санкт-Петербург
посёлок Парголово
Санкт-Пе

Сланцы
Санкт-Петербург
Кириши
Санкт-Петербург
Пушкин
Санкт-Петербург
Тихвин
Санкт-Петербург
Всеволожск
Коммунар
Санкт-Петербург
деревня Кудрово
Сертолово
Санкт-Петербург
Высоцк
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Ломоносов
деревня Новое Девяткино
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Всеволожск
Санкт-Петербург
Всеволожск
Санкт-Петербург
Санкт-Петербург
Колпино
Санкт-Петербург
Всеволожск
Санкт-Петербург
Санкт-Петербург
посёлок Шушары
Санкт-Петербург
Колпино
Гатчина
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
посёлок Мурино
деревня Рабитицы
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Выборг
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-Петербург
Санкт-

In [26]:
def title_name(s):
    out = []
    for i in s:
        no_lowercase = ' '.join([word for word in i.split(' ') if not word.islower()])
        out.append(no_lowercase)
    return out 

In [27]:
title_name(data['locality_name'])

['Санкт-Петербург',
 'Шушары',
 'Санкт-Петербург',
 'Санкт-Петербург',
 'Санкт-Петербург',
 'Янино-1',
 'Парголово',
 'Санкт-Петербург',
 'Мурино',
 'Санкт-Петербург',
 'Санкт-Петербург',
 'Ломоносов',
 'Сертолово',
 'Петергоф',
 'Пушкин',
 'Санкт-Петербург',
 'Санкт-Петербург',
 'Санкт-Петербург',
 'Санкт-Петербург',
 'Санкт-Петербург',
 'Парголово',
 'Санкт-Петербург',
 'Кудрово',
 'Санкт-Петербург',
 'Санкт-Петербург',
 'Санкт-Петербург',
 'Санкт-Петербург',
 'Санкт-Петербург',
 'Пушкин',
 'Санкт-Петербург',
 'Коммунар',
 'Санкт-Петербург',
 'Санкт-Петербург',
 'Колпино',
 'Санкт-Петербург',
 'Санкт-Петербург',
 'Санкт-Петербург',
 'Красный Бор',
 'Мурино',
 'Санкт-Петербург',
 'Парголово',
 'Санкт-Петербург',
 'Петергоф',
 'Санкт-Петербург',
 'Санкт-Петербург',
 'Санкт-Петербург',
 'Санкт-Петербург',
 'Гатчина',
 'Санкт-Петербург',
 'Санкт-Петербург',
 'Пушкин',
 'Санкт-Петербург',
 'Санкт-Петербург',
 'Парголово',
 'Санкт-Петербург',
 'Санкт-Петербург',
 'Санкт-Петербург',
 'Шушар

<div class="alert alert-info">
<b>Комментарий студента:</b>
<br>А сейчас встаим в столбец 'airports_nearest' расстояние до ближайшего аэропорта в метрах и сделаем, с помощью вставки 
в первую строку проекта библиотеки: from geopy.distance import geodesic as gd (определение расстояния между двумя географическими координатами) и from geopy.geocoders import Nominatim as nm (определение широты и долготы координат на карте)   
<br><br><b><i>Внимание!</i></b> Процесс опредения широты и долготы по данному населённому пункту происходит дольше обычного выполнения команды программ.<br>
</div>

In [28]:
city_point = []
app = nm(user_agent="GetLoc")

airport_Pulkovo = (app.geocode('аэропорт Пулково').raw['lat'], app.geocode('аэропорт Пулково').raw['lon'])

for value in title_name(data['locality_name'].unique()):
    point = (app.geocode(value).raw['lat'], app.geocode(value).raw['lon'])
    print(value, round(gd(airport_Pulkovo, point).m, 1))
    city_point.append([value, round(gd(airport_Pulkovo, point).m, 1)])  
    #data.loc[(data['airports_nearest'] != data['airports_nearest']) & (data['locality_name'] == value), 'airports_nearest'] = round(gd(airport_Pulkovo, point).m, 1) 
     

Санкт-Петербург 15508.0
Шушары 6108.5
Янино-1 23118.4
Парголово 31425.5
Мурино 29007.1
Ломоносов 30081.0
Сертолово 38249.8
Петергоф 21843.3
Пушкин 12150.6
Кудрово 18161.3
Коммунар 21186.8
Колпино 19833.4
Красный Бор 28053.4
Гатчина 26876.2
Мурино 29007.1
Фёдоровское 653878.8
Выборг 131674.5
Кронштадт 34719.0
Кировск 41219.4
Новое Девяткино 30831.8
Металлострой 17277.3
Лебяжье 50871.1
Сиверский 51238.1
Молодцово 46767.5
Кузьмоловский 36550.0
Новая Ропша 22734.2
Павловск 16007.3
Пикколово 13299.7
Всеволожск 32583.7
Волхов 116265.8
Кингисепп 105639.5
Приозерск 138030.9
Сестрорецк 37235.7
Куттузи 12100.9
Аннино 12585.5
Ефимовский 250587.2
Плодовое 1678500.7
Заклинье 214723.2
Торковичи 105157.9
Первомайское 68667.6
Красное Село 12696.9
Понтонный 20589.4
Сясьстрой 133645.4
Старая 24772.9
Лесколово 53513.9
Новый Свет 1427359.7
Сланцы 145265.4
Путилово 829020.2
Ивангород 125117.5
Мурино 29007.1
Шлиссельбург 45612.5
Никольское 31134.6
Зеленогорск 54021.8
Сосновый Бор 67603.0
Новый Свет 1427359.

In [29]:
for i in range(len(data['locality_name'])):
    data['locality_name'] = data['locality_name'].replace(data['locality_name'][i], title_name(data['locality_name'])[i])
display(data.head(10))

Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,...,kitchen_area,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition
0,20,13000000.0,108.0,2019-03-07T00:00:00,3,2.7,16,51.0,8,False,...,25.0,0,Санкт-Петербург,18863.0,16028.0,1.0,482.0,2.0,755.0,95
1,7,3350000.0,40.4,2018-12-04T00:00:00,1,,11,18.6,1,False,...,11.0,2,Шушары,12817.0,18603.0,0.0,0.0,0.0,0.0,81
2,10,5196000.0,56.0,2015-08-20T00:00:00,2,,5,34.3,4,False,...,8.3,0,Санкт-Петербург,21741.0,13933.0,1.0,90.0,2.0,574.0,558
3,0,64900000.0,159.0,2015-07-24T00:00:00,3,,14,,9,False,...,,0,Санкт-Петербург,28098.0,6800.0,2.0,84.0,3.0,234.0,424
4,2,10000000.0,100.0,2018-06-19T00:00:00,2,3.03,14,32.0,13,False,...,41.0,0,Санкт-Петербург,31856.0,8098.0,2.0,112.0,1.0,48.0,121
5,10,2890000.0,30.4,2018-09-10T00:00:00,1,,12,14.4,5,False,...,9.1,0,Янино-1,,,,,,,55
6,6,3700000.0,37.3,2017-11-02T00:00:00,1,,26,10.6,6,False,...,14.4,1,Парголово,52996.0,19143.0,0.0,0.0,0.0,0.0,155
7,5,7915000.0,71.6,2019-04-18T00:00:00,2,,24,,22,False,...,18.9,2,Санкт-Петербург,23982.0,11634.0,0.0,0.0,0.0,0.0,95
8,20,2900000.0,33.16,2018-05-23T00:00:00,1,,27,15.43,26,False,...,8.81,0,Мурино,,,,,,,189
9,18,5400000.0,61.0,2017-02-26T00:00:00,3,2.5,9,43.6,7,False,...,6.5,2,Санкт-Петербург,50898.0,15008.0,0.0,0.0,0.0,0.0,289


In [30]:
for item in city_point:
    data.loc[(data['airports_nearest'] != data['airports_nearest']) & (data['locality_name'] == item[0]), 'airports_nearest'] = item[1]
display(data.head(10))

Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,...,kitchen_area,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition
0,20,13000000.0,108.0,2019-03-07T00:00:00,3,2.7,16,51.0,8,False,...,25.0,0,Санкт-Петербург,18863.0,16028.0,1.0,482.0,2.0,755.0,95
1,7,3350000.0,40.4,2018-12-04T00:00:00,1,,11,18.6,1,False,...,11.0,2,Шушары,12817.0,18603.0,0.0,0.0,0.0,0.0,81
2,10,5196000.0,56.0,2015-08-20T00:00:00,2,,5,34.3,4,False,...,8.3,0,Санкт-Петербург,21741.0,13933.0,1.0,90.0,2.0,574.0,558
3,0,64900000.0,159.0,2015-07-24T00:00:00,3,,14,,9,False,...,,0,Санкт-Петербург,28098.0,6800.0,2.0,84.0,3.0,234.0,424
4,2,10000000.0,100.0,2018-06-19T00:00:00,2,3.03,14,32.0,13,False,...,41.0,0,Санкт-Петербург,31856.0,8098.0,2.0,112.0,1.0,48.0,121
5,10,2890000.0,30.4,2018-09-10T00:00:00,1,,12,14.4,5,False,...,9.1,0,Янино-1,23118.4,,,,,,55
6,6,3700000.0,37.3,2017-11-02T00:00:00,1,,26,10.6,6,False,...,14.4,1,Парголово,52996.0,19143.0,0.0,0.0,0.0,0.0,155
7,5,7915000.0,71.6,2019-04-18T00:00:00,2,,24,,22,False,...,18.9,2,Санкт-Петербург,23982.0,11634.0,0.0,0.0,0.0,0.0,95
8,20,2900000.0,33.16,2018-05-23T00:00:00,1,,27,15.43,26,False,...,8.81,0,Мурино,29007.1,,,,,,189
9,18,5400000.0,61.0,2017-02-26T00:00:00,3,2.5,9,43.6,7,False,...,6.5,2,Санкт-Петербург,50898.0,15008.0,0.0,0.0,0.0,0.0,289


In [31]:
city_point
for item in city_point:
    data.loc[(data['airports_nearest'] != data['airports_nearest']) & (data['locality_name'] == item[0]), 'airports_nearest'] = item[1] 
display(data.head(10))

Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,...,kitchen_area,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition
0,20,13000000.0,108.0,2019-03-07T00:00:00,3,2.7,16,51.0,8,False,...,25.0,0,Санкт-Петербург,18863.0,16028.0,1.0,482.0,2.0,755.0,95
1,7,3350000.0,40.4,2018-12-04T00:00:00,1,,11,18.6,1,False,...,11.0,2,Шушары,12817.0,18603.0,0.0,0.0,0.0,0.0,81
2,10,5196000.0,56.0,2015-08-20T00:00:00,2,,5,34.3,4,False,...,8.3,0,Санкт-Петербург,21741.0,13933.0,1.0,90.0,2.0,574.0,558
3,0,64900000.0,159.0,2015-07-24T00:00:00,3,,14,,9,False,...,,0,Санкт-Петербург,28098.0,6800.0,2.0,84.0,3.0,234.0,424
4,2,10000000.0,100.0,2018-06-19T00:00:00,2,3.03,14,32.0,13,False,...,41.0,0,Санкт-Петербург,31856.0,8098.0,2.0,112.0,1.0,48.0,121
5,10,2890000.0,30.4,2018-09-10T00:00:00,1,,12,14.4,5,False,...,9.1,0,Янино-1,23118.4,,,,,,55
6,6,3700000.0,37.3,2017-11-02T00:00:00,1,,26,10.6,6,False,...,14.4,1,Парголово,52996.0,19143.0,0.0,0.0,0.0,0.0,155
7,5,7915000.0,71.6,2019-04-18T00:00:00,2,,24,,22,False,...,18.9,2,Санкт-Петербург,23982.0,11634.0,0.0,0.0,0.0,0.0,95
8,20,2900000.0,33.16,2018-05-23T00:00:00,1,,27,15.43,26,False,...,8.81,0,Мурино,29007.1,,,,,,189
9,18,5400000.0,61.0,2017-02-26T00:00:00,3,2.5,9,43.6,7,False,...,6.5,2,Санкт-Петербург,50898.0,15008.0,0.0,0.0,0.0,0.0,289


'floors_total' (количество этажей в доме);
'airports_nearest' (расстояние до ближайшего аэропорта в метрах (м));
'parks_nearest' (расстояние до ближайшего парка);
'ponds_nearest'

<div class="alert alert-info">
<b>Комментарий студента:</b>
<br>
Теперь нужно заполнить пропущенные значения, но, к счастью, среди некоторых данных столбцов есть такие данные, которые можно логически определить чисто из здравого смысла, реже с помощью условий из других значений столбцов.<br>  
<br> Ими относятся: 
    <ul> 'is_apartment' (наличие аппартаментов); </ul>
    <ul> 'balcony' (наличие балконов); </ul>
    <ul> 'locality_name' (название населённого пункта); </ul>
    <ul> 'days_exposition' (длительность размещения объявления (от публикации до снятия)); </ul><br>, а также: 
    <ul> 'floors_total' (количество этажей в доме); </ul> 
    <ul> 'airports_nearest' (расстояние до ближайшего аэропорта в метрах (м)); </ul> 
    <ul> 'parks_nearest' (расстояние до ближайшего парка); </ul>
    <ul> 'ponds_nearest' (расстояние до ближайшего пруда). </ul>          
    
<br>    
    Судя на третьей строчке проектной работы по установлению параметров и проведению предобработки и исследовательского анализа данных с архивными объявлениями о продаже квартир в г. Санкт-Петербург: мы обнаруживаем, что вместо представления данных в столбцах: 'studio' (наличие квартиры-студии) и 'open_plan'. <br>
<br>
     Также данные столбцов 'balcony', 'floors_total', а также 'days_exposition' приведём к типу данных 'int' (насчёт столбца 'days_exposition' - ни один SEO-специалист не будет ослеживать длительность с точностью до минуты, для удобства длительность размещения объявления будет измеряться в целых числах дней).<br>
</div>

### Шаг 2.2 Приведение столбцов к нужным типам данных.

In [32]:
data['price_sqmetr'] = (data['last_price'] / data['total_area']).astype('int')
display(data.head(10))

Unnamed: 0,total_images,last_price,total_area,first_day_exposition,rooms,ceiling_height,floors_total,living_area,floor,is_apartment,...,balcony,locality_name,airports_nearest,cityCenters_nearest,parks_around3000,parks_nearest,ponds_around3000,ponds_nearest,days_exposition,price_sqmetr
0,20,13000000.0,108.0,2019-03-07T00:00:00,3,2.7,16,51.0,8,False,...,0,Санкт-Петербург,18863.0,16028.0,1.0,482.0,2.0,755.0,95,120370
1,7,3350000.0,40.4,2018-12-04T00:00:00,1,,11,18.6,1,False,...,2,Шушары,12817.0,18603.0,0.0,0.0,0.0,0.0,81,82920
2,10,5196000.0,56.0,2015-08-20T00:00:00,2,,5,34.3,4,False,...,0,Санкт-Петербург,21741.0,13933.0,1.0,90.0,2.0,574.0,558,92785
3,0,64900000.0,159.0,2015-07-24T00:00:00,3,,14,,9,False,...,0,Санкт-Петербург,28098.0,6800.0,2.0,84.0,3.0,234.0,424,408176
4,2,10000000.0,100.0,2018-06-19T00:00:00,2,3.03,14,32.0,13,False,...,0,Санкт-Петербург,31856.0,8098.0,2.0,112.0,1.0,48.0,121,100000
5,10,2890000.0,30.4,2018-09-10T00:00:00,1,,12,14.4,5,False,...,0,Янино-1,23118.4,,,,,,55,95065
6,6,3700000.0,37.3,2017-11-02T00:00:00,1,,26,10.6,6,False,...,1,Парголово,52996.0,19143.0,0.0,0.0,0.0,0.0,155,99195
7,5,7915000.0,71.6,2019-04-18T00:00:00,2,,24,,22,False,...,2,Санкт-Петербург,23982.0,11634.0,0.0,0.0,0.0,0.0,95,110544
8,20,2900000.0,33.16,2018-05-23T00:00:00,1,,27,15.43,26,False,...,0,Мурино,29007.1,,,,,,189,87454
9,18,5400000.0,61.0,2017-02-26T00:00:00,3,2.5,9,43.6,7,False,...,2,Санкт-Петербург,50898.0,15008.0,0.0,0.0,0.0,0.0,289,88524


In [33]:
#data['week_exposition'] = data['first_day_exposition'].dt.weekday 
#data['month_exposition'] = data['first_day_exposition'].dt.month 
#data['year_exposition'] = data['first_day_exposition'].dt.year 
#data = data.drop('first_day_exposition')
#display(data.head(30))

#data['week_exposition'] = data['first_day_exposition'].dt.round('1Y')


data['first_day_exposition'] = pd.date_range(data['first_day_exposition'])
#data['first_day_exposition'] = datetime(data['first_day_exposition'])


#data['week_exposition'] = data['first_day_exposition'].dt.weekday 
display(data.head(10))

ValueError: Of the four parameters: start, end, periods, and freq, exactly three must be specified

### Шаг 3.1 Подсчёт данных и добавление в новые столбцы.

### 0.4 Шаг 4.1 Проведите исследовательский анализ данных.

## 1 Общий вывод: