# Импортируем модули

In [1]:
# Для мониторинга выполнения циклов
from tqdm import tqdm_notebook, tqdm

# Для работы с табличными данными
import pandas as pd
# Для интерактивной работы с таблицами
import qgrid

# Для работы с операционной системой
import os

# Для работы с SQL
import sqlalchemy
from sqlalchemy import create_engine

# Для работы с картами
import folium
# Для работы с кластерами точек
from folium.plugins import MarkerCluster

# Для работы с HTTP-запросами 
import requests
from requests import ConnectTimeout, ConnectionError, ReadTimeout 
from requests.exceptions import ProxyError
import urllib

# Создадим функции и наборы данных

In [2]:
# Создадим подключние к dwh
engine = create_engine('postgres://volokzhanin:{password}@localhost:5432/volokzhanin'.format(password = os.getenv('PASSWORD1', False)))

In [3]:
def city_polygon(city = 'Владивосток') -> dict:
    """
    Функция для возвращения полигона города. 
    Вход: наименование города.
    Выход: gojson. 
    """
    url = 'https://nominatim.openstreetmap.org/search?'
    params = {'format' : 'json', 'limit' : '1', 'polygon_geojson' : '10', 'city' : city}
    city = requests.get(url, params = params)
    return city.json()[0]

# Получаем данные

## Поля сырых данных таблицы

Поле                          |  Значение                            
:-----------------------------|-----------------------------------
id                            | Идентификатор объявления
text                          | Текст объявления
clean_text                    | Очищенный текст
lem_text                      | Лемматизированный текст
image                         | Список ссылок на картинки
address                       | Адрес
status_house                  | Статус дома 
is_builder                    | Объявление от застройщика
price                         | Цена
area                          | Общая площадь
is_mortage                    | Подходит под ипотеку
floor                         | Этаж
url                           | url 
is_balcony                    | Наличие балкона
source                        | Источник
load_date                     | Дата загрузки данных

In [8]:
query = """
select 
		*
from 
		farpost.farpost
where 
		farpost.is_mortage = True
"""
# Получаем lданные по квартирам
raw_flats_df = pd.read_sql(
    con = engine,
    sql = query
)

# # Запишем данные в csv
# raw_flats_df.to_csv(
#     '/mnt/sda1/Documents/Projects/web_scraping_flats/data/result.csv', 
#     index = False
# )

# Посмотримм данные
raw_flats_df.head()

Unnamed: 0,id,title,text,clean_text,lem_text,image,address,status_house,is_builder,price,area,is_mortage,floor,url,is_balcony,img_main,longitude,latitude,load_date
0,77550371,2-комнатная квартира в ЖК Восточный луч на Сне...,"Центр продажи недвижимости ""Максимум"" предлага...",2 комнатная квартира в жк восточный луч на сне...,2 комнатный квартира в жк восточный луч на сне...,[https://static.baza.farpost.ru/v/157292451639...,"Россия, Приморский край, Владивосток, улица Ад...",False,False,4817600,60.0,True,,https://www.farpost.ru/vladivostok/realty/sell...,False,https://static.baza.farpost.ru/v/1572924516394,131.956652,43.166348,2019-11-06 22:19:47
1,70072955,1-комнатная квартира в новом доме на Нейбута,Квартира от застройщика - без посредников и до...,1 комнатная квартира в новом доме на нейбута к...,1 комнатный квартира в новый дом на нейбут ква...,[https://static.baza.farpost.ru/v/157178581309...,"Россия, Приморский край, Владивосток, улица Не...",False,True,3829500,41.0,True,13-й в 25-этажном здании,https://www.farpost.ru/vladivostok/realty/sell...,False,https://static.baza.farpost.ru/v/1571785813090,131.962627,43.103268,2019-11-06 22:19:36
2,70635567,2-комнатная квартира в новом доме на Нейбута,Квартира от застройщика - без посредников и до...,2 комнатная квартира в новом доме на нейбута к...,2 комнатный квартира в новый дом на нейбут ква...,[https://static.baza.farpost.ru/v/157225017902...,"Россия, Приморский край, Владивосток, улица Не...",False,True,4376100,50.0,True,21-й в 25-этажном здании,https://www.farpost.ru/vladivostok/realty/sell...,False,https://static.baza.farpost.ru/v/1572250179023,131.962627,43.103268,2019-11-06 22:20:04
3,70071163,2-комнатная квартира в новом доме на Нейбута,Квартира от застройщика - без посредников и до...,2 комнатная квартира в новом доме на нейбута к...,2 комнатный квартира в новый дом на нейбут ква...,[https://static.baza.farpost.ru/v/156740198082...,"Россия, Приморский край, Владивосток, улица Не...",False,True,4576200,52.0,True,5-й в 25-этажном здании,https://www.farpost.ru/vladivostok/realty/sell...,False,https://static.baza.farpost.ru/v/1567401980827,131.962627,43.103268,2019-11-06 22:19:54
4,70073177,2-комнатная квартира в новом доме на Нейбута,Квартира от застройщика - без посредников и до...,2 комнатная квартира в новом доме на нейбута к...,2 комнатный квартира в новый дом на нейбут ква...,[https://static.baza.farpost.ru/v/156740139946...,"Россия, Приморский край, Владивосток, улица Не...",False,True,5280000,60.0,True,11-й в 25-этажном здании,https://www.farpost.ru/vladivostok/realty/sell...,False,https://static.baza.farpost.ru/v/1567401399469,131.962627,43.103268,2019-11-06 22:19:56


In [12]:
# # Загружаем данные из csv
# raw_flats_df = pd.read_csv('/mnt/sda1/Documents/Projects/web_scraping_flats/data/result.csv')
# raw_flats_df.head()

In [10]:
# Получаем полигон Владивсотока
polygon_vladivostok = city_polygon() 

# Визуализируем данные

In [13]:
# Фильтруем данные
filtered_df = qgrid.show_grid(raw_flats_df)
filtered_df

QgridWidget(grid_options={'fullWidthRows': True, 'syncColumnCellResize': True, 'forceFitColumns': True, 'defau…

In [14]:
# Нарисуем карту
latlon = filtered_df.get_changed_df()
latlon.reset_index(drop = True, inplace = True)
center = [filtered_df.get_changed_df()['latitude'].mean(), filtered_df.get_changed_df()['longitude'].mean()]
zoom = 11

# Нарисуем и отобразим карту
m = folium.Map(
    width = '100%', 
    height = '100%',
    location = center,
    zoom_start = zoom,
    tiles = 'OpenStreetMap'
)

# Передадим координаты в кластера 
marker_cluster = MarkerCluster().add_to(m)

# Нарисуем полигон
folium.GeoJson(polygon_vladivostok['geojson']).add_to(m)

for i in range(len(latlon)): 
    folium.Marker(
        location = [latlon.latitude[i], latlon.longitude[i]],
        popup = '<b> Цена: </b>' + '{:,}'.format(latlon.price[i]) + ' руб. ' '<br/>' \
        + '<b> Площадь: </b>' + str(latlon['area'][i]) + ' кв.м' + '<br/>' \
        + '<b> Ссылка: </b>' + '<a href="' + latlon.url[i] + '">' +  latlon.title[i] + '</a><br/>' \
        + '<b> Картинка: </b>' + "<img style='zoom:25%;' src=" + latlon.img_main[i] + '>' + '<br/>',
        icon = folium.Icon(color = 'red', icon = 'ok-sign')
).add_to(marker_cluster)

m