# Подключение

In [68]:
import pyodbc

In [69]:
conn = pyodbc.connect('DRIVER={SQL Server};SERVER=10.199.13.60;DATABASE=rway;UID=vkomarnitskii;PWD=Rway1')
cursor = conn.cursor()


## Pandas

In [70]:
import pandas as pd
from math import isnan
from numpy import float64
from pprint import pprint

Тут можно установить параметры отображения для pandas. Сколько показывать строк и столбцов соответственно.

In [71]:
pd.options.display.max_rows = 100
pd.options.display.max_columns = 150

### Отладка


In [72]:
def benchmark(func):
    """
    Декоратор, выводящий время, которое заняло
    выполнение декорируемой функции
    """
    import time
    
    def wrapper(*args, **kwargs):
        t = time.time()
        res = func(*args, **kwargs)
        print(f'{func.__name__} выполнилась за время {time.time() - t:.2f}s')
        return res
    
    return wrapper

## Необходимые функции

Позволяет получить список характеристик для всех предложений из задачи `task_id`. 

In [73]:
@benchmark
def get_harks_by_object_keys(task_id):
    """
    Позволяет получить список характеристик для всех предложений из задачи task_id. 
    :param task_id: id задачи
    :type task_id: str
    :return: DataFrame, в котором указаны характеристики и их значения для всех объектов из задачи task_id
    """
    
#     in_expr = f'({", ".join(list_of_keys)})'
    query = '''
    SELECT
    t_har.Наименование,
    CASE 
        WHEN t.Значение_Тип = 04 THEN CAST(t.Значение_Дата AS varchar)
        WHEN t.Значение_Тип = 03 THEN CAST(t.Значение_Число AS varchar)
        WHEN t.Значение_Тип = 05 THEN t.Значение_Строка
        WHEN t.Значение_Тип = 08 THEN 
        COALESCE(
            (SELECT Наименование FROM [rway].[Справочник].[ДополнительныеЗначенияХарактеристик] t_dop WHERE t_dop.Ссылка = t.Значение),
            (SELECT Наименование FROM [rway].[Справочник].[ТипыОбъектовНедвижимости] t_types WHERE t_types.Ссылка = t.Значение),
            (SELECT Наименование FROM [rway].[Перечисление].[ТипыСделки] t_types_1 WHERE t_types_1.Ссылка = t.Значение),
            (SELECT Наименование FROM [rway].[Перечисление].[ЛогическиеЗначения] t_logic WHERE t_logic.Ссылка = t.Значение),
            (SELECT Наименование FROM [rway].[Перечисление].[ТипыВерифицированности] t_verif WHERE t_verif.Ссылка = t.Значение),
            (SELECT Наименование FROM [rway].[Справочник].[ПодСегменты] t_podseg WHERE t_podseg.Ссылка = t.Значение),
            (SELECT Наименование FROM [rway].[Справочник].[Застройщики] t_zastr WHERE t_zastr.Ссылка = t.Значение),
            (SELECT Наименование FROM [rway].[Справочник].[ОстановкиОбщественногоТранспорта] t_stations WHERE t_stations.Ссылка = t.Значение)                  
        )
    END
        AS Значение,
    t.Объект AS Ссылка
FROM [rway].[РегистрСведений].[ЗначенияХарактеристик] t
    INNER JOIN [rway].[ПВХ].[Характеристики] t_har
        ON t_har.[Ссылка] = t.[Характеристика]
    INNER JOIN [rway].[РегистрСведений].[ПредложенияЗадач] reg_task
        ON reg_task.Предложение = t.Объект
        AND reg_task.Задача in (
            SELECT
                task._IDRRef AS Ссылка
            FROM [rway].[dbo].[_Task62] task
            JOIN [rway].[Документ].[Задание] tasks
                ON task._Fld192RRef = tasks.Ссылка
            JOIN [rway].[Справочник].[ТипыЗадач] types
                ON types.Ссылка = task._Fld231RRef AND types.Наименование = 'Импорт'
            WHERE tasks.КодЗадания = '{}')
    '''.format(task_id)
    
    cursor.execute(query)
#     data_df = pd.read_sql(sql=query, con=conn)

    # Преобразование данных, которые вернул запрос в список списков, одновременно все байты преобразуются в hex
    data = list(map(lambda x: list(x), cursor.fetchall()))
    data_df = pd.DataFrame(data, columns=list(map(lambda x: x[0], cursor.description)))
    # Создание словаря для DataFrame
    return data_df.pivot(index='Ссылка', columns='Наименование', values='Значение')

    

Функция позволяет получить все предложения по конкретному заданию. Задание указывается в виде строки id задания.

`'0001-0405'`

In [74]:
@benchmark
def get_base_info_by_task_id(task_id, offers_count=None):
    """
    :param task_id: id задания
    :param offers_count: Количество предложений для выбора из базы (пустое для выбора всех предложений)
    :type task_id: str
    :return: DataFrame, содержащий все поля, которые можно получить из таблицы "ПредложенияЗадач"
    """
    
    # Запрос к дате задания
    date = cursor.execute("SELECT Дата FROM [rway].[Документ].[Задание] WHERE КодЗадания = '{}'".format(task_id)).fetchone()
    
    top = '' if not offers_count else 'TOP {}'.format(offers_count)
    query = '''
    SELECT {top}
          t.Код,
          t.Ссылка,
          t_task._Fld198 AS КодЗадачи,
          t_source.Наименование AS Источник,
          t.АдресAhunter,
          t.АктуальнаяСсылкаИсточника,
          t.ДатаПересмотраЭкспозиции,
          t.ДатаПроверкиАктуальности,
          t.ДатаРазмещения,
          t.Город,
          t.Описание,
          (SELECT Наименование FROM [rway].[Справочник].[Подсегменты] WHERE Ссылка = t.Подсегмент) AS Подсегмент,
          (SELECT Наименование FROM [rway].[Справочник].[Сегменты] WHERE Ссылка = t.Сегмент) AS Сегмент,
          (SELECT Наименование FROM [rway].[Справочник].[СубъектыРФ] WHERE Ссылка = t.Субъект) AS Субъект,
          t.СсылкаИсточника,
          (SELECT Значение FROM [rway].[Перечисление].[ТипыРынка] WHERE Ссылка = t.ТипРынка) AS ТипРынка,
          (SELECT Значение FROM [rway].[Перечисление].[ТипыСделки] WHERE Ссылка = t.ТипСделки) AS ТипСделки
    FROM [rway].[Справочник].[ПредложенияОбъектовНедвижимости] t
        JOIN [rway].[РегистрСведений].[ПредложенияЗадач] t_offer
            ON Ссылка = t_offer.[Предложение]
        JOIN [rway].[dbo].[_Task62] t_task
            ON t_task.[_IDRRef] = t_offer.[Задача] AND t_task.[_IDRRef] in (
            SELECT
                task._IDRRef AS Ссылка
            FROM [rway].[dbo].[_Task62] task
            JOIN [rway].[Документ].[Задание] tasks
                ON task._Fld192RRef = tasks.Ссылка
            JOIN [rway].[Справочник].[ТипыЗадач] types
                ON types.Ссылка = task._Fld231RRef AND types.Наименование = 'Импорт'
            WHERE tasks.КодЗадания = '{task_id}')
        JOIN [rway].[Справочник].[Источники] t_source
            ON t_source.Ссылка = ИсточникИнформации

    '''.format(top=top, task_id=task_id)
    
    cursor.execute(query)    
    data = cursor.fetchall()
    # Те же самые преобрзования, как в функции с характеристиками
    df = pd.DataFrame(map(lambda x: list(x), data))
    df.columns = list(map(lambda x: x[0].replace('.', '_'), cursor.description))
    df['КодЗадания'] = task_id
    df['ДатаЗадания'] = date[0]
#     df = pd.read_sql(sql=query, con=conn)
    return df
    

# Боевой запуск

In [75]:
# Сбор основных данных из "ПредложенияОбъектовНедвижимости"
base_df = get_base_info_by_task_id('0001-0405')

get_base_info_by_task_id выполнилась за время 34.52s


In [76]:
base_df


Unnamed: 0,Код,Ссылка,КодЗадачи,Источник,АдресAhunter,АктуальнаяСсылкаИсточника,ДатаПересмотраЭкспозиции,ДатаПроверкиАктуальности,ДатаРазмещения,Город,Описание,Подсегмент,Сегмент,Субъект,СсылкаИсточника,ТипРынка,ТипСделки,КодЗадания,ДатаЗадания
0,190725W00083177,b'\x80J\xc9^W\xa5-PE\x89\xed\xe7\xc8J\xa5\x0f',0001-0405-0011,КУПИ.ру,обл Магаданская,,2019-07-25 00:00:00,2019-07-25 14:27:01,2019-07-25 00:00:00,,нет данных,,Коммерческая Недвижимость,Магаданская обл,https://qp.ru/?standart=true,Вторичный,,0001-0405,2019-07-24 13:52:21
1,190725W00118461,b'\x80p\xc4^)\x1bKDKJ\xcb\x98\xa9l\xd6D',0001-0405-0011,КУПИ.ру,обл Магаданская,,2019-07-25 00:00:00,2019-07-25 15:01:32,2019-07-25 00:00:00,,нет данных,,Коммерческая Недвижимость,Магаданская обл,https://qp.ru/?standart=true,Вторичный,,0001-0405,2019-07-24 13:52:21
2,190725W00143303,b'\x81J\xa7\x9d-\x92\x9b\x8bL\xa3D_#\x9b|\x8c',0001-0405-0011,КУПИ.ру,обл Магаданская,,2019-07-25 00:00:00,2019-07-25 15:30:38,2019-07-25 00:00:00,,нет данных,,Коммерческая Недвижимость,Магаданская обл,https://qp.ru/?standart=true,Вторичный,,0001-0405,2019-07-24 13:52:21
3,190725W00088154,b'\x82\x1b\x8dExG|pBB1\xf6\xc6~\xfes',0001-0405-0011,КУПИ.ру,обл Магаданская,,2019-07-25 00:00:00,2019-07-25 14:31:52,2019-07-25 00:00:00,,нет данных,,Коммерческая Недвижимость,Магаданская обл,https://qp.ru/?standart=true,Вторичный,,0001-0405,2019-07-24 13:52:21
4,190725W00113236,b'\x82<x\xf5\xb0\xa2x\xd6N\xfd#b\xe1\xa2\xfa%',0001-0405-0011,КУПИ.ру,обл Магаданская,,2019-07-25 00:00:00,2019-07-25 14:57:49,2019-07-25 00:00:00,,нет данных,,Коммерческая Недвижимость,Магаданская обл,https://qp.ru/?standart=true,Вторичный,,0001-0405,2019-07-24 13:52:21
5,190725W00083083,b'\x82N\x91{\xf0\xaf\x10\xf7M\xa4\xe7\xcb\xc5n...,0001-0405-0011,КУПИ.ру,обл Магаданская,,2019-07-25 00:00:00,2019-07-25 14:28:08,2019-07-25 00:00:00,,нет данных,,Коммерческая Недвижимость,Магаданская обл,https://qp.ru/?standart=true,Вторичный,,0001-0405,2019-07-24 13:52:21
6,190725W00118615,b'\x82_\xbc(\xa2\x98_\xeaM\x93\x91\xcbs\xf9fR',0001-0405-0011,КУПИ.ру,,,2019-07-25 00:00:00,2019-07-25 15:02:45,2019-07-25 00:00:00,,нет данных,,Коммерческая Недвижимость,Москва г,https://moskva.qp.ru/?standart=true,Вторичный,,0001-0405,2019-07-24 13:52:21
7,190725W00113047,"b""\x82s\x9b\x89_'\xae\xd0M\xccg\xb2K4f[""",0001-0405-0011,КУПИ.ру,обл Магаданская,,2019-07-25 00:00:00,2019-07-25 14:58:34,2019-07-25 00:00:00,,нет данных,,Коммерческая Недвижимость,Магаданская обл,https://qp.ru/?standart=true,Вторичный,,0001-0405,2019-07-24 13:52:21
8,190725W00113048,b'\x82\xd2\x8b)>f\xc4\x0fF\x8f\xe7\xdcY\x9f\xd9!',0001-0405-0011,КУПИ.ру,обл Магаданская,,2019-07-25 00:00:00,2019-07-25 14:58:45,2019-07-25 00:00:00,,нет данных,,Коммерческая Недвижимость,Магаданская обл,https://qp.ru/?standart=true,Вторичный,,0001-0405,2019-07-24 13:52:21
9,190725W00108336,b'\x83\n\x9ea\xe7\x85\xf4\x95MU\n\x13\x8b.T\x92',0001-0405-0011,КУПИ.ру,обл Магаданская,,2019-07-25 00:00:00,2019-07-25 14:50:02,2019-07-25 00:00:00,,нет данных,,Коммерческая Недвижимость,Магаданская обл,https://qp.ru/?standart=true,Вторичный,,0001-0405,2019-07-24 13:52:21


In [77]:
# Сбор характеристик по ссылкам из основного DataFrame base_df
har_df = get_harks_by_object_keys('0001-0405')

get_harks_by_object_keys выполнилась за время 524.04s


In [78]:
har_df

Наименование,3.Муниципальное Образование,5.Внутригородской Район,7.Улица,8.Дом,Адрес (временная),Ближайшая Станция Метро,Водоснабжение,Высота Потолков,ГеоКод Долгота,ГеоКод Широта,Год Постройки,Дата Сбора Информации,Заголовок,Интернет,Класс Объекта,Количество Комнат,Количество Этажей,Кондиционирование,Лифты,Материал Наружных Стен,Минут До Ближайшей Станции Метро,Мощность Электричества,НДС,Назначение Объекта Предложения,Наличие Отделки Помещений,Общая Площадь Предложения,Ориентир,Отдельный Вход,Охрана Предложения,"Парковка Наземная, Количество м/м",Планировка Помещения,Площадь Всего Объекта,Площадь Земельного Участка Объекта,Пожаротушение,Попадает в полигон,Предмет Сделки,Продавец,Размерность Площади,Размерность Стоимости,Расположение Относительно Первой Линии Домов,Расстояние До Ближайщей Станции Метро,Система Вентиляции,Способ Реализации,Статус Строительства,Субъект РФ,Телефон Продавца,Температурный Режим Склада,Тип Объекта,Тип Парковки,Тип объекта недвижимости,Управляющая Компания,Цена,Цена Предложения За 1 кв.м.,Электричество,Этаж
Ссылка,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1,Unnamed: 24_level_1,Unnamed: 25_level_1,Unnamed: 26_level_1,Unnamed: 27_level_1,Unnamed: 28_level_1,Unnamed: 29_level_1,Unnamed: 30_level_1,Unnamed: 31_level_1,Unnamed: 32_level_1,Unnamed: 33_level_1,Unnamed: 34_level_1,Unnamed: 35_level_1,Unnamed: 36_level_1,Unnamed: 37_level_1,Unnamed: 38_level_1,Unnamed: 39_level_1,Unnamed: 40_level_1,Unnamed: 41_level_1,Unnamed: 42_level_1,Unnamed: 43_level_1,Unnamed: 44_level_1,Unnamed: 45_level_1,Unnamed: 46_level_1,Unnamed: 47_level_1,Unnamed: 48_level_1,Unnamed: 49_level_1,Unnamed: 50_level_1,Unnamed: 51_level_1,Unnamed: 52_level_1,Unnamed: 53_level_1,Unnamed: 54_level_1,Unnamed: 55_level_1
b'\x80\x00\x01#\xc4QYuC\x82\xf6\xb5\xe4kfm',,,Рябикова ул,дом № 75,,,,,48.289042,54.272843,,2019-07-22 00:00:00,Сдаю свободного назначения помещение 190.0 м² ...,,,,,,,,,,,торговая площадь,,190.000000,,,,,,,,,,,Костя,кв.м.,руб./мес.,,,,Без Проведения Торгов,,,(951) 0987299,,,,,,25000.000000,131.578947,,1
b'\x80\x00\x02\x9c|\xb3%\x9cG\x8fmJ\x8f\xc9\xef\xd8',,,Космонавтов пр-кт,дом № 32В/21В,,,,,39.713863,47.296090,,2019-07-25 15:57:00,"Аренда коммерческой недвижимости, 35 м2, Росто...",,,,0.000000,,,,,,,торговая площадь,,35.000000,,,,,,,,,,,Продавец,кв.м.,руб./мес.,,,,Без Проведения Торгов,,,(928) 2266935,,,,,,26000.000000,742.857143,,2
b'\x80\x00\x04\x8a=+\xc1pHh)\xdc\xbbF\x9f\xe5',,,Рыбинская 3-я ул,"дом № 18, строение 1",,,,,37.659127,55.789683,,2019-07-22 00:00:00,"Аренда коммерческой недвижимости, 286м 2, Моск...",,,,,,,,,,,офис,,286.000000,,,,,,,,,,,Продавец,кв.м.,руб.,,,,Без Проведения Торгов,,,(926) 9175628,,,,,,572000.000000,2000.000000,,"6, 2, 5"
b'\x80\x00\x05\x02\xb5\xa2\xcf\x86MG\x7fJ\xe70M&',,,им Бабушкина ул,,,,,,38.955820,45.049704,0.000000,2019-07-25 20:40:12,"Офис, 1600 м2, им Бабушкина,-",,,,5.000000,,,,,,,офис,Чистовая,1600.000000,,,,,,,,,,,"Тарасова Евгения, Агентство",кв.м.,руб./мес.,,0.000000,,Без Проведения Торгов,,,(967) 9300021,,бизнес-центр,,бизнес-центр,,183700.000000,114.812500,,5
"b""\x80\x00\x06~\xb0'\xa1\x06B\xf1\x81\x91\x84Fe\x04""",,,Мира пр-кт,дом № 40,,,,,37.633949,55.780205,,2019-07-25 21:54:35,"Помещение свободного назначения м. Пр.Мира, 27...",,,,,,,,,,,офис,,276.000000,,,,,,,,,,,Городской Департамент Недвижимости,кв.м.,руб./мес.,,,,Без Проведения Торгов,,,(958) 7696931,,,,,,720000.000000,2608.695652,,9
b'\x80\x00\x14\xcb3\x0f\xa3QO\x01\x11r\x19\xd4\x8f\x16',,,Ленина пр-кт,дом № 112Б,,,,0.000000,37.581900,54.154391,0.000000,2019-07-26 11:46:39,"Свободное назначение, 74 м2",,,,9.000000,,,,,0.000000,Включая,свободное,,74.000000,,Отдельный Вход,,0.000000,,74.000000,0.000000,,,,Сергей Парфенов,кв.м.,руб./мес.,,0.000000,,Без Проведения Торгов,Действующий,,(906) 5310114,,,,жилой дом,,58978.000000,797.000000,,
b'\x80\x00\x15\xf3\xc32#n@\xb6!F_V\xcd\xa6',,,Кирова пр-кт,дом № 143,,,,,,,0.000000,2019-07-25 14:13:16,"Помещение свободного назначения, 72 м 2",,,,0.000000,,,,,,,парикмахерская,,72.000000,,,,,,,,,,,Павел,кв.м.,руб./мес.,,0.000000,,Без Проведения Торгов,,,(927) 6927576,,,,,,40000.000000,555.555556,,
b'\x80\x00\x16\x1cP\xb6\x89\xb2Gp)\xda\x8f\x14\xdbq',,,,,,,,0.000000,0.000000,0.000000,0.000000,2019-07-26 09:12:35,"Продается земельный участок, всего этажей: 1, ...",,,,0.000000,,,,,,,,,0.000000,,,,,,,,,,,"АН Новожилов Администратор, АН Новожилов Админ...",кв.м.,руб.,,,,Без Проведения Торгов,,,+7(920)159-56-29,,,,,,294000.000000,,,
b'\x80\x00\x16\xb4\x0e\xd20\x85O\x85i{\x11\x01\x0f\xc5',,,Катушечная ул,,,,,,40.944524,57.779600,0.000000,2019-07-25 16:12:57,"Помещение под торговлю, 75 м2, Катушечная улица",,,,5.000000,,,,,,,торговая площадь,,75.000000,,,,,,,,,,,Агентство,кв.м.,руб./мес.,,0.000000,,Без Проведения Торгов,,,(962) 1802080,,,,,,37500.000000,500.000000,,1
"b""\x80\x00\x1f1\x96m\x81'B\xb5\xbe\xff\xae\xbb\xd6\xe2""",,,Оптиков ул,дом № 30,,,,,30.220158,59.999161,,2019-07-25 17:36:54,"Сдаю коммерческую недвижимость, 2300 м2, Санкт...",,,,0.000000,,,,,,,магазин,,2300.000000,,,,,,,,,,,Продавец,кв.м.,руб./мес.,,,,Без Проведения Торгов,,,(964) 3992237,,,,,,3450000.000000,1500.000000,,0


In [79]:
# Собираем обе таблицы в одну большую
result_df = pd.merge(base_df, har_df, on='Ссылка', how='left')

In [80]:
result_df

Unnamed: 0,Код,Ссылка,КодЗадачи,Источник,АдресAhunter,АктуальнаяСсылкаИсточника,ДатаПересмотраЭкспозиции,ДатаПроверкиАктуальности,ДатаРазмещения,Город,Описание,Подсегмент,Сегмент,Субъект,СсылкаИсточника,ТипРынка,ТипСделки,КодЗадания,ДатаЗадания,3.Муниципальное Образование,5.Внутригородской Район,7.Улица,8.Дом,Адрес (временная),Ближайшая Станция Метро,Водоснабжение,Высота Потолков,ГеоКод Долгота,ГеоКод Широта,Год Постройки,Дата Сбора Информации,Заголовок,Интернет,Класс Объекта,Количество Комнат,Количество Этажей,Кондиционирование,Лифты,Материал Наружных Стен,Минут До Ближайшей Станции Метро,Мощность Электричества,НДС,Назначение Объекта Предложения,Наличие Отделки Помещений,Общая Площадь Предложения,Ориентир,Отдельный Вход,Охрана Предложения,"Парковка Наземная, Количество м/м",Планировка Помещения,Площадь Всего Объекта,Площадь Земельного Участка Объекта,Пожаротушение,Попадает в полигон,Предмет Сделки,Продавец,Размерность Площади,Размерность Стоимости,Расположение Относительно Первой Линии Домов,Расстояние До Ближайщей Станции Метро,Система Вентиляции,Способ Реализации,Статус Строительства,Субъект РФ,Телефон Продавца,Температурный Режим Склада,Тип Объекта,Тип Парковки,Тип объекта недвижимости,Управляющая Компания,Цена,Цена Предложения За 1 кв.м.,Электричество,Этаж
0,190725W00083177,b'\x80J\xc9^W\xa5-PE\x89\xed\xe7\xc8J\xa5\x0f',0001-0405-0011,КУПИ.ру,обл Магаданская,,2019-07-25 00:00:00,2019-07-25 14:27:01,2019-07-25 00:00:00,,нет данных,,Коммерческая Недвижимость,Магаданская обл,https://qp.ru/?standart=true,Вторичный,,0001-0405,2019-07-24 13:52:21,,,,,",",,,,,,,2019-07-25 14:27:01,,,,,0.000000,,,,,,,,,0.000000,,,,,,,,,,,,кв.м.,,,,,Без Проведения Торгов,,,нет данных,,,,,,0.000000,,,
1,190725W00118461,b'\x80p\xc4^)\x1bKDKJ\xcb\x98\xa9l\xd6D',0001-0405-0011,КУПИ.ру,обл Магаданская,,2019-07-25 00:00:00,2019-07-25 15:01:32,2019-07-25 00:00:00,,нет данных,,Коммерческая Недвижимость,Магаданская обл,https://qp.ru/?standart=true,Вторичный,,0001-0405,2019-07-24 13:52:21,,,,,",",,,,,,,2019-07-25 15:01:32,,,,,0.000000,,,,,,,,,0.000000,,,,,,,,,,,,кв.м.,,,,,Без Проведения Торгов,,,нет данных,,,,,,0.000000,,,
2,190725W00143303,b'\x81J\xa7\x9d-\x92\x9b\x8bL\xa3D_#\x9b|\x8c',0001-0405-0011,КУПИ.ру,обл Магаданская,,2019-07-25 00:00:00,2019-07-25 15:30:38,2019-07-25 00:00:00,,нет данных,,Коммерческая Недвижимость,Магаданская обл,https://qp.ru/?standart=true,Вторичный,,0001-0405,2019-07-24 13:52:21,,,,,",",,,,,,,2019-07-25 15:30:38,,,,,0.000000,,,,,,,,,0.000000,,,,,,,,,,,,кв.м.,,,,,Без Проведения Торгов,,,нет данных,,,,,,0.000000,,,
3,190725W00088154,b'\x82\x1b\x8dExG|pBB1\xf6\xc6~\xfes',0001-0405-0011,КУПИ.ру,обл Магаданская,,2019-07-25 00:00:00,2019-07-25 14:31:52,2019-07-25 00:00:00,,нет данных,,Коммерческая Недвижимость,Магаданская обл,https://qp.ru/?standart=true,Вторичный,,0001-0405,2019-07-24 13:52:21,,,,,",",,,,,,,2019-07-25 14:31:52,,,,,0.000000,,,,,,,,,0.000000,,,,,,,,,,,,кв.м.,,,,,Без Проведения Торгов,,,нет данных,,,,,,0.000000,,,
4,190725W00113236,b'\x82<x\xf5\xb0\xa2x\xd6N\xfd#b\xe1\xa2\xfa%',0001-0405-0011,КУПИ.ру,обл Магаданская,,2019-07-25 00:00:00,2019-07-25 14:57:49,2019-07-25 00:00:00,,нет данных,,Коммерческая Недвижимость,Магаданская обл,https://qp.ru/?standart=true,Вторичный,,0001-0405,2019-07-24 13:52:21,,,,,",",,,,,,,2019-07-25 14:57:49,,,,,0.000000,,,,,,,,,0.000000,,,,,,,,,,,,кв.м.,,,,,Без Проведения Торгов,,,нет данных,,,,,,0.000000,,,
5,190725W00083083,b'\x82N\x91{\xf0\xaf\x10\xf7M\xa4\xe7\xcb\xc5n...,0001-0405-0011,КУПИ.ру,обл Магаданская,,2019-07-25 00:00:00,2019-07-25 14:28:08,2019-07-25 00:00:00,,нет данных,,Коммерческая Недвижимость,Магаданская обл,https://qp.ru/?standart=true,Вторичный,,0001-0405,2019-07-24 13:52:21,,,,,",",,,,,,,2019-07-25 14:28:08,,,,,0.000000,,,,,,,,,0.000000,,,,,,,,,,,,кв.м.,,,,,Без Проведения Торгов,,,нет данных,,,,,,0.000000,,,
6,190725W00118615,b'\x82_\xbc(\xa2\x98_\xeaM\x93\x91\xcbs\xf9fR',0001-0405-0011,КУПИ.ру,,,2019-07-25 00:00:00,2019-07-25 15:02:45,2019-07-25 00:00:00,,нет данных,,Коммерческая Недвижимость,Москва г,https://moskva.qp.ru/?standart=true,Вторичный,,0001-0405,2019-07-24 13:52:21,,,,,",",,,,,,,2019-07-25 15:02:45,,,,,0.000000,,,,,,,,,0.000000,,,,,,,,,,,,кв.м.,,,,,Без Проведения Торгов,,,нет данных,,,,,,0.000000,,,
7,190725W00113047,"b""\x82s\x9b\x89_'\xae\xd0M\xccg\xb2K4f[""",0001-0405-0011,КУПИ.ру,обл Магаданская,,2019-07-25 00:00:00,2019-07-25 14:58:34,2019-07-25 00:00:00,,нет данных,,Коммерческая Недвижимость,Магаданская обл,https://qp.ru/?standart=true,Вторичный,,0001-0405,2019-07-24 13:52:21,,,,,",",,,,,,,2019-07-25 14:58:34,,,,,0.000000,,,,,,,,,0.000000,,,,,,,,,,,,кв.м.,,,,,Без Проведения Торгов,,,нет данных,,,,,,0.000000,,,
8,190725W00113048,b'\x82\xd2\x8b)>f\xc4\x0fF\x8f\xe7\xdcY\x9f\xd9!',0001-0405-0011,КУПИ.ру,обл Магаданская,,2019-07-25 00:00:00,2019-07-25 14:58:45,2019-07-25 00:00:00,,нет данных,,Коммерческая Недвижимость,Магаданская обл,https://qp.ru/?standart=true,Вторичный,,0001-0405,2019-07-24 13:52:21,,,,,",",,,,,,,2019-07-25 14:58:45,,,,,0.000000,,,,,,,,,0.000000,,,,,,,,,,,,кв.м.,,,,,Без Проведения Торгов,,,нет данных,,,,,,0.000000,,,
9,190725W00108336,b'\x83\n\x9ea\xe7\x85\xf4\x95MU\n\x13\x8b.T\x92',0001-0405-0011,КУПИ.ру,обл Магаданская,,2019-07-25 00:00:00,2019-07-25 14:50:02,2019-07-25 00:00:00,,нет данных,,Коммерческая Недвижимость,Магаданская обл,https://qp.ru/?standart=true,Вторичный,,0001-0405,2019-07-24 13:52:21,,,,,",",,,,,,,2019-07-25 14:50:02,,,,,0.000000,,,,,,,,,0.000000,,,,,,,,,,,,кв.м.,,,,,Без Проведения Торгов,,,нет данных,,,,,,0.000000,,,


Функция, в которой и происходит тестирование.

In [81]:
@benchmark
def make_test():
    new_df = pd.DataFrame(columns=set(result_df.loc[:, 'Источник']), index=list(result_df.columns.fillna(0)) + ['Всего'])
    nan = float('nan')
    for source in set(result_df['Источник']):
        filtered = result_df[result_df['Источник'] == source]
        new_df.loc['Всего', source] = len(filtered)
        count_s = filtered.replace('', nan).replace('НетДанных', nan).replace('0.000000', nan).count()
        for k, v in count_s.items():
            new_df.loc[k, source] = v * 100 / new_df.loc['Всего', source]
        new_df.loc['КодЗадания', source] = list(filtered['КодЗадания'])[0]
        new_df.loc['КодЗадачи', source] = list(filtered['КодЗадачи'])[0]
    new_df.loc['ДатаЗадания'] = list(filtered['ДатаЗадания'])[0]
    new_df = new_df.T

    return new_df

In [82]:
test = make_test()

make_test выполнилась за время 32.03s


Выгрузка данных в `csv` файл для удобного просмотра в Excel

In [83]:
# test.to_csv('test_result.csv', header=list(test.columns), encoding='cp1251', sep=';')
test.columns = list(map(lambda x: x.replace('(', '_').replace(')', '_').replace('.', '_').replace(' ', '_'), test.columns))

In [146]:
test.shape

(55, 75)

## Postgre

In [None]:
!pip install psycopg2

In [85]:
import sqlalchemy

engine = sqlalchemy.create_engine('postgresql://rway:rway@10.199.13.111/rway_analysis')

In [222]:
test = pd.read_sql('SELECT * FROM fill_rate', con=engine, index_col='index')
test

Unnamed: 0_level_0,Код,Ссылка,КодЗадачи,Источник,АдресAhunter,АктуальнаяСсылкаИсточника,ДатаПересмотраЭкспозиции,ДатаПроверкиАктуальности,ДатаРазмещения,Город,Описание,Подсегмент,Сегмент,Субъект,СсылкаИсточника,ТипРынка,ТипСделки,КодЗадания,ДатаЗадания,3_Муниципальное_Образование,5_Внутригородской_Район,7_Улица,8_Дом,Адрес__временная_,Ближайшая_Станция_Метро,Водоснабжение,Высота_Потолков,ГеоКод_Долгота,ГеоКод_Широта,Год_Постройки,Дата_Сбора_Информации,Заголовок,Интернет,Класс_Объекта,Количество_Комнат,Количество_Этажей,Кондиционирование,Лифты,Материал_Наружных_Стен,Минут_До_Ближайшей_Станции_Метро,Мощность_Электричества,НДС,Назначение_Объекта_Предложения,Наличие_Отделки_Помещений,Общая_Площадь_Предложения,Ориентир,Отдельный_Вход,Охрана_Предложения,"Парковка_Наземная,_Количество_м/м",Планировка_Помещения,Площадь_Всего_Объекта,Площадь_Земельного_Участка_Объект,Пожаротушение,Попадает_в_полигон,Предмет_Сделки,Продавец,Размерность_Площади,Размерность_Стоимости,Расположение_Относительно_Первой_,Расстояние_До_Ближайщей_Станции_М,Система_Вентиляции,Способ_Реализации,Статус_Строительства,Субъект_РФ,Телефон_Продавца,Температурный_Режим_Склада,Тип_Объекта,Тип_Парковки,Тип_объекта_недвижимости,Управляющая_Компания,Цена,Цена_Предложения_За_1_кв_м_,Электричество,Этаж,Всего
index,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1,Unnamed: 24_level_1,Unnamed: 25_level_1,Unnamed: 26_level_1,Unnamed: 27_level_1,Unnamed: 28_level_1,Unnamed: 29_level_1,Unnamed: 30_level_1,Unnamed: 31_level_1,Unnamed: 32_level_1,Unnamed: 33_level_1,Unnamed: 34_level_1,Unnamed: 35_level_1,Unnamed: 36_level_1,Unnamed: 37_level_1,Unnamed: 38_level_1,Unnamed: 39_level_1,Unnamed: 40_level_1,Unnamed: 41_level_1,Unnamed: 42_level_1,Unnamed: 43_level_1,Unnamed: 44_level_1,Unnamed: 45_level_1,Unnamed: 46_level_1,Unnamed: 47_level_1,Unnamed: 48_level_1,Unnamed: 49_level_1,Unnamed: 50_level_1,Unnamed: 51_level_1,Unnamed: 52_level_1,Unnamed: 53_level_1,Unnamed: 54_level_1,Unnamed: 55_level_1,Unnamed: 56_level_1,Unnamed: 57_level_1,Unnamed: 58_level_1,Unnamed: 59_level_1,Unnamed: 60_level_1,Unnamed: 61_level_1,Unnamed: 62_level_1,Unnamed: 63_level_1,Unnamed: 64_level_1,Unnamed: 65_level_1,Unnamed: 66_level_1,Unnamed: 67_level_1,Unnamed: 68_level_1,Unnamed: 69_level_1,Unnamed: 70_level_1,Unnamed: 71_level_1,Unnamed: 72_level_1,Unnamed: 73_level_1,Unnamed: 74_level_1,Unnamed: 75_level_1
Золотая Середина - АН,100.000000,100.000000,0001-0405-0045,100.000000,100.000000,0.000000,100.000000,100.000000,100.000000,100.000000,100.000000,100.000000,100.000000,100.000000,100.000000,100.000000,100.000000,0001-0405,2019-07-24 13:52:21,0.000000,0.000000,100.000000,90.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,100.000000,100.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,100.000000,0.000000,100.000000,0.000000,90.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,100.000000,100.000000,100.000000,0.000000,0.000000,0.000000,100.000000,0.000000,0.000000,100.000000,0.000000,0.000000,0.000000,0.000000,0.000000,100.000000,100.000000,0.000000,60.000000,10
Buy business portal,100.000000,100.000000,0001-0405-0070,100.000000,98.642534,100.000000,100.000000,100.000000,100.000000,86.274510,100.000000,99.547511,100.000000,99.698341,100.000000,100.000000,100.000000,0001-0405,2019-07-24 13:52:21,19.758673,0.000000,80.995475,53.092006,1.809955,0.000000,0.000000,0.000000,0.000000,0.000000,2.564103,100.000000,100.000000,0.000000,1.508296,0.000000,19.306184,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,99.547511,0.000000,98.340875,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.452489,0.000000,100.000000,99.396682,100.000000,0.000000,0.000000,0.000000,100.000000,0.000000,0.000000,100.000000,0.000000,1.055807,0.000000,4.675716,0.000000,99.698341,96.681750,0.000000,25.037707,663
Яндекс Недвижимость,100.000000,100.000000,0001-0405-0071,100.000000,99.731314,100.000000,100.000000,100.000000,100.000000,94.650708,100.000000,99.780166,100.000000,100.000000,100.000000,100.000000,100.000000,0001-0405,2019-07-24 13:52:21,2.418173,0.293112,95.017098,80.019541,0.781632,0.000000,0.000000,15.803615,100.000000,100.000000,0.000000,100.000000,100.000000,0.000000,7.620909,0.000000,59.477284,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,99.658036,0.000000,95.969712,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.390816,0.122130,100.000000,92.330239,100.000000,0.000000,0.000000,0.000000,100.000000,0.000000,0.000000,100.000000,0.000000,0.000000,0.000000,0.903762,0.000000,100.000000,95.749878,0.000000,82.559844,4094
Gde.ru,100.000000,100.000000,0001-0405-0016,100.000000,97.395833,0.000000,100.000000,100.000000,100.000000,88.932292,100.000000,98.177083,100.000000,99.869792,100.000000,100.000000,99.479167,0001-0405,2019-07-24 13:52:21,2.213542,0.130208,76.562500,64.713542,4.166667,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,100.000000,100.000000,0.000000,3.385417,0.000000,15.885417,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,98.177083,0.000000,93.098958,100.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.260417,0.260417,100.000000,82.682292,99.479167,0.000000,0.000000,0.000000,100.000000,0.000000,0.000000,96.614583,0.000000,0.000000,0.000000,1.041667,0.000000,98.177083,90.234375,0.000000,26.692708,768
Rosnedv.ru,100.000000,100.000000,0001-0405-0015,100.000000,99.903351,99.065722,100.000000,100.000000,100.000000,93.750000,100.000000,99.903351,100.000000,100.000000,100.000000,100.000000,100.000000,0001-0405,2019-07-24 13:52:21,1.868557,0.193299,93.508376,39.159149,0.402706,0.000000,0.000000,0.000000,30.782861,30.782861,0.000000,100.000000,99.065722,0.000000,5.331830,0.000000,11.082474,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,99.903351,0.000000,99.001289,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.193299,0.096649,100.000000,96.085696,100.000000,0.000000,0.000000,0.000000,100.000000,0.000000,0.000000,100.000000,0.000000,0.000000,0.000000,1.385309,0.000000,99.919459,98.840206,0.000000,49.130155,6208
Tvoyadres.ru,100.000000,100.000000,0001-0405-0069,100.000000,99.689922,100.000000,100.000000,100.000000,100.000000,98.062016,100.000000,99.689922,100.000000,100.000000,100.000000,100.000000,99.767442,0001-0405,2019-07-24 13:52:21,3.462532,0.439276,82.170543,66.925065,2.299742,0.000000,0.000000,0.000000,100.000000,100.000000,0.000000,100.000000,100.000000,0.000000,2.144703,0.000000,5.788114,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,99.974160,0.000000,99.819121,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.697674,0.465116,100.000000,99.741602,99.767442,0.000000,0.000000,0.000000,100.000000,0.000000,0.000000,100.000000,0.000000,0.000000,0.000000,3.229974,0.000000,94.754522,94.263566,0.000000,20.671835,3870
Zdanie.info,100.000000,100.000000,0001-0405-0027,100.000000,99.986548,0.000000,100.000000,100.000000,100.000000,99.313963,100.000000,99.986548,100.000000,100.000000,100.000000,100.000000,100.000000,0001-0405,2019-07-24 13:52:21,0.511165,0.269034,98.331988,79.634114,0.201776,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,100.000000,100.000000,0.000000,9.483454,0.000000,25.127791,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,99.986548,0.000000,98.614474,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.295938,0.094162,100.000000,96.072101,100.000000,0.000000,0.000000,0.000000,100.000000,0.000000,0.000000,100.000000,0.000000,0.000000,0.000000,12.644606,0.000000,84.920635,83.763788,0.000000,29.486145,7434
Издательский дом Ярмарка,100.000000,100.000000,0001-0405-0044,100.000000,100.000000,0.000000,100.000000,100.000000,100.000000,75.000000,100.000000,100.000000,100.000000,100.000000,100.000000,100.000000,100.000000,0001-0405,2019-07-24 13:52:21,0.000000,0.000000,75.000000,50.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,100.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,100.000000,0.000000,100.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,100.000000,100.000000,100.000000,0.000000,0.000000,0.000000,100.000000,0.000000,0.000000,100.000000,0.000000,0.000000,0.000000,50.000000,0.000000,100.000000,100.000000,0.000000,0.000000,4
Олимп - АН,100.000000,100.000000,0001-0405-0063,100.000000,0.000000,0.000000,100.000000,100.000000,100.000000,0.000000,100.000000,0.000000,100.000000,100.000000,100.000000,100.000000,0.000000,0001-0405,2019-07-24 13:52:21,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,100.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,100.000000,0.000000,0.000000,0.000000,0.000000,0.000000,100.000000,0.000000,0.000000,100.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,5
Kalugahouse.ru,100.000000,100.000000,0001-0405-0036,100.000000,92.374101,0.000000,100.000000,100.000000,100.000000,92.086331,100.000000,92.374101,100.000000,100.000000,100.000000,100.000000,100.000000,0001-0405,2019-07-24 13:52:21,1.582734,1.582734,67.913669,16.258993,24.172662,0.000000,0.000000,0.000000,62.446043,62.446043,0.000000,100.000000,100.000000,0.000000,0.431655,30.359712,16.258993,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,95.107914,0.000000,95.971223,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,0.000000,1.582734,0.431655,100.000000,89.640288,100.000000,0.000000,0.000000,0.000000,100.000000,0.000000,0.000000,100.000000,0.000000,0.000000,0.000000,0.431655,0.000000,99.856115,89.784173,0.000000,65.179856,695
