# Подключение

In [22]:
import pyodbc
import sqlalchemy

In [23]:
conn = pyodbc.connect('DRIVER={SQL Server};SERVER=10.199.13.60;DATABASE=rway;UID=vkomarnitskii;PWD=Rway1')
cursor = conn.cursor()
engine = sqlalchemy.create_engine('postgresql://rway:rway@10.199.13.111/rway_analysis')

## Pandas

In [3]:
import pandas as pd
from math import isnan
from numpy import float64
from pprint import pprint

Тут можно установить параметры отображения для pandas. Сколько показывать строк и столбцов соответственно.

In [4]:
pd.options.display.max_rows = 100
pd.options.display.max_columns = 150

### Отладка


In [5]:
def benchmark(func):
    """
    Декоратор, выводящий время, которое заняло
    выполнение декорируемой функции
    """
    import time
    
    def wrapper(*args, **kwargs):
        t = time.time()
        res = func(*args, **kwargs)
        print(f'{func.__name__} выполнилась за время {time.time() - t:.2f}s')
        return res
    
    return wrapper

## Необходимые функции

Позволяет получить список характеристик для всех предложений из задачи `task_id`. 

In [6]:
@benchmark
def get_harks_by_object_keys(task_id):
    """
    Позволяет получить список характеристик для всех предложений из задачи task_id. 
    :param task_id: id задачи
    :type task_id: str
    :return: DataFrame, в котором указаны характеристики и их значения для всех объектов из задачи task_id
    """
    
#     in_expr = f'({", ".join(list_of_keys)})'
    query = '''
    SELECT
    t_har.Наименование,
    CASE 
        WHEN t.Значение_Тип = 04 THEN CAST(t.Значение_Дата AS varchar)
        WHEN t.Значение_Тип = 03 THEN CAST(t.Значение_Число AS varchar)
        WHEN t.Значение_Тип = 05 THEN t.Значение_Строка
        WHEN t.Значение_Тип = 08 THEN 
        COALESCE(
            (SELECT Наименование FROM [rway].[Справочник].[ДополнительныеЗначенияХарактеристик] t_dop WHERE t_dop.Ссылка = t.Значение),
            (SELECT Наименование FROM [rway].[Справочник].[ТипыОбъектовНедвижимости] t_types WHERE t_types.Ссылка = t.Значение),
            (SELECT Наименование FROM [rway].[Перечисление].[ТипыСделки] t_types_1 WHERE t_types_1.Ссылка = t.Значение),
            (SELECT Наименование FROM [rway].[Перечисление].[ЛогическиеЗначения] t_logic WHERE t_logic.Ссылка = t.Значение),
            (SELECT Наименование FROM [rway].[Перечисление].[ТипыВерифицированности] t_verif WHERE t_verif.Ссылка = t.Значение),
            (SELECT Наименование FROM [rway].[Справочник].[ПодСегменты] t_podseg WHERE t_podseg.Ссылка = t.Значение),
            (SELECT Наименование FROM [rway].[Справочник].[Застройщики] t_zastr WHERE t_zastr.Ссылка = t.Значение),
            (SELECT Наименование FROM [rway].[Справочник].[ОстановкиОбщественногоТранспорта] t_stations WHERE t_stations.Ссылка = t.Значение)                  
        )
    END
        AS Значение,
    t.Объект AS Ссылка
FROM [rway].[РегистрСведений].[ЗначенияХарактеристик] t
    INNER JOIN [rway].[ПВХ].[Характеристики] t_har
        ON t_har.[Ссылка] = t.[Характеристика]
    INNER JOIN [rway].[РегистрСведений].[ПредложенияЗадач] reg_task
        ON reg_task.Предложение = t.Объект
        AND reg_task.Задача in (
            SELECT
                task._IDRRef AS Ссылка
            FROM [rway].[dbo].[_Task62] task
            JOIN [rway].[Документ].[Задание] tasks
                ON task._Fld192RRef = tasks.Ссылка
            JOIN [rway].[Справочник].[ТипыЗадач] types
                ON types.Ссылка = task._Fld231RRef AND types.Наименование = 'Импорт'
            WHERE tasks.КодЗадания = '{}')
    '''.format(task_id)
    
    cursor.execute(query)
#     data_df = pd.read_sql(sql=query, con=conn)

    # Преобразование данных, которые вернул запрос в список списков, одновременно все байты преобразуются в hex
    data = list(map(lambda x: list(x), cursor.fetchall()))
    data_df = pd.DataFrame(data, columns=list(map(lambda x: x[0], cursor.description)))
    # Создание словаря для DataFrame
    return data_df.pivot(index='Ссылка', columns='Наименование', values='Значение')

    

Функция позволяет получить все предложения по конкретному заданию. Задание указывается в виде строки id задания.

Например, `'0001-0405'`

In [7]:
@benchmark
def get_base_info_by_task_id(task_id, offers_count=None):
    """
    :param task_id: id задания
    :param offers_count: Количество предложений для выбора из базы (пустое для выбора всех предложений)
    :type task_id: str
    :return: DataFrame, содержащий все поля, которые можно получить из таблицы "ПредложенияЗадач"
    """
    
    # Запрос к дате задания
    date = cursor.execute("SELECT Дата FROM [rway].[Документ].[Задание] WHERE КодЗадания = '{}'".format(task_id)).fetchone()
    
    top = '' if not offers_count else 'TOP {}'.format(offers_count)
    query = '''
    SELECT {top}
          t.Код,
          t.Ссылка,
          t_task._Fld198 AS КодЗадачи,
          t_source.Наименование AS Источник,
          t.АдресAhunter,
          t.АктуальнаяСсылкаИсточника,
          t.ДатаПересмотраЭкспозиции,
          t.ДатаПроверкиАктуальности,
          t.ДатаРазмещения,
          t.Город,
          t.Описание,
          (SELECT Наименование FROM [rway].[Справочник].[Подсегменты] WHERE Ссылка = t.Подсегмент) AS Подсегмент,
          (SELECT Наименование FROM [rway].[Справочник].[Сегменты] WHERE Ссылка = t.Сегмент) AS Сегмент,
          (SELECT Наименование FROM [rway].[Справочник].[СубъектыРФ] WHERE Ссылка = t.Субъект) AS Субъект,
          t.СсылкаИсточника,
          (SELECT Значение FROM [rway].[Перечисление].[ТипыРынка] WHERE Ссылка = t.ТипРынка) AS ТипРынка,
          (SELECT Значение FROM [rway].[Перечисление].[ТипыСделки] WHERE Ссылка = t.ТипСделки) AS ТипСделки
    FROM [rway].[Справочник].[ПредложенияОбъектовНедвижимости] t
        JOIN [rway].[РегистрСведений].[ПредложенияЗадач] t_offer
            ON Ссылка = t_offer.[Предложение]
        JOIN [rway].[dbo].[_Task62] t_task
            ON t_task.[_IDRRef] = t_offer.[Задача] AND t_task.[_IDRRef] in (
            SELECT
                task._IDRRef AS Ссылка
            FROM [rway].[dbo].[_Task62] task
            JOIN [rway].[Документ].[Задание] tasks
                ON task._Fld192RRef = tasks.Ссылка
            JOIN [rway].[Справочник].[ТипыЗадач] types
                ON types.Ссылка = task._Fld231RRef AND types.Наименование = 'Импорт'
            WHERE tasks.КодЗадания = '{task_id}')
        JOIN [rway].[Справочник].[Источники] t_source
            ON t_source.Ссылка = ИсточникИнформации

    '''.format(top=top, task_id=task_id)
    
    cursor.execute(query)    
    data = cursor.fetchall()
    # Те же самые преобрзования, как в функции с характеристиками
    df = pd.DataFrame(map(lambda x: list(x), data))
    df.columns = list(map(lambda x: x[0].replace('.', '_'), cursor.description))
    df['КодЗадания'] = task_id
    df['ДатаЗадания'] = date[0]
#     df = pd.read_sql(sql=query, con=conn)
    return df
    

# Боевой запуск
Здесь необходимо указать код задания, по которому будет происходить сбор данных.

In [25]:
task_id = '0001-0410'

In [26]:
# Сбор основных данных из "ПредложенияОбъектовНедвижимости"
base_df = get_base_info_by_task_id(task_id)

get_base_info_by_task_id выполнилась за время 29.28s


Вывести таблицу с базовыми характеристиками

In [27]:
base_df

Unnamed: 0,Код,Ссылка,КодЗадачи,Источник,АдресAhunter,АктуальнаяСсылкаИсточника,ДатаПересмотраЭкспозиции,ДатаПроверкиАктуальности,ДатаРазмещения,Город,Описание,Подсегмент,Сегмент,Субъект,СсылкаИсточника,ТипРынка,ТипСделки,КодЗадания,ДатаЗадания
0,190801W01016375,"b""\xb5\x9e\x08\x80i\xf7\x9d\xadD\x9f\x84\xfd\x...",0001-0410-0057,MOVE.ru,"Респ Крым, р-н Симферопольский, с Мирное, ул Т...",,2019-08-01 00:00:00,2019-08-01 18:42:11,2019-07-26 00:00:00,,Предлагаем к покупке нежилое помещение общей п...,,Коммерческая Недвижимость,Крым Респ,https://krim.move.ru/objects/prodaetsya_psn_pl...,,,0001-0410,2019-07-31 12:03:55
1,190801W00724809,b'\xbc\xf6F\xb7M\x1b\xd4rFB\xd4v0-w\x02',0001-0410-0040,СИТИСТАР,,,2019-08-01 00:00:00,2019-08-01 17:20:58,2019-08-01 00:00:00,,нет данных,,Коммерческая Недвижимость,Самарская обл,http://samara_realty.citystar.ru/realty/sdacha...,Вторичный,,0001-0410,2019-07-31 12:03:55
2,190801W00087563,b'\xbc\x83\xaa\x16\xa7C\xf2\xc4LO\xd1\x15}\x17...,0001-0410-0053,Vladimirhouse.ru,,,2019-08-01 00:00:00,2019-08-01 14:08:08,2019-08-01 00:00:00,,�5484. ������� � ������ ������� ��������� 267 ...,,Коммерческая Недвижимость,Владимирская обл,http://vladimirhouse.ru/item/374675/,Вторичный,,0001-0410,2019-07-31 12:03:55
3,190801W00087561,"b'\xbbd3\xc1.\xcb""_N\x97\xc9\xa1\xc4\xaf\xe9b'",0001-0410-0053,Vladimirhouse.ru,,,2019-08-01 00:00:00,2019-08-01 14:10:11,2019-08-01 00:00:00,,�4049. ������� � ������ �������� ��������� ���...,,Коммерческая Недвижимость,Владимирская обл,http://vladimirhouse.ru/item/261350/,Вторичный,,0001-0410,2019-07-31 12:03:55
4,190801W00096236,b'\xbb=i\xf9\xb7\x15O\x01I^\x19\xdfI\xdd9\xe6',0001-0410-0053,Vladimirhouse.ru,,,2019-08-01 00:00:00,2019-08-01 14:14:47,2019-08-01 00:00:00,,�3426. ��������� �������-������� ��������� 582...,,Коммерческая Недвижимость,Владимирская обл,http://vladimirhouse.ru/item/218173/,Вторичный,,0001-0410,2019-07-31 12:03:55
5,190801W00125400,b'\xb86\x81Vw\xe7\xc0\xe1Iu\xe4\\/P\xacY',0001-0410-0053,Vladimirhouse.ru,,,2019-08-01 00:00:00,2019-08-01 14:38:41,2019-08-01 00:00:00,,12385. Ñäàåòñÿ â àðåíäó òîðãî...,,Коммерческая Недвижимость,Владимирская обл,http://vladimirhouse.ru/item/113220/,Вторичный,,0001-0410,2019-07-31 12:03:55
6,190801W00220598,b'\xb8B\xc8\x90\x9a\xf6W\x8cA\xc1\xec\xf9\x9aSng',0001-0410-0046,Олимп - АН,,,2019-08-01 00:00:00,2019-08-01 15:00:52,2019-08-01 00:00:00,,нет данных,,Коммерческая Недвижимость,Краснодарский край,http://olymprealty.ru/sale/445955/nedvizhimost...,Вторичный,,0001-0410,2019-07-31 12:03:55
7,190801W00075680,b'\xb6\xd1\x0f\xcf\xaa\\\xb6\x07Dk\x0cI\xa6\x0...,0001-0410-0053,Vladimirhouse.ru,,,2019-08-01 00:00:00,2019-08-01 14:01:52,2019-08-01 00:00:00,,������������������� ���������-��������������� ...,,Коммерческая Недвижимость,Владимирская обл,http://vladimirhouse.ru/item/391507/,Вторичный,,0001-0410,2019-07-31 12:03:55
8,190801W00075679,b'\xb6?[ \x062\xf7\x9eAj\xfe\xde\xf3\x99\xb3n',0001-0410-0053,Vladimirhouse.ru,,,2019-08-01 00:00:00,2019-08-01 14:01:54,2019-08-01 00:00:00,,"��������������� �����, ����������� �����. ��� ...",,Коммерческая Недвижимость,Владимирская обл,http://vladimirhouse.ru/item/363727/,Вторичный,,0001-0410,2019-07-31 12:03:55
9,190801W00996124,b'\xb5\x96oe[I\xe6rB\xde=\xa40<\xa8|',0001-0410-0040,СИТИСТАР,,,2019-08-01 00:00:00,2019-08-01 19:02:51,2019-08-01 00:00:00,,нет данных,,Коммерческая Недвижимость,Самарская обл,http://samara_realty.citystar.ru/realty/sdacha...,Вторичный,,0001-0410,2019-07-31 12:03:55


Сбор характеристик по ссылкам из основного DataFrame base_df

In [28]:
har_df = get_harks_by_object_keys(task_id)

get_harks_by_object_keys выполнилась за время 450.62s


Вывести таблицу со значениями харакетристик из ПВХ.

In [29]:
har_df

Наименование,7.Улица,8.Дом,Адрес (временная),Ближайшая Станция Метро,Водоснабжение,Высота Потолков,ГеоКод Долгота,ГеоКод Широта,Год Постройки,Дата Сбора Информации,Заголовок,Интернет,Класс Объекта,Количество Комнат,Количество Этажей,Кондиционирование,Лифты,Материал Наружных Стен,Минут До Ближайшей Станции Метро,Мощность Электричества,НДС,Назначение Объекта Предложения,Наличие Отделки Помещений,Общая Площадь Предложения,Ориентир,Отдельный Вход,Охрана Предложения,"Парковка Наземная, Количество м/м",Планировка Помещения,Площадь Всего Объекта,Площадь Земельного Участка Объекта,Пожаротушение,Предмет Сделки,Продавец,Размерность Площади,Размерность Стоимости,Расположение Относительно Первой Линии Домов,Расстояние До Ближайщей Станции Метро,Система Вентиляции,Способ Реализации,Статус Строительства,Телефон Продавца,Температурный Режим Склада,Тип Объекта,Тип Парковки,Тип объекта недвижимости,Управляющая Компания,Цена,Цена Предложения За 1 кв.м.,Электричество,Этаж,Этажность Максимальная
Ссылка,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1,Unnamed: 24_level_1,Unnamed: 25_level_1,Unnamed: 26_level_1,Unnamed: 27_level_1,Unnamed: 28_level_1,Unnamed: 29_level_1,Unnamed: 30_level_1,Unnamed: 31_level_1,Unnamed: 32_level_1,Unnamed: 33_level_1,Unnamed: 34_level_1,Unnamed: 35_level_1,Unnamed: 36_level_1,Unnamed: 37_level_1,Unnamed: 38_level_1,Unnamed: 39_level_1,Unnamed: 40_level_1,Unnamed: 41_level_1,Unnamed: 42_level_1,Unnamed: 43_level_1,Unnamed: 44_level_1,Unnamed: 45_level_1,Unnamed: 46_level_1,Unnamed: 47_level_1,Unnamed: 48_level_1,Unnamed: 49_level_1,Unnamed: 50_level_1,Unnamed: 51_level_1,Unnamed: 52_level_1
b'\x80\x00\x05\x9d\x98\xaa\xc2>I\xf6\xb0{R\xe4\xed]',Генерала Васильева ул,,,,,,34.072256,44.936212,,2019-08-01 17:35:31,"Аренда склада, Симферополь, улица Генерала Вас...",,,,0.000000,,,,,,,склад,,0.000000,,,,,,,,,,Продавец,кв.м.,руб./мес.,,,,Без Проведения Торгов,,+7(978)802-81-29,,,,,,210000.000000,,,,
b'\x80\x00\x0e\rp\xe3\xa0\xb2E\tv\x175\xe1\x8d$',Ленина ул,дом № 38,,,,,61.347253,55.341700,0.000000,2019-08-01 14:19:52,"Склад, 301,5 м2, улица Ленина, 38",,,,1.000000,,,,,,,склад,,301.500000,,,,,,,,,,"АН Компаньон Premium, агентство",кв.м.,руб.,,0.000000,,Без Проведения Торгов,,+7(951)799-20-28,,складской комплекс,,складской комплекс,,3990000.000000,,,,
b'\x80\x00\x13\xd9\x9d\xa9NsA\xd2\x9a\xb1_>\xed\xa7',Пушкина ул,дом № 89А,,,,,56.228743,58.003703,0.000000,2019-08-01 15:16:23,"Помещение под торговлю, 832 м2, улица Пушкина,...",,,,2.000000,,,,,,,торговая площадь,,832.000000,,,,,,,,,,"Ирина, агентство",кв.м.,руб.,,0.000000,,Без Проведения Торгов,,+7(922)349-96-86,,,,,,65000000.000000,,,1,
b'\x80\x00\x16#\xce\xc3%\xc0@\xc8P\x98\xba\x80\xc6\xb4',Зелёный пр-кт,"дом № 3/10, строение 15",,,,0.000000,0.000000,0.000000,1995.000000,2019-07-31 16:07:13,"Офис, 1 380 м2",,,,2.000000,,,,,0.000000,УСН,офис,Чистовая,1380.000000,,Нет,,0.000000,,1380.000000,700.000000,,,ID 12978517,кв.м.,руб./мес.,,0.000000,Естественная,Без Проведения Торгов,Действующий,+7(985)640-09-32,,,,бизнес-центр,,1265000.000000,,,1,
b'\x80\x00\x18\xd1\xafs\xbd\nI\xb8\xee\xfb?\xc5\x00\x99',Долгополова ул,дом № 42,,,,,43.946574,56.317795,0.000000,2019-08-01 18:07:58,"Помещение под торговлю, 28 м2, улица Долгополо...",,,,1.000000,,,,,,,торговая площадь,,28.000000,,,,,,,,,,"Виталий Витковский, агентство",кв.м.,руб.,,0.000000,,Без Проведения Торгов,,+7(930)699-50-88,,,,,,2990000.000000,,,1,
"b""\x80\x00\x19)\x0f\x12+\xe0N-\x84'\xfb\xe4\x96~""",Балакирева ул,дом № 47,,,,0.000000,40.356006,56.131576,0.000000,2019-08-02 02:37:59,"Продается квартира площадью 46.00 кв.м, 2-комн...",,,,5.000000,,,,,,,,,46.000000,,,,,,,,,,"Ненаглядова Марина Александровна, Ненаглядова ...",кв.м.,руб.,,,,Без Проведения Торгов,,+7(920)625-91-40,,,,,,2350000.000000,,,4,
b'\x80\x00 \xde\xea\xea\xe6\xa5CM\xa3\xffz\xe1[U',Куйбышева ул,дом № 48,,,,0.000000,0.000000,0.000000,1990.000000,2019-07-31 12:36:31,"Офис, 1 957 м2",,,,3.000000,,,,,0.000000,Включая,офис,,1957.000000,,Отдельный Вход,,0.000000,,1957.000000,700.000000,,,Продавец,кв.м.,,,0.000000,,Без Проведения Торгов,Действующий,нет данных,,,,,,39000000.000000,,,1,
b'\x80\x002\x13i\xaa\x0e+E\xf9d[?\xf8\x89\xc4',Первомайская ул,дом № 121А,,,,,50.835361,61.664303,,2019-08-01 14:57:45,"Помещение свободного назначения, 330 м2",,,,,,,,,,,свободное,,330.000000,,,,,,,,,,"АН ""Геометрия""",кв.м.,руб.,,,,Без Проведения Торгов,,+7(912)183-77-69,,,,,,14200000.000000,,,,
b'\x80\x00YI\xf6\xa0\xd1\xc9B\x90\x9a;\xa20\xafa',Нижняя Дуброва ул,дом № 52,,,,0.000000,40.336467,56.104803,0.000000,2019-08-02 06:13:22,"Продается квартира площадью 36.50 кв.м, 1-комн...",,,,17.000000,,,,,,,,,36.500000,,,,,,,,,,"Кокшаева Анастасия Сергеевна, Кокшаева Анастас...",кв.м.,руб.,,,,Без Проведения Торгов,,+7(920)930-98-01,,,,,,1345750.000000,,,4,
"b""\x80\x00a'&6\xfa\xebG\xccO\x07\x04\x92\x16\n""",Шоссейная ул,,,,,,45.210124,44.792966,,2019-08-01 17:15:37,"Продается помещение свободного назначения, 182...",,,,0.000000,,,,,,,свободное,,1826.100000,,,,,,,,,,Продавец,кв.м.,руб.,,,,Без Проведения Торгов,,+7(495)801-65-86,,,,,,3400200.000000,,,,


Собираем обе таблицы в одну большую

In [30]:
result_df = pd.merge(base_df, har_df, on='Ссылка', how='left')

In [31]:
result_df

Unnamed: 0,Код,Ссылка,КодЗадачи,Источник,АдресAhunter,АктуальнаяСсылкаИсточника,ДатаПересмотраЭкспозиции,ДатаПроверкиАктуальности,ДатаРазмещения,Город,Описание,Подсегмент,Сегмент,Субъект,СсылкаИсточника,ТипРынка,ТипСделки,КодЗадания,ДатаЗадания,7.Улица,8.Дом,Адрес (временная),Ближайшая Станция Метро,Водоснабжение,Высота Потолков,ГеоКод Долгота,ГеоКод Широта,Год Постройки,Дата Сбора Информации,Заголовок,Интернет,Класс Объекта,Количество Комнат,Количество Этажей,Кондиционирование,Лифты,Материал Наружных Стен,Минут До Ближайшей Станции Метро,Мощность Электричества,НДС,Назначение Объекта Предложения,Наличие Отделки Помещений,Общая Площадь Предложения,Ориентир,Отдельный Вход,Охрана Предложения,"Парковка Наземная, Количество м/м",Планировка Помещения,Площадь Всего Объекта,Площадь Земельного Участка Объекта,Пожаротушение,Предмет Сделки,Продавец,Размерность Площади,Размерность Стоимости,Расположение Относительно Первой Линии Домов,Расстояние До Ближайщей Станции Метро,Система Вентиляции,Способ Реализации,Статус Строительства,Телефон Продавца,Температурный Режим Склада,Тип Объекта,Тип Парковки,Тип объекта недвижимости,Управляющая Компания,Цена,Цена Предложения За 1 кв.м.,Электричество,Этаж,Этажность Максимальная
0,190801W01016375,"b""\xb5\x9e\x08\x80i\xf7\x9d\xadD\x9f\x84\xfd\x...",0001-0410-0057,MOVE.ru,"Респ Крым, р-н Симферопольский, с Мирное, ул Т...",,2019-08-01 00:00:00,2019-08-01 18:42:11,2019-07-26 00:00:00,,Предлагаем к покупке нежилое помещение общей п...,,Коммерческая Недвижимость,Крым Респ,https://krim.move.ru/objects/prodaetsya_psn_pl...,,,0001-0410,2019-07-31 12:03:55,Тепличная ул,дом № 26,,,,,34.064376,44.987769,,2019-08-01 18:42:11,"Продаю помещение свободного назначения, 54.3 м...",,,,0.000000,,,,,,,,,0.000000,,,,,,,,,,Продавец,кв.м.,руб.,,,,Без Проведения Торгов,,нет данных,,,,,,2900000.000000,,,,
1,190801W00724809,b'\xbc\xf6F\xb7M\x1b\xd4rFB\xd4v0-w\x02',0001-0410-0040,СИТИСТАР,,,2019-08-01 00:00:00,2019-08-01 17:20:58,2019-08-01 00:00:00,,нет данных,,Коммерческая Недвижимость,Самарская обл,http://samara_realty.citystar.ru/realty/sdacha...,Вторичный,,0001-0410,2019-07-31 12:03:55,,,,,,,0.000000,0.000000,,2019-08-01 17:20:58,,,,,0.000000,,,,,,,,,0.000000,,,,,,,,,,Продавец,,,,,,Без Проведения Торгов,,нет данных,,,,,,0.000000,,,,
2,190801W00087563,b'\xbc\x83\xaa\x16\xa7C\xf2\xc4LO\xd1\x15}\x17...,0001-0410-0053,Vladimirhouse.ru,,,2019-08-01 00:00:00,2019-08-01 14:08:08,2019-08-01 00:00:00,,�5484. ������� � ������ ������� ��������� 267 ...,,Коммерческая Недвижимость,Владимирская обл,http://vladimirhouse.ru/item/374675/,Вторичный,,0001-0410,2019-07-31 12:03:55,,,,,,,0.000000,0.000000,,2019-08-01 14:08:08,������� � ������ ������� ��������� 267 ��.�,,,0.000000,0.000000,,,,,,,,,0.000000,,,,,,,,,,Продавец,,,,,,Без Проведения Торгов,,+7(960)733-66-77,,,,,,106800.000000,,,,
3,190801W00087561,"b'\xbbd3\xc1.\xcb""_N\x97\xc9\xa1\xc4\xaf\xe9b'",0001-0410-0053,Vladimirhouse.ru,,,2019-08-01 00:00:00,2019-08-01 14:10:11,2019-08-01 00:00:00,,�4049. ������� � ������ �������� ��������� ���...,,Коммерческая Недвижимость,Владимирская обл,http://vladimirhouse.ru/item/261350/,Вторичный,,0001-0410,2019-07-31 12:03:55,,,,,,,0.000000,0.000000,,2019-08-01 14:10:11,������� � ������ �������� ��������� �������� 1...,,,0.000000,0.000000,,,,,,,,,0.000000,,,,,,,,,,Продавец,,,,,,Без Проведения Торгов,,+7(905)147-70-77,,,,,,191100.000000,,,,
4,190801W00096236,b'\xbb=i\xf9\xb7\x15O\x01I^\x19\xdfI\xdd9\xe6',0001-0410-0053,Vladimirhouse.ru,,,2019-08-01 00:00:00,2019-08-01 14:14:47,2019-08-01 00:00:00,,�3426. ��������� �������-������� ��������� 582...,,Коммерческая Недвижимость,Владимирская обл,http://vladimirhouse.ru/item/218173/,Вторичный,,0001-0410,2019-07-31 12:03:55,,,,,,,0.000000,0.000000,,2019-08-01 14:14:47,��������� �������-������� ��������� � ������ �...,,,0.000000,0.000000,,,,,,,,,0.000000,,,,,,,,,,Продавец,,,,,,Без Проведения Торгов,,+7(961)113-43-33,,,,,,27354000.000000,,,,
5,190801W00125400,b'\xb86\x81Vw\xe7\xc0\xe1Iu\xe4\\/P\xacY',0001-0410-0053,Vladimirhouse.ru,,,2019-08-01 00:00:00,2019-08-01 14:38:41,2019-08-01 00:00:00,,12385. Ñäàåòñÿ â àðåíäó òîðãî...,,Коммерческая Недвижимость,Владимирская обл,http://vladimirhouse.ru/item/113220/,Вторичный,,0001-0410,2019-07-31 12:03:55,,,,,,,0.000000,0.000000,,2019-08-01 14:38:41,Ñäàåòñÿ â àðåíäó òîðãîâî-î...,,,0.000000,0.000000,,,,,,,,,0.000000,,,,,,,,,,Продавец,,,,,,Без Проведения Торгов,,+7(905)147-70-77,,,,,,62400.000000,,,,
6,190801W00220598,b'\xb8B\xc8\x90\x9a\xf6W\x8cA\xc1\xec\xf9\x9aSng',0001-0410-0046,Олимп - АН,,,2019-08-01 00:00:00,2019-08-01 15:00:52,2019-08-01 00:00:00,,нет данных,,Коммерческая Недвижимость,Краснодарский край,http://olymprealty.ru/sale/445955/nedvizhimost...,Вторичный,,0001-0410,2019-07-31 12:03:55,,,,,,,,,0.000000,2019-08-01 15:00:52,,,,,0.000000,,,,,,,,,0.000000,,,,,,,0.000000,,,Продавец,,,,,,Без Проведения Торгов,,нет данных,,,,,,0.000000,,,,
7,190801W00075680,b'\xb6\xd1\x0f\xcf\xaa\\\xb6\x07Dk\x0cI\xa6\x0...,0001-0410-0053,Vladimirhouse.ru,,,2019-08-01 00:00:00,2019-08-01 14:01:52,2019-08-01 00:00:00,,������������������� ���������-��������������� ...,,Коммерческая Недвижимость,Владимирская обл,http://vladimirhouse.ru/item/391507/,Вторичный,,0001-0410,2019-07-31 12:03:55,,,,,,,0.000000,0.000000,,2019-08-01 14:01:52,��������� 722 � � �. ����-�����������,,,0.000000,0.000000,,,,,,,,,0.000000,,,,,,,,,,Продавец,,,,,,Без Проведения Торгов,,+7(915)766-08-03,,,,,,14000000.000000,,,,
8,190801W00075679,b'\xb6?[ \x062\xf7\x9eAj\xfe\xde\xf3\x99\xb3n',0001-0410-0053,Vladimirhouse.ru,,,2019-08-01 00:00:00,2019-08-01 14:01:54,2019-08-01 00:00:00,,"��������������� �����, ����������� �����. ��� ...",,Коммерческая Недвижимость,Владимирская обл,http://vladimirhouse.ru/item/363727/,Вторичный,,0001-0410,2019-07-31 12:03:55,,,,,,,0.000000,0.000000,,2019-08-01 14:01:54,��� �����. �������������� ����������. 8-495-99...,,,0.000000,0.000000,,,,,,,,,0.000000,,,,,,,,,,Продавец,,,,,,Без Проведения Торгов,,+7(495)991-92-01,,,,,,1000.000000,,,,
9,190801W00996124,b'\xb5\x96oe[I\xe6rB\xde=\xa40<\xa8|',0001-0410-0040,СИТИСТАР,,,2019-08-01 00:00:00,2019-08-01 19:02:51,2019-08-01 00:00:00,,нет данных,,Коммерческая Недвижимость,Самарская обл,http://samara_realty.citystar.ru/realty/sdacha...,Вторичный,,0001-0410,2019-07-31 12:03:55,,,,,,,0.000000,0.000000,,2019-08-01 19:02:51,,,,,0.000000,,,,,,,,,0.000000,,,,,,,,,,Продавец,,,,,,Без Проведения Торгов,,нет данных,,,,,,0.000000,,,,


Функция, в которой и происходит тестирование.

In [32]:
@benchmark
def make_test():
    new_df = pd.DataFrame(columns=set(result_df.loc[:, 'Источник']), index=list(result_df.columns.fillna(0)) + ['Всего'])
    nan = float('nan')
    for source in set(result_df['Источник']):
        filtered = result_df[result_df['Источник'] == source]
        new_df.loc['Всего', source] = len(filtered)
        count_s = filtered.replace('', nan).replace('НетДанных', nan).replace('0.000000', nan).replace('нет данных', nan).count()
        for k, v in count_s.items():
            new_df.loc[k, source] = v * 100 / new_df.loc['Всего', source]
        new_df.loc['КодЗадания', source] = list(filtered['КодЗадания'])[0]
        new_df.loc['КодЗадачи', source] = list(filtered['КодЗадачи'])[0]
    new_df.loc['ДатаЗадания'] = list(filtered['ДатаЗадания'])[0]
    new_df = new_df.T

    return new_df

In [33]:
test = make_test()

make_test выполнилась за время 35.36s


Вывести на экран таблицу с результатами теста

In [34]:
test

Unnamed: 0,Код,Ссылка,КодЗадачи,Источник,АдресAhunter,АктуальнаяСсылкаИсточника,ДатаПересмотраЭкспозиции,ДатаПроверкиАктуальности,ДатаРазмещения,Город,Описание,Подсегмент,Сегмент,Субъект,СсылкаИсточника,ТипРынка,ТипСделки,КодЗадания,ДатаЗадания,7.Улица,8.Дом,Адрес (временная),Ближайшая Станция Метро,Водоснабжение,Высота Потолков,ГеоКод Долгота,ГеоКод Широта,Год Постройки,Дата Сбора Информации,Заголовок,Интернет,Класс Объекта,Количество Комнат,Количество Этажей,Кондиционирование,Лифты,Материал Наружных Стен,Минут До Ближайшей Станции Метро,Мощность Электричества,НДС,Назначение Объекта Предложения,Наличие Отделки Помещений,Общая Площадь Предложения,Ориентир,Отдельный Вход,Охрана Предложения,"Парковка Наземная, Количество м/м",Планировка Помещения,Площадь Всего Объекта,Площадь Земельного Участка Объекта,Пожаротушение,Предмет Сделки,Продавец,Размерность Площади,Размерность Стоимости,Расположение Относительно Первой Линии Домов,Расстояние До Ближайщей Станции Метро,Система Вентиляции,Способ Реализации,Статус Строительства,Телефон Продавца,Температурный Режим Склада,Тип Объекта,Тип Парковки,Тип объекта недвижимости,Управляющая Компания,Цена,Цена Предложения За 1 кв.м.,Электричество,Этаж,Этажность Максимальная,Всего
Уральская палата недвижимости,100,100,0001-0410-0034,100,98.9276,0.0,100,100,100.0,95.067,99.3029,68.311,100,100.0,100,100.0,99.3029,0001-0410,2019-07-31 12:03:55,98.1769,94.37,0,0.0,0.0,26.3271,99.0885,99.0885,34.1555,100,99.3029,0.0,0.0,0.0,64.0751,0,0.0,0.214477,0,7.18499,0.0,62.6273,0.0,91.8499,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,100.0,91.8499,99.3029,0.0,0,1.01877,100,0.0,99.2493,0.0,0.0,0.0,40.3753,0.0,99.3029,0.0,0.0,74.9598,0,1865
FARPOST.ru,100,100,0001-0410-0008,100,95.3581,0.0,100,100,81.3992,91.1804,99.6353,65.4841,100,100.0,100,100.0,100.0,0001-0410,2019-07-31 12:03:55,92.0756,87.069,0,0.0,0.0,0.0,0.0,0.0,0.0,100,99.6684,0.0,0.0,0.0,0.0,0,0.0,0.0,0,0.0,0.0,75.5305,0.0,96.6512,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,100.0,96.6512,100.0,0.0,0,0.0,100,0.0,95.1592,0.0,0.0,0.0,0.0,0.0,91.2798,0.0,0.0,0.0,0,3016
MLSN.ru,100,100,0001-0410-0050,100,99.7155,0.0,100,100,100.0,96.0171,100.0,7.68137,100,100.0,100,100.0,100.0,0001-0410,2019-07-31 12:03:55,97.8663,27.027,0,0.0,0.0,0.0,0.0,0.0,0.0,100,0.0,0.0,0.0,0.0,92.3186,0,0.0,0.0,0,0.0,0.0,0.0,0.0,100.0,0.0,7.82361,0.0,0.0,0.0,0.0,0.0,0.0,8.53485,99.8578,100.0,100.0,13.6558,0,0.0,100,0.0,99.2888,0.0,0.0,0.0,0.0,0.0,98.7198,98.7198,0.0,100.0,0,703
MIRKVARTIR.ru,100,100,0001-0410-0092,100,98.4756,57.3171,100,100,100.0,80.1829,98.1707,42.6829,100,100.0,100,100.0,100.0,0001-0410,2019-07-31 12:03:55,76.5244,70.7317,0,0.304878,0.0,0.0,90.5488,90.5488,0.0,100,100.0,0.0,0.0,0.0,14.939,0,0.0,0.0,0,0.0,0.0,55.7927,0.0,71.9512,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,100.0,74.0854,98.1707,0.0,0,0.0,100,0.0,100.0,0.0,0.0,0.0,0.0,0.0,98.1707,0.0,0.0,14.939,0,328
MOVE.ru,100,100,0001-0410-0057,100,99.3934,0.0,100,100,100.0,94.1599,99.9689,75.4157,100,100.0,100,99.6573,98.517,0001-0410,2019-07-31 12:03:55,92.0318,76.8013,0,0.0,0.0,0.0,99.7559,99.8164,0.0,100,100.0,0.0,0.0,0.0,18.75,0,0.0,0.0,0,0.0,0.0,75.5993,0.0,77.3902,11.2579,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,100.0,100.0,99.5131,0.0,0,0.0,100,0.0,99.8529,0.0,0.0,0.0,1.63633,0.0,100.0,0.0,0.0,14.0698,0,241333
Связист - АН,100,100,0001-0410-0086,100,97.5535,100.0,100,100,100.0,94.8012,100.0,46.789,100,100.0,100,100.0,99.3884,0001-0410,2019-07-31 12:03:55,90.5199,69.7248,0,0.0,0.0,0.0,0.0,0.0,47.4006,100,0.0,0.0,0.0,0.0,0.0,0,0.0,0.0,0,0.0,0.0,17.737,0.0,97.5535,62.9969,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,100.0,97.8593,97.2477,0.0,0,0.0,100,0.0,99.6942,0.0,15.5963,0.0,15.5963,0.0,96.6361,53.211,0.0,0.0,0,327
N1.ru,100,100,0001-0410-0010,100,99.8279,0.0,100,100,100.0,98.2792,95.5486,14.7761,100,100.0,100,100.0,100.0,0001-0410,2019-07-31 12:03:55,96.5675,82.9643,0,0.0,0.0,0.0,0.0,0.0,24.0321,100,100.0,35.7605,0.0,0.0,0.0,0,0.0,0.0,0,16.9452,0.0,14.3006,0.0,99.8279,0.0,49.4724,0.0,27.9582,0.0,0.0,0.0,0.0,0.0,99.923,99.8279,100.0,0.0,0,0.0,100,0.0,99.8234,0.0,0.0,0.0,32.4956,0.0,100.0,0.0,0.0,58.3662,0,22083
Market.sakh.com,100,100,0001-0410-0022,100,100.0,0.0,100,100,100.0,96.2366,96.7742,61.828,100,100.0,100,100.0,100.0,0001-0410,2019-07-31 12:03:55,100.0,80.6452,0,0.0,51.6129,0.0,0.0,0.0,28.4946,100,100.0,0.0,0.0,0.0,68.8172,0,0.0,10.7527,0,61.828,0.0,66.6667,0.0,97.8495,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,100.0,97.8495,100.0,0.0,0,0.0,100,0.0,88.7097,51.6129,0.0,0.0,0.0,0.0,100.0,0.0,0.0,66.129,0,186
Vladimirhouse.ru,100,100,0001-0410-0053,100,17.8571,0.0,100,100,100.0,17.8571,96.4286,0.0,100,100.0,100,100.0,25.0,0001-0410,2019-07-31 12:03:55,14.2857,14.2857,0,0.0,0.0,0.0,28.5714,28.5714,0.0,100,96.4286,0.0,0.0,0.0,0.0,0,0.0,0.0,0,0.0,0.0,25.0,0.0,17.8571,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,100.0,17.8571,25.0,0.0,0,0.0,100,0.0,89.2857,0.0,0.0,0.0,0.0,0.0,89.2857,0.0,0.0,3.57143,0,28
Из рук в руки,100,100,0001-0410-0018,100,98.1792,0.0,100,100,100.0,91.5927,98.5315,0.506649,100,100.0,100,100.0,100.0,0001-0410,2019-07-31 12:03:55,83.9821,68.9697,0,0.0,0.0,0.933793,55.4632,55.4632,22.6651,100,100.0,0.0,0.0,0.0,80.3623,0,0.0,13.0996,0,0.0,0.0,0.506649,0.0,85.1108,0.0,0.835581,0.0,0.0,0.0,0.0,0.0,0.0,0.0,100.0,100.0,100.0,0.0,0,0.0,100,0.0,99.4934,0.282164,0.0,0.0,1.22843,0.0,99.1488,0.0,0.0,81.6921,0,64147


Выгрузка данных в `csv` файл для удобного просмотра в Excel

In [35]:
# test.to_csv('test_result.csv', header=list(test.columns), encoding='cp1251', sep=';')
test.columns = list(map(lambda x: x.replace('(', '_').replace(')', '_').replace('.', '_').replace(' ', '_'), test.columns))

Запись результатов теста в базу

In [40]:
for col in test.columns:
    engine.execute('ALTER TABLE fill_rate ADD COLUMN IF NOT EXISTS "{}" double precision'.format(col))

In [41]:
test.to_sql('fill_rate', con=engine, if_exists='append')