In [1]:
import importlib
import pandas as pd
import numpy as np
import re

In [2]:
from functions.get_mon_data import *
from functions.functions_dataframe import * 
from functions.functions_shared import *
from parameters.filters_lists import *
from parameters.route import *
from parameters.regs import *

In [None]:
""" 
Для формування списку ЄДРПОУ навчальних закладів, які потрібно наносити на мапу, використані бази даних МОН, опубліковані у листопаді 2019 року на Порталі відкритих даних.

### Перелік закладів загальної середньої та дошкільної освіти (ЗЗСДО)
    https://data.gov.ua/dataset/bd70757a-ab49-46be-a650-608a9b3bd7b1
    
### Перелік закладів позашкільної освіти (державна форма власності)
    https://data.gov.ua/dataset/9a88fb96-a043-4769-acf1-1c4a948ec285
    Перелік закладів позашкільної освіти системи Міністерства освіти і науки України
    https://data.gov.ua/dataset/18d7fb70-3781-4017-88d2-651e14d14211
    Заклади професійної (професійно-технічної) освіти
    https://data.gov.ua/dataset/824513a9-aa5e-45c8-b45e-dced6909761a
"""

In [None]:
"""
df_raw - база даних завершених закупівель 24 обласних центрів з 1 серпня 2016 до 31 грудня 2019.
В Донецькій області - Краматорськ. В Луганській - Сєвєродонецьк. 
Згерерована у Профейсійному модулі аналітики bipro.prozorro.
"ИдентификаторЛота" є унікальним ідентифікатором рядка.
"""  

In [3]:
df_raw = pandas.read_csv('data/TrainingProZorroForSchoolProject20162019.csv', sep = ';', low_memory = False)
training_data_columns = df_raw.columns.tolist()
print("Дані з файлу викачки BIPro Prozorro: " + "df_raw" + str(df_raw.shape))

Дані з файлу викачки BIPro Prozorro: df_raw(537893, 11)


##### Step 0: Підготовка бази МОН для використання у фільтруванні закупівель

In [4]:
expdata_sc = pandas.read_csv('data/mon_data/expdata_sc.csv', sep = ';', low_memory = False)
expdata_dnz = pandas.read_csv('data/mon_data/expdata_dnz.csv', sep = ';', low_memory = False)

In [5]:
expdata_sc = expdata_sc.fillna(0)
expdata_sc['edrpou'] = expdata_sc['edrpou'].astype(np.int64)
mask = (expdata_sc['edrpou'].astype(str).str.len() == 7) | (expdata_sc['edrpou'].astype(str).str.len() == 8)
expdata_sc = expdata_sc.loc[mask].sort_values(by=['edrpou'])
print("expdata_sc", expdata_sc.shape)

expdata_sc (15206, 21)


In [6]:
expdata_dnz['edrpou'] = pd.to_numeric(expdata_dnz['edrpou'],errors='coerce')
expdata_dnz = expdata_dnz.fillna(0)
expdata_dnz['edrpou'] = expdata_dnz['edrpou'].astype(np.int64)
mask = (expdata_dnz['edrpou'].astype(str).str.len() == 7) | (expdata_dnz['edrpou'].astype(str).str.len() == 8)
expdata_dnz = expdata_dnz.loc[mask].sort_values(by=['edrpou'])
print("expdata_dnz", expdata_dnz.shape)

expdata_dnz (15745, 21)


In [7]:
frames = [expdata_dnz, expdata_sc]
df_mon_data = pd.concat(frames)
print("База МОН шкіл і садків з 7-8 значинми ЄДРПОУ, df_mon_data", df_mon_data.shape)

База МОН шкіл і садків з 7-8 значинми ЄДРПОУ, df_mon_data (30951, 22)


In [8]:
filter_keywords_exclude = ["департамент", "управлін.*освіт", "відділ.*освіт"]
df_raw_upravlin_osvity = df_raw[df_raw['Организатор'].astype(str).str.contains(r'({})'.format('|'.join(filter_keywords_exclude)), case = False, na = False, regex = True)]
edrpou_upravlin_osvity_prozorro = df_raw_upravlin_osvity['IDOrganizator'].unique().tolist()
print("edrpou_upravlin_osvity_prozorro", len(edrpou_upravlin_osvity_prozorro))

mask = (df_mon_data['edrpou'].isin(edrpou_upravlin_osvity_prozorro))
df_mon_data_bez_upravlin_osvity = df_mon_data.loc[~mask]
print("df_mon_data_bez_upravlin_osvity", df_mon_data_bez_upravlin_osvity.shape)

  


edrpou_upravlin_osvity_prozorro 234
df_mon_data_bez_upravlin_osvity (30881, 22)


In [None]:
"""
TODO:
    Артем: 
        створити базу управлінь освіти для формування переліку закупівель управлінь освіти 
        (закупівлі можуть дублюватись із закупівлями шкіл і садків)
        ЄДРПОУ - Місто (для Києва - по районам, якщо можливо)

"""

##### Step 1: Створити базу навчальних закладів, які самостійно купують через ProZorro. Виділення закупівель шкіл-замовників , згідно з базою МОН (пошук по колонці "IDOrganizator"

In [9]:
mon_data = df_mon_data_bez_upravlin_osvity.edrpou.unique().tolist()
# mon_data = get_mon_data()

df_tenders_by_schools_by_edrpou = df_raw[df_raw['IDOrganizator'].isin(mon_data)]
df_undefined_1 = df_raw[~df_raw['IDOrganizator'].isin(mon_data)]

print("Закупівлі шкіл-замовників, визначених через МОН: df_tenders_by_schools_by_edrpou " + str(df_tenders_by_schools_by_edrpou.shape))
print("Невизначені записи: df_undefined_1 " + str(df_undefined_1.shape))

Закупівлі шкіл-замовників, визначених через МОН: df_tenders_by_schools_by_edrpou (32188, 11)
Невизначені записи: df_undefined_1 (505705, 11)


In [None]:
# evaluation of results of Step 1

# df_tenders_by_schools_by_edrpou['Организатор'].value_counts()

##### Step 2: Виділення закупівель шкіл-замовників за допомогою пошуку ключових слів в колонці "Организатор" 

In [10]:
df_tenders_by_schools_by_keywords = df_undefined_1[df_undefined_1['Организатор'].astype(str).str.contains(r'({})'.format('|'.join(filter_keywords)), case = False, na = False, regex = True) ]
print(f"Закупівлі шкіл-замовників, визначених через 'Организатор': df_tenders_by_schools_by_keywords {df_tenders_by_schools_by_keywords.shape}")

  """Entry point for launching an IPython kernel.


Закупівлі шкіл-замовників, визначених через 'Организатор': df_tenders_by_schools_by_keywords (9351, 11)


In [None]:
# evalutaion #1 of results of Step 2
# df_tenders_by_schools_by_keywords['Организатор'].value_counts()

In [11]:
# solution for Step 2

filter_keywords_step_2_exclude = ['професійн', 'міжшкільн']
df_tenders_by_schools_by_keywords_2_temp = df_tenders_by_schools_by_keywords[~df_tenders_by_schools_by_keywords['Организатор'].astype(str).str.contains(r'({})'.format('|'.join(filter_keywords_step_2_exclude)), case = False, na = False, regex = True)]
filter_keywords_step_2_include = ["школа І-І.*ступенів", "навчальн.*виховн.*комплекс", "гімназ", "ліце", "дошкільний"]
df_tenders_by_schools_by_keywords_2 = df_tenders_by_schools_by_keywords_2_temp[df_tenders_by_schools_by_keywords_2_temp['Организатор'].astype(str).str.contains(r'({})'.format('|'.join(filter_keywords_step_2_include)), case = False, na = False, regex = True)]
print(f"Видалення із датафрейму df_tenders_by_schools_by_keywords так званих 'професійних' навчальних закладів, {df_tenders_by_schools_by_keywords_2_temp.shape} \nДодаткове фільтрування датафрейму: {filter_keywords_step_2_include}. Залишилось:, {df_tenders_by_schools_by_keywords_2.shape}")

Видалення із датафрейму df_tenders_by_schools_by_keywords так званих 'професійних' навчальних закладів, (6890, 11) 
Додаткове фільтрування датафрейму: ['школа І-І.*ступенів', 'навчальн.*виховн.*комплекс', 'гімназ', 'ліце', 'дошкільний']. Залишилось:, (329, 11)


  after removing the cwd from sys.path.
  


In [None]:
# evalutaion #2 of results of Step 2

# df_tenders_by_schools_by_keywords_2_temp['Организатор'].value_counts()
# df_tenders_by_schools_by_keywords_2['Организатор'].value_counts()

##### Step 2.5: Об'єднання двох датафреймів шкіл-замовників в один

In [12]:
df_tenders_by_schools = pandas.concat([df_tenders_by_schools_by_edrpou, df_tenders_by_schools_by_keywords_2])

print(f"Закупівлі шкіл-замовників: df_tenders_by_schools {df_tenders_by_schools.shape} \nНевизначені записи: df_undefined_1:{df_undefined_1.shape}")

Закупівлі шкіл-замовників: df_tenders_by_schools (32517, 11) 
Невизначені записи: df_undefined_1:(505705, 11)


##### Step 3: Класифікація шкіл-замовників по типах

In [13]:
columns_to_classify = ['Организатор']
df_tenders_by_schools_classified = classification_by_type_one_column(df_tenders_by_schools, columns_to_classify, filter_priority, filter_name_priority)

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  given_df['Тип закладу'] = "Невідомо"
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  given_df[column + "_check"] = ""
  case = False, na = False, regex = True)
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  case = False, na = False, regex = True)
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexe

In [None]:
# evaluation of Step 3

# pd.set_option("display.max_colwidth", 200)
# print("Заклади, де не визначений тип:")
# df_tenders_by_schools_classified[df_tenders_by_schools_classified['Тип закладу'] == 'Невідомо']['Организатор'].unique().tolist()

##### Step 4: Нумерація шкіл-замовників

In [14]:
columns_to_numerate = ['Организатор']
df_tenders_by_schools_numerated = numeration_one_column(df_tenders_by_schools_classified, columns_to_numerate, reg_number)

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  given_df['Номер'] = given_df[column].str.findall(f"{regex}", flags = re.IGNORECASE).apply(''.join)


##### Step 4.5: Найменування шкіл-замовників

In [19]:
columns_to_name = ['Организатор']
df_tenders_by_schools_named = naming_one_column(df_tenders_by_schools_numerated, columns_to_name, reg_quotes)

In [20]:
print('filter_poza', )
print('Було закупівель', df_tenders_by_schools_named.shape)
df_tenders_by_schools_named = df_tenders_by_schools_named[~df_tenders_by_schools_named['Организатор'].astype(str).str.contains(r'({})'.format('|'.join(filter_poza)),
                case = False, na = False, regex = True)]
df_tenders_by_schools_named['Номер'] = df_tenders_by_schools_named['Номер'].replace(r'^\s*$', np.nan, regex=True) # перетворити пусті строки в NaN
print(f'Залишилось закупівель після видалення закупівель закладів ключовими словами {filter_poza}, \ndf_tenders_by_schools_named', df_tenders_by_schools_named.shape)

filter_poza
Було закупівель (32517, 15)


  after removing the cwd from sys.path.


Залишилось закупівель після видалення закупівель закладів ключовими словами ['художн', 'мистецтв', 'дхш', 'дмш', 'музич', 'юнацьк.*спортивн', 'дюсш', 'дитяч.*спортивн'], 
df_tenders_by_schools_named (31859, 15)


A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  """


In [None]:
# # evaluation of Step 4

# for_analysis_step_4 = df_tenders_by_schools_named[df_tenders_by_schools_named['Назва'].isnull() & 
#                                   df_tenders_by_schools_named['Номер'].isnull()]
# print('Навчальні заклади, де не визначились номер чи назва:')
# for_analysis_step_4['Организатор'].unique().tolist()

##### Step 4.9: Форматування бази шкіл-замовників

In [21]:
df_tenders_by_schools = df_tenders_by_schools_named.copy()
df_tenders_by_schools['Заклад-замовник'] = True

col_names = training_data_columns.copy() 
col_names += ['Номер', 'Назва', 'Тип закладу', 'Заклад-замовник']

df_tenders_by_schools = df_tenders_by_schools[col_names]

##### Step 5: Виділення закупівель шкіл-не-замовників за допомогою пошуку ключових слів в колонках Тендер, ОписаниеТендера, Лот

In [23]:
df_tenders_not_by_schools_by_keywords = df_undefined_1[df_undefined_1['Тендер'].astype(str).str.contains(r'({})'.format('|'.join(filter_keywords_extended)), 
            case = False, na = False, regex = True)  | 
                                                      df_undefined_1['ОписаниеТендера'].astype(str).str.contains(r'({})'.format('|'.join(filter_keywords_extended)), 
            case = False, na = False, regex = True) | 
                                                      df_undefined_1['Лот'].astype(str).str.contains(r'({})'.format('|'.join(filter_keywords_extended)), 
            case = False, na = False, regex = True) | df_undefined_1['Тендер'].astype(str).str.contains(r'(/b{}/b)'.format('|'.join(filter_keywords_strict_extended)), 
            case = False, na = False, regex = True) | df_undefined_1['ОписаниеТендера'].astype(str).str.contains(r'(/b{}/b)'.format('|'.join(filter_keywords_strict_extended)), 
            case = False, na = False, regex = True) | df_undefined_1['Лот'].astype(str).str.contains(r'(/b{}/b)'.format('|'.join(filter_keywords_strict_extended)), 
            case = False, na = False, regex = True)]

print("Закупівлі шкіл-не-замовників, визначених через Тендер, Лот, ОписаниеТендера: df_tenders_by_schools_by_keywords " + str(df_tenders_not_by_schools_by_keywords.shape))

  
  if __name__ == '__main__':


Закупівлі шкіл-не-замовників, визначених через Тендер, Лот, ОписаниеТендера: df_tenders_by_schools_by_keywords (28708, 11)


In [None]:
# evaluation of Step 5

# df_tenders_not_by_schools_by_keywords

##### Step 6: Класифікація шкіл-не-замовників по типах

In [26]:
# тимчасово винсені з filters_lists фільтри сюди для тестування порядковості

filter_priority = [
        filter_nvk,
        filter_gimnasium,
        filter_liceum,
        filter_specializovana,
        filter_internat,
        filter_kombinat,
        filter_sanatorna,
        filter_specializovana,
        filter_specialna,
        filter_sadik,
        filter_shkola 
    ]

filter_name_priority = [
        filter_nvk_name,
        filter_gimnasium_name,
        filter_liceum_name,
        filter_specializovana_name,
        filter_internat_name,
        filter_kombinat_name,
        filter_sanatorna_name,
        filter_specializovana_name,
        filter_specialna_name,
        filter_sadik_name,
        filter_shkola_name
    ]

In [25]:
columns_to_classify = ['Тендер', 'ОписаниеТендера', 'Лот']
df_tenders_not_by_schools_classified = classification_by_type_three_cols(df_tenders_not_by_schools_by_keywords, columns_to_classify, filter_priority, filter_name_priority)

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  given_df['Тип закладу'] = "Невідомо"
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  given_df[column + "_check"] = ""
  case = False, na = False, regex = True)
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  case = False, na = False, regex = True)
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexe

In [None]:
# # evaluation of Step 6

# pd.set_option("display.max_colwidth", 200)

# type_sample = 'Інтернат'
# df_tenders_not_by_schools_classified[df_tenders_not_by_schools_classified['Тип закладу'] == type_sample][['Тендер', 'ОписаниеТендера', 'Лот', 'Тип закладу']].sort_values(by=['Тип закладу'])
# df_tenders_not_by_schools_classified['Тип закладу'].value_counts()

##### Step 7: Нумерація шкіл-не-замовників

In [27]:
"""
Принцип фільтрування в функції numeration():

    Визначається наявністья символу № в кожній колонці columns_to_numerate_step7
    
    Регулярний вираз знаходить всі паттерни і джойнить через кому
    
    Паралельно створюється колонка, де рахується кількість знайдених паттернів
    
    Результат фільтрування numeration() - потрапляє у датафрейм df_step7_numerated
"""
columns_to_numerate_step7 = ['Тендер', 'Лот']
action_mark = 'numeration'
df_step7 = df_tenders_not_by_schools_classified[df_tenders_not_by_schools_classified['Тип закладу'] != 'Невідомо'].copy()

df_step7_numerated = numeration(df_step7, columns_to_numerate_step7, reg_number, action_mark)
print("df_step7_numerated", df_step7_numerated.shape)

df_step7_numerated (23695, 19)


In [28]:
"""
    Якщо в колонках Лот і Тендер знайшло по одному паттерну і вони однакові - 
    закупівля вважається такою, де коректно визначений номер

    Ці закупівлі потрапляють до датафрейму df_step7_numerated_lot_tender

    Колонка "Номер" отримує знайдений номер "Лот_numeration"

    Решта закупівель потрапляють до датафрейму df_step7_numerated_undefined.
"""

df_step7_numerated['Номер'] = np.where(((df_step7_numerated['Тендер_numeration_count'] == 1) | 
                                        (df_step7_numerated['Лот_numeration_count'] == 1)) & 
                                        (df_step7_numerated['Лот_numeration_count'] == df_step7_numerated['Тендер_numeration_count']), 
                                        df_step7_numerated['Лот_numeration'], 
                                        'Невідомо')

df_step7_numerated_lot_tender = df_step7_numerated[df_step7_numerated['Номер'] != 'Невідомо']

df_step7_numerated_undefined = df_step7_numerated[df_step7_numerated['Номер'] == 'Невідомо']

print("df_step7_numerated_lot_tender", df_step7_numerated_lot_tender.shape, "\ndf_step7_numerated_undefined", df_step7_numerated_undefined.shape)

df_step7_numerated_lot_tender (17104, 20) 
df_step7_numerated_undefined (6591, 20)


In [29]:
"""
    Якщо в колонці Лот знайдений один паттерн - 
    закупівля потрапляють до датафрейму df_step7_numerated_lot
    
    Решта закупівель потрапляють до датафрейму до df_step7_numerated_undefined_2
"""

df_step7_numerated_lot = df_step7_numerated_undefined.copy()

df_step7_numerated_lot['Номер'] = np.where(df_step7_numerated_lot['Лот_numeration_count'] == 1, 
                                                 df_step7_numerated_lot['Лот_numeration'], 
                                                 'Невідомо')

df_step7_numerated_undefined_2 = df_step7_numerated_lot[df_step7_numerated_lot['Номер'] == 'Невідомо']
df_step7_numerated_lot = df_step7_numerated_lot[df_step7_numerated_lot['Номер'] != 'Невідомо']

print("df_step7_numerated_lot", df_step7_numerated_lot.shape, "\ndf_step7_numerated_undefined_2", df_step7_numerated_undefined_2.shape)

df_step7_numerated_lot (527, 20) 
df_step7_numerated_undefined_2 (6064, 20)


In [30]:
"""
    Якщо в колонці Тендер знайдений один паттерн - 
    закупівля потрапляють до датафрейму df_step7_numerated_tender
    
    Решта закупівель потрапляють до датафрейму до df_step7_numerated_undefined_3
"""
df_step7_numerated_tender = df_step7_numerated_undefined_2.copy()

df_step7_numerated_tender['Номер'] = np.where(df_step7_numerated_tender['Тендер_numeration_count'] == 1, 
                                                 df_step7_numerated_tender['Тендер_numeration'], 
                                                 'Невідомо')
df_step7_numerated_undefined_3 = df_step7_numerated_tender[df_step7_numerated_tender['Номер'] == 'Невідомо']
df_step7_numerated_tender = df_step7_numerated_tender[df_step7_numerated_tender['Номер'] != 'Невідомо']

print("df_step7_numerated_tender", df_step7_numerated_tender.shape, "\ndf_step7_numerated_undefined_3", df_step7_numerated_undefined_3.shape)

df_step7_numerated_tender (25, 20) 
df_step7_numerated_undefined_3 (6039, 20)


##### Step 7.5: Об'єднання датафреймів шкіл-не-замовників з номерами

In [33]:
frames = [df_step7_numerated_lot_tender, df_step7_numerated_lot, df_step7_numerated_tender]
df_tenders_not_by_schools_numerated = pd.concat(frames)
df_tenders_not_by_schools_numerated['Назва'] = np.nan # Створення пустої колонки "Назва" для подальшого обєднання з датафреймом з номерами

##### Step 8: Найменування шкіл-не-замовників

In [35]:
columns_to_classify_step8 = ['Тендер', 'Лот']
action_mark = 'naming'
df_step8 = df_step7_numerated_undefined_3.copy()

df_tenders_not_by_schools_named = naming(df_step8, columns_to_classify_step8, reg_quotes, action_mark)
print("df_tenders_not_by_schools_named", df_tenders_not_by_schools_named.shape)

df_tenders_not_by_schools_named (6039, 22)


In [36]:
df_tenders_not_by_schools_named['Назва'] = np.where((df_tenders_not_by_schools_named['Тендер_naming'].notnull()) & 
                             (df_tenders_not_by_schools_named['Лот_naming'].notnull()) & 
                             (df_tenders_not_by_schools_named['Тендер_naming'] == df_tenders_not_by_schools_named['Лот_naming']),
                             df_tenders_not_by_schools_named['Тендер_naming'], 
                             'Невідомо')

df_step8_undefined = df_tenders_not_by_schools_named[df_tenders_not_by_schools_named['Назва'] == 'Невідомо']
df_tenders_not_by_schools_named_lot_tender = df_tenders_not_by_schools_named[df_tenders_not_by_schools_named['Назва'] != 'Невідомо']

##### Step 9: Об'єднання двох датафреймів шкіл-не-замовників

In [49]:
frames = [df_tenders_not_by_schools_numerated, df_tenders_not_by_schools_named]
df_tenders_not_by_schools = pd.concat(frames)

In [50]:
df_tenders_not_by_schools['Заклад-замовник'] = False

In [51]:
df_tenders_not_by_schools = df_tenders_not_by_schools[col_names]
print("df_tenders_not_by_schools_numerated", df_tenders_not_by_schools_numerated.shape)

df_tenders_not_by_schools_numerated (17656, 21)


In [52]:
df_tenders_not_by_schools

Unnamed: 0,ИдентификаторЛота,Идентификатор,Организатор,Тендер,СуммаЛота,ОписаниеТендера,Лот,Адрес поставки,АдресОрганизатора,Главный орган,IDOrganizator,Номер,Назва,Тип закладу,Заклад-замовник
159,UA-2016-12-14-000943-a-L1,UA-2016-12-14-000943-a,Управління освіти Солом'янської районної в міс...,Капітальний ремонт місць загального користуван...,200000,Капітальний ремонт місць загального користуван...,Капітальний ремонт місць загального користуван...,"вул.Єреванська, 20","вулиця Пітерська, 12",КМДА,37485490,№166,,Загальноосвітня школа,False
297,UA-2016-12-29-000878-c-L1,UA-2016-12-29-000878-c,Управління освіти Солом'янської районної в міс...,Поточний (аварійний) ремонт електрощитової з з...,59049.6,Поточний (аварійний) ремонт електрощитової з з...,Поточний (аварійний) ремонт електрощитової з з...,"вул. Курська, 12","вулиця Пітерська, 12",КМДА,37485490,№177,,Гімназія,False
1006,UA-2017-04-28-001555-b-L1,UA-2017-04-28-001555-b,Управління освіти Солом'янської районної в міс...,ДСТУ Б.Д. 1.1-1:2013 Капітальний ремонт інжене...,306000,ДСТУ Б.Д. 1.1-1:2013 Капітальний ремонт інжене...,ДСТУ Б.Д. 1.1-1:2013 Капітальний ремонт інжене...,"вул. Зелена, буд. 12","вулиця Пітерська, 12",КМДА,37485490,№ 12,,Загальноосвітня школа,False
1070,UA-2017-06-02-001017-a-L1,UA-2017-06-02-001017-a,ВК Управління освіти виконавчого комітету Полт...,Капітальний ремонт приміщення харчоблоку Полта...,320383.2,,Капітальний ремонт приміщення харчоблоку Полта...,"вул. Грушевського, 17а","вул. Соборності, 36",Полтавська міська рада,2145725,№ 45,,Навчально-виховний комплекс (об'єднання),False
1096,UA-2017-04-28-000337-c-L1,UA-2017-04-28-000337-c,Управління освіти Деснянської районної в місті...,Капітальний ремонт покрівлі в дошкільному навч...,200000,В очікувану вартість закупівлі входять витрати...,Капітальний ремонт покрівлі в дошкільному навч...,"вул. Маршала Жукова, 24-Б","вул. Закревського, 15-А",КМДА,37501684,№ 534,,ДНЗ,False
1102,UA-2017-08-15-000776-c-L1,UA-2017-08-15-000776-c,Департамент освіти Харківської міської ради,Капітальний ремонт і реставрація (Капітальний ...,168300,ДСТУ Б Д.1.1-1:2013,Капітальний ремонт і реставрація (Капітальний ...,"вул. Алчевських,55","вул. Сумська, 64",Харківська міська рада,22704183,№36,,Загальноосвітня школа,False
1135,UA-2017-09-06-001000-a-L1,UA-2017-09-06-001000-a,Управління капітального будівництва Чернігівсь...,"Реконструкція об'єкту згідно проекту ""Технічн...",414777.52,"Реконструкція об'єкту згідно проекту ""Технічн...","Реконструкція об'єкту згідно проекту ""Технічн...","Івана Мазепи, 19","вул. Івана Мазепи, 19, к. 216",Чернігівська міська рада,5517729,№ 46,,ДНЗ,False
1148,UA-2017-11-04-000056-c-L1,UA-2017-11-04-000056-c,Управління освіти та інноваційного розвитку Пе...,Поточний ремонт вентиляції ДНЗ № 265 за адресо...,60000,Поточний ремонт вентиляції ДНЗ № 265 за адресо...,Поточний ремонт вентиляції ДНЗ № 265 за адресо...,"б-р. Дружби Народів, 22-А","вул. Інститутська, буд. 24/7",КМДА,39833860,№ 265,,ДНЗ,False
1167,UA-2017-03-16-000247-b-L1,UA-2017-03-16-000247-b,Департамент капітального будівництва,Реконструкція будівлі (термомодернізація) кому...,251358,Розробка проектно-кошторисної документації по ...,Реконструкція будівлі (термомодернізація) кому...,"вул. Б. Ступки,18","вул. Пирогова , буд. 34а",Вінницька міська рада,3084204,№5,,Загальноосвітня школа,False
1199,UA-2017-04-08-000001-c-L1,UA-2017-04-08-000001-c,Львівська міська рада Відділ освіти Шевченківс...,Капітальний ремонт з заміною вікон у ДНЗ № 106...,122716.8,,Капітальний ремонт з заміною вікон у ДНЗ № 106...,"вул. Хвильового, 11","Джерельна, 71",Львівська міська рада,2144588,№ 106,,ДНЗ,False


##### Step 10: Об'єднання датафреймів шкіл-не-замовників та шкіл-замовників

In [44]:
frames = [df_tenders_by_schools, df_tenders_not_by_schools]
df_tenders = pd.concat(frames)
print("df_tenders", df_tenders.shape)

df_tenders (55554, 15)
