**ВИЗУАЛИЗАЦИЯ МЕДИЦИНСКОЙ СТАТИСТИКИ:** 
Ресурсы и деятельность организаций здравоохранения

- тг для оперативной связи - @koroleva_katerina
- ссылка на дэш https://datalens.yandex/viic7kbounpyj

⭐️ **Цель:** превращение разрозненных таблиц статистики в простой и наглядный дашборд

⭐️ **Задачи:**

- Изучить все таблицы и вытащить нужные
- Сделать предобработку данных: чистку, переименование столбцов, объединение таблиц
- Построить дашборд в DataLens
- Проверить предположения о том, что за период 2006-2022 число государственных больничных организаций снизилось более, чем на 20%, число частных больничных организаций выросло в 4 раза, а количество участковых (сельских) больниц уменьшилось в 20 раз
- Подготовить описание: какие таблицы использованы и почему

⭐️ **Ожидаемый результат:**

- Тетрадка ipynb
- Ссылка на дашборд
- Ссылка на документ с текстовым описанием решения задачи

⭐️ **Данные:**

Были получены путем парсинга сайта Росстата. Они являются общедоступными, их использование в любых коммерческих и не коммерческих проектах разрешено. К сожалению, данные представляют собой огромное количество файлов разных форматов и не всегда согласующихся между собой (пример - разные заголовки столбцов у одного вида статистике в разных годах). При этом данные относительно чистые - поэтому усилия по предобработке меньше, чем обычно.

df_hospital:
- `Год`
- `Общее число всех больничных организаций`
- `Общее число негосударственных организаций`
- `Общее число частных организаций`
- `Общее число коек в больничных организациях (тыс)` - Койки круглосуточных стационаров (без коек в дневных стационарах)
- `Общее число коек в негосударственных организациях (тыс)`
- `Общее число коек в частных организациях (тыс)`
- `Общее число коек в больничных организациях на 10 000 человек населения`
- `Общее число ЦРБ` - Общее число центральных районных больниц в системе Минздрава России
- `Общее число коек ЦРБ (тыс)`
- `Общая средняя мощность одной ЦРБ (коек)`
- `Общее число РБ` - Общее число районных больниц в системе Минздрава России
- `Общее число коек РБ (тыс)`
- `Общая средняя мощность одной РБ (коек)`
- `Общее число УБ` - Общее число участковых больниц в системе Минздрава России
- `Общее число коек УБ (тыс)`
- `Общая средняя мощность одной УБ (коек)`
- `Число всех городских больничных организаций`
- `Число городских негосударственных организаций`
- `Число городских частных организаций`
- `Число коек в городских больничных организациях (тыс)` - Койки круглосуточных стационаров (без коек в дневных стационарах)
- `Число коек в городских негосударственных организациях (тыс)`
- `Число коек в городских частных организациях (тыс)`
- `Число коек в городских больничных организациях на 10 000 человек населения`
- `Число городских ЦРБ` - Число городских центральных районных больниц в системе Минздрава России
- `Число городских РБ` - Число городских районных больниц в системе Минздрава России
- `Число городских УБ` - Число городских участковых больниц в системе Минздрава России
- `Число всех сельских больничных организаций`
- `Число сельских негосударственных организаций`
- `Число сельских частных организаций`
- `Число коек в сельских больничных организациях (тыс)` - Койки круглосуточных стационаров (без коек в дневных стационарах)
- `Число коек в сельских негосударственных организациях (тыс)`
- `Число коек в сельских частных организациях (тыс)`
- `Число коек в сельских больничных организациях на 10 000 человек населения`
- `Число сельских ЦРБ` - Число сельских центральных районных больниц в системе Минздрава России
- `Число сельских РБ` - Число сельских районных больниц в системе Минздрава России
- `Число сельских УБ` - Число сельских участковых больниц в системе Минздрава России

# Загрузим данные

## Импортируем библиотеки

In [1]:
import pandas as pd
pd.set_option('display.max_columns', 500) # отображение всех столбцов без сокращений
pd.set_option('display.max_rows', 500)
import numpy as np
import re

# отображение сообщений об ошибках
import warnings
warnings.filterwarnings('ignore')

## Загрузим датасеты и сделаем первичную обработку

Для исследования были выбраны данные из раздела 3.1 Сеть и материально-техническая база  медицинских организаций. Там как раз есть нужные данные по количеству медицинских организаций

In [2]:
try: 
    df_hospitals_2023 = pd.read_excel(r'C:\Users\admin\YandexDisk\Practice\Pet-projects\medicine\source2\2023\Zdrav_03-01-2023.xlsx', sheet_name='3.1', header=1)
    df_hospitals_2019 = pd.read_csv(r'C:\Users\admin\YandexDisk\Practice\Pet-projects\medicine\source2\2019\РЕСУРСЫ И ДЕЯТЕЛЬНОСТЬ ОРГАНИЗАЦИЙ-\3.1. больничные организации.csv')
    df_hospitals_2015 = pd.read_csv(r'C:\Users\admin\YandexDisk\Practice\Pet-projects\medicine\source2\2015\РЕСУРСЫ И ДЕЯТЕЛЬНОСТЬ ОРГАНИЗАЦИЙ-\3.1. больничные организации.csv')
    df_hospitals_2011 = pd.read_csv(r'C:\Users\admin\YandexDisk\Practice\Pet-projects\medicine\source2\2011\Ресурсы и деятельность учреждений здравоохранения\больничные учреждения.csv', header=1)
    df_hospitals_2009 = pd.read_csv(r'C:\Users\admin\YandexDisk\Practice\Pet-projects\medicine\source2\2009\Ресурсы и деятельность учреждений здравоохранения\больничные учреждения.csv', header=1)
    df_hospitals_2007 = pd.read_csv(r'C:\Users\admin\YandexDisk\Practice\Pet-projects\medicine\source2\2007\Ресурсы и деятельность учреждений здравоохранения\больничные учреждения.csv', header=1)
    #df_hospitals_2005 = pd.read_csv(r'C:\Users\admin\YandexDisk\Practice\Pet-projects\medicine\source2\2005\Ресурсы и деятельность учреждений здравоохранения\больничные учреждения.csv', header=1)
except: 
    print('Ошибка импорта')

In [3]:
# транспонируем и объединим таблицы
def transpose_and_concatenate(*dfs):
    '''Транспонирует и объединяет таблицы. 
       Устанавливает заловок'''
    transposed_dfs = [df.T for df in dfs]
    concatenated_df = pd.concat(transposed_dfs, axis=0).reset_index(drop=False)
    concatenated_df.columns = concatenated_df.iloc[0] 
    concatenated_df = concatenated_df[1:].reset_index(drop=True)
    return concatenated_df

df_hospitals = transpose_and_concatenate(df_hospitals_2023, df_hospitals_2019, df_hospitals_2015, df_hospitals_2011, 
                                   df_hospitals_2009, df_hospitals_2007)
df_hospitals

Unnamed: 0.1,Unnamed: 0,NaN,Число больничных организаций,из них негосударственные,из них частной формы собственности,Число коек в больничных организациях:,"всего, тыс.",из них в негосударственных организациях,из них частной формы собственности.1,на 10 000 человек населения,Число центральных районных больниц2),"в них коек, тыс.","средняя мощность одной больницы, коек",Число районных больниц2),"в них коек, тыс..1","средняя мощность одной больницы, коек.1",Число участковых больниц2),"в них коек, тыс..2","средняя мощность одной больницы, коек.2",NaN.1,Число больничных организаций.1,из них негосударственные.1,из них частной формы собственности.2,Число коек в больничных организациях:.1,"всего, тыс..1",из них в негосударственных организациях.1,из них частной формы собственности.3,на 10 000 человек населения.1,Число центральных районных больниц2).1,Число районных больниц2).1,Число участковых больниц2).1,NaN.2,Число больничных организаций.2,из них негосударственные.2,из них частной формы собственности.4,Число коек в больничных организациях:.2,"всего, тыс..2",из них в негосударственных организациях.2,из них частной формы собственности.5,на 10 000 человек населения.2,Число центральных районных больниц2).2,Число районных больниц2).2,Число участковых больниц2).2,1) Койки круглосуточных стационаров (без коек в дневных стационарах).,2) В системе Минздрава России.
0,2010,Всего,6 308,224,115,,"1 339,51)",21.7,4.1,93.8,1 754,327.1,186,191,24.2,126,400,11.2,28,В городских поселениях,4 959,216,110,,"1 186,11)",20.2,3.4,112.5,1 027,112,18,В сельской местности,1 349,8,5,,"153,41)",1.6,0.68,40.9,727,79,382,,
1,2015,,5 433,245,180,,"1 222,01)",24.1,12.8,83.4,1 426,205.6,144,415,54.5,131,69,2.2,32,,4 397,239,176,,"1 060,11)",21.8,12.1,97.6,829,230,4,,1 036,6,4,,"161,91)",2.3,0.6,42.7,597,185,65,,
2,2019,,5 130,328,274,,"1 173,61)",29.8,20.5,80,1 325,177.4,134,416,52.6,126,32,1,31,,4 186,318,265,,"1 017,61)",25.7,17.8,92.9,789,217,4,,944,10,9,,"155,91)",4.1,2.7,41.9,536,199,28,,
3,2020,,5 065,344,294,,"1 188,81)",32.7,23.3,81.3,1 316,175.4,133,409,51.5,126,29,0.9,31,,4 136,340,290,,"1 031,11)",29.6,21.1,94.4,784,208,4,,929,4,4,,"157,61)",3.1,2.3,42.7,532,201,25,,
4,2021,,5072,410,367,,"1 162,11)",32.6,24.9,,1311,171.6,131,391,49.1,126,28,0.9,31,,4146,398,355,,"1 009,81)",28.7,21.8,,778,202,4,,926,12,12,,"152,41)",3.9,3.1,,533,189,24,,
5,2022,,5167,458,409,,"1 141,91)",36.1,28,,1280,164,128,396,48.4,122,21,0.7,33,,4219,446,397,,"991,11)",31.8,24.5,,757,211,4,,948,12,12,,150.8,4.3,3.4,,523,185,17,,
6,Unnamed: 0,,Число больничных организаций,из них негосударственные,из них частной формы собственности,Число коек в больничных организациях:,"всего, тыс.",из них в негосударственных организациях,из них частной формы собственности,на 10 000 человек населения,Число центральных районных больниц2),"в них коек, тыс.","средняя мощность одной больницы, коек",Число районных больниц2),"в них коек, тыс.","средняя мощность одной больницы, коек",Число участковых больниц2),"в них коек, тыс.","средняя мощность одной больницы, коек",,Число больничных организаций,из них негосударственные,из них частной формы собственности,Число коек в больничных организациях:,"всего, тыс.",из них в негосударственных организациях,из них частной формы собственности,на 10 000 человек населения,Число центральных районных больниц2),Число районных больниц2),Число участковых больниц2),,Число больничных организаций,из них негосударственные,из них частной формы собственности,Число коек в больничных организациях:,"всего, тыс.",из них в негосударственных организациях,из них частной формы собственности,на 10 000 человек населения,Число центральных районных больниц2),Число районных больниц2),Число участковых больниц2),,
7,2005,Всего,9479,293,…,,15754,324,…,1109,1734,3451,199,267,308,115,2631,623,24,В городских поселениях,5820,286,…,,13659,321,…,1303,1046,148,40,В сельской местности,3659,7,…,,2095,03,…,556,688,119,2591,,
8,2010,Всего,6308,224,115,,"1339,51)",217,41,938,1754,3271,186,191,242,126,400,112,28,В городских поселениях,4959,216,110,,"1186,11)",202,34,1125,1027,112,18,В сельской местности,1349,8,5,,"153,41)",16,068,409,727,79,382,,
9,2015,Всего,5433,245,180,,"1222,01)",241,128,834,1426,2056,144,415,545,131,69,22,32,В городских поселениях,4397,239,176,,"1060,11)",218,121,976,829,230,4,В сельской местности,1036,6,4,,"161,91)",23,06,427,597,185,65,,


In [4]:
# переименуем столбцы датафрейма
df_hospitals.columns=['Год',
                     'delete1',
                     'Общее число всех больничных организаций',
                     'Общее число негосударственных организаций',
                     'Общее число частных организаций',
                     'delete2',
                     'Общее число коек в больничных организациях (тыс)',
                     'Общее число коек в негосударственных организациях (тыс)',
                     'Общее число коек в частных организациях (тыс)',
                     'Общее число коек в больничных организациях на 10 000 человек населения',
                     'Общее число ЦРБ',
                     'Общее число коек ЦРБ (тыс)',
                     'Общая средняя мощность одной ЦРБ (коек)',
                     'Общее число РБ',
                     'Общее число коек РБ (тыс)',
                     'Общая средняя мощность одной РБ (коек)',
                     'Общее число УБ',
                     'Общее число коек УБ (тыс)',
                     'Общая средняя мощность одной УБ (коек)',
                     'delete3',
                     'Число всех городских больничных организаций',
                     'Число городских негосударственных организаций',
                     'Число городских частных организаций',
                     'delete4',
                     'Число коек в городских больничных организациях (тыс)',
                     'Число коек в городских негосударственных организациях (тыс)',
                     'Число коек в городских частных организациях (тыс)',
                     'Число коек в городских больничных организациях на 10 000 человек населения',
                     'Число городских ЦРБ',
                     'Число городских РБ',
                     'Число городских УБ',
                     'delete5',
                     'Число всех сельских больничных организаций',
                     'Число сельских негосударственных организаций',
                     'Число сельских частных организаций',
                     'delete6',
                     'Число коек в сельских больничных организациях (тыс)',
                     'Число коек в сельских негосударственных организациях (тыс)',
                     'Число коек в сельских частных организациях (тыс)',
                     'Число коек в сельских больничных организациях на 10 000 человек населения',
                     'Число сельских ЦРБ',
                     'Число сельских РБ',
                     'Число сельских УБ',
                     'delete7',
                     'delete8']

df_hospitals

Unnamed: 0,Год,delete1,Общее число всех больничных организаций,Общее число негосударственных организаций,Общее число частных организаций,delete2,Общее число коек в больничных организациях (тыс),Общее число коек в негосударственных организациях (тыс),Общее число коек в частных организациях (тыс),Общее число коек в больничных организациях на 10 000 человек населения,Общее число ЦРБ,Общее число коек ЦРБ (тыс),Общая средняя мощность одной ЦРБ (коек),Общее число РБ,Общее число коек РБ (тыс),Общая средняя мощность одной РБ (коек),Общее число УБ,Общее число коек УБ (тыс),Общая средняя мощность одной УБ (коек),delete3,Число всех городских больничных организаций,Число городских негосударственных организаций,Число городских частных организаций,delete4,Число коек в городских больничных организациях (тыс),Число коек в городских негосударственных организациях (тыс),Число коек в городских частных организациях (тыс),Число коек в городских больничных организациях на 10 000 человек населения,Число городских ЦРБ,Число городских РБ,Число городских УБ,delete5,Число всех сельских больничных организаций,Число сельских негосударственных организаций,Число сельских частных организаций,delete6,Число коек в сельских больничных организациях (тыс),Число коек в сельских негосударственных организациях (тыс),Число коек в сельских частных организациях (тыс),Число коек в сельских больничных организациях на 10 000 человек населения,Число сельских ЦРБ,Число сельских РБ,Число сельских УБ,delete7,delete8
0,2010,Всего,6 308,224,115,,"1 339,51)",21.7,4.1,93.8,1 754,327.1,186,191,24.2,126,400,11.2,28,В городских поселениях,4 959,216,110,,"1 186,11)",20.2,3.4,112.5,1 027,112,18,В сельской местности,1 349,8,5,,"153,41)",1.6,0.68,40.9,727,79,382,,
1,2015,,5 433,245,180,,"1 222,01)",24.1,12.8,83.4,1 426,205.6,144,415,54.5,131,69,2.2,32,,4 397,239,176,,"1 060,11)",21.8,12.1,97.6,829,230,4,,1 036,6,4,,"161,91)",2.3,0.6,42.7,597,185,65,,
2,2019,,5 130,328,274,,"1 173,61)",29.8,20.5,80,1 325,177.4,134,416,52.6,126,32,1,31,,4 186,318,265,,"1 017,61)",25.7,17.8,92.9,789,217,4,,944,10,9,,"155,91)",4.1,2.7,41.9,536,199,28,,
3,2020,,5 065,344,294,,"1 188,81)",32.7,23.3,81.3,1 316,175.4,133,409,51.5,126,29,0.9,31,,4 136,340,290,,"1 031,11)",29.6,21.1,94.4,784,208,4,,929,4,4,,"157,61)",3.1,2.3,42.7,532,201,25,,
4,2021,,5072,410,367,,"1 162,11)",32.6,24.9,,1311,171.6,131,391,49.1,126,28,0.9,31,,4146,398,355,,"1 009,81)",28.7,21.8,,778,202,4,,926,12,12,,"152,41)",3.9,3.1,,533,189,24,,
5,2022,,5167,458,409,,"1 141,91)",36.1,28,,1280,164,128,396,48.4,122,21,0.7,33,,4219,446,397,,"991,11)",31.8,24.5,,757,211,4,,948,12,12,,150.8,4.3,3.4,,523,185,17,,
6,Unnamed: 0,,Число больничных организаций,из них негосударственные,из них частной формы собственности,Число коек в больничных организациях:,"всего, тыс.",из них в негосударственных организациях,из них частной формы собственности,на 10 000 человек населения,Число центральных районных больниц2),"в них коек, тыс.","средняя мощность одной больницы, коек",Число районных больниц2),"в них коек, тыс.","средняя мощность одной больницы, коек",Число участковых больниц2),"в них коек, тыс.","средняя мощность одной больницы, коек",,Число больничных организаций,из них негосударственные,из них частной формы собственности,Число коек в больничных организациях:,"всего, тыс.",из них в негосударственных организациях,из них частной формы собственности,на 10 000 человек населения,Число центральных районных больниц2),Число районных больниц2),Число участковых больниц2),,Число больничных организаций,из них негосударственные,из них частной формы собственности,Число коек в больничных организациях:,"всего, тыс.",из них в негосударственных организациях,из них частной формы собственности,на 10 000 человек населения,Число центральных районных больниц2),Число районных больниц2),Число участковых больниц2),,
7,2005,Всего,9479,293,…,,15754,324,…,1109,1734,3451,199,267,308,115,2631,623,24,В городских поселениях,5820,286,…,,13659,321,…,1303,1046,148,40,В сельской местности,3659,7,…,,2095,03,…,556,688,119,2591,,
8,2010,Всего,6308,224,115,,"1339,51)",217,41,938,1754,3271,186,191,242,126,400,112,28,В городских поселениях,4959,216,110,,"1186,11)",202,34,1125,1027,112,18,В сельской местности,1349,8,5,,"153,41)",16,068,409,727,79,382,,
9,2015,Всего,5433,245,180,,"1222,01)",241,128,834,1426,2056,144,415,545,131,69,22,32,В городских поселениях,4397,239,176,,"1060,11)",218,121,976,829,230,4,В сельской местности,1036,6,4,,"161,91)",23,06,427,597,185,65,,


In [5]:
# удалим столбцы, название которых содержит слово 'delete'
def remove_columns_with_delete(df): 
    '''Фильтрует и удаляет столбцы, если название содержит delete'''
    columns_to_delete = df.filter(like='delete').columns # найти
    df = df.drop(columns=columns_to_delete) # удалить
    return df

df_hospitals = remove_columns_with_delete(df_hospitals)
df_hospitals

Unnamed: 0,Год,Общее число всех больничных организаций,Общее число негосударственных организаций,Общее число частных организаций,Общее число коек в больничных организациях (тыс),Общее число коек в негосударственных организациях (тыс),Общее число коек в частных организациях (тыс),Общее число коек в больничных организациях на 10 000 человек населения,Общее число ЦРБ,Общее число коек ЦРБ (тыс),Общая средняя мощность одной ЦРБ (коек),Общее число РБ,Общее число коек РБ (тыс),Общая средняя мощность одной РБ (коек),Общее число УБ,Общее число коек УБ (тыс),Общая средняя мощность одной УБ (коек),Число всех городских больничных организаций,Число городских негосударственных организаций,Число городских частных организаций,Число коек в городских больничных организациях (тыс),Число коек в городских негосударственных организациях (тыс),Число коек в городских частных организациях (тыс),Число коек в городских больничных организациях на 10 000 человек населения,Число городских ЦРБ,Число городских РБ,Число городских УБ,Число всех сельских больничных организаций,Число сельских негосударственных организаций,Число сельских частных организаций,Число коек в сельских больничных организациях (тыс),Число коек в сельских негосударственных организациях (тыс),Число коек в сельских частных организациях (тыс),Число коек в сельских больничных организациях на 10 000 человек населения,Число сельских ЦРБ,Число сельских РБ,Число сельских УБ
0,2010,6 308,224,115,"1 339,51)",21.7,4.1,93.8,1 754,327.1,186,191,24.2,126,400,11.2,28,4 959,216,110,"1 186,11)",20.2,3.4,112.5,1 027,112,18,1 349,8,5,"153,41)",1.6,0.68,40.9,727,79,382
1,2015,5 433,245,180,"1 222,01)",24.1,12.8,83.4,1 426,205.6,144,415,54.5,131,69,2.2,32,4 397,239,176,"1 060,11)",21.8,12.1,97.6,829,230,4,1 036,6,4,"161,91)",2.3,0.6,42.7,597,185,65
2,2019,5 130,328,274,"1 173,61)",29.8,20.5,80,1 325,177.4,134,416,52.6,126,32,1,31,4 186,318,265,"1 017,61)",25.7,17.8,92.9,789,217,4,944,10,9,"155,91)",4.1,2.7,41.9,536,199,28
3,2020,5 065,344,294,"1 188,81)",32.7,23.3,81.3,1 316,175.4,133,409,51.5,126,29,0.9,31,4 136,340,290,"1 031,11)",29.6,21.1,94.4,784,208,4,929,4,4,"157,61)",3.1,2.3,42.7,532,201,25
4,2021,5072,410,367,"1 162,11)",32.6,24.9,,1311,171.6,131,391,49.1,126,28,0.9,31,4146,398,355,"1 009,81)",28.7,21.8,,778,202,4,926,12,12,"152,41)",3.9,3.1,,533,189,24
5,2022,5167,458,409,"1 141,91)",36.1,28,,1280,164,128,396,48.4,122,21,0.7,33,4219,446,397,"991,11)",31.8,24.5,,757,211,4,948,12,12,150.8,4.3,3.4,,523,185,17
6,Unnamed: 0,Число больничных организаций,из них негосударственные,из них частной формы собственности,"всего, тыс.",из них в негосударственных организациях,из них частной формы собственности,на 10 000 человек населения,Число центральных районных больниц2),"в них коек, тыс.","средняя мощность одной больницы, коек",Число районных больниц2),"в них коек, тыс.","средняя мощность одной больницы, коек",Число участковых больниц2),"в них коек, тыс.","средняя мощность одной больницы, коек",Число больничных организаций,из них негосударственные,из них частной формы собственности,"всего, тыс.",из них в негосударственных организациях,из них частной формы собственности,на 10 000 человек населения,Число центральных районных больниц2),Число районных больниц2),Число участковых больниц2),Число больничных организаций,из них негосударственные,из них частной формы собственности,"всего, тыс.",из них в негосударственных организациях,из них частной формы собственности,на 10 000 человек населения,Число центральных районных больниц2),Число районных больниц2),Число участковых больниц2)
7,2005,9479,293,…,15754,324,…,1109,1734,3451,199,267,308,115,2631,623,24,5820,286,…,13659,321,…,1303,1046,148,40,3659,7,…,2095,03,…,556,688,119,2591
8,2010,6308,224,115,"1339,51)",217,41,938,1754,3271,186,191,242,126,400,112,28,4959,216,110,"1186,11)",202,34,1125,1027,112,18,1349,8,5,"153,41)",16,068,409,727,79,382
9,2015,5433,245,180,"1222,01)",241,128,834,1426,2056,144,415,545,131,69,22,32,4397,239,176,"1060,11)",218,121,976,829,230,4,1036,6,4,"161,91)",23,06,427,597,185,65


In [6]:
# удалим ненужные строки
def remove_rows_by_index(df, indices):
    df = df.drop(indices) # удалить по указанным индексам
    return df

indices_to_remove = [6, 13, 20, 26, 32]

df_hospitals = remove_rows_by_index(df_hospitals, indices_to_remove)
df_hospitals

Unnamed: 0,Год,Общее число всех больничных организаций,Общее число негосударственных организаций,Общее число частных организаций,Общее число коек в больничных организациях (тыс),Общее число коек в негосударственных организациях (тыс),Общее число коек в частных организациях (тыс),Общее число коек в больничных организациях на 10 000 человек населения,Общее число ЦРБ,Общее число коек ЦРБ (тыс),Общая средняя мощность одной ЦРБ (коек),Общее число РБ,Общее число коек РБ (тыс),Общая средняя мощность одной РБ (коек),Общее число УБ,Общее число коек УБ (тыс),Общая средняя мощность одной УБ (коек),Число всех городских больничных организаций,Число городских негосударственных организаций,Число городских частных организаций,Число коек в городских больничных организациях (тыс),Число коек в городских негосударственных организациях (тыс),Число коек в городских частных организациях (тыс),Число коек в городских больничных организациях на 10 000 человек населения,Число городских ЦРБ,Число городских РБ,Число городских УБ,Число всех сельских больничных организаций,Число сельских негосударственных организаций,Число сельских частных организаций,Число коек в сельских больничных организациях (тыс),Число коек в сельских негосударственных организациях (тыс),Число коек в сельских частных организациях (тыс),Число коек в сельских больничных организациях на 10 000 человек населения,Число сельских ЦРБ,Число сельских РБ,Число сельских УБ
0,2010,6 308,224,115,"1 339,51)",21.7,4.1,93.8,1 754,327.1,186,191,24.2,126,400,11.2,28,4 959,216,110,"1 186,11)",20.2,3.4,112.5,1 027,112,18,1 349,8,5,"153,41)",1.6,0.68,40.9,727,79,382
1,2015,5 433,245,180,"1 222,01)",24.1,12.8,83.4,1 426,205.6,144,415,54.5,131,69,2.2,32,4 397,239,176,"1 060,11)",21.8,12.1,97.6,829,230,4,1 036,6,4,"161,91)",2.3,0.6,42.7,597,185,65
2,2019,5 130,328,274,"1 173,61)",29.8,20.5,80.0,1 325,177.4,134,416,52.6,126,32,1.0,31,4 186,318,265,"1 017,61)",25.7,17.8,92.9,789,217,4,944,10,9,"155,91)",4.1,2.7,41.9,536,199,28
3,2020,5 065,344,294,"1 188,81)",32.7,23.3,81.3,1 316,175.4,133,409,51.5,126,29,0.9,31,4 136,340,290,"1 031,11)",29.6,21.1,94.4,784,208,4,929,4,4,"157,61)",3.1,2.3,42.7,532,201,25
4,2021,5072,410,367,"1 162,11)",32.6,24.9,,1311,171.6,131,391,49.1,126,28,0.9,31,4146,398,355,"1 009,81)",28.7,21.8,,778,202,4,926,12,12,"152,41)",3.9,3.1,,533,189,24
5,2022,5167,458,409,"1 141,91)",36.1,28,,1280,164.0,128,396,48.4,122,21,0.7,33,4219,446,397,"991,11)",31.8,24.5,,757,211,4,948,12,12,150.8,4.3,3.4,,523,185,17
7,2005,9479,293,…,15754,324,…,1109.0,1734,3451.0,199,267,308.0,115,2631,623.0,24,5820,286,…,13659,321,…,1303,1046,148,40,3659,7,…,2095,03,…,556,688,119,2591
8,2010,6308,224,115,"1339,51)",217,41,938.0,1754,3271.0,186,191,242.0,126,400,112.0,28,4959,216,110,"1186,11)",202,34,1125,1027,112,18,1349,8,5,"153,41)",16,068,409,727,79,382
9,2015,5433,245,180,"1222,01)",241,128,834.0,1426,2056.0,144,415,545.0,131,69,22.0,32,4397,239,176,"1060,11)",218,121,976,829,230,4,1036,6,4,"161,91)",23,06,427,597,185,65
10,2016,5357,266,205,"1197,21)",235,129,816.0,1388,1926.0,139,425,581.0,137,68,24.0,35,4351,263,203,"1041,01)",222,127,955,815,242,9,1006,3,2,"156,21)",13,02,414,573,183,59


## Вывод

- Импортированы библиотеки
- Для исследования были выбраны данные из раздела 3.1 Сеть и материально-техническая база медицинских организаций. Там как раз есть нужные данные по количеству медицинских организаций с 2006 по 2022 год

- Проведена первичная обработка:
   - транспонирование и объединение таблиц
   - установка заголовков
   - переименованы заголовки столбцов 
   - удалены лишние столбцы и строки

# Изучим общую информацию

In [7]:
df_hospitals.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 33 entries, 0 to 37
Data columns (total 37 columns):
 #   Column                                                                      Non-Null Count  Dtype 
---  ------                                                                      --------------  ----- 
 0   Год                                                                         33 non-null     object
 1   Общее число всех больничных организаций                                     33 non-null     object
 2   Общее число негосударственных организаций                                   33 non-null     object
 3   Общее число частных организаций                                             33 non-null     object
 4   Общее число коек в больничных организациях (тыс)                            33 non-null     object
 5   Общее число коек в негосударственных организациях (тыс)                     33 non-null     object
 6   Общее число коек в частных организациях (тыс)               

👀 Нужно:
- изменить формат в `Год` → int64, остальные → float64
- удалить строки-дубликаты по столбцу `Год`
- найти пропуски и заменить → NaN
- удалить число со скобкой, образовавшееся из-за кривого исходника (пример столбца: Общее число коек в больничных организациях (тыс))
- названия столбцов к snake_case приводить нет смысла - в таком виде проще отображать на дэше

## Ошибки исходника в значениях

In [8]:
def remove_last_two_chars_if_contains_parenthesis(df):
    '''Проверяет все значения в `df_hospitals` и удаляет последние два символа из ячейки, если она содержит символ `)` '''
    # Применяем функцию ко всем ячейкам DataFrame
    def check_and_modify(value):
        if isinstance(value, str) and ')' in value:
            return value[:-2]
        return value
    
    # Применяем функцию ко всем элементам DataFrame
    return df.applymap(check_and_modify)

df_hospitals = remove_last_two_chars_if_contains_parenthesis(df_hospitals)
df_hospitals

Unnamed: 0,Год,Общее число всех больничных организаций,Общее число негосударственных организаций,Общее число частных организаций,Общее число коек в больничных организациях (тыс),Общее число коек в негосударственных организациях (тыс),Общее число коек в частных организациях (тыс),Общее число коек в больничных организациях на 10 000 человек населения,Общее число ЦРБ,Общее число коек ЦРБ (тыс),Общая средняя мощность одной ЦРБ (коек),Общее число РБ,Общее число коек РБ (тыс),Общая средняя мощность одной РБ (коек),Общее число УБ,Общее число коек УБ (тыс),Общая средняя мощность одной УБ (коек),Число всех городских больничных организаций,Число городских негосударственных организаций,Число городских частных организаций,Число коек в городских больничных организациях (тыс),Число коек в городских негосударственных организациях (тыс),Число коек в городских частных организациях (тыс),Число коек в городских больничных организациях на 10 000 человек населения,Число городских ЦРБ,Число городских РБ,Число городских УБ,Число всех сельских больничных организаций,Число сельских негосударственных организаций,Число сельских частных организаций,Число коек в сельских больничных организациях (тыс),Число коек в сельских негосударственных организациях (тыс),Число коек в сельских частных организациях (тыс),Число коек в сельских больничных организациях на 10 000 человек населения,Число сельских ЦРБ,Число сельских РБ,Число сельских УБ
0,2010,6 308,224,115,"1 339,5",21.7,4.1,93.8,1 754,327.1,186,191,24.2,126,400,11.2,28,4 959,216,110,"1 186,1",20.2,3.4,112.5,1 027,112,18,1 349,8,5,1534,1.6,0.68,40.9,727,79,382
1,2015,5 433,245,180,"1 222,0",24.1,12.8,83.4,1 426,205.6,144,415,54.5,131,69,2.2,32,4 397,239,176,"1 060,1",21.8,12.1,97.6,829,230,4,1 036,6,4,1619,2.3,0.6,42.7,597,185,65
2,2019,5 130,328,274,"1 173,6",29.8,20.5,80.0,1 325,177.4,134,416,52.6,126,32,1.0,31,4 186,318,265,"1 017,6",25.7,17.8,92.9,789,217,4,944,10,9,1559,4.1,2.7,41.9,536,199,28
3,2020,5 065,344,294,"1 188,8",32.7,23.3,81.3,1 316,175.4,133,409,51.5,126,29,0.9,31,4 136,340,290,"1 031,1",29.6,21.1,94.4,784,208,4,929,4,4,1576,3.1,2.3,42.7,532,201,25
4,2021,5072,410,367,"1 162,1",32.6,24.9,,1311,171.6,131,391,49.1,126,28,0.9,31,4146,398,355,"1 009,8",28.7,21.8,,778,202,4,926,12,12,1524,3.9,3.1,,533,189,24
5,2022,5167,458,409,"1 141,9",36.1,28,,1280,164.0,128,396,48.4,122,21,0.7,33,4219,446,397,9911,31.8,24.5,,757,211,4,948,12,12,150.8,4.3,3.4,,523,185,17
7,2005,9479,293,…,15754,324,…,1109.0,1734,3451.0,199,267,308.0,115,2631,623.0,24,5820,286,…,13659,321,…,1303,1046,148,40,3659,7,…,2095,03,…,556,688,119,2591
8,2010,6308,224,115,13395,217,41,938.0,1754,3271.0,186,191,242.0,126,400,112.0,28,4959,216,110,11861,202,34,1125,1027,112,18,1349,8,5,1534,16,068,409,727,79,382
9,2015,5433,245,180,12220,241,128,834.0,1426,2056.0,144,415,545.0,131,69,22.0,32,4397,239,176,10601,218,121,976,829,230,4,1036,6,4,1619,23,06,427,597,185,65
10,2016,5357,266,205,11972,235,129,816.0,1388,1926.0,139,425,581.0,137,68,24.0,35,4351,263,203,10410,222,127,955,815,242,9,1006,3,2,1562,13,02,414,573,183,59


## Тип данных

In [9]:
# `Год`
df_hospitals['Год'] = df_hospitals['Год'].astype('int64')
df_hospitals['Год'].dtypes

dtype('int64')

In [10]:
# остальные столбцы

def convert_columns_to_float64(df):
    '''Преобразует все столбцы `df_hospitals`, кроме первого, в формат `float64`'''
    for col in df.columns[1:]:
        # Преобразуем столбец в строковый формат, если он является объектом
        if df[col].dtype == 'object':
            df[col] = df[col].astype(str)
        # Применяем функцию только к строковым значениям
        df[col] = df[col].apply(lambda x: re.sub(r'[^\d.,]', '', x).replace(',', '.') if isinstance(x, str) else x)
        df[col] = df[col].apply(lambda x: x.replace('\xa0', '') if isinstance(x, str) else x)
        
        # Попробуем преобразовать в float64, игнорируя ошибки
        def safe_convert_to_float(x):
            try:
                return float(x)
            except ValueError:
                return None  # Или можно вернуть np.nan, если это более уместно для твоего случая
        
        df[col] = df[col].apply(safe_convert_to_float)
    return df

df_hospitals = convert_columns_to_float64(df_hospitals)
df_hospitals

Unnamed: 0,Год,Общее число всех больничных организаций,Общее число негосударственных организаций,Общее число частных организаций,Общее число коек в больничных организациях (тыс),Общее число коек в негосударственных организациях (тыс),Общее число коек в частных организациях (тыс),Общее число коек в больничных организациях на 10 000 человек населения,Общее число ЦРБ,Общее число коек ЦРБ (тыс),Общая средняя мощность одной ЦРБ (коек),Общее число РБ,Общее число коек РБ (тыс),Общая средняя мощность одной РБ (коек),Общее число УБ,Общее число коек УБ (тыс),Общая средняя мощность одной УБ (коек),Число всех городских больничных организаций,Число городских негосударственных организаций,Число городских частных организаций,Число коек в городских больничных организациях (тыс),Число коек в городских негосударственных организациях (тыс),Число коек в городских частных организациях (тыс),Число коек в городских больничных организациях на 10 000 человек населения,Число городских ЦРБ,Число городских РБ,Число городских УБ,Число всех сельских больничных организаций,Число сельских негосударственных организаций,Число сельских частных организаций,Число коек в сельских больничных организациях (тыс),Число коек в сельских негосударственных организациях (тыс),Число коек в сельских частных организациях (тыс),Число коек в сельских больничных организациях на 10 000 человек населения,Число сельских ЦРБ,Число сельских РБ,Число сельских УБ
0,2010,6308.0,224.0,115.0,1339.5,21.7,4.1,93.8,1754.0,327.1,186.0,191.0,24.2,126.0,400.0,11.2,28.0,4959.0,216.0,110.0,1186.1,20.2,3.4,112.5,1027.0,112.0,18.0,1349.0,8.0,5.0,153.4,1.6,0.68,40.9,727.0,79.0,382.0
1,2015,5433.0,245.0,180.0,1222.0,24.1,12.8,83.4,1426.0,205.6,144.0,415.0,54.5,131.0,69.0,2.2,32.0,4397.0,239.0,176.0,1060.1,21.8,12.1,97.6,829.0,230.0,4.0,1036.0,6.0,4.0,161.9,2.3,0.6,42.7,597.0,185.0,65.0
2,2019,5130.0,328.0,274.0,1173.6,29.8,20.5,80.0,1325.0,177.4,134.0,416.0,52.6,126.0,32.0,1.0,31.0,4186.0,318.0,265.0,1017.6,25.7,17.8,92.9,789.0,217.0,4.0,944.0,10.0,9.0,155.9,4.1,2.7,41.9,536.0,199.0,28.0
3,2020,5065.0,344.0,294.0,1188.8,32.7,23.3,81.3,1316.0,175.4,133.0,409.0,51.5,126.0,29.0,0.9,31.0,4136.0,340.0,290.0,1031.1,29.6,21.1,94.4,784.0,208.0,4.0,929.0,4.0,4.0,157.6,3.1,2.3,42.7,532.0,201.0,25.0
4,2021,5072.0,410.0,367.0,1162.1,32.6,24.9,,1311.0,171.6,131.0,391.0,49.1,126.0,28.0,0.9,31.0,4146.0,398.0,355.0,1009.8,28.7,21.8,,778.0,202.0,4.0,926.0,12.0,12.0,152.4,3.9,3.1,,533.0,189.0,24.0
5,2022,5167.0,458.0,409.0,1141.9,36.1,28.0,,1280.0,164.0,128.0,396.0,48.4,122.0,21.0,0.7,33.0,4219.0,446.0,397.0,991.1,31.8,24.5,,757.0,211.0,4.0,948.0,12.0,12.0,150.8,4.3,3.4,,523.0,185.0,17.0
7,2005,9479.0,293.0,,1575.4,32.4,,110.9,1734.0,345.1,199.0,267.0,30.8,115.0,2631.0,62.3,24.0,5820.0,286.0,,1365.9,32.1,,130.3,1046.0,148.0,40.0,3659.0,7.0,,209.5,0.3,,55.6,688.0,119.0,2591.0
8,2010,6308.0,224.0,115.0,1339.5,21.7,4.1,93.8,1754.0,327.1,186.0,191.0,24.2,126.0,400.0,11.2,28.0,4959.0,216.0,110.0,1186.1,20.2,3.4,112.5,1027.0,112.0,18.0,1349.0,8.0,5.0,153.4,1.6,0.68,40.9,727.0,79.0,382.0
9,2015,5433.0,245.0,180.0,1222.0,24.1,12.8,83.4,1426.0,205.6,144.0,415.0,54.5,131.0,69.0,2.2,32.0,4397.0,239.0,176.0,1060.1,21.8,12.1,97.6,829.0,230.0,4.0,1036.0,6.0,4.0,161.9,2.3,0.6,42.7,597.0,185.0,65.0
10,2016,5357.0,266.0,205.0,1197.2,23.5,12.9,81.6,1388.0,192.6,139.0,425.0,58.1,137.0,68.0,2.4,35.0,4351.0,263.0,203.0,1041.0,22.2,12.7,95.5,815.0,242.0,9.0,1006.0,3.0,2.0,156.2,1.3,0.2,41.4,573.0,183.0,59.0


## Явные дубли

In [11]:
df_hospitals.duplicated().sum()

10

👀 найдено 10 дублирующихся строк

In [12]:
df_hospitals.drop_duplicates(inplace=True)
df_hospitals.duplicated().sum()

0

## Неявные дубли

In [13]:
df_hospitals['Год'].value_counts()

2005    2
2010    2
2006    1
2014    1
2013    1
2012    1
2011    1
2009    1
2008    1
2007    1
2016    1
2017    1
1990    1
2000    1
1995    1
2022    1
2021    1
2020    1
2019    1
2018    1
2015    1
Name: Год, dtype: int64

In [14]:
df_hospitals.drop_duplicates(subset=['Год'], inplace=True)
df_hospitals['Год'].value_counts()

2016    1
2006    1
2014    1
2013    1
2012    1
2011    1
2010    1
2009    1
2008    1
2007    1
2005    1
2017    1
1990    1
2000    1
1995    1
2022    1
2021    1
2020    1
2019    1
2018    1
2015    1
Name: Год, dtype: int64

## Пропуски

In [15]:
# считаем количество пропусков в столбцах
display(df_hospitals.isna().sum())

# и в %
display(pd.DataFrame(round(df_hospitals.isna().mean()*100)).style.background_gradient('coolwarm'))

Год                                                                           0
Общее число всех больничных организаций                                       0
Общее число негосударственных организаций                                     1
Общее число частных организаций                                               4
Общее число коек в больничных организациях (тыс)                              0
Общее число коек в негосударственных организациях (тыс)                       1
Общее число коек в частных организациях (тыс)                                 5
Общее число коек в больничных организациях на 10 000 человек населения        2
Общее число ЦРБ                                                               0
Общее число коек ЦРБ (тыс)                                                    0
Общая средняя мощность одной ЦРБ (коек)                                       0
Общее число РБ                                                                0
Общее число коек РБ (тыс)               

Unnamed: 0,0
Год,0.0
Общее число всех больничных организаций,0.0
Общее число негосударственных организаций,5.0
Общее число частных организаций,19.0
Общее число коек в больничных организациях (тыс),0.0
Общее число коек в негосударственных организациях (тыс),5.0
Общее число коек в частных организациях (тыс),24.0
Общее число коек в больничных организациях на 10 000 человек населения,10.0
Общее число ЦРБ,0.0
Общее число коек ЦРБ (тыс),0.0


In [16]:
# посмотрим строки с пропусками
df_hospitals[df_hospitals.isna().any(axis=1)]

Unnamed: 0,Год,Общее число всех больничных организаций,Общее число негосударственных организаций,Общее число частных организаций,Общее число коек в больничных организациях (тыс),Общее число коек в негосударственных организациях (тыс),Общее число коек в частных организациях (тыс),Общее число коек в больничных организациях на 10 000 человек населения,Общее число ЦРБ,Общее число коек ЦРБ (тыс),Общая средняя мощность одной ЦРБ (коек),Общее число РБ,Общее число коек РБ (тыс),Общая средняя мощность одной РБ (коек),Общее число УБ,Общее число коек УБ (тыс),Общая средняя мощность одной УБ (коек),Число всех городских больничных организаций,Число городских негосударственных организаций,Число городских частных организаций,Число коек в городских больничных организациях (тыс),Число коек в городских негосударственных организациях (тыс),Число коек в городских частных организациях (тыс),Число коек в городских больничных организациях на 10 000 человек населения,Число городских ЦРБ,Число городских РБ,Число городских УБ,Число всех сельских больничных организаций,Число сельских негосударственных организаций,Число сельских частных организаций,Число коек в сельских больничных организациях (тыс),Число коек в сельских негосударственных организациях (тыс),Число коек в сельских частных организациях (тыс),Число коек в сельских больничных организациях на 10 000 человек населения,Число сельских ЦРБ,Число сельских РБ,Число сельских УБ
4,2021,5072.0,410.0,367.0,1162.1,32.6,24.9,,1311.0,171.6,131.0,391.0,49.1,126.0,28.0,0.9,31.0,4146.0,398.0,355.0,1009.8,28.7,21.8,,778.0,202.0,4.0,926.0,12.0,12.0,152.4,3.9,3.1,,533.0,189.0,24.0
5,2022,5167.0,458.0,409.0,1141.9,36.1,28.0,,1280.0,164.0,128.0,396.0,48.4,122.0,21.0,0.7,33.0,4219.0,446.0,397.0,991.1,31.8,24.5,,757.0,211.0,4.0,948.0,12.0,12.0,150.8,4.3,3.4,,523.0,185.0,17.0
7,2005,9479.0,293.0,,1575.4,32.4,,110.9,1734.0,345.1,199.0,267.0,30.8,115.0,2631.0,62.3,24.0,5820.0,286.0,,1365.9,32.1,,130.3,1046.0,148.0,40.0,3659.0,7.0,,209.5,0.3,,55.6,688.0,119.0,2591.0
21,1995,12064.0,29.0,,1850.5,2.5,,125.8,1786.0,409.7,229.0,294.0,31.6,107.0,4409.0,129.0,29.0,6627.0,29.0,,1569.2,,,145.5,1103.0,143.0,11.0,5437.0,,,281.3,,,71.7,683.0,151.0,4398.0
22,2000,10704.0,87.0,,1671.6,7.7,,115.0,1765.0,373.6,211.0,263.0,28.4,107.0,3310.0,85.1,26.0,6326.0,87.0,,1438.7,7.7,,134.8,1078.0,145.0,30.0,4378.0,,,232.9,,,60.4,687.0,118.0,3280.0
24,2009,6454.0,224.0,107.0,1373.4,24.0,,96.8,1752.0,350.1,200.0,200.0,24.8,124.0,438.0,12.4,28.0,5079.0,220.0,105.0,1210.0,23.2,,116.8,1029.0,116.0,23.0,1375.0,4.0,2.0,163.4,0.7,,42.3,723.0,84.0,415.0
33,1990,12762.0,,,2037.6,,,137.4,1798.0,451.0,251.0,324.0,33.8,104.0,4813.0,156.3,32.0,,,,,,,,1196.0,146.0,,,,,,,,,602.0,178.0,4813.0


👀 Пропуски:
- для 2021 и 2022 - проблемы с подсчетом коек на 10 тыс населения, восполнить не получится, поскольку на других ресурсах этих данных также нет - оставим как есть
- в 2005 - проблема с подсчетом частных учреждений, удалим, тк это наш основной показатель
- в 1995, 2000 и 1990 годах нас не интересуют, удалим эти строки
- в 2009 - проблема с подсчетом коек, восполнить не получится - оставим как есть

In [17]:
# Удаляем строки, где в столбце 'Год' значение равно 1995, 2000 или 1990
df_hospitals = df_hospitals[~df_hospitals['Год'].isin([1995, 2000, 1990, 2005])]
df_hospitals

Unnamed: 0,Год,Общее число всех больничных организаций,Общее число негосударственных организаций,Общее число частных организаций,Общее число коек в больничных организациях (тыс),Общее число коек в негосударственных организациях (тыс),Общее число коек в частных организациях (тыс),Общее число коек в больничных организациях на 10 000 человек населения,Общее число ЦРБ,Общее число коек ЦРБ (тыс),Общая средняя мощность одной ЦРБ (коек),Общее число РБ,Общее число коек РБ (тыс),Общая средняя мощность одной РБ (коек),Общее число УБ,Общее число коек УБ (тыс),Общая средняя мощность одной УБ (коек),Число всех городских больничных организаций,Число городских негосударственных организаций,Число городских частных организаций,Число коек в городских больничных организациях (тыс),Число коек в городских негосударственных организациях (тыс),Число коек в городских частных организациях (тыс),Число коек в городских больничных организациях на 10 000 человек населения,Число городских ЦРБ,Число городских РБ,Число городских УБ,Число всех сельских больничных организаций,Число сельских негосударственных организаций,Число сельских частных организаций,Число коек в сельских больничных организациях (тыс),Число коек в сельских негосударственных организациях (тыс),Число коек в сельских частных организациях (тыс),Число коек в сельских больничных организациях на 10 000 человек населения,Число сельских ЦРБ,Число сельских РБ,Число сельских УБ
0,2010,6308.0,224.0,115.0,1339.5,21.7,4.1,93.8,1754.0,327.1,186.0,191.0,24.2,126.0,400.0,11.2,28.0,4959.0,216.0,110.0,1186.1,20.2,3.4,112.5,1027.0,112.0,18.0,1349.0,8.0,5.0,153.4,1.6,0.68,40.9,727.0,79.0,382.0
1,2015,5433.0,245.0,180.0,1222.0,24.1,12.8,83.4,1426.0,205.6,144.0,415.0,54.5,131.0,69.0,2.2,32.0,4397.0,239.0,176.0,1060.1,21.8,12.1,97.6,829.0,230.0,4.0,1036.0,6.0,4.0,161.9,2.3,0.6,42.7,597.0,185.0,65.0
2,2019,5130.0,328.0,274.0,1173.6,29.8,20.5,80.0,1325.0,177.4,134.0,416.0,52.6,126.0,32.0,1.0,31.0,4186.0,318.0,265.0,1017.6,25.7,17.8,92.9,789.0,217.0,4.0,944.0,10.0,9.0,155.9,4.1,2.7,41.9,536.0,199.0,28.0
3,2020,5065.0,344.0,294.0,1188.8,32.7,23.3,81.3,1316.0,175.4,133.0,409.0,51.5,126.0,29.0,0.9,31.0,4136.0,340.0,290.0,1031.1,29.6,21.1,94.4,784.0,208.0,4.0,929.0,4.0,4.0,157.6,3.1,2.3,42.7,532.0,201.0,25.0
4,2021,5072.0,410.0,367.0,1162.1,32.6,24.9,,1311.0,171.6,131.0,391.0,49.1,126.0,28.0,0.9,31.0,4146.0,398.0,355.0,1009.8,28.7,21.8,,778.0,202.0,4.0,926.0,12.0,12.0,152.4,3.9,3.1,,533.0,189.0,24.0
5,2022,5167.0,458.0,409.0,1141.9,36.1,28.0,,1280.0,164.0,128.0,396.0,48.4,122.0,21.0,0.7,33.0,4219.0,446.0,397.0,991.1,31.8,24.5,,757.0,211.0,4.0,948.0,12.0,12.0,150.8,4.3,3.4,,523.0,185.0,17.0
10,2016,5357.0,266.0,205.0,1197.2,23.5,12.9,81.6,1388.0,192.6,139.0,425.0,58.1,137.0,68.0,2.4,35.0,4351.0,263.0,203.0,1041.0,22.2,12.7,95.5,815.0,242.0,9.0,1006.0,3.0,2.0,156.2,1.3,0.2,41.4,573.0,183.0,59.0
11,2017,5293.0,294.0,241.0,1182.7,25.4,15.2,80.5,1372.0,185.5,135.0,418.0,57.9,138.0,58.0,1.9,33.0,4297.0,288.0,236.0,1026.9,23.0,14.6,93.9,809.0,225.0,6.0,996.0,6.0,5.0,155.8,2.4,0.6,41.5,563.0,193.0,52.0
12,2018,5257.0,319.0,259.0,1172.8,27.0,17.3,79.9,1361.0,183.7,135.0,418.0,55.8,134.0,47.0,1.5,33.0,4275.0,309.0,252.0,1018.7,24.4,16.5,93.1,801.0,224.0,5.0,982.0,10.0,7.0,154.1,2.6,0.8,41.3,560.0,194.0,42.0
16,2011,6343.0,220.0,116.0,1347.1,20.6,4.1,94.2,1755.0,324.1,185.0,177.0,22.9,129.0,301.0,8.3,27.0,5048.0,215.0,113.0,1198.3,20.0,3.7,113.3,1033.0,101.0,11.0,1295.0,5.0,3.0,148.8,0.6,0.46,39.9,722.0,76.0,290.0


In [18]:
# После всех удалений индексы строк могут не совпадать с общим количество строк, поэтому сбросим их
df_hospitals.reset_index(drop=True,inplace=True)
df_hospitals

Unnamed: 0,Год,Общее число всех больничных организаций,Общее число негосударственных организаций,Общее число частных организаций,Общее число коек в больничных организациях (тыс),Общее число коек в негосударственных организациях (тыс),Общее число коек в частных организациях (тыс),Общее число коек в больничных организациях на 10 000 человек населения,Общее число ЦРБ,Общее число коек ЦРБ (тыс),Общая средняя мощность одной ЦРБ (коек),Общее число РБ,Общее число коек РБ (тыс),Общая средняя мощность одной РБ (коек),Общее число УБ,Общее число коек УБ (тыс),Общая средняя мощность одной УБ (коек),Число всех городских больничных организаций,Число городских негосударственных организаций,Число городских частных организаций,Число коек в городских больничных организациях (тыс),Число коек в городских негосударственных организациях (тыс),Число коек в городских частных организациях (тыс),Число коек в городских больничных организациях на 10 000 человек населения,Число городских ЦРБ,Число городских РБ,Число городских УБ,Число всех сельских больничных организаций,Число сельских негосударственных организаций,Число сельских частных организаций,Число коек в сельских больничных организациях (тыс),Число коек в сельских негосударственных организациях (тыс),Число коек в сельских частных организациях (тыс),Число коек в сельских больничных организациях на 10 000 человек населения,Число сельских ЦРБ,Число сельских РБ,Число сельских УБ
0,2010,6308.0,224.0,115.0,1339.5,21.7,4.1,93.8,1754.0,327.1,186.0,191.0,24.2,126.0,400.0,11.2,28.0,4959.0,216.0,110.0,1186.1,20.2,3.4,112.5,1027.0,112.0,18.0,1349.0,8.0,5.0,153.4,1.6,0.68,40.9,727.0,79.0,382.0
1,2015,5433.0,245.0,180.0,1222.0,24.1,12.8,83.4,1426.0,205.6,144.0,415.0,54.5,131.0,69.0,2.2,32.0,4397.0,239.0,176.0,1060.1,21.8,12.1,97.6,829.0,230.0,4.0,1036.0,6.0,4.0,161.9,2.3,0.6,42.7,597.0,185.0,65.0
2,2019,5130.0,328.0,274.0,1173.6,29.8,20.5,80.0,1325.0,177.4,134.0,416.0,52.6,126.0,32.0,1.0,31.0,4186.0,318.0,265.0,1017.6,25.7,17.8,92.9,789.0,217.0,4.0,944.0,10.0,9.0,155.9,4.1,2.7,41.9,536.0,199.0,28.0
3,2020,5065.0,344.0,294.0,1188.8,32.7,23.3,81.3,1316.0,175.4,133.0,409.0,51.5,126.0,29.0,0.9,31.0,4136.0,340.0,290.0,1031.1,29.6,21.1,94.4,784.0,208.0,4.0,929.0,4.0,4.0,157.6,3.1,2.3,42.7,532.0,201.0,25.0
4,2021,5072.0,410.0,367.0,1162.1,32.6,24.9,,1311.0,171.6,131.0,391.0,49.1,126.0,28.0,0.9,31.0,4146.0,398.0,355.0,1009.8,28.7,21.8,,778.0,202.0,4.0,926.0,12.0,12.0,152.4,3.9,3.1,,533.0,189.0,24.0
5,2022,5167.0,458.0,409.0,1141.9,36.1,28.0,,1280.0,164.0,128.0,396.0,48.4,122.0,21.0,0.7,33.0,4219.0,446.0,397.0,991.1,31.8,24.5,,757.0,211.0,4.0,948.0,12.0,12.0,150.8,4.3,3.4,,523.0,185.0,17.0
6,2016,5357.0,266.0,205.0,1197.2,23.5,12.9,81.6,1388.0,192.6,139.0,425.0,58.1,137.0,68.0,2.4,35.0,4351.0,263.0,203.0,1041.0,22.2,12.7,95.5,815.0,242.0,9.0,1006.0,3.0,2.0,156.2,1.3,0.2,41.4,573.0,183.0,59.0
7,2017,5293.0,294.0,241.0,1182.7,25.4,15.2,80.5,1372.0,185.5,135.0,418.0,57.9,138.0,58.0,1.9,33.0,4297.0,288.0,236.0,1026.9,23.0,14.6,93.9,809.0,225.0,6.0,996.0,6.0,5.0,155.8,2.4,0.6,41.5,563.0,193.0,52.0
8,2018,5257.0,319.0,259.0,1172.8,27.0,17.3,79.9,1361.0,183.7,135.0,418.0,55.8,134.0,47.0,1.5,33.0,4275.0,309.0,252.0,1018.7,24.4,16.5,93.1,801.0,224.0,5.0,982.0,10.0,7.0,154.1,2.6,0.8,41.3,560.0,194.0,42.0
9,2011,6343.0,220.0,116.0,1347.1,20.6,4.1,94.2,1755.0,324.1,185.0,177.0,22.9,129.0,301.0,8.3,27.0,5048.0,215.0,113.0,1198.3,20.0,3.7,113.3,1033.0,101.0,11.0,1295.0,5.0,3.0,148.8,0.6,0.46,39.9,722.0,76.0,290.0


## Добавим столбцы

### Число государственных организаций

In [19]:
# `Общее число государственных организаций`

df_hospitals['Общее число государственных организаций'] = (
    df_hospitals['Общее число всех больничных организаций'] - 
    df_hospitals['Общее число негосударственных организаций'])

df_hospitals.sample()

Unnamed: 0,Год,Общее число всех больничных организаций,Общее число негосударственных организаций,Общее число частных организаций,Общее число коек в больничных организациях (тыс),Общее число коек в негосударственных организациях (тыс),Общее число коек в частных организациях (тыс),Общее число коек в больничных организациях на 10 000 человек населения,Общее число ЦРБ,Общее число коек ЦРБ (тыс),Общая средняя мощность одной ЦРБ (коек),Общее число РБ,Общее число коек РБ (тыс),Общая средняя мощность одной РБ (коек),Общее число УБ,Общее число коек УБ (тыс),Общая средняя мощность одной УБ (коек),Число всех городских больничных организаций,Число городских негосударственных организаций,Число городских частных организаций,Число коек в городских больничных организациях (тыс),Число коек в городских негосударственных организациях (тыс),Число коек в городских частных организациях (тыс),Число коек в городских больничных организациях на 10 000 человек населения,Число городских ЦРБ,Число городских РБ,Число городских УБ,Число всех сельских больничных организаций,Число сельских негосударственных организаций,Число сельских частных организаций,Число коек в сельских больничных организациях (тыс),Число коек в сельских негосударственных организациях (тыс),Число коек в сельских частных организациях (тыс),Число коек в сельских больничных организациях на 10 000 человек населения,Число сельских ЦРБ,Число сельских РБ,Число сельских УБ,Общее число государственных организаций
16,2006,7478.0,320.0,148.0,1553.6,35.9,5.1,109.2,1748.0,393.0,225.0,223.0,26.8,120.0,628.0,18.1,29.0,5512.0,313.0,144.0,1349.5,35.5,4.9,130.0,989.0,132.0,32.0,1966.0,7.0,4.0,204.1,0.5,0.2,53.1,759.0,91.0,596.0,7158.0


In [20]:
# `Число городских государственных больничных организаций`

df_hospitals['Число городских государственных больничных организаций'] = (
    df_hospitals['Число всех городских больничных организаций'] - 
    df_hospitals['Число городских негосударственных организаций'])

df_hospitals.sample()

Unnamed: 0,Год,Общее число всех больничных организаций,Общее число негосударственных организаций,Общее число частных организаций,Общее число коек в больничных организациях (тыс),Общее число коек в негосударственных организациях (тыс),Общее число коек в частных организациях (тыс),Общее число коек в больничных организациях на 10 000 человек населения,Общее число ЦРБ,Общее число коек ЦРБ (тыс),Общая средняя мощность одной ЦРБ (коек),Общее число РБ,Общее число коек РБ (тыс),Общая средняя мощность одной РБ (коек),Общее число УБ,Общее число коек УБ (тыс),Общая средняя мощность одной УБ (коек),Число всех городских больничных организаций,Число городских негосударственных организаций,Число городских частных организаций,Число коек в городских больничных организациях (тыс),Число коек в городских негосударственных организациях (тыс),Число коек в городских частных организациях (тыс),Число коек в городских больничных организациях на 10 000 человек населения,Число городских ЦРБ,Число городских РБ,Число городских УБ,Число всех сельских больничных организаций,Число сельских негосударственных организаций,Число сельских частных организаций,Число коек в сельских больничных организациях (тыс),Число коек в сельских негосударственных организациях (тыс),Число коек в сельских частных организациях (тыс),Число коек в сельских больничных организациях на 10 000 человек населения,Число сельских ЦРБ,Число сельских РБ,Число сельских УБ,Общее число государственных организаций,Число городских государственных больничных организаций
4,2021,5072.0,410.0,367.0,1162.1,32.6,24.9,,1311.0,171.6,131.0,391.0,49.1,126.0,28.0,0.9,31.0,4146.0,398.0,355.0,1009.8,28.7,21.8,,778.0,202.0,4.0,926.0,12.0,12.0,152.4,3.9,3.1,,533.0,189.0,24.0,4662.0,3748.0


In [21]:
# `Число сельских государственных больничных организаций`

df_hospitals['Число сельских государственных больничных организаций'] = (
    df_hospitals['Число всех сельских больничных организаций'] - 
    df_hospitals['Число сельских негосударственных организаций'])

df_hospitals.sample()

Unnamed: 0,Год,Общее число всех больничных организаций,Общее число негосударственных организаций,Общее число частных организаций,Общее число коек в больничных организациях (тыс),Общее число коек в негосударственных организациях (тыс),Общее число коек в частных организациях (тыс),Общее число коек в больничных организациях на 10 000 человек населения,Общее число ЦРБ,Общее число коек ЦРБ (тыс),Общая средняя мощность одной ЦРБ (коек),Общее число РБ,Общее число коек РБ (тыс),Общая средняя мощность одной РБ (коек),Общее число УБ,Общее число коек УБ (тыс),Общая средняя мощность одной УБ (коек),Число всех городских больничных организаций,Число городских негосударственных организаций,Число городских частных организаций,Число коек в городских больничных организациях (тыс),Число коек в городских негосударственных организациях (тыс),Число коек в городских частных организациях (тыс),Число коек в городских больничных организациях на 10 000 человек населения,Число городских ЦРБ,Число городских РБ,Число городских УБ,Число всех сельских больничных организаций,Число сельских негосударственных организаций,Число сельских частных организаций,Число коек в сельских больничных организациях (тыс),Число коек в сельских негосударственных организациях (тыс),Число коек в сельских частных организациях (тыс),Число коек в сельских больничных организациях на 10 000 человек населения,Число сельских ЦРБ,Число сельских РБ,Число сельских УБ,Общее число государственных организаций,Число городских государственных больничных организаций,Число сельских государственных больничных организаций
8,2018,5257.0,319.0,259.0,1172.8,27.0,17.3,79.9,1361.0,183.7,135.0,418.0,55.8,134.0,47.0,1.5,33.0,4275.0,309.0,252.0,1018.7,24.4,16.5,93.1,801.0,224.0,5.0,982.0,10.0,7.0,154.1,2.6,0.8,41.3,560.0,194.0,42.0,4938.0,3966.0,972.0


### Число других негосударственных организаций

In [22]:
# `Общее число других негосударственных организаций`

df_hospitals['Общее число других негосударственных организаций'] = (
    df_hospitals['Общее число негосударственных организаций'] - 
    df_hospitals['Общее число частных организаций'])

df_hospitals.sample()

Unnamed: 0,Год,Общее число всех больничных организаций,Общее число негосударственных организаций,Общее число частных организаций,Общее число коек в больничных организациях (тыс),Общее число коек в негосударственных организациях (тыс),Общее число коек в частных организациях (тыс),Общее число коек в больничных организациях на 10 000 человек населения,Общее число ЦРБ,Общее число коек ЦРБ (тыс),Общая средняя мощность одной ЦРБ (коек),Общее число РБ,Общее число коек РБ (тыс),Общая средняя мощность одной РБ (коек),Общее число УБ,Общее число коек УБ (тыс),Общая средняя мощность одной УБ (коек),Число всех городских больничных организаций,Число городских негосударственных организаций,Число городских частных организаций,Число коек в городских больничных организациях (тыс),Число коек в городских негосударственных организациях (тыс),Число коек в городских частных организациях (тыс),Число коек в городских больничных организациях на 10 000 человек населения,Число городских ЦРБ,Число городских РБ,Число городских УБ,Число всех сельских больничных организаций,Число сельских негосударственных организаций,Число сельских частных организаций,Число коек в сельских больничных организациях (тыс),Число коек в сельских негосударственных организациях (тыс),Число коек в сельских частных организациях (тыс),Число коек в сельских больничных организациях на 10 000 человек населения,Число сельских ЦРБ,Число сельских РБ,Число сельских УБ,Общее число государственных организаций,Число городских государственных больничных организаций,Число сельских государственных больничных организаций,Общее число других негосударственных организаций
14,2007,6777.0,333.0,177.0,1522.1,30.3,5.1,107.2,1747.0,380.6,218.0,215.0,26.6,124.0,510.0,14.9,29.0,5315.0,326.0,173.0,1331.6,29.9,4.9,128.3,1028.0,118.0,29.0,1462.0,7.0,4.0,190.4,0.4,0.2,49.8,719.0,97.0,481.0,6444.0,4989.0,1455.0,156.0


In [23]:
# `Число других городских негосударственных организаций`

df_hospitals['Число других городских негосударственных организаций'] = (
    df_hospitals['Число городских негосударственных организаций'] - 
    df_hospitals['Число городских частных организаций'])

df_hospitals.sample()

Unnamed: 0,Год,Общее число всех больничных организаций,Общее число негосударственных организаций,Общее число частных организаций,Общее число коек в больничных организациях (тыс),Общее число коек в негосударственных организациях (тыс),Общее число коек в частных организациях (тыс),Общее число коек в больничных организациях на 10 000 человек населения,Общее число ЦРБ,Общее число коек ЦРБ (тыс),Общая средняя мощность одной ЦРБ (коек),Общее число РБ,Общее число коек РБ (тыс),Общая средняя мощность одной РБ (коек),Общее число УБ,Общее число коек УБ (тыс),Общая средняя мощность одной УБ (коек),Число всех городских больничных организаций,Число городских негосударственных организаций,Число городских частных организаций,Число коек в городских больничных организациях (тыс),Число коек в городских негосударственных организациях (тыс),Число коек в городских частных организациях (тыс),Число коек в городских больничных организациях на 10 000 человек населения,Число городских ЦРБ,Число городских РБ,Число городских УБ,Число всех сельских больничных организаций,Число сельских негосударственных организаций,Число сельских частных организаций,Число коек в сельских больничных организациях (тыс),Число коек в сельских негосударственных организациях (тыс),Число коек в сельских частных организациях (тыс),Число коек в сельских больничных организациях на 10 000 человек населения,Число сельских ЦРБ,Число сельских РБ,Число сельских УБ,Общее число государственных организаций,Число городских государственных больничных организаций,Число сельских государственных больничных организаций,Общее число других негосударственных организаций,Число других городских негосударственных организаций
3,2020,5065.0,344.0,294.0,1188.8,32.7,23.3,81.3,1316.0,175.4,133.0,409.0,51.5,126.0,29.0,0.9,31.0,4136.0,340.0,290.0,1031.1,29.6,21.1,94.4,784.0,208.0,4.0,929.0,4.0,4.0,157.6,3.1,2.3,42.7,532.0,201.0,25.0,4721.0,3796.0,925.0,50.0,50.0


In [24]:
# `Число других сельских негосударственных организаций`

df_hospitals['Число других сельских негосударственных организаций'] = (
    df_hospitals['Число сельских негосударственных организаций'] - 
    df_hospitals['Число сельских частных организаций'])

df_hospitals.sample()

Unnamed: 0,Год,Общее число всех больничных организаций,Общее число негосударственных организаций,Общее число частных организаций,Общее число коек в больничных организациях (тыс),Общее число коек в негосударственных организациях (тыс),Общее число коек в частных организациях (тыс),Общее число коек в больничных организациях на 10 000 человек населения,Общее число ЦРБ,Общее число коек ЦРБ (тыс),Общая средняя мощность одной ЦРБ (коек),Общее число РБ,Общее число коек РБ (тыс),Общая средняя мощность одной РБ (коек),Общее число УБ,Общее число коек УБ (тыс),Общая средняя мощность одной УБ (коек),Число всех городских больничных организаций,Число городских негосударственных организаций,Число городских частных организаций,Число коек в городских больничных организациях (тыс),Число коек в городских негосударственных организациях (тыс),Число коек в городских частных организациях (тыс),Число коек в городских больничных организациях на 10 000 человек населения,Число городских ЦРБ,Число городских РБ,Число городских УБ,Число всех сельских больничных организаций,Число сельских негосударственных организаций,Число сельских частных организаций,Число коек в сельских больничных организациях (тыс),Число коек в сельских негосударственных организациях (тыс),Число коек в сельских частных организациях (тыс),Число коек в сельских больничных организациях на 10 000 человек населения,Число сельских ЦРБ,Число сельских РБ,Число сельских УБ,Общее число государственных организаций,Число городских государственных больничных организаций,Число сельских государственных больничных организаций,Общее число других негосударственных организаций,Число других городских негосударственных организаций,Число других сельских негосударственных организаций
5,2022,5167.0,458.0,409.0,1141.9,36.1,28.0,,1280.0,164.0,128.0,396.0,48.4,122.0,21.0,0.7,33.0,4219.0,446.0,397.0,991.1,31.8,24.5,,757.0,211.0,4.0,948.0,12.0,12.0,150.8,4.3,3.4,,523.0,185.0,17.0,4709.0,3773.0,936.0,49.0,49.0,0.0


### Число коек в государственных организациях

In [25]:
# `Общее число коек в государственных организациях (тыс)`

df_hospitals['Общее число коек в государственных организациях (тыс)'] = (
    df_hospitals['Общее число коек в больничных организациях (тыс)'] - 
    df_hospitals['Общее число коек в негосударственных организациях (тыс)'])

df_hospitals.sample()

Unnamed: 0,Год,Общее число всех больничных организаций,Общее число негосударственных организаций,Общее число частных организаций,Общее число коек в больничных организациях (тыс),Общее число коек в негосударственных организациях (тыс),Общее число коек в частных организациях (тыс),Общее число коек в больничных организациях на 10 000 человек населения,Общее число ЦРБ,Общее число коек ЦРБ (тыс),Общая средняя мощность одной ЦРБ (коек),Общее число РБ,Общее число коек РБ (тыс),Общая средняя мощность одной РБ (коек),Общее число УБ,Общее число коек УБ (тыс),Общая средняя мощность одной УБ (коек),Число всех городских больничных организаций,Число городских негосударственных организаций,Число городских частных организаций,Число коек в городских больничных организациях (тыс),Число коек в городских негосударственных организациях (тыс),Число коек в городских частных организациях (тыс),Число коек в городских больничных организациях на 10 000 человек населения,Число городских ЦРБ,Число городских РБ,Число городских УБ,Число всех сельских больничных организаций,Число сельских негосударственных организаций,Число сельских частных организаций,Число коек в сельских больничных организациях (тыс),Число коек в сельских негосударственных организациях (тыс),Число коек в сельских частных организациях (тыс),Число коек в сельских больничных организациях на 10 000 человек населения,Число сельских ЦРБ,Число сельских РБ,Число сельских УБ,Общее число государственных организаций,Число городских государственных больничных организаций,Число сельских государственных больничных организаций,Общее число других негосударственных организаций,Число других городских негосударственных организаций,Число других сельских негосударственных организаций,Общее число коек в государственных организациях (тыс)
1,2015,5433.0,245.0,180.0,1222.0,24.1,12.8,83.4,1426.0,205.6,144.0,415.0,54.5,131.0,69.0,2.2,32.0,4397.0,239.0,176.0,1060.1,21.8,12.1,97.6,829.0,230.0,4.0,1036.0,6.0,4.0,161.9,2.3,0.6,42.7,597.0,185.0,65.0,5188.0,4158.0,1030.0,65.0,63.0,2.0,1197.9


In [26]:
# `Число коек в городских государственных организациях (тыс)`

df_hospitals['Число коек в городских государственных организациях (тыс)'] = (
    df_hospitals['Число коек в городских больничных организациях (тыс)'] - 
    df_hospitals['Число коек в городских негосударственных организациях (тыс)'])

df_hospitals.sample()

Unnamed: 0,Год,Общее число всех больничных организаций,Общее число негосударственных организаций,Общее число частных организаций,Общее число коек в больничных организациях (тыс),Общее число коек в негосударственных организациях (тыс),Общее число коек в частных организациях (тыс),Общее число коек в больничных организациях на 10 000 человек населения,Общее число ЦРБ,Общее число коек ЦРБ (тыс),Общая средняя мощность одной ЦРБ (коек),Общее число РБ,Общее число коек РБ (тыс),Общая средняя мощность одной РБ (коек),Общее число УБ,Общее число коек УБ (тыс),Общая средняя мощность одной УБ (коек),Число всех городских больничных организаций,Число городских негосударственных организаций,Число городских частных организаций,Число коек в городских больничных организациях (тыс),Число коек в городских негосударственных организациях (тыс),Число коек в городских частных организациях (тыс),Число коек в городских больничных организациях на 10 000 человек населения,Число городских ЦРБ,Число городских РБ,Число городских УБ,Число всех сельских больничных организаций,Число сельских негосударственных организаций,Число сельских частных организаций,Число коек в сельских больничных организациях (тыс),Число коек в сельских негосударственных организациях (тыс),Число коек в сельских частных организациях (тыс),Число коек в сельских больничных организациях на 10 000 человек населения,Число сельских ЦРБ,Число сельских РБ,Число сельских УБ,Общее число государственных организаций,Число городских государственных больничных организаций,Число сельских государственных больничных организаций,Общее число других негосударственных организаций,Число других городских негосударственных организаций,Число других сельских негосударственных организаций,Общее число коек в государственных организациях (тыс),Число коек в городских государственных организациях (тыс)
8,2018,5257.0,319.0,259.0,1172.8,27.0,17.3,79.9,1361.0,183.7,135.0,418.0,55.8,134.0,47.0,1.5,33.0,4275.0,309.0,252.0,1018.7,24.4,16.5,93.1,801.0,224.0,5.0,982.0,10.0,7.0,154.1,2.6,0.8,41.3,560.0,194.0,42.0,4938.0,3966.0,972.0,60.0,57.0,3.0,1145.8,994.3


In [27]:
# `Число коек в сельских государственных организациях (тыс)`

df_hospitals['Число коек в сельских государственных организациях (тыс)'] = (
    df_hospitals['Число коек в сельских больничных организациях (тыс)'] - 
    df_hospitals['Число коек в сельских негосударственных организациях (тыс)'])

df_hospitals.sample()

Unnamed: 0,Год,Общее число всех больничных организаций,Общее число негосударственных организаций,Общее число частных организаций,Общее число коек в больничных организациях (тыс),Общее число коек в негосударственных организациях (тыс),Общее число коек в частных организациях (тыс),Общее число коек в больничных организациях на 10 000 человек населения,Общее число ЦРБ,Общее число коек ЦРБ (тыс),Общая средняя мощность одной ЦРБ (коек),Общее число РБ,Общее число коек РБ (тыс),Общая средняя мощность одной РБ (коек),Общее число УБ,Общее число коек УБ (тыс),Общая средняя мощность одной УБ (коек),Число всех городских больничных организаций,Число городских негосударственных организаций,Число городских частных организаций,Число коек в городских больничных организациях (тыс),Число коек в городских негосударственных организациях (тыс),Число коек в городских частных организациях (тыс),Число коек в городских больничных организациях на 10 000 человек населения,Число городских ЦРБ,Число городских РБ,Число городских УБ,Число всех сельских больничных организаций,Число сельских негосударственных организаций,Число сельских частных организаций,Число коек в сельских больничных организациях (тыс),Число коек в сельских негосударственных организациях (тыс),Число коек в сельских частных организациях (тыс),Число коек в сельских больничных организациях на 10 000 человек населения,Число сельских ЦРБ,Число сельских РБ,Число сельских УБ,Общее число государственных организаций,Число городских государственных больничных организаций,Число сельских государственных больничных организаций,Общее число других негосударственных организаций,Число других городских негосударственных организаций,Число других сельских негосударственных организаций,Общее число коек в государственных организациях (тыс),Число коек в городских государственных организациях (тыс),Число коек в сельских государственных организациях (тыс)
14,2007,6777.0,333.0,177.0,1522.1,30.3,5.1,107.2,1747.0,380.6,218.0,215.0,26.6,124.0,510.0,14.9,29.0,5315.0,326.0,173.0,1331.6,29.9,4.9,128.3,1028.0,118.0,29.0,1462.0,7.0,4.0,190.4,0.4,0.2,49.8,719.0,97.0,481.0,6444.0,4989.0,1455.0,156.0,153.0,3.0,1491.8,1301.7,190.0


### Число коек в других негосударственных организациях

In [28]:
# `Общее число коек в других негосударственных организациях (тыс)`

df_hospitals['Общее число коек в других негосударственных организациях (тыс)'] = (
    df_hospitals['Общее число коек в негосударственных организациях (тыс)'] - 
    df_hospitals['Общее число коек в частных организациях (тыс)'])

df_hospitals.sample()

Unnamed: 0,Год,Общее число всех больничных организаций,Общее число негосударственных организаций,Общее число частных организаций,Общее число коек в больничных организациях (тыс),Общее число коек в негосударственных организациях (тыс),Общее число коек в частных организациях (тыс),Общее число коек в больничных организациях на 10 000 человек населения,Общее число ЦРБ,Общее число коек ЦРБ (тыс),Общая средняя мощность одной ЦРБ (коек),Общее число РБ,Общее число коек РБ (тыс),Общая средняя мощность одной РБ (коек),Общее число УБ,Общее число коек УБ (тыс),Общая средняя мощность одной УБ (коек),Число всех городских больничных организаций,Число городских негосударственных организаций,Число городских частных организаций,Число коек в городских больничных организациях (тыс),Число коек в городских негосударственных организациях (тыс),Число коек в городских частных организациях (тыс),Число коек в городских больничных организациях на 10 000 человек населения,Число городских ЦРБ,Число городских РБ,Число городских УБ,Число всех сельских больничных организаций,Число сельских негосударственных организаций,Число сельских частных организаций,Число коек в сельских больничных организациях (тыс),Число коек в сельских негосударственных организациях (тыс),Число коек в сельских частных организациях (тыс),Число коек в сельских больничных организациях на 10 000 человек населения,Число сельских ЦРБ,Число сельских РБ,Число сельских УБ,Общее число государственных организаций,Число городских государственных больничных организаций,Число сельских государственных больничных организаций,Общее число других негосударственных организаций,Число других городских негосударственных организаций,Число других сельских негосударственных организаций,Общее число коек в государственных организациях (тыс),Число коек в городских государственных организациях (тыс),Число коек в сельских государственных организациях (тыс),Общее число коек в других негосударственных организациях (тыс)
14,2007,6777.0,333.0,177.0,1522.1,30.3,5.1,107.2,1747.0,380.6,218.0,215.0,26.6,124.0,510.0,14.9,29.0,5315.0,326.0,173.0,1331.6,29.9,4.9,128.3,1028.0,118.0,29.0,1462.0,7.0,4.0,190.4,0.4,0.2,49.8,719.0,97.0,481.0,6444.0,4989.0,1455.0,156.0,153.0,3.0,1491.8,1301.7,190.0,25.2


In [29]:
# `Число коек в других городских негосударственных организаций (тыс)

df_hospitals['Число коек в других городских негосударственных организаций (тыс)'] = (
    df_hospitals['Число коек в городских негосударственных организациях (тыс)'] - 
    df_hospitals['Число коек в городских частных организациях (тыс)'])

df_hospitals.sample()

Unnamed: 0,Год,Общее число всех больничных организаций,Общее число негосударственных организаций,Общее число частных организаций,Общее число коек в больничных организациях (тыс),Общее число коек в негосударственных организациях (тыс),Общее число коек в частных организациях (тыс),Общее число коек в больничных организациях на 10 000 человек населения,Общее число ЦРБ,Общее число коек ЦРБ (тыс),Общая средняя мощность одной ЦРБ (коек),Общее число РБ,Общее число коек РБ (тыс),Общая средняя мощность одной РБ (коек),Общее число УБ,Общее число коек УБ (тыс),Общая средняя мощность одной УБ (коек),Число всех городских больничных организаций,Число городских негосударственных организаций,Число городских частных организаций,Число коек в городских больничных организациях (тыс),Число коек в городских негосударственных организациях (тыс),Число коек в городских частных организациях (тыс),Число коек в городских больничных организациях на 10 000 человек населения,Число городских ЦРБ,Число городских РБ,Число городских УБ,Число всех сельских больничных организаций,Число сельских негосударственных организаций,Число сельских частных организаций,Число коек в сельских больничных организациях (тыс),Число коек в сельских негосударственных организациях (тыс),Число коек в сельских частных организациях (тыс),Число коек в сельских больничных организациях на 10 000 человек населения,Число сельских ЦРБ,Число сельских РБ,Число сельских УБ,Общее число государственных организаций,Число городских государственных больничных организаций,Число сельских государственных больничных организаций,Общее число других негосударственных организаций,Число других городских негосударственных организаций,Число других сельских негосударственных организаций,Общее число коек в государственных организациях (тыс),Число коек в городских государственных организациях (тыс),Число коек в сельских государственных организациях (тыс),Общее число коек в других негосударственных организациях (тыс),Число коек в других городских негосударственных организаций (тыс)
13,2009,6454.0,224.0,107.0,1373.4,24.0,,96.8,1752.0,350.1,200.0,200.0,24.8,124.0,438.0,12.4,28.0,5079.0,220.0,105.0,1210.0,23.2,,116.8,1029.0,116.0,23.0,1375.0,4.0,2.0,163.4,0.7,,42.3,723.0,84.0,415.0,6230.0,4859.0,1371.0,117.0,115.0,2.0,1349.4,1186.8,162.7,,


In [30]:
# `Число коек в других сельских негосударственных организаций (тыс)`

df_hospitals['Число коек в других сельских негосударственных организаций (тыс)'] = (
    df_hospitals['Число коек в сельских негосударственных организациях (тыс)'] - 
    df_hospitals['Число коек в сельских частных организациях (тыс)'])

df_hospitals.sample()

Unnamed: 0,Год,Общее число всех больничных организаций,Общее число негосударственных организаций,Общее число частных организаций,Общее число коек в больничных организациях (тыс),Общее число коек в негосударственных организациях (тыс),Общее число коек в частных организациях (тыс),Общее число коек в больничных организациях на 10 000 человек населения,Общее число ЦРБ,Общее число коек ЦРБ (тыс),Общая средняя мощность одной ЦРБ (коек),Общее число РБ,Общее число коек РБ (тыс),Общая средняя мощность одной РБ (коек),Общее число УБ,Общее число коек УБ (тыс),Общая средняя мощность одной УБ (коек),Число всех городских больничных организаций,Число городских негосударственных организаций,Число городских частных организаций,Число коек в городских больничных организациях (тыс),Число коек в городских негосударственных организациях (тыс),Число коек в городских частных организациях (тыс),Число коек в городских больничных организациях на 10 000 человек населения,Число городских ЦРБ,Число городских РБ,Число городских УБ,Число всех сельских больничных организаций,Число сельских негосударственных организаций,Число сельских частных организаций,Число коек в сельских больничных организациях (тыс),Число коек в сельских негосударственных организациях (тыс),Число коек в сельских частных организациях (тыс),Число коек в сельских больничных организациях на 10 000 человек населения,Число сельских ЦРБ,Число сельских РБ,Число сельских УБ,Общее число государственных организаций,Число городских государственных больничных организаций,Число сельских государственных больничных организаций,Общее число других негосударственных организаций,Число других городских негосударственных организаций,Число других сельских негосударственных организаций,Общее число коек в государственных организациях (тыс),Число коек в городских государственных организациях (тыс),Число коек в сельских государственных организациях (тыс),Общее число коек в других негосударственных организациях (тыс),Число коек в других городских негосударственных организаций (тыс),Число коек в других сельских негосударственных организаций (тыс)
10,2012,6172.0,225.0,127.0,1332.3,22.6,6.5,92.9,1719.0,281.0,163.0,195.0,21.6,111.0,237.0,5.4,23.0,4956.0,220.0,124.0,1188.9,21.3,6.1,112.0,985.0,127.0,9.0,1216.0,5.0,3.0,143.4,1.3,0.46,38.5,734.0,68.0,228.0,5947.0,4736.0,1211.0,98.0,96.0,2.0,1309.7,1167.6,142.1,16.1,15.2,0.84


In [31]:
df_hospitals

Unnamed: 0,Год,Общее число всех больничных организаций,Общее число негосударственных организаций,Общее число частных организаций,Общее число коек в больничных организациях (тыс),Общее число коек в негосударственных организациях (тыс),Общее число коек в частных организациях (тыс),Общее число коек в больничных организациях на 10 000 человек населения,Общее число ЦРБ,Общее число коек ЦРБ (тыс),Общая средняя мощность одной ЦРБ (коек),Общее число РБ,Общее число коек РБ (тыс),Общая средняя мощность одной РБ (коек),Общее число УБ,Общее число коек УБ (тыс),Общая средняя мощность одной УБ (коек),Число всех городских больничных организаций,Число городских негосударственных организаций,Число городских частных организаций,Число коек в городских больничных организациях (тыс),Число коек в городских негосударственных организациях (тыс),Число коек в городских частных организациях (тыс),Число коек в городских больничных организациях на 10 000 человек населения,Число городских ЦРБ,Число городских РБ,Число городских УБ,Число всех сельских больничных организаций,Число сельских негосударственных организаций,Число сельских частных организаций,Число коек в сельских больничных организациях (тыс),Число коек в сельских негосударственных организациях (тыс),Число коек в сельских частных организациях (тыс),Число коек в сельских больничных организациях на 10 000 человек населения,Число сельских ЦРБ,Число сельских РБ,Число сельских УБ,Общее число государственных организаций,Число городских государственных больничных организаций,Число сельских государственных больничных организаций,Общее число других негосударственных организаций,Число других городских негосударственных организаций,Число других сельских негосударственных организаций,Общее число коек в государственных организациях (тыс),Число коек в городских государственных организациях (тыс),Число коек в сельских государственных организациях (тыс),Общее число коек в других негосударственных организациях (тыс),Число коек в других городских негосударственных организаций (тыс),Число коек в других сельских негосударственных организаций (тыс)
0,2010,6308.0,224.0,115.0,1339.5,21.7,4.1,93.8,1754.0,327.1,186.0,191.0,24.2,126.0,400.0,11.2,28.0,4959.0,216.0,110.0,1186.1,20.2,3.4,112.5,1027.0,112.0,18.0,1349.0,8.0,5.0,153.4,1.6,0.68,40.9,727.0,79.0,382.0,6084.0,4743.0,1341.0,109.0,106.0,3.0,1317.8,1165.9,151.8,17.6,16.8,0.92
1,2015,5433.0,245.0,180.0,1222.0,24.1,12.8,83.4,1426.0,205.6,144.0,415.0,54.5,131.0,69.0,2.2,32.0,4397.0,239.0,176.0,1060.1,21.8,12.1,97.6,829.0,230.0,4.0,1036.0,6.0,4.0,161.9,2.3,0.6,42.7,597.0,185.0,65.0,5188.0,4158.0,1030.0,65.0,63.0,2.0,1197.9,1038.3,159.6,11.3,9.7,1.7
2,2019,5130.0,328.0,274.0,1173.6,29.8,20.5,80.0,1325.0,177.4,134.0,416.0,52.6,126.0,32.0,1.0,31.0,4186.0,318.0,265.0,1017.6,25.7,17.8,92.9,789.0,217.0,4.0,944.0,10.0,9.0,155.9,4.1,2.7,41.9,536.0,199.0,28.0,4802.0,3868.0,934.0,54.0,53.0,1.0,1143.8,991.9,151.8,9.3,7.9,1.4
3,2020,5065.0,344.0,294.0,1188.8,32.7,23.3,81.3,1316.0,175.4,133.0,409.0,51.5,126.0,29.0,0.9,31.0,4136.0,340.0,290.0,1031.1,29.6,21.1,94.4,784.0,208.0,4.0,929.0,4.0,4.0,157.6,3.1,2.3,42.7,532.0,201.0,25.0,4721.0,3796.0,925.0,50.0,50.0,0.0,1156.1,1001.5,154.5,9.4,8.5,0.8
4,2021,5072.0,410.0,367.0,1162.1,32.6,24.9,,1311.0,171.6,131.0,391.0,49.1,126.0,28.0,0.9,31.0,4146.0,398.0,355.0,1009.8,28.7,21.8,,778.0,202.0,4.0,926.0,12.0,12.0,152.4,3.9,3.1,,533.0,189.0,24.0,4662.0,3748.0,914.0,43.0,43.0,0.0,1129.5,981.1,148.5,7.7,6.9,0.8
5,2022,5167.0,458.0,409.0,1141.9,36.1,28.0,,1280.0,164.0,128.0,396.0,48.4,122.0,21.0,0.7,33.0,4219.0,446.0,397.0,991.1,31.8,24.5,,757.0,211.0,4.0,948.0,12.0,12.0,150.8,4.3,3.4,,523.0,185.0,17.0,4709.0,3773.0,936.0,49.0,49.0,0.0,1105.8,959.3,146.5,8.1,7.3,0.9
6,2016,5357.0,266.0,205.0,1197.2,23.5,12.9,81.6,1388.0,192.6,139.0,425.0,58.1,137.0,68.0,2.4,35.0,4351.0,263.0,203.0,1041.0,22.2,12.7,95.5,815.0,242.0,9.0,1006.0,3.0,2.0,156.2,1.3,0.2,41.4,573.0,183.0,59.0,5091.0,4088.0,1003.0,61.0,60.0,1.0,1173.7,1018.8,154.9,10.6,9.5,1.1
7,2017,5293.0,294.0,241.0,1182.7,25.4,15.2,80.5,1372.0,185.5,135.0,418.0,57.9,138.0,58.0,1.9,33.0,4297.0,288.0,236.0,1026.9,23.0,14.6,93.9,809.0,225.0,6.0,996.0,6.0,5.0,155.8,2.4,0.6,41.5,563.0,193.0,52.0,4999.0,4009.0,990.0,53.0,52.0,1.0,1157.3,1003.9,153.4,10.2,8.4,1.8
8,2018,5257.0,319.0,259.0,1172.8,27.0,17.3,79.9,1361.0,183.7,135.0,418.0,55.8,134.0,47.0,1.5,33.0,4275.0,309.0,252.0,1018.7,24.4,16.5,93.1,801.0,224.0,5.0,982.0,10.0,7.0,154.1,2.6,0.8,41.3,560.0,194.0,42.0,4938.0,3966.0,972.0,60.0,57.0,3.0,1145.8,994.3,151.5,9.7,7.9,1.8
9,2011,6343.0,220.0,116.0,1347.1,20.6,4.1,94.2,1755.0,324.1,185.0,177.0,22.9,129.0,301.0,8.3,27.0,5048.0,215.0,113.0,1198.3,20.0,3.7,113.3,1033.0,101.0,11.0,1295.0,5.0,3.0,148.8,0.6,0.46,39.9,722.0,76.0,290.0,6123.0,4833.0,1290.0,104.0,102.0,2.0,1326.5,1178.3,148.2,16.5,16.3,0.14


## Вывод

- Изучили общую информацию и наметили фронт исправлений
- Исправили ошибки исходного файла в значениях со скобкой
- Изменили типы данных:
   - столбец 'Год' в int64
   - остальные в float64
- Удалили явные и недавные дубли
- Рассмотрены пропуски, решили:
   - для 2021 и 2022 - проблемы с подсчетом коек на 10 тыс населения, восполнить не получится, поскольку на других ресурсах этих данных также нет - оставим как есть
   - в 2005 - проблема с подсчетом частных учреждений, удалим, тк это наш основной показатель
   - в 1995, 2000 и 1990 годах нас не интересуют, удалим эти строки
   - в 2009 - проблема с подсчетом коек, восполнить не получится - оставим как есть
- Удалены строки, где в столбце 'Год' значение равно 1995, 2000 или 1990
- После всех манипуляций сбросили индексы
- Добавлены столбцы с доп расчетами:
   - `Общее число государственных организаций`
   - `Число городских государственных больничных организаций`
   - `Число сельских государственных больничных организаций`
   - `Общее число других негосударственных организаций`
   - `Число других городских негосударственных организаций`
   - `Число других сельских негосударственных организаций`
   - `Общее число коек в государственных организациях (тыс)`
   - `Число коек в городских государственных организациях (тыс)`
   - `Число коек в сельских государственных организациях (тыс)`
   - `Общее число коек в других негосударственных организациях (тыс)`
   - `Число коек в других городских негосударственных организаций (тыс)`
   - `Число коек в других сельских негосударственных организаций (тыс)`
- Данные выгружены в excel для дальнейшей обработки

# Строим дэш в Datalens и делаем выводы по гипотезе

## Выгрузим таблицу в Excel для DataLens

In [32]:
df_hospitals.to_excel("output.xlsx")

Готовый дэш можно найти по ссылке - https://datalens.yandex/viic7kbounpyj

## Проверим гипотезы

- За период 2006-2022 число государственных больничных организаций снизилось более, чем на 20%
- Число частных больничных организаций выросло в 4 раза
- Количество участковых (сельских) больниц уменьшилось в 20 раз

### За период 2006-2022 число государственных больничных организаций снизилось на 20%

In [33]:
# выведем общее число государственных организаций за 2006 год
gov_hos_2006 = df_hospitals[df_hospitals['Год'] == 2006]['Общее число государственных организаций'].values[0]
gov_hos_2006

7158.0

In [34]:
# выведем общее число государственных организаций за 2022 год
gov_hos_2022 = df_hospitals[df_hospitals['Год'] == 2022]['Общее число государственных организаций'].values[0]
gov_hos_2022

4709.0

In [35]:
(gov_hos_2022 - gov_hos_2006) / gov_hos_2006 * 100

-34.2134674490081

Таким образом, количество больничных организаций с 2006 по 2022 снизилось на 34%. Гипотеза подтвердилась

### Число частных больничных организаций выросло в 4 раза

In [36]:
# выведем общее число частных организаций за 2006 год
priv_hos_2006 = df_hospitals[df_hospitals['Год'] == 2006]['Общее число частных организаций'].values[0]
priv_hos_2006

148.0

In [37]:
# выведем общее число частных организаций за 2022 год
priv_hos_2022 = df_hospitals[df_hospitals['Год'] == 2022]['Общее число частных организаций'].values[0]
priv_hos_2022

409.0

In [38]:
priv_hos_2022 / priv_hos_2006

2.7635135135135136

Число частных больничных организаций выросло в 2.8 раз. Гипотеза не подтвердилась

### Количество участковых больниц уменьшилось в 20 раз

In [39]:
# выведем общее число УБ за 2006 год
distr_hos_2006 = df_hospitals[df_hospitals['Год'] == 2006]['Общее число УБ'].values[0]
distr_hos_2006

628.0

In [40]:
# выведем общее число УБ за 2022 год
distr_hos_2022 = df_hospitals[df_hospitals['Год'] == 2022]['Общее число УБ'].values[0]
distr_hos_2022

21.0

In [41]:
distr_hos_2006 / distr_hos_2022

29.904761904761905

Гипотеза подтвердилась. Число участковых больниц уменьшилось почти в 30 раз

# Вывод

- Проверены гипотезы:
   - подтверждено - количество больничных организаций с 2006 по 2022 снизилось на 34%
   - опровергнуто - число частных больничных организаций выросло в 2.8 раз
   - подтверждено - число участковых больниц уменьшилось почти в 30 раз

# Общий вывод

**В первой части исследования:**

- Импортированы библиотеки
- Для исследования были выбраны данные из раздела 3.1 Сеть и материально-техническая база медицинских организаций. Там как раз есть нужные данные по количеству медицинских организаций с 2006 по 2022 год

- Проведена первичная обработка:
   - транспонирование и объединение таблиц
   - установка заголовков
   - переименованы заголовки столбцов 
   - удалены лишние столбцы и строки

**Во второй части исследования:**

- Изучили общую информацию и наметили фронт исправлений
- Исправили ошибки исходного файла в значениях со скобкой
- Изменили типы данных:
   - столбец 'Год' в int64
   - остальные в float64
- Удалили явные и недавные дубли
- Рассмотрены пропуски, решили:
   - для 2021 и 2022 - проблемы с подсчетом коек на 10 тыс населения, восполнить не получится, поскольку на других ресурсах этих данных также нет - оставим как есть
   - в 2005 - проблема с подсчетом частных учреждений, удалим, тк это наш основной показатель
   - в 1995, 2000 и 1990 годах нас не интересуют, удалим эти строки
   - в 2009 - проблема с подсчетом коек, восполнить не получится - оставим как есть
- Удалены строки, где в столбце 'Год' значение равно 1995, 2000 или 1990
- После всех манипуляций сбросили индексы
- Добавлены столбцы с доп расчетами:
   - `Общее число государственных организаций`
   - `Число городских государственных больничных организаций`
   - `Число сельских государственных больничных организаций`
   - `Общее число других негосударственных организаций`
   - `Число других городских негосударственных организаций`
   - `Число других сельских негосударственных организаций`
   - `Общее число коек в государственных организациях (тыс)`
   - `Число коек в городских государственных организациях (тыс)`
   - `Число коек в сельских государственных организациях (тыс)`
   - `Общее число коек в других негосударственных организациях (тыс)`
   - `Число коек в других городских негосударственных организаций (тыс)`
   - `Число коек в других сельских негосударственных организаций (тыс)`
- Данные выгружены в excel для дальнейшей обработки
- Построен дэш в DataLens https://datalens.yandex/viic7kbounpyj

**В третьей части исследования:**

- Проверены гипотезы:
   - подтверждено - количество больничных организаций с 2006 по 2022 снизилось на 34%
   - опровергнуто - число частных больничных организаций выросло в 2.8 раз
   - подтверждено - число участковых больниц уменьшилось почти в 30 раз