# Создание таблицы с данными о продолжительности жизни

**Оглавление**<a id='toc0_'></a>    
- [Данные о странах и продолжительности жизни](#toc1_)    
- [Данные, связанные со смертностью населения](#toc2_)    
  - [Смертность среди взрослых](#toc2_1_)    
  - [Оценки уровня убийств (на 100 000 населения)](#toc2_2_)    
  - [Коэффициент материнской смертности (на 100 000 живорождений)](#toc2_3_)    
  - [Вероятность (в процентах) смерти в возрасте от 30 до 70 лет от сердечно-сосудистых заболеваний, рака, диабета или хронических респираторных заболеваний](#toc2_4_)    
  - [Число смертей, связанных с неинфекционными заболеваниями, разбитые по типу заболевания](#toc2_5_)    
  - [Уровень смертности от непреднамеренного отравления (на 100 000 населения)](#toc2_6_)    
  - [Общий уровень самоубийств (на 100 000 населения)](#toc2_7_)    
- [Потребление алкоголя, которое регистрируется в литрах чистого алкоголя на душу населения в возрасте 15+ лет](#toc3_)    
- [Данные, связанные с иммунизацией населения против различных болезней](#toc4_)    
  - [Охват иммунизацией детей в возрасте 1 года против гепатита В (ГепВ3) (%)](#toc4_1_)    
  - [Охват первой дозой вакцины, содержащей коревой компонент (MCV1), среди детей в возрасте 1 года (%)](#toc4_2_)    
  - [Охват иммунизацией от полиомиелита (Pol3) среди детей в возрасте 1 года (%)](#toc4_3_)    
  - [Охват иммунизацией детей в возрасте 1 года дифтерийно-столбнячным анатоксином и коклюшем (АКДС3) (%)](#toc4_4_)    
- [Индекс массы тела (ИМТ)](#toc5_)    
  - [Распространенность недостаточного веса среди взрослых, ИМТ < 18,5 (стандартизированная по возрасту оценка) (%)](#toc5_1_)    
  - [Распространенность избыточного веса среди взрослых, ИМТ >= 25 (стандартизированная по возрасту оценка) (%)](#toc5_2_)    
  - [Распространенность ожирения среди взрослых, ИМТ >= 30 (стандартизированная по возрасту оценка) (%)](#toc5_3_)    
  - [Распространенность худобы среди детей 5-9 лет, ИМТ < -2 стандартных отклонений ниже медианы (грубая оценка) (%)](#toc5_4_)    
  - [Распространенность худобы среди подростков 10-19 лет, ИМТ < -2 стандартных отклонений ниже медианы (грубая оценка) (%)](#toc5_5_)    
  - [Распространенность избыточного веса среди детей 5-9 лет, ИМТ > +1 стандартного отклонения выше медианы (грубая оценка) (%)](#toc5_6_)    
  - [Распространенность избыточного веса среди подростков 10-19 лет, ИМТ > +1 стандартного отклонения выше медианы (грубая оценка) (%)](#toc5_7_)    
  - [Распространенность ожирения среди детей 5-9 лет, ИМТ > +2 стандартных отклонений выше медианы (грубая оценка) (%)](#toc5_8_)    
  - [Распространенность ожирения среди подростков 10-19 лет, ИМТ > +2 стандартных отклонений выше медианы (грубая оценка) (%)](#toc5_9_)    
- [Оценки водоснабжения, санитарии и гигиены](#toc6_)    
  - [Население, пользующееся как минимум базовыми услугами санитарии (%)](#toc6_1_)    
  - [Население, пользующееся по крайней мере базовыми услугами питьевого водоснабжения (%)](#toc6_2_)    
- [Финансирование здравоохранения](#toc7_)    
  - [Общие внутренние государственные расходы на здравоохранение в процентах от общих государственных расходов (%)](#toc7_1_)    
  - [Общие внутренние государственные расходы на здравоохранение в процентах от валового внутреннего продукта (ВВП) (%)](#toc7_2_)    
  - [Общие внутренние государственные расходы на здравоохранение на душу населения в долларах США](#toc7_3_)    
- [ВВП на душу населения (в долл. США)](#toc8_)    
- [Общая численность населения](#toc9_)    
- [Средняя продолжительность формального образования для лиц в возрасте 15–64 лет](#toc10_)    
- [Итоговая таблица](#toc11_)    

<!-- vscode-jupyter-toc-config
	numbering=false
	anchor=true
	flat=false
	minLevel=2
	maxLevel=6
	/vscode-jupyter-toc-config -->
<!-- THIS CELL WILL BE REPLACED ON TOC UPDATE. DO NOT WRITE YOUR TEXT IN THIS CELL -->

In [3]:
import sys
# Добавим папку проекта в список системных директорий, чтобы Python видел путь к папке utils
sys.path.append('..')

In [None]:
import pandas as pd

from utils.prepare_data import (
    move_column_to_end_table,
)

from warnings import simplefilter
simplefilter('ignore')

## <a id='toc1_'></a>[Данные о странах и продолжительности жизни](#toc0_)

С сайта ВОЗ (Всемирная Организация Здравоохранения) скачаем данные об ожидаемой продолжительности жизни в различных странах за период с 2000 по 2020 годы. \
Эти данные можно найти по ссылке \
[https://www.who.int/data/gho/data/indicators/indicator-details/GHO/life-expectancy-at-birth-(years)](https://www.who.int/data/gho/data/indicators/indicator-details/GHO/life-expectancy-at-birth-(years))

Исследуем скачанные данные.

In [5]:
who_life_expectancy_data = pd.read_csv('../data/who_life_expectancy_all.csv')

who_life_expectancy_data.head(2)

Unnamed: 0,IndicatorCode,Indicator,ValueType,ParentLocationCode,ParentLocation,Location type,SpatialDimValueCode,Location,Period type,Period,...,FactValueUoM,FactValueNumericLowPrefix,FactValueNumericLow,FactValueNumericHighPrefix,FactValueNumericHigh,Value,FactValueTranslationID,FactComments,Language,DateModified
0,WHOSIS_000001,Life expectancy at birth (years),text,AFR,Africa,Country,LSO,Lesotho,Year,2020,...,,,50.77,,53.15,51.9 [50.8-53.2],,,EN,2024-08-02 00:00:00
1,WHOSIS_000001,Life expectancy at birth (years),text,AFR,Africa,Country,CAF,Central African Republic,Year,2020,...,,,51.9,,54.1,53.1 [51.9-54.1],,,EN,2024-08-02 00:00:00


Описание нужных нам столбцов.

- `ParentLocationCode` - код региона
- `ParentLocation` - название региона
- `SpatialDimValueCode` - код страны
- `Location` - название страны
- `Period` - год
- `FactValueNumeric` - ожидаемый возраст

Оставим только их.

In [6]:
base_columns = [
    'ParentLocationCode', 'ParentLocation', 'SpatialDimValueCode', 
    'Location', 'Period', 'FactValueNumeric',
]

who_life_expectancy_data = who_life_expectancy_data[base_columns]
who_life_expectancy_data.head(3)

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,FactValueNumeric
0,AFR,Africa,LSO,Lesotho,2020,51.85
1,AFR,Africa,CAF,Central African Republic,2020,53.08
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13


Имена столбцов (кроме `FactValueNumeric`) оставим как в исходной таблице, \
потому что в других таблицах с сайта https://www.who.int/ \
столбцы с аналогичными данными называются так же.\
И это будет удобно при их объединении.

Столбец с `FactValueNumeric` переименуем в `LifeExpectancy`.

In [7]:
who_life_expectancy_data.rename(
    columns={'FactValueNumeric': 'LifeExpectancy'},
    inplace=True,
)
who_life_expectancy_data.head(3)

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy
0,AFR,Africa,LSO,Lesotho,2020,51.85
1,AFR,Africa,CAF,Central African Republic,2020,53.08
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13


In [8]:
# Посмотрим на размерность
who_life_expectancy_data.shape

(3885, 6)

In [9]:
# Посмотрим на информацию о столбцах
who_life_expectancy_data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3885 entries, 0 to 3884
Data columns (total 6 columns):
 #   Column               Non-Null Count  Dtype  
---  ------               --------------  -----  
 0   ParentLocationCode   3885 non-null   object 
 1   ParentLocation       3885 non-null   object 
 2   SpatialDimValueCode  3885 non-null   object 
 3   Location             3885 non-null   object 
 4   Period               3885 non-null   int64  
 5   LifeExpectancy       3885 non-null   float64
dtypes: float64(1), int64(1), object(4)
memory usage: 182.2+ KB


Типы данных столбцов соответствуют их содержимому, пропусков нет.

Также сразу удалим данные по следующим странам:
- *Democratic People's Republic of Korea* \
(Корейская Народно-Демократическая Республика), \
код страны **PRK**;
- *South Sudan* (Южный Судан), код страны **SSD**.
- *Puerto Rico* (Пуэрто-Рико), код страны **PRI**
- *occupied Palestinian territory, including east Jerusalem* \
(оккупированная палестинская территория, включая восточный Иерусалим), \
код страны  **PSE**

Потому что в дальнейшем в информации по ним будет много пропусков.

In [10]:
mask = who_life_expectancy_data['SpatialDimValueCode'].isin(['PRK', 'SSD', 'PRI', 'PSE'])

who_life_expectancy_data.drop(who_life_expectancy_data[mask].index, inplace=True)

Создадим таблицу с данными регионов и стран, в дальнейшем она пригодится.

In [11]:
# Оставим только нужные столбцы из исходной таблицы
regions_and_locations_data = \
    who_life_expectancy_data[[
        'ParentLocationCode', 'ParentLocation', 
        'SpatialDimValueCode', 'Location',
    ]]

# Оставим по каждой стране только одну строку
regions_and_locations_data = regions_and_locations_data \
    .groupby('SpatialDimValueCode') \
    .first() \
    .reset_index() \
    .sort_values(by=['ParentLocationCode', 'SpatialDimValueCode']) \
    .reset_index(drop=True) \
    .reindex(columns=[
        'ParentLocationCode', 'ParentLocation', 
        'SpatialDimValueCode', 'Location',
    ])

regions_and_locations_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location
0,AFR,Africa,AGO,Angola
1,AFR,Africa,BDI,Burundi
2,AFR,Africa,BEN,Benin
3,AFR,Africa,BFA,Burkina Faso
4,AFR,Africa,BWA,Botswana


In [None]:
# Сохраним полученную таблицу для дальнейшего использования
regions_and_locations_data.to_csv('../data/regions_and_locations.csv', index=False)

## <a id='toc2_'></a>[Данные, связанные со смертностью населения](#toc0_)

Перечень этих данных на сайте ВОЗ можно найти по ссылке \
https://www.who.int/data/gho/data/themes/mortality-and-global-health-estimates

### <a id='toc2_1_'></a>[Смертность среди взрослых](#toc0_)

Коэффициент смертности среди взрослого населения \
(вероятность смерти в возрасте от 15 до 60 лет на 1000 человек населения). 

Эти данные можно найти по ссылке:\
https://www.who.int/data/gho/data/indicators/indicator-details/GHO/adult-mortality-rate-(probability-of-dying-between-15-and-60-years-per-1000-population)

Скачаем данные за 2000 - 2020 гг. 

In [13]:
# Загрузим выкачанные данные
who_adult_mortality_data = pd.read_csv('../data/who_adult_mortality.csv')

who_adult_mortality_data.head(2)

Unnamed: 0,IndicatorCode,Indicator,ValueType,ParentLocationCode,ParentLocation,Location type,SpatialDimValueCode,Location,Period type,Period,...,FactValueUoM,FactValueNumericLowPrefix,FactValueNumericLow,FactValueNumericHighPrefix,FactValueNumericHigh,Value,FactValueTranslationID,FactComments,Language,DateModified
0,WHOSIS_000004,Adult mortality rate (probability of dying bet...,numeric,AMR,Americas,Country,PAN,Panama,Year,2020,...,,,,,,101,,,EN,2024-10-31 00:00:00
1,WHOSIS_000004,Adult mortality rate (probability of dying bet...,numeric,EMR,Eastern Mediterranean,Country,IRN,Iran (Islamic Republic of),Year,2020,...,,,,,,103,,,EN,2024-10-31 00:00:00


Коэффициент смертности содержится в поле `FactValueNumeric` .\
Остальные нужные столбцы имеют такие же названия, как в предыдущей таблице.

Оставим только столбцы которые будут участвовать в объединении таблиц.

In [14]:
who_adult_mortality_data = who_adult_mortality_data[
    ['SpatialDimValueCode', 'Period', 'FactValueNumeric']
]

Переименуем столбец `FactValueNumeric` в `AdultMortality`.

In [15]:
who_adult_mortality_data.rename(
    columns={ 'FactValueNumeric': 'AdultMortality' },
    inplace=True,
)

Посмотрим, есть ли пропуски

In [16]:
who_adult_mortality_data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3885 entries, 0 to 3884
Data columns (total 3 columns):
 #   Column               Non-Null Count  Dtype  
---  ------               --------------  -----  
 0   SpatialDimValueCode  3885 non-null   object 
 1   Period               3885 non-null   int64  
 2   AdultMortality       3885 non-null   float64
dtypes: float64(1), int64(1), object(1)
memory usage: 91.2+ KB


Пропусков нет.

Проверим, что множества годов (столбец `Period`) и кодов стран (столбец `SpatialDimValueCode`) \
в обеих таблицах совпадают.

In [17]:
set(who_life_expectancy_data['Period'].unique()) == \
    set(who_adult_mortality_data['Period'].unique())

True

In [18]:
set(who_life_expectancy_data['SpatialDimValueCode'].unique()) == \
    set(who_adult_mortality_data['SpatialDimValueCode'].unique())

False

Коды некоторых стран в таблицах не совпадают.\
Скорее всего это из-за того, что выше мы удалили некоторые страны из основной таблицы.\
После левого объединения данных с основной таблицей пропусков быть не должно.

Теперь объединим таблицы.

In [19]:
cumulative_live_data = who_life_expectancy_data.merge(
    who_adult_mortality_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2


Проверим, что нет пропусков.

In [20]:
cumulative_live_data.isna().sum().sum()

0

Пропусков нет.

### <a id='toc2_2_'></a>[Оценки уровня убийств (на 100 000 населения)](#toc0_)

Формирование данной таблицы вынесено в файл [03_homicides.ipynb](./03_homicides.ipynb).

Здесь просто скачаем итоговую таблицу и присоединим к текущей.

In [21]:
who_homicides_data = pd.read_csv('../data/who_homicides_prepared.csv')

who_homicides_data.head()

Unnamed: 0,SpatialDimValueCode,Period,Homicides
0,JPN,2019,0.21
1,SGP,2019,0.25
2,BHR,2019,0.31
3,QAT,2019,0.5
4,CHE,2019,0.49


Здесь в столбцах:

- `SpatialDimValueCode` - Код региона
- `Period` - год
- `Homicides` - оценка уровня убийств (на 100 000 населения)

Присоединим таблицу к текущей.

In [22]:
cumulative_live_data = cumulative_live_data.merge(
    who_homicides_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667


Проверим, что пропусков нет.

In [None]:
cumulative_live_data.isna().sum().sum()

0

### <a id='toc2_3_'></a>[Коэффициент материнской смертности (на 100 000 живорождений)](#toc0_)

Формирование данной таблицы вынесено в файл [04_maternal_mortality.ipynb](./04_maternal_mortality.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [24]:
who_maternal_mortality_data = pd.read_csv('../data/who_maternal_mortality_prepared.csv')

who_maternal_mortality_data.head()

Unnamed: 0,Period,Location,MaternalMortality
0,2003,Samoa,63.63342
1,2019,Montenegro,5.81691
2,2020,Montenegro,6.17443
3,2005,Oman,19.72671
4,2018,Serbia,11.46952


In [25]:
cumulative_live_data = cumulative_live_data.merge(
    who_maternal_mortality_data,
    on=['Location', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

### <a id='toc2_4_'></a>[Вероятность (в процентах) смерти в возрасте от 30 до 70 лет от сердечно-сосудистых заболеваний, рака, диабета или хронических респираторных заболеваний](#toc0_)

Формирование данной таблицы вынесено в файл [05_adult_mortality_noncommunicable_diseases.ipynb](./05_adult_mortality_noncommunicable_diseases.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [27]:
who_adult_ncd_mortality_data = \
    pd.read_csv('../data/who_adult_ncd_mortality_prepared.csv')
    
who_adult_ncd_mortality_data.head()

Unnamed: 0,SpatialDimValueCode,Period,AdultNcdMortality
0,FRA,2020,10.0
1,CAN,2020,10.0
2,NZL,2020,10.0
3,PAN,2020,10.1
4,CRI,2020,10.1


In [28]:
cumulative_live_data = cumulative_live_data.merge(
    who_adult_ncd_mortality_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality,AdultNcdMortality
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625,37.5
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601,32.7
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232,29.3
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239,35.1
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243,26.8


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

### <a id='toc2_5_'></a>[Число смертей, связанных с неинфекционными заболеваниями, разбитые по типу заболевания](#toc0_)

Формирование данной таблицы вынесено в файл [06_adult_ncd_causes_mortality.ipynb](./06_adult_ncd_causes_mortality.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [30]:
who_adult_ncd_causes_mortality_prepare_data = \
    pd.read_csv('../data/who_adult_ncd_causes_mortality_prepare.csv')

who_adult_ncd_causes_mortality_prepare_data.head()

Unnamed: 0,SpatialDimValueCode,Period,AdultNcdMortality117,AdultNcdMortality110,AdultNcdMortality080,AdultNcdMortality061,AdultNcdMortalitySum
0,MNE,2000,68.0,3269.0,153.0,960.0,4450.0
1,RUS,2000,59915.0,1265019.0,12976.0,323636.0,1661546.0
2,URY,2000,2104.0,10592.0,694.0,7947.0,21337.0
3,BRB,2000,108.0,847.0,232.0,556.0,1743.0
4,MAR,2000,6019.0,71045.0,4161.0,16699.0,97924.0


In [31]:
cumulative_live_data = cumulative_live_data.merge(
    who_adult_ncd_causes_mortality_prepare_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality,AdultNcdMortality,AdultNcdMortality117,AdultNcdMortality110,AdultNcdMortality080,AdultNcdMortality061,AdultNcdMortalitySum
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625,37.5,1899.666667,6673.333333,2303.333333,1397.333333,12273.666667
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601,32.7,1806.666667,8326.0,1362.333333,1848.333333,13343.333333
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232,29.3,4364.666667,19821.333333,3395.333333,8139.333333,35720.666667
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239,35.1,441.0,2035.666667,1000.666667,592.333333,4069.666667
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243,26.8,365.666667,2115.0,396.666667,766.666667,3644.0


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

### <a id='toc2_6_'></a>[Уровень смертности от непреднамеренного отравления (на 100 000 населения)](#toc0_)

Формирование данной таблицы вынесено в файл [07_poisoning_mortality.ipynb](./07_poisoning_mortality.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [33]:
who_poisoning_mortality_prepared_data = \
    pd.read_csv('../data/who_poisoning_mortality_prepared.csv')

who_poisoning_mortality_prepared_data.head()

Unnamed: 0,SpatialDimValueCode,Period,PoisoningMortality
0,BRN,2019,0.001
1,VCT,2019,0.005
2,SGP,2019,0.019
3,ISR,2019,0.047
4,MDV,2019,0.047


In [34]:
cumulative_live_data = cumulative_live_data.merge(
    who_poisoning_mortality_prepared_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality,AdultNcdMortality,AdultNcdMortality117,AdultNcdMortality110,AdultNcdMortality080,AdultNcdMortality061,AdultNcdMortalitySum,PoisoningMortality
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625,37.5,1899.666667,6673.333333,2303.333333,1397.333333,12273.666667,5.286667
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601,32.7,1806.666667,8326.0,1362.333333,1848.333333,13343.333333,2.973333
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232,29.3,4364.666667,19821.333333,3395.333333,8139.333333,35720.666667,4.393333
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239,35.1,441.0,2035.666667,1000.666667,592.333333,4069.666667,3.266667
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243,26.8,365.666667,2115.0,396.666667,766.666667,3644.0,2.363333


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

### <a id='toc2_7_'></a>[Общий уровень самоубийств (на 100 000 населения)](#toc0_)

Формирование данной таблицы вынесено в файл [08_suicide_mortality.ipynb](./08_suicide_mortality.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [36]:
who_suicide_mortality_prepared_data = \
    pd.read_csv('../data/who_suicide_mortality_prepared.csv')

who_suicide_mortality_prepared_data.head()

Unnamed: 0,SpatialDimValueCode,Period,SuicideMortality
0,BRB,2019,0.31
1,ATG,2019,0.32
2,GRD,2019,0.64
3,VCT,2019,1.01
4,NER,2019,10.15


In [37]:
cumulative_live_data = cumulative_live_data.merge(
    who_suicide_mortality_prepared_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality,AdultNcdMortality,AdultNcdMortality117,AdultNcdMortality110,AdultNcdMortality080,AdultNcdMortality061,AdultNcdMortalitySum,PoisoningMortality,SuicideMortality
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625,37.5,1899.666667,6673.333333,2303.333333,1397.333333,12273.666667,5.286667,92.28
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601,32.7,1806.666667,8326.0,1362.333333,1848.333333,13343.333333,2.973333,24.113333
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232,29.3,4364.666667,19821.333333,3395.333333,8139.333333,35720.666667,4.393333,14.78
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239,35.1,441.0,2035.666667,1000.666667,592.333333,4069.666667,3.266667,41.166667
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243,26.8,365.666667,2115.0,396.666667,766.666667,3644.0,2.363333,12.79


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

## <a id='toc3_'></a>[Потребление алкоголя, которое регистрируется в литрах чистого алкоголя на душу населения в возрасте 15+ лет](#toc0_)

Формирование данной таблицы вынесено в файл [09_alcohol.ipynb](./09_alcohol.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [39]:
who_alcohol_prepared_data = pd.read_csv('../data/who_alcohol_prepared.csv')

who_alcohol_prepared_data.head()

Unnamed: 0,SpatialDimValueCode,Period,AlcoholСonsumption
0,AFG,2020,0.009
1,KWT,2020,0.0
2,LBY,2020,0.011
3,MRT,2020,0.0
4,PAK,2020,0.048


In [40]:
cumulative_live_data = cumulative_live_data.merge(
    who_alcohol_prepared_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality,AdultNcdMortality,AdultNcdMortality117,AdultNcdMortality110,AdultNcdMortality080,AdultNcdMortality061,AdultNcdMortalitySum,PoisoningMortality,SuicideMortality,AlcoholСonsumption
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625,37.5,1899.666667,6673.333333,2303.333333,1397.333333,12273.666667,5.286667,92.28,3.25
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601,32.7,1806.666667,8326.0,1362.333333,1848.333333,13343.333333,2.973333,24.113333,1.27
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232,29.3,4364.666667,19821.333333,3395.333333,8139.333333,35720.666667,4.393333,14.78,0.0
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239,35.1,441.0,2035.666667,1000.666667,592.333333,4069.666667,3.266667,41.166667,5.8
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243,26.8,365.666667,2115.0,396.666667,766.666667,3644.0,2.363333,12.79,2.92


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

## <a id='toc4_'></a>[Данные, связанные с иммунизацией населения против различных болезней](#toc0_)

Перечень этих данных на сайте ВОЗ можно найти по ссылке \
https://www.who.int/data/gho/data/themes/immunization

### <a id='toc4_1_'></a>[Охват иммунизацией детей в возрасте 1 года против гепатита В (ГепВ3) (%)](#toc0_)

Формирование данной таблицы вынесено в файл [10_hepatitis_b_immunization.ipynb](./10_hepatitis_b_immunization.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [42]:
who_hepatitis_b_immunization_prepared_data = pd.read_csv(
    '../data/who_hepatitis_b_immunization_prepared.csv'
)

who_hepatitis_b_immunization_prepared_data.head()

Unnamed: 0,SpatialDimValueCode,Period,HepatitisBImmunization
0,PNG,2020,40.0
1,CAF,2020,42.0
2,SOM,2020,42.0
3,GIN,2020,47.0
4,AGO,2020,51.0


In [43]:
cumulative_live_data = cumulative_live_data.merge(
    who_hepatitis_b_immunization_prepared_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality,AdultNcdMortality,AdultNcdMortality117,AdultNcdMortality110,AdultNcdMortality080,AdultNcdMortality061,AdultNcdMortalitySum,PoisoningMortality,SuicideMortality,AlcoholСonsumption,HepatitisBImmunization
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625,37.5,1899.666667,6673.333333,2303.333333,1397.333333,12273.666667,5.286667,92.28,3.25,87.0
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601,32.7,1806.666667,8326.0,1362.333333,1848.333333,13343.333333,2.973333,24.113333,1.27,42.0
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232,29.3,4364.666667,19821.333333,3395.333333,8139.333333,35720.666667,4.393333,14.78,0.0,42.0
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239,35.1,441.0,2035.666667,1000.666667,592.333333,4069.666667,3.266667,41.166667,5.8,83.0
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243,26.8,365.666667,2115.0,396.666667,766.666667,3644.0,2.363333,12.79,2.92,74.0


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

### <a id='toc4_2_'></a>[Охват первой дозой вакцины, содержащей коревой компонент (MCV1), среди детей в возрасте 1 года (%)](#toc0_)

Формирование данной таблицы вынесено в файл [11_measles_immunization.ipynb](./11_measles_immunization.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [45]:
who_measles_immunization_prepared_data = pd.read_csv(
    '../data/who_measles_immunization_prepared.csv'
)

who_measles_immunization_prepared_data.head()

Unnamed: 0,SpatialDimValueCode,Period,MeaslesImmunization
0,MNE,2020,24.0
1,CAF,2020,41.0
2,AGO,2020,44.0
3,PNG,2020,44.0
4,TCD,2020,45.0


In [46]:
cumulative_live_data = cumulative_live_data.merge(
    who_measles_immunization_prepared_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality,AdultNcdMortality,AdultNcdMortality117,AdultNcdMortality110,AdultNcdMortality080,AdultNcdMortality061,AdultNcdMortalitySum,PoisoningMortality,SuicideMortality,AlcoholСonsumption,HepatitisBImmunization,MeaslesImmunization
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625,37.5,1899.666667,6673.333333,2303.333333,1397.333333,12273.666667,5.286667,92.28,3.25,87.0,90.0
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601,32.7,1806.666667,8326.0,1362.333333,1848.333333,13343.333333,2.973333,24.113333,1.27,42.0,41.0
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232,29.3,4364.666667,19821.333333,3395.333333,8139.333333,35720.666667,4.393333,14.78,0.0,42.0,46.0
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239,35.1,441.0,2035.666667,1000.666667,592.333333,4069.666667,3.266667,41.166667,5.8,83.0,76.0
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243,26.8,365.666667,2115.0,396.666667,766.666667,3644.0,2.363333,12.79,2.92,74.0,72.0


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

### <a id='toc4_3_'></a>[Охват иммунизацией от полиомиелита (Pol3) среди детей в возрасте 1 года (%)](#toc0_)

Формирование данной таблицы вынесено в файл [12_polio_immunization.ipynb](./12_polio_immunization.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [48]:
who_polio_immunization_prepared_data = pd.read_csv(
    '../data/who_polio_immunization_prepared.csv'
)

who_polio_immunization_prepared_data.head()

Unnamed: 0,SpatialDimValueCode,Period,PolioImmunization
0,PNG,2020,43.0
1,CAF,2020,46.0
2,SOM,2020,47.0
3,GIN,2020,48.0
4,AGO,2020,51.0


In [49]:
cumulative_live_data = cumulative_live_data.merge(
    who_polio_immunization_prepared_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality,AdultNcdMortality,...,AdultNcdMortality110,AdultNcdMortality080,AdultNcdMortality061,AdultNcdMortalitySum,PoisoningMortality,SuicideMortality,AlcoholСonsumption,HepatitisBImmunization,MeaslesImmunization,PolioImmunization
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625,37.5,...,6673.333333,2303.333333,1397.333333,12273.666667,5.286667,92.28,3.25,87.0,90.0,87.0
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601,32.7,...,8326.0,1362.333333,1848.333333,13343.333333,2.973333,24.113333,1.27,42.0,41.0,46.0
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232,29.3,...,19821.333333,3395.333333,8139.333333,35720.666667,4.393333,14.78,0.0,42.0,46.0,47.0
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239,35.1,...,2035.666667,1000.666667,592.333333,4069.666667,3.266667,41.166667,5.8,83.0,76.0,82.0
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243,26.8,...,2115.0,396.666667,766.666667,3644.0,2.363333,12.79,2.92,74.0,72.0,63.0


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

### <a id='toc4_4_'></a>[Охват иммунизацией детей в возрасте 1 года дифтерийно-столбнячным анатоксином и коклюшем (АКДС3) (%)](#toc0_)

Формирование данной таблицы вынесено в файл [13_diphtheria_immunization.ipynb](./13_diphtheria_immunization.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [51]:
who_diphtheria_immunization_prepared_data = pd.read_csv(
    '../data/who_diphtheria_immunization_prepared.csv'
)

who_diphtheria_immunization_prepared_data.head()

Unnamed: 0,SpatialDimValueCode,Period,DiphtheriaImmunization
0,PNG,2020,40.0
1,CAF,2020,42.0
2,SOM,2020,42.0
3,GIN,2020,47.0
4,AGO,2020,51.0


In [52]:
cumulative_live_data = cumulative_live_data.merge(
    who_diphtheria_immunization_prepared_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality,AdultNcdMortality,...,AdultNcdMortality080,AdultNcdMortality061,AdultNcdMortalitySum,PoisoningMortality,SuicideMortality,AlcoholСonsumption,HepatitisBImmunization,MeaslesImmunization,PolioImmunization,DiphtheriaImmunization
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625,37.5,...,2303.333333,1397.333333,12273.666667,5.286667,92.28,3.25,87.0,90.0,87.0,87.0
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601,32.7,...,1362.333333,1848.333333,13343.333333,2.973333,24.113333,1.27,42.0,41.0,46.0,42.0
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232,29.3,...,3395.333333,8139.333333,35720.666667,4.393333,14.78,0.0,42.0,46.0,47.0,42.0
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239,35.1,...,1000.666667,592.333333,4069.666667,3.266667,41.166667,5.8,83.0,76.0,82.0,83.0
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243,26.8,...,396.666667,766.666667,3644.0,2.363333,12.79,2.92,74.0,72.0,63.0,74.0


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

## <a id='toc5_'></a>[Индекс массы тела (ИМТ)](#toc0_)

Перечень этих данных на сайте ВОЗ можно найти по ссылке \
https://www.who.int/data/gho/data/themes/topics/topic-details/GHO/body-mass-index

### <a id='toc5_1_'></a>[Распространенность недостаточного веса среди взрослых, ИМТ < 18,5 (стандартизированная по возрасту оценка) (%)](#toc0_)

Формирование данной таблицы вынесено в файл [14_bmi_adult_underweight.ipynb](./14_bmi_adult_underweight.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [54]:
who_bmi_adult_underweight_prepared_data = pd.read_csv(
    '../data/who_bmi_adult_underweight_prepared.csv'
)

who_bmi_adult_underweight_prepared_data.head()

Unnamed: 0,SpatialDimValueCode,Period,BmiAdultUnderweight
0,TON,2020,0.26
1,ASM,2020,0.34
2,WSM,2020,0.42
3,NRU,2020,0.44
4,TKL,2020,0.45


In [55]:
cumulative_live_data = cumulative_live_data.merge(
    who_bmi_adult_underweight_prepared_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality,AdultNcdMortality,...,AdultNcdMortality061,AdultNcdMortalitySum,PoisoningMortality,SuicideMortality,AlcoholСonsumption,HepatitisBImmunization,MeaslesImmunization,PolioImmunization,DiphtheriaImmunization,BmiAdultUnderweight
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625,37.5,...,1397.333333,12273.666667,5.286667,92.28,3.25,87.0,90.0,87.0,87.0,6.96
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601,32.7,...,1848.333333,13343.333333,2.973333,24.113333,1.27,42.0,41.0,46.0,42.0,20.8
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232,29.3,...,8139.333333,35720.666667,4.393333,14.78,0.0,42.0,46.0,47.0,42.0,17.08
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239,35.1,...,592.333333,4069.666667,3.266667,41.166667,5.8,83.0,76.0,82.0,83.0,4.31
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243,26.8,...,766.666667,3644.0,2.363333,12.79,2.92,74.0,72.0,63.0,74.0,10.03


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

### <a id='toc5_2_'></a>[Распространенность избыточного веса среди взрослых, ИМТ >= 25 (стандартизированная по возрасту оценка) (%)](#toc0_)

Формирование данной таблицы вынесено в файл [15_bmi_adult_overweight_25.ipynb](./15_bmi_adult_overweight_25.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [57]:
who_bmi_adult_overweight_25_prepared_data = pd.read_csv(
    '../data/who_bmi_adult_overweight_25_prepared.csv'
)

who_bmi_adult_overweight_25_prepared_data.head()

Unnamed: 0,SpatialDimValueCode,Period,BmiAdultOverweight25
0,ETH,2020,10.12
1,TLS,2020,13.08
2,BDI,2020,15.42
3,MDG,2020,15.76
4,ERI,2020,16.02


In [58]:
cumulative_live_data = cumulative_live_data.merge(
    who_bmi_adult_overweight_25_prepared_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality,AdultNcdMortality,...,AdultNcdMortalitySum,PoisoningMortality,SuicideMortality,AlcoholСonsumption,HepatitisBImmunization,MeaslesImmunization,PolioImmunization,DiphtheriaImmunization,BmiAdultUnderweight,BmiAdultOverweight25
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625,37.5,...,12273.666667,5.286667,92.28,3.25,87.0,90.0,87.0,87.0,6.96,41.12
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601,32.7,...,13343.333333,2.973333,24.113333,1.27,42.0,41.0,46.0,42.0,20.8,22.42
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232,29.3,...,35720.666667,4.393333,14.78,0.0,42.0,46.0,47.0,42.0,17.08,33.16
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239,35.1,...,4069.666667,3.266667,41.166667,5.8,83.0,76.0,82.0,83.0,4.31,55.37
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243,26.8,...,3644.0,2.363333,12.79,2.92,74.0,72.0,63.0,74.0,10.03,30.72


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

### <a id='toc5_3_'></a>[Распространенность ожирения среди взрослых, ИМТ >= 30 (стандартизированная по возрасту оценка) (%)](#toc0_)

Формирование данной таблицы вынесено в файл [16_bmi_adult_overweight_30.ipynb](./16_bmi_adult_overweight_30.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [60]:
who_bmi_adult_overweight_30_prepared_data = pd.read_csv(
    '../data/who_bmi_adult_overweight_30_prepared.csv'
)

who_bmi_adult_overweight_30_prepared_data.head()

Unnamed: 0,SpatialDimValueCode,Period,BmiAdultOverweight30
0,VNM,2020,1.71
1,ZMB,2020,10.04
2,IDN,2020,9.98
3,HTI,2020,10.15
4,FRA,2020,10.07


In [61]:
cumulative_live_data = cumulative_live_data.merge(
    who_bmi_adult_overweight_30_prepared_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality,AdultNcdMortality,...,PoisoningMortality,SuicideMortality,AlcoholСonsumption,HepatitisBImmunization,MeaslesImmunization,PolioImmunization,DiphtheriaImmunization,BmiAdultUnderweight,BmiAdultOverweight25,BmiAdultOverweight30
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625,37.5,...,5.286667,92.28,3.25,87.0,90.0,87.0,87.0,6.96,41.12,19.79
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601,32.7,...,2.973333,24.113333,1.27,42.0,41.0,46.0,42.0,20.8,22.42,8.45
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232,29.3,...,4.393333,14.78,0.0,42.0,46.0,47.0,42.0,17.08,33.16,13.43
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239,35.1,...,3.266667,41.166667,5.8,83.0,76.0,82.0,83.0,4.31,55.37,28.49
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243,26.8,...,2.363333,12.79,2.92,74.0,72.0,63.0,74.0,10.03,30.72,10.58


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

### <a id='toc5_4_'></a>[Распространенность худобы среди детей 5-9 лет, ИМТ < -2 стандартных отклонений ниже медианы (грубая оценка) (%)](#toc0_)

Формирование данной таблицы вынесено в файл [17_bmi_child_5_9_thinness.ipynb](./17_bmi_child_5_9_thinness.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [63]:
who_bmi_child_5_9_thinness_prepared_data = pd.read_csv(
    '../data/who_bmi_child_5_9_thinness_prepared.csv'
)

who_bmi_child_5_9_thinness_prepared_data.head()

Unnamed: 0,SpatialDimValueCode,Period,BmiChildThinness
0,TON,2020,0.63
1,CHL,2020,0.84
2,NLD,2020,0.81
3,URY,2020,0.84
4,NZL,2020,0.84


In [64]:
cumulative_live_data = cumulative_live_data.merge(
    who_bmi_child_5_9_thinness_prepared_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality,AdultNcdMortality,...,SuicideMortality,AlcoholСonsumption,HepatitisBImmunization,MeaslesImmunization,PolioImmunization,DiphtheriaImmunization,BmiAdultUnderweight,BmiAdultOverweight25,BmiAdultOverweight30,BmiChildThinness
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625,37.5,...,92.28,3.25,87.0,90.0,87.0,87.0,6.96,41.12,19.79,3.49
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601,32.7,...,24.113333,1.27,42.0,41.0,46.0,42.0,20.8,22.42,8.45,6.44
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232,29.3,...,14.78,0.0,42.0,46.0,47.0,42.0,17.08,33.16,13.43,5.26
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239,35.1,...,41.166667,5.8,83.0,76.0,82.0,83.0,4.31,55.37,28.49,2.74
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243,26.8,...,12.79,2.92,74.0,72.0,63.0,74.0,10.03,30.72,10.58,6.32


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

### <a id='toc5_5_'></a>[Распространенность худобы среди подростков 10-19 лет, ИМТ < -2 стандартных отклонений ниже медианы (грубая оценка) (%)](#toc0_)

Формирование данной таблицы вынесено в файл [18_bmi_teenager_10_19_thinness.ipynb](./18_bmi_teenager_10_19_thinness.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [66]:
who_bmi_teenager_10_19_thinness_prepared_data = pd.read_csv(
    '../data/who_bmi_teenager_10_19_thinness_prepared.csv'
)

who_bmi_teenager_10_19_thinness_prepared_data.head()

Unnamed: 0,SpatialDimValueCode,Period,BmiTeenagerThinness
0,TON,2020,0.36
1,NIU,2020,0.61
2,NRU,2020,0.69
3,COK,2020,0.67
4,ASM,2020,0.76


In [67]:
cumulative_live_data = cumulative_live_data.merge(
    who_bmi_teenager_10_19_thinness_prepared_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality,AdultNcdMortality,...,AlcoholСonsumption,HepatitisBImmunization,MeaslesImmunization,PolioImmunization,DiphtheriaImmunization,BmiAdultUnderweight,BmiAdultOverweight25,BmiAdultOverweight30,BmiChildThinness,BmiTeenagerThinness
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625,37.5,...,3.25,87.0,90.0,87.0,87.0,6.96,41.12,19.79,3.49,5.99
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601,32.7,...,1.27,42.0,41.0,46.0,42.0,20.8,22.42,8.45,6.44,8.87
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232,29.3,...,0.0,42.0,46.0,47.0,42.0,17.08,33.16,13.43,5.26,8.42
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239,35.1,...,5.8,83.0,76.0,82.0,83.0,4.31,55.37,28.49,2.74,4.22
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243,26.8,...,2.92,74.0,72.0,63.0,74.0,10.03,30.72,10.58,6.32,8.47


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

### <a id='toc5_6_'></a>[Распространенность избыточного веса среди детей 5-9 лет, ИМТ > +1 стандартного отклонения выше медианы (грубая оценка) (%)](#toc0_)

Формирование данной таблицы вынесено в файл [19_bmi_child_5_9_overweight_1.ipynb](./19_bmi_child_5_9_overweight_1.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [69]:
who_bmi_child_5_9_overweight_1_prepared_data = pd.read_csv(
    '../data/who_bmi_child_5_9_overweight_1_prepared.csv'
)

who_bmi_child_5_9_overweight_1_prepared_data.head()

Unnamed: 0,SpatialDimValueCode,Period,BmiChildOverweight1
0,NGA,2020,10.37
1,IND,2020,10.47
2,ZWE,2020,10.76
3,NER,2020,11.07
4,ERI,2020,11.19


In [70]:
cumulative_live_data = cumulative_live_data.merge(
    who_bmi_child_5_9_overweight_1_prepared_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality,AdultNcdMortality,...,HepatitisBImmunization,MeaslesImmunization,PolioImmunization,DiphtheriaImmunization,BmiAdultUnderweight,BmiAdultOverweight25,BmiAdultOverweight30,BmiChildThinness,BmiTeenagerThinness,BmiChildOverweight1
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625,37.5,...,87.0,90.0,87.0,87.0,6.96,41.12,19.79,3.49,5.99,12.94
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601,32.7,...,42.0,41.0,46.0,42.0,20.8,22.42,8.45,6.44,8.87,14.18
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232,29.3,...,42.0,46.0,47.0,42.0,17.08,33.16,13.43,5.26,8.42,11.79
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239,35.1,...,83.0,76.0,82.0,83.0,4.31,55.37,28.49,2.74,4.22,18.21
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243,26.8,...,74.0,72.0,63.0,74.0,10.03,30.72,10.58,6.32,8.47,12.8


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

### <a id='toc5_7_'></a>[Распространенность избыточного веса среди подростков 10-19 лет, ИМТ > +1 стандартного отклонения выше медианы (грубая оценка) (%)](#toc0_)

Формирование данной таблицы вынесено в файл [20_bmi_teenager_10_19_overweight_1.ipynb](./20_bmi_teenager_10_19_overweight_1.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [72]:
who_bmi_teenager_10_19_overweight_1_prepared_data = pd.read_csv(
    '../data/who_bmi_teenager_10_19_overweight_1_prepared.csv'
)

who_bmi_teenager_10_19_overweight_1_prepared_data.head()

Unnamed: 0,SpatialDimValueCode,Period,BmiTeenagerOverweight1
0,COG,2020,10.06
1,GIN,2020,10.59
2,TGO,2020,10.57
3,GNB,2020,10.83
4,GMB,2020,10.84


In [73]:
cumulative_live_data = cumulative_live_data.merge(
    who_bmi_teenager_10_19_overweight_1_prepared_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality,AdultNcdMortality,...,MeaslesImmunization,PolioImmunization,DiphtheriaImmunization,BmiAdultUnderweight,BmiAdultOverweight25,BmiAdultOverweight30,BmiChildThinness,BmiTeenagerThinness,BmiChildOverweight1,BmiTeenagerOverweight1
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625,37.5,...,90.0,87.0,87.0,6.96,41.12,19.79,3.49,5.99,12.94,12.45
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601,32.7,...,41.0,46.0,42.0,20.8,22.42,8.45,6.44,8.87,14.18,13.25
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232,29.3,...,46.0,47.0,42.0,17.08,33.16,13.43,5.26,8.42,11.79,9.67
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239,35.1,...,76.0,82.0,83.0,4.31,55.37,28.49,2.74,4.22,18.21,17.84
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243,26.8,...,72.0,63.0,74.0,10.03,30.72,10.58,6.32,8.47,12.8,10.83


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

### <a id='toc5_8_'></a>[Распространенность ожирения среди детей 5-9 лет, ИМТ > +2 стандартных отклонений выше медианы (грубая оценка) (%)](#toc0_)

Формирование данной таблицы вынесено в файл [21_bmi_child_5_9_overweight_2.ipynb](./21_bmi_child_5_9_overweight_2.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [75]:
who_bmi_child_5_9_overweight_2_prepared_data = pd.read_csv(
    '../data/who_bmi_child_5_9_overweight_2_prepared.csv'
)

who_bmi_child_5_9_overweight_2_prepared_data.head()

Unnamed: 0,SpatialDimValueCode,Period,BmiChildOverweight2
0,BFA,2020,1.02
1,TLS,2020,1.02
2,BGD,2020,1.75
3,TJK,2020,1.72
4,TZA,2020,1.92


In [76]:
cumulative_live_data = cumulative_live_data.merge(
    who_bmi_child_5_9_overweight_2_prepared_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality,AdultNcdMortality,...,PolioImmunization,DiphtheriaImmunization,BmiAdultUnderweight,BmiAdultOverweight25,BmiAdultOverweight30,BmiChildThinness,BmiTeenagerThinness,BmiChildOverweight1,BmiTeenagerOverweight1,BmiChildOverweight2
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625,37.5,...,87.0,87.0,6.96,41.12,19.79,3.49,5.99,12.94,12.45,5.41
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601,32.7,...,46.0,42.0,20.8,22.42,8.45,6.44,8.87,14.18,13.25,5.15
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232,29.3,...,47.0,42.0,17.08,33.16,13.43,5.26,8.42,11.79,9.67,4.27
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239,35.1,...,82.0,83.0,4.31,55.37,28.49,2.74,4.22,18.21,17.84,7.49
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243,26.8,...,63.0,74.0,10.03,30.72,10.58,6.32,8.47,12.8,10.83,4.89


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

### <a id='toc5_9_'></a>[Распространенность ожирения среди подростков 10-19 лет, ИМТ > +2 стандартных отклонений выше медианы (грубая оценка) (%)](#toc0_)

Формирование данной таблицы вынесено в файл [22_bmi_teenager_10_19_overweight_2.ipynb](./22_bmi_teenager_10_19_overweight_2.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [78]:
who_bmi_teenager_10_19_overweight_2_prepared_data = pd.read_csv(
    '../data/who_bmi_teenager_10_19_overweight_2_prepared.csv'
)

who_bmi_teenager_10_19_overweight_2_prepared_data.head()

Unnamed: 0,SpatialDimValueCode,Period,BmiTeenagerOverweight2
0,TLS,2020,0.7
1,ETH,2020,0.79
2,BFA,2020,0.86
3,RWA,2020,1.03
4,MDG,2020,1.22


In [79]:
cumulative_live_data = cumulative_live_data.merge(
    who_bmi_teenager_10_19_overweight_2_prepared_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality,AdultNcdMortality,...,DiphtheriaImmunization,BmiAdultUnderweight,BmiAdultOverweight25,BmiAdultOverweight30,BmiChildThinness,BmiTeenagerThinness,BmiChildOverweight1,BmiTeenagerOverweight1,BmiChildOverweight2,BmiTeenagerOverweight2
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625,37.5,...,87.0,6.96,41.12,19.79,3.49,5.99,12.94,12.45,5.41,3.52
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601,32.7,...,42.0,20.8,22.42,8.45,6.44,8.87,14.18,13.25,5.15,4.0
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232,29.3,...,42.0,17.08,33.16,13.43,5.26,8.42,11.79,9.67,4.27,2.41
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239,35.1,...,83.0,4.31,55.37,28.49,2.74,4.22,18.21,17.84,7.49,5.42
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243,26.8,...,74.0,10.03,30.72,10.58,6.32,8.47,12.8,10.83,4.89,2.84


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

## <a id='toc6_'></a>[Оценки водоснабжения, санитарии и гигиены](#toc0_)

Перечень этих данных на сайте ВОЗ можно найти по ссылке 

https://www.who.int/data/gho/data/themes/topics/sdg-target-6-ensure-availability-and-sustainable-management-of-water-and-sanitation-for-all

### <a id='toc6_1_'></a>[Население, пользующееся как минимум базовыми услугами санитарии (%)](#toc0_)

Формирование данной таблицы вынесено в файл [23_sanitation.ipynb](./23_sanitation.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [81]:
who_sanitation_prepared_data = pd.read_csv(
    '../data/who_sanitation_prepared.csv'
)

who_sanitation_prepared_data.head()

Unnamed: 0,SpatialDimValueCode,Period,Sanitation
0,AND,2020,100.0
1,AUS,2020,100.0
2,AUT,2020,99.97
3,BHR,2020,100.0
4,CHL,2020,100.0


In [82]:
cumulative_live_data = cumulative_live_data.merge(
    who_sanitation_prepared_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality,AdultNcdMortality,...,BmiAdultUnderweight,BmiAdultOverweight25,BmiAdultOverweight30,BmiChildThinness,BmiTeenagerThinness,BmiChildOverweight1,BmiTeenagerOverweight1,BmiChildOverweight2,BmiTeenagerOverweight2,Sanitation
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625,37.5,...,6.96,41.12,19.79,3.49,5.99,12.94,12.45,5.41,3.52,50.32
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601,32.7,...,20.8,22.42,8.45,6.44,8.87,14.18,13.25,5.15,4.0,14.12
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232,29.3,...,17.08,33.16,13.43,5.26,8.42,11.79,9.67,4.27,2.41,39.31
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239,35.1,...,4.31,55.37,28.49,2.74,4.22,18.21,17.84,7.49,5.42,64.49
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243,26.8,...,10.03,30.72,10.58,6.32,8.47,12.8,10.83,4.89,2.84,26.35


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

### <a id='toc6_2_'></a>[Население, пользующееся по крайней мере базовыми услугами питьевого водоснабжения (%)](#toc0_)

Формирование данной таблицы вынесено в файл [24_drinking_water.ipynb](./24_drinking_water.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [84]:
who_drinking_water_prepared_data = pd.read_csv(
    '../data/who_drinking_water_prepared.csv'
)

who_drinking_water_prepared_data.head()

Unnamed: 0,SpatialDimValueCode,Period,DrinkingWater
0,AND,2020,100.0
1,ARM,2020,99.94
2,AUS,2020,99.97
3,AUT,2020,100.0
4,BHR,2020,99.92


In [85]:
cumulative_live_data = cumulative_live_data.merge(
    who_drinking_water_prepared_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality,AdultNcdMortality,...,BmiAdultOverweight25,BmiAdultOverweight30,BmiChildThinness,BmiTeenagerThinness,BmiChildOverweight1,BmiTeenagerOverweight1,BmiChildOverweight2,BmiTeenagerOverweight2,Sanitation,DrinkingWater
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625,37.5,...,41.12,19.79,3.49,5.99,12.94,12.45,5.41,3.52,50.32,73.29
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601,32.7,...,22.42,8.45,6.44,8.87,14.18,13.25,5.15,4.0,14.12,37.2
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232,29.3,...,33.16,13.43,5.26,8.42,11.79,9.67,4.27,2.41,39.31,56.48
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239,35.1,...,55.37,28.49,2.74,4.22,18.21,17.84,7.49,5.42,64.49,71.44
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243,26.8,...,30.72,10.58,6.32,8.47,12.8,10.83,4.89,2.84,26.35,61.54


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

## <a id='toc7_'></a>[Финансирование здравоохранения](#toc0_)

Перечень этих данных на сайте ВОЗ можно найти по ссылке 

https://www.who.int/data/gho/data/themes/topics/health-financing

### <a id='toc7_1_'></a>[Общие внутренние государственные расходы на здравоохранение в процентах от общих государственных расходов (%)](#toc0_)

Формирование данной таблицы вынесено в файл [25_health_care_costs.ipynb](./25_health_care_costs.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [87]:
who_health_care_costs_prepared_data = pd.read_csv(
    '../data/who_health_care_costs_prepared.csv'
)

who_health_care_costs_prepared_data.head()

Unnamed: 0,SpatialDimValueCode,Period,HealthCareCosts
0,SYR,2020,10.0
1,KAZ,2020,10.06
2,SYC,2020,10.18
3,IDN,2020,10.24
4,OMN,2020,10.24


In [88]:
cumulative_live_data = cumulative_live_data.merge(
    who_health_care_costs_prepared_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality,AdultNcdMortality,...,BmiAdultOverweight30,BmiChildThinness,BmiTeenagerThinness,BmiChildOverweight1,BmiTeenagerOverweight1,BmiChildOverweight2,BmiTeenagerOverweight2,Sanitation,DrinkingWater,HealthCareCosts
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625,37.5,...,19.79,3.49,5.99,12.94,12.45,5.41,3.52,50.32,73.29,8.95
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601,32.7,...,8.45,6.44,8.87,14.18,13.25,5.15,4.0,14.12,37.2,4.86
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232,29.3,...,13.43,5.26,8.42,11.79,9.67,4.27,2.41,39.31,56.48,2.92
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239,35.1,...,28.49,2.74,4.22,18.21,17.84,7.49,5.42,64.49,71.44,10.39
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243,26.8,...,10.58,6.32,8.47,12.8,10.83,4.89,2.84,26.35,61.54,4.8


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

### <a id='toc7_2_'></a>[Общие внутренние государственные расходы на здравоохранение в процентах от валового внутреннего продукта (ВВП) (%)](#toc0_)

Формирование данной таблицы вынесено в файл [26_health_care_costs_gdp.ipynb](./26_health_care_costs_gdp.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [90]:
who_health_care_costs_gdp_prepared_data = pd.read_csv(
    '../data/who_health_care_costs_gdp_prepared.csv'
)

who_health_care_costs_gdp_prepared_data.head()

Unnamed: 0,SpatialDimValueCode,Period,HealthCareCostsGdp
0,SOM,2020,0.15
1,YEM,2020,0.39
2,BGD,2020,0.41
3,HTI,2020,0.41
4,NGA,2020,0.51


In [91]:
cumulative_live_data = cumulative_live_data.merge(
    who_health_care_costs_gdp_prepared_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality,AdultNcdMortality,...,BmiChildThinness,BmiTeenagerThinness,BmiChildOverweight1,BmiTeenagerOverweight1,BmiChildOverweight2,BmiTeenagerOverweight2,Sanitation,DrinkingWater,HealthCareCosts,HealthCareCostsGdp
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625,37.5,...,3.49,5.99,12.94,12.45,5.41,3.52,50.32,73.29,8.95,4.87
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601,32.7,...,6.44,8.87,14.18,13.25,5.15,4.0,14.12,37.2,4.86,1.22
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232,29.3,...,5.26,8.42,11.79,9.67,4.27,2.41,39.31,56.48,2.92,0.15
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239,35.1,...,2.74,4.22,18.21,17.84,7.49,5.42,64.49,71.44,10.39,3.54
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243,26.8,...,6.32,8.47,12.8,10.83,4.89,2.84,26.35,61.54,4.8,1.2


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

### <a id='toc7_3_'></a>[Общие внутренние государственные расходы на здравоохранение на душу населения в долларах США](#toc0_)

Формирование данной таблицы вынесено в файл [27_health_care_costs_per_capita.ipynb](./27_health_care_costs_per_capita.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [93]:
who_health_care_costs_per_capita_prepared_data = pd.read_csv(
    '../data/who_health_care_costs_per_capita_prepared.csv'
)

who_health_care_costs_per_capita_prepared_data.head()

Unnamed: 0,SpatialDimValueCode,Period,HealthCareCostsPerCapita
0,SOM,2020,0.83
1,NGA,2020,10.16
2,UGA,2020,10.17
3,MMR,2020,10.99
4,NIC,2020,102.6


In [94]:
cumulative_live_data = cumulative_live_data.merge(
    who_health_care_costs_per_capita_prepared_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality,AdultNcdMortality,...,BmiTeenagerThinness,BmiChildOverweight1,BmiTeenagerOverweight1,BmiChildOverweight2,BmiTeenagerOverweight2,Sanitation,DrinkingWater,HealthCareCosts,HealthCareCostsGdp,HealthCareCostsPerCapita
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625,37.5,...,5.99,12.94,12.45,5.41,3.52,50.32,73.29,8.95,4.87,45.33
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601,32.7,...,8.87,14.18,13.25,5.15,4.0,14.12,37.2,4.86,1.22,5.8
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232,29.3,...,8.42,11.79,9.67,4.27,2.41,39.31,56.48,2.92,0.15,0.83
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239,35.1,...,4.22,18.21,17.84,7.49,5.42,64.49,71.44,10.39,3.54,118.1
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243,26.8,...,8.47,12.8,10.83,4.89,2.84,26.35,61.54,4.8,1.2,9.07


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

## <a id='toc8_'></a>[ВВП на душу населения (в долл. США)](#toc0_)

Формирование данной таблицы вынесено в файл [28_gdp_per_capita.ipynb](./28_gdp_per_capita.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [96]:
worldbank_gdp_per_capita_prepared_data = pd.read_csv(
    '../data/worldbank_gdp_per_capita_prepared.csv'
)

worldbank_gdp_per_capita_prepared_data.head()

Unnamed: 0,SpatialDimValueCode,Period,GdpPerCapita
0,AFG,2000,174.930991
1,AGO,2000,563.733796
2,ALB,2000,1126.68334
3,ARE,2000,29865.502347
4,ARG,2000,7637.014892


In [97]:
cumulative_live_data = cumulative_live_data.merge(
    worldbank_gdp_per_capita_prepared_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality,AdultNcdMortality,...,BmiChildOverweight1,BmiTeenagerOverweight1,BmiChildOverweight2,BmiTeenagerOverweight2,Sanitation,DrinkingWater,HealthCareCosts,HealthCareCostsGdp,HealthCareCostsPerCapita,GdpPerCapita
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625,37.5,...,12.94,12.45,5.41,3.52,50.32,73.29,8.95,4.87,45.33,918.582577
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601,32.7,...,14.18,13.25,5.15,4.0,14.12,37.2,4.86,1.22,5.8,462.879071
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232,29.3,...,11.79,9.67,4.27,2.41,39.31,56.48,2.92,0.15,0.83,518.184778
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239,35.1,...,18.21,17.84,7.49,5.42,64.49,71.44,10.39,3.54,118.1,3442.321653
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243,26.8,...,12.8,10.83,4.89,2.84,26.35,61.54,4.8,1.2,9.07,817.780336


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

## <a id='toc9_'></a>[Общая численность населения](#toc0_)

Формирование данной таблицы вынесено в файл [29_population.ipynb](./29_population.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [99]:
worldbank_population_prepared_data = pd.read_csv(
    '../data/worldbank_population_prepared.csv'
)

worldbank_population_prepared_data.head()

Unnamed: 0,SpatialDimValueCode,Period,Population
0,AFG,2000,20130327.0
1,AGO,2000,16194869.0
2,ALB,2000,3089027.0
3,ARE,2000,3493575.0
4,ARG,2000,37213984.0


In [100]:
cumulative_live_data = cumulative_live_data.merge(
    worldbank_population_prepared_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality,AdultNcdMortality,...,BmiTeenagerOverweight1,BmiChildOverweight2,BmiTeenagerOverweight2,Sanitation,DrinkingWater,HealthCareCosts,HealthCareCostsGdp,HealthCareCostsPerCapita,GdpPerCapita,Population
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625,37.5,...,12.45,5.41,3.52,50.32,73.29,8.95,4.87,45.33,918.582577,2235727.0
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601,32.7,...,13.25,5.15,4.0,14.12,37.2,4.86,1.22,5.8,462.879071,5026628.0
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232,29.3,...,9.67,4.27,2.41,39.31,56.48,2.92,0.15,0.83,518.184778,16651191.0
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239,35.1,...,17.84,7.49,5.42,64.49,71.44,10.39,3.54,118.1,3442.321653,1192729.0
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243,26.8,...,10.83,4.89,2.84,26.35,61.54,4.8,1.2,9.07,817.780336,2013255.0


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

## <a id='toc10_'></a>[Средняя продолжительность формального образования для лиц в возрасте 15–64 лет](#toc0_)

Формирование данной таблицы вынесено в файл [30_schooling.ipynb](./30_schooling.ipynb).

Здесь скачаем итоговую таблицу и присоединим к текущей.

In [102]:
ourworldindata_schooling_prepared_data = pd.read_csv(
    '../data/ourworldindata_schooling_prepared.csv'
)

ourworldindata_schooling_prepared_data.head()

Unnamed: 0,SpatialDimValueCode,Period,Schooling
0,AFG,2000,3.03
1,ALB,2000,9.93
2,ARE,2000,9.35
3,ARG,2000,9.08
4,ARM,2000,10.45


In [103]:
cumulative_live_data = cumulative_live_data.merge(
    ourworldindata_schooling_prepared_data,
    on=['SpatialDimValueCode', 'Period'],
    how='left',
)

cumulative_live_data.head()

Unnamed: 0,ParentLocationCode,ParentLocation,SpatialDimValueCode,Location,Period,LifeExpectancy,AdultMortality,Homicides,MaternalMortality,AdultNcdMortality,...,BmiChildOverweight2,BmiTeenagerOverweight2,Sanitation,DrinkingWater,HealthCareCosts,HealthCareCostsGdp,HealthCareCostsPerCapita,GdpPerCapita,Population,Schooling
0,AFR,Africa,LSO,Lesotho,2020,51.85,552.3,44.11,566.20625,37.5,...,5.41,3.52,50.32,73.29,8.95,4.87,45.33,918.582577,2235727.0,6.88
1,AFR,Africa,CAF,Central African Republic,2020,53.08,441.9,21.476667,835.26601,32.7,...,5.15,4.0,14.12,37.2,4.86,1.22,5.8,462.879071,5026628.0,4.64
2,EMR,Eastern Mediterranean,SOM,Somalia,2020,55.13,362.7,5.433333,620.68232,29.3,...,4.27,2.41,39.31,56.48,2.92,0.15,0.83,518.184778,16651191.0,7.96
3,AFR,Africa,SWZ,Eswatini,2020,55.97,463.2,18.65,239.63239,35.1,...,7.49,5.42,64.49,71.44,10.39,3.54,118.1,3442.321653,1192729.0,6.46
4,AFR,Africa,GNB,Guinea-Bissau,2020,58.38,350.2,9.186667,725.09243,26.8,...,4.89,2.84,26.35,61.54,4.8,1.2,9.07,817.780336,2013255.0,6.599062


In [None]:
# Убедимся, что нет пропусков
cumulative_live_data.isna().sum().sum()

0

## <a id='toc11_'></a>[Итоговая таблица](#toc0_)

In [None]:
# Переставим столбец с целевой переменной продолжительности жизни в конец таблицы
cumulative_live_data = move_column_to_end_table(
    cumulative_live_data,
    'LifeExpectancy'
)

# Отсортируем данные по регионам, странам и году
cumulative_live_data.sort_values(
    by=['ParentLocationCode', 'SpatialDimValueCode', 'Period'],
    inplace=True,
)

# Сохраним полученную таблицу для дальнейшего использования
cumulative_live_data.to_csv('../data/cumulative_life_expectancy.csv', index=False)