In [2]:
import pandas as pd
import chart_studio.plotly as py
import plotly.express as px

In [3]:
import plotly.graph_objects as go
from plotly.subplots import make_subplots

# Загальні зміни кількості населення в Україні за період 2010-2022 роки

У цьому блоці наведена загальна статистика стосовно кількості населення України та його зміна протягом 1 січня 2010 - 1 січня
2022 років.

In [4]:
amount = pd.read_excel("кількість_чоловіків_жінок_2010_2022.xlsx")

In [6]:
fig = px.scatter(amount, x="Рік", y="Всього ", color='Рік', size='Всього ', labels={'Всього ': 'Кількість (млн)'})
fig.update_layout(
    title=dict(text="Зміна кількості населення України", font=dict(size=17))
)
fig.update_layout(plot_bgcolor='rgba(0,0,0,0)',  
                  )
fig.update_layout(
    xaxis=dict(
        showline=True,
        showgrid=False,
        linecolor='rgb(204, 204, 204)',
        linewidth=2,
        ticks='outside',
        tickfont=dict(
            family='Arial',
            size=12,
            color='rgb(82, 82, 82)')))
fig.show()

In [9]:
fig = px.line(amount, x='Рік', y='Кількість', color='Стать', markers=True, labels = {'Кількість':'Кількість, млн'})
fig.update_layout(
    xaxis=dict(
        showline=True,
        showgrid=False,
        linecolor='rgb(204, 204, 204)',
        linewidth=2,
        ticks='outside',
        tickfont=dict(
            family='Arial',
            size=12,
            color='rgb(82, 82, 82)')))
fig.update_layout(plot_bgcolor='rgba(0,0,0,0)',  
                  )
fig.update_layout(title_text='Загальна кількість жінок та чоловіків')
fig

З графіків можемо прослідкувати, що кількість населення скорочується.
Очевидно, найбільшу зміну можна прослідкувати в період 2014-2015 років.
Варто зазначити, що у цей графік не включені дані за сам 2022 рік. Але, спираючись на досвід 2014 року, можемо припустити, що кількість населення скорочуватиметься ще швидшими темпами.

# Міграція (усі потоки) 2002-2021

У цьому блоці проаналізована інформація про міграцію за 2002-2021 роки.

In [5]:
df_general_migr = pd.read_excel('migration_2002-2021.xlsx')
df_general_migr

Unnamed: 0,Рік,Прибули,Вибули,Приріст,Тип місцевості
0,2002,760005,793796,-33791,Міська та сільська
1,2003,762033,786243,-24210,Міська та сільська
2,2004,789379,796994,-7615,Міська та сільська
3,2005,763222,758639,4583,Міська та сільська
4,2006,765882,751637,14245,Міська та сільська
5,2007,758292,741454,16838,Міська та сільська
6,2008,710790,695869,14921,Міська та сільська
7,2009,642819,629372,13447,Міська та сільська
8,2010,683449,667316,16133,Міська та сільська
9,2011,669397,652301,17096,Міська та сільська


In [6]:
fig = px.bar(df_general_migr, x="Тип місцевості", y="Приріст", color="Тип місцевості",
            animation_frame="Рік", animation_group="Тип місцевості", range_y=[-51000, 65500], 
            title = 'Міграційний приріст у різних типах місцевості, дані за 2002-2021 роки')
fig

Графік ілюструє як змінювався приріст населення у різних типах місцевості протягом цього періоду.
Властиво, в основному, міський приріст населення збільшувався приблизно до 2014 року. Проте після початку війни він різко впав. У таблиці з 2014 року не включені дані міграції тимчасово окупованих територій: АР Крим, частини Донецької та Луганської областей.

In [7]:
fig = make_subplots(
    rows=3, cols=1,
    subplot_titles=('Вибулі протягом 2002-2021','Прибулі протягом 2002-2021', "Приріст"))
fig.add_trace(go.Scatter(x=df_general_migr['Рік'], y=df_general_migr['Вибули'][df_general_migr['Тип місцевості'] == 'Міська та сільська'], 
                        mode='lines+markers', name='Вибули з України', line_color='#d61515'), row = 1, col = 1)
fig.add_trace(go.Scatter(x=df_general_migr['Рік'], y=df_general_migr['Прибули'][df_general_migr['Тип місцевості'] == 'Міська та сільська'], 
                        mode='lines+markers', name='Прибули в Україну',  line_color = '#1589d6'), row = 2, col = 1)
fig.add_trace(go.Scatter(x=df_general_migr['Рік'], y=df_general_migr['Приріст'][df_general_migr['Тип місцевості'] == 'Міська та сільська'], 
                        mode='lines+markers', name='Приріст',  line_color = '#41b56c'), row = 3, col = 1)

fig.update_layout(height=750)
fig.update_yaxes(title_text = 'Кількість мігрантів')
fig.update_xaxes(title_text = 'Рік')


Графік дає змогу прослідкувати, що приріст повільно зростає.
Особливим роком був 2012, тоді показник приросту був особливо великим.

## Кількість людей, що виїжджали з Україну та поверталися назад протягом 2002-2021 років

In [8]:
total_in = pd.read_excel("загальна_кількість_прибули_2002_2021.xlsx")
total_out = pd.read_excel("загальна_кількість_вибулих_2002_2021.xlsx")

In [9]:
fig = px.scatter(total_in, y=total_in['Прибулі'], x=total_in['Роки'],
    size=total_in['Прибулі'], size_max=35, log_x=True, labels={'Роки':'Рік', 'Прибулі':'Кількість'})
fig
fig.update_layout(
    title=dict(text="Кількість людей, що прибули в Україну", font=dict(size=30))
)
fig.update_layout(
    xaxis=dict(
        showline=True,
        showgrid=False,
        linecolor='rgb(204, 204, 204)',
        linewidth=2,
        ticks='outside',
        tickfont=dict(
            family='Arial',
            size=12,
            color='rgb(82, 82, 82)')))
fig.update_layout(plot_bgcolor='rgba(0,0,0,0)',  
                  )

In [10]:
fig = px.scatter(total_out, y=total_out['Вибулі'], x=total_out['Роки'],
    size=total_in['Прибулі'], size_max=35, log_x=True, labels={'Роки':'Рік', 'Вибулі':'Кількість'})

fig.update_layout(
    title=dict(text="Кількість людей, що виїхали з України", font=dict(size=30))
)
fig.update_layout(
    xaxis=dict(
        showline=True,
        showgrid=False,
        linecolor='rgb(204, 204, 204)',
        linewidth=2,
        ticks='outside',
        tickfont=dict(
            family='Arial',
            size=12,
            color='rgb(82, 82, 82)')))
fig.update_layout(plot_bgcolor='rgba(0,0,0,0)',  
                  )
fig

In [12]:
total_movement = total_in[['Роки','Прибулі']]
total_movement['Вибулі'] = total_out['Вибулі']

In [13]:
fig = go.Figure()
fig.add_trace(go.Scatter(
    x=total_movement['Роки'],
    y=total_movement['Прибулі'],
    name="Кількість людей, що в'їхали",
      mode='lines+markers',   # this sets its legend entry
))
fig.add_trace(go.Scatter(
    x=total_movement['Роки'],
    y=total_movement['Вибулі'],
    name="Кількість людей, що виїхали",
        mode='lines+markers',      # this sets its legend entry
))

fig.update_layout(
    title="Різниця прибулих/вибулих",
    xaxis_title="Роки",
    yaxis_title="Кількість",
    font=dict(
        size=18
        
    )
)
fig.update_layout(
    xaxis=dict(
        showline=True,
        showgrid=False,
        linecolor='rgb(204, 204, 204)',
        linewidth=2,
        ticks='outside',
        tickfont=dict(
            family='Arial',
            size=12,
            color='rgb(82, 82, 82)')))
fig.update_layout(plot_bgcolor='rgba(0,0,0,0)',  
                  )

З  графіків можемо прослідкувати, що кількість емігрантів з 2002 року скорочувалась. У 2016 році вона досягла свого мінімуму.
Загалом, з 2005 року, кількість людей, що повертаються в Україну є більшою, ніж тих, що виїжджають (не враховуючи ситуації 2022-2023 років)

# Зміни кількості населення в областях протягом 2019-2021 

In [17]:
total_regions_all=pd.read_excel("прибулі_вибулі_області_2019-2021.xlsx")
total_regions=total_regions_all.iloc[0:25]

In [19]:
fig = go.Figure()
fig.add_trace(go.Bar(
    x=total_regions['Область'],
    y=total_regions['Прибулі'],
    name='Кількість прибулих',
))
fig.add_trace(go.Bar(
    x=total_regions['Область'],
    y=total_regions['Вибулі'],
    name='Кількість вибулих',
))
fig.update_layout(
    title="Кількість прибулих/вибулих в областях України",
)
fig.update_layout(plot_bgcolor='rgba(0,0,0,0)',  
                  )

fig.update_layout(barmode='group', xaxis_tickangle=-45)
fig.show()


У східних областях, зокрема Донецька та Луганська, які на момент 2019-2021 років були районами ведення бойових дій, міграційний приріст є від'ємний. На противагу Київська область має найбільший показник приросту.

# Міграційний рух населення за типом місцевості по регіонах.

З даних по роках 2019 - 2021 ми розглядали окремо 2 категорії: сільська та міська місцевості. З кожної категорії, окремо від загального руху населення, виділялась також міждержавна міграція. Дані з держстату були обʼєднані в одну таблицю для зручності роботи.

## Міське населення

In [20]:
df_city = pd.read_excel('migration_terrain.xlsx', sheet_name='Sheet1')
df_city

Unnamed: 0,регіон,кількість прибулих,кількість вибулих,"міграційний приріст, скорочення (-)",тип потоку,рік
0,Вінницька область,13421,12598,823,усі,2019
1,Волинська область,8295,8612,-317,усі,2019
2,Дніпропетровська область,29208,27886,1322,усі,2019
3,Донецька область,14596,20871,-6275,усі,2019
4,Житомирська область,12433,12742,-309,усі,2019
...,...,...,...,...,...,...
145,Хмельницька область,484,143,341,міждержавні,2021
146,Черкаська область,398,230,168,міждержавні,2021
147,Чернівецька область,900,352,548,міждержавні,2021
148,Чернігівська область,24,74,-50,міждержавні,2021


In [21]:
all_migration,  crosscountry_migration = df_city[df_city['тип потоку'].str.contains('усі')], df_city[df_city['тип потоку'].str.contains('міждержавні')]
all_migration

Unnamed: 0,регіон,кількість прибулих,кількість вибулих,"міграційний приріст, скорочення (-)",тип потоку,рік
0,Вінницька область,13421,12598,823,усі,2019
1,Волинська область,8295,8612,-317,усі,2019
2,Дніпропетровська область,29208,27886,1322,усі,2019
3,Донецька область,14596,20871,-6275,усі,2019
4,Житомирська область,12433,12742,-309,усі,2019
...,...,...,...,...,...,...
120,Хмельницька область,10897,9753,1144,усі,2021
121,Черкаська область,8920,9006,-86,усі,2021
122,Чернівецька область,4722,4250,472,усі,2021
123,Чернігівська область,7027,7686,-659,усі,2021


Анімований графік відображає співвідношення між кількістю вибулих та прибулих в міста кожної області. Інформація про внутрішню та зовнішню міграцію. Щоб переглянути дані за різні роки, потрібно перетягнути повзунок.

In [22]:
px.scatter(all_migration, x="кількість прибулих", y="кількість вибулих", animation_frame="рік", 
           animation_group="регіон", color="регіон", hover_name="регіон",
           log_x=True, size_max=55, range_x=[3000,80000], title='Загальне співвідношення прибулих та вибулих в міській місцевості')

Теплова мапа відображає загальний міграційний приріст міських місцевостей кожної області.

In [8]:
fig = px.density_heatmap(all_migration, x='рік', y='регіон', z='міграційний приріст, скорочення (-)', title='Загальний міграційний приріст в міській місцевості')
fig.layout.height = 1000

fig

Теплова мапа відображає приріст населення міст за рахунок міждержавної міграції. За винятком декількох областей, в яких показники додатні, є більше емігрантів, аніж іммігрантів.

In [9]:
fig = px.density_heatmap(crosscountry_migration, x='рік', y='регіон', z='міграційний приріст, скорочення (-)', title='Міждержавний міграційний приріст в міській місцевості')
fig.layout.height = 1000

fig

Переглянувши графіки, можна побачити, що в більшості міст населення зростає. На це значним чином впливає бажання великої кількості жителів сільської місцевості переїхати в місто, де є значно більше можливостей. Особливо це стає помітно після перегляду графіків з інформацією про сільську місцевість.

## Сільське населення

In [None]:
df_village = pd.read_excel('migration_terrain_2019.xlsx', sheet_name=1)
df_village

In [12]:
all_migration,  crosscountry_migration = df_village[df_village['тип потоку'].str.contains('усі')], df_village[df_village['тип потоку'].str.contains('міждержавні')]

Анімований графі відображає співвідношення між кількістю вибулих та прибулих в села кожної області. Інформація про внутрішню та зовнішню міграцію. Щоб переглянути дані за різні роки, потрібно перетягнути повзунок.

In [13]:
px.scatter(all_migration, x="кількість прибулих", y="кількість вибулих", animation_frame="рік", 
           animation_group="регіон", color="регіон", hover_name="регіон",
           log_x=True, size_max=55, range_x=[1000,70000], title='Загальне співвідношення прибулих та вибулих в сільській місцевості')

Графік аналогічний до попереднього, однак інформація лише про міждержавну міграцію.

In [14]:
px.scatter(crosscountry_migration, x="кількість прибулих", y="кількість вибулих", animation_frame="рік", 
           animation_group="регіон", color="регіон", hover_name="регіон",
           log_x=True, size_max=55, title='Співвідношення міждержавних мігрантів в сільській місцевості')

Теплова мапа відображає загальний міграційний приріст міських місцевостей кожної області.

In [15]:
fig = px.density_heatmap(all_migration, x='рік', y='регіон', z='міграційний приріст, скорочення (-)', title='Загальний міграційний приріст в сільській місцевості')
fig.layout.height = 1000

fig

Теплова мапа відображає приріст населення міст за рахунок міждержавної міграції. Знову ж таки, як і в ситуації з містами, Київська область має найвищі показники приросту населення.

In [16]:
fig = px.density_heatmap(crosscountry_migration, x='рік', y='регіон', z='міграційний приріст, скорочення (-)', title='Міждержавний міграційний приріст в сільській місцевості')
fig.layout.height = 1000

fig

Що стосується сільської місцевості, то можемо побачити, що кількість населення має відʼємні показники приросту. Винятком є Київська область.

Не можна не помітити, що в сільській місцевості приріст населення за рахунок міждержавних мігрантів або збільшується, або залишається доволі сталим.

# Демографічні зміни, що відбуваються у міській та сільській місцевості
На прикладі даних за 2021 рік показано тенденцію в зміні вікового складу населення у міській та сільській місцевостях.

In [20]:
total_city = pd.read_excel("прибулі_у_місто_2021_загальні.xlsx")
total_village = pd.read_excel("прибулі_у_село_2021_загальні.xlsx")
out_total_village = pd.read_excel("вибулі_село_2021.xlsx")
out_total_city = pd.read_excel("вибулі_місто_2021.xlsx")


In [21]:
fig = go.Figure()

fig.add_trace(go.Funnelarea(
            scalegroup = "second", values = total_village['Прибулі'], 
            textinfo = "value", title = {"position": "top center", "text": "Кількість молодих людей прибулих у село"},
            domain = {"x": [0.55, 1], "y": [0.55, 1]}))

fig.add_trace(go.Funnelarea(
    scalegroup = "second", values = out_total_city['Вибулі'], textinfo = "value",
    title = {"position": "top center", "text": "Кількість молодих людей вибулих з міста"},
    domain = {"x": [0, 0.5], "y": [0, 0.5]}))

fig.add_trace(go.Funnelarea(
    scalegroup = "first", values = total_city['Прибулі'], textinfo = "value",
    title = {"position": "top center", "text": "Кількість молодих людей прибулих у місто"},
    domain = {"x": [0, 0.5], "y": [0.55, 1]}))

fig.add_trace(go.Funnelarea(
    scalegroup = "second", values = out_total_village['Вибулі'], textinfo = "value",
    title = {"position": "top center", "text": "Кількість молодих людей вибулих з ceла"},
    domain = {"x": [0.55, 1], "y": [0, 0.5]}))



fig.update_layout(
            margin = {"l": 200, "r": 200}, shapes = [
            {"x0": 0, "x1": 0.5, "y0": 0, "y1": 0.5},
            {"x0": 0, "x1": 0.5, "y0": 0.55, "y1": 1},
            {"x0": 0.55, "x1": 1, "y0": 0, "y1": 0.5},
            {"x0": 0.55, "x1": 1, "y0": 0.55, "y1": 1}])


fig.update_traces(textfont = {'color': 'white', 'size':15})
fig.update_layout(
    width=900,  # Set the width of the plot
    height=700,  # Set the height of the plot
    margin=dict(l=40, r=40, t=40, b=40),  # Set the margin
)
fig.update_layout(
    title=dict(text="Різниця між притоком і відтоком молодого населення у міській та сільській місцевості", font=dict(size=17))
)
fig.update_layout(legend_title_text='Вік')
fig

In [22]:
# arrived to city
older_to_city = pd.read_excel("старші_прибулі_у_місто_2021.xlsx")

# arrived to village
older_to_village = pd.read_excel("старші_прибулі_у_село_2021.xlsx")


# out of city
older_out_city = pd.read_excel("старші_вибулі_місто_2021.xlsx")

# out of village
older_out_village = pd.read_excel("старші_вибулі_село_2021.xlsx")


In [23]:
fig = go.Figure()

fig.add_trace(go.Funnelarea(
            scalegroup = "second", values = older_to_village['Прибулі'], 
            textinfo = "value", title = {"position": "top center", "text": "Кількість старших людей прибулих у село"},
            domain = {"x": [0.55, 1], "y": [0.55, 1]}, name="прибулі у село"))

fig.add_trace(go.Funnelarea(
    scalegroup = "second", values = older_out_city['Вибулі'], textinfo = "value",
    title = {"position": "top center", "text": "Кількість старших людей вибулих з міста"},
    domain = {"x": [0, 0.5], "y": [0, 0.5]}, name='вибулі з міста'))

fig.add_trace(go.Funnelarea(
    scalegroup = "first", values = older_to_city['Прибулі'], textinfo = "value",
    title = {"position": "top center", "text": "Кількість старших людей прибулих у місто"},
    domain = {"x": [0, 0.5], "y": [0.55, 1]}, name='прибулі у місто'))

fig.add_trace(go.Funnelarea(
    scalegroup = "second", values = older_out_village['Вибулі'], textinfo = "value",
    title = {"position": "top center", "text": "Кількість старших людей вибулих з ceла"},
    domain = {"x": [0.55, 1], "y": [0, 0.5]}, name='вибулі з ceла'))

# fig.update_traces(values=older_out_village['Вік'])


fig.update_layout(
            margin = {"l": 200, "r": 200}, shapes = [
            {"x0": 0, "x1": 0.5, "y0": 0, "y1": 0.5},
            {"x0": 0, "x1": 0.5, "y0": 0.55, "y1": 1},
            {"x0": 0.55, "x1": 1, "y0": 0, "y1": 0.5},
            {"x0": 0.55, "x1": 1, "y0": 0.55, "y1": 1}])


fig.update_traces(textfont = {'color': 'white', 'size':15})
fig.update_layout(
    width=900,  # Set the width of the plot
    height=700,  # Set the height of the plot
    margin=dict(l=40, r=40, t=40, b=40),  # Set the margin
)
fig.update_layout(
    title=dict(text="Різниця між притоком і відтоком старшого населення у міській та сільській місцевості", font=dict(size=17))
)
fig.update_layout(legend_title_text='Вік')

fig

На графіках можна прослідкувати тенденцію, що молоде населення частіше виїжджає із сільської місцевості в міську, шукаючи більше можливостей реалізації. Тоді як люди старшого віку, більш охоче переїжджають з міста в село. 

# Міграція українців закордон

Міграція є великою проблемою сучасної України. У графіках нижче наведені країни, куди люди емігрували протягом 2019-2021 років, а також виведено топ 20 країн за кількістю українських емігрантів.

In [24]:
migration_over_countries = pd.read_excel("міграція_по_країнах_всі_роки.xlsx")
migration_over_countries

Unnamed: 0,Країна,Кількість вибулих,Рік,Кількість прибулих,Континент
0,Австрія,18.0,2019.0,211.0,Країни Європи
1,Албанія,0.0,2019.0,1.0,Країни Європи
2,Андорра,0.0,2019.0,0.0,Країни Європи
3,Бельгія,35.0,2019.0,13.0,Країни Європи
4,Білорусь,122.0,2019.0,401.0,Країни Європи
...,...,...,...,...,...
667,Австралія,5.0,2021.0,2.0,Країни Австралії та Океанії
668,Нова Зеландія,0.0,2021.0,0.0,Країни Австралії та Океанії
669,Соломонові Острови,0.0,2021.0,0.0,Країни Австралії та Океанії
670,Фіджі,0.0,2021.0,0.0,Країни Австралії та Океанії


In [26]:
fig = px.scatter(migration_over_countries, x='Кількість прибулих', y="Кількість вибулих", animation_frame="Рік", 
           animation_group="Країна", color="Країна", hover_name="Країна",
           log_x=True,  size_max=35, size="Кількість вибулих")
fig.update_layout(plot_bgcolor='rgba(0,0,0,0)',  
                  )

In [29]:
migration_2019 = pd.read_excel("міграція_по_країнах_2019.xlsx")
migration_2020 = pd.read_excel("мігррація_по_країнах_2020.xlsx")
migration_2021 = pd.read_excel("міграція_по_країнах_2021.xlsx")
total_migration = pd.DataFrame({'Країни': migration_2019['Країна'], 
                                'Кількість прибулих': migration_2019['Кількість прибулих'] + migration_2020['Кількість прибулих']+ migration_2021['Кількість прибулих'],
                                'Кількість вибулих': migration_2019['Кількість вибулих'] + migration_2020['Кількість вибулих']+ migration_2021['Кількість вибулих']})
top_migration = total_migration.nlargest(20, 'Кількість вибулих')

index = pd.Index(range(1, 21))
top_migration = top_migration.set_index(index)
# top_migration

In [30]:
# графік(гістограма)

emigration = px.histogram(top_migration, y='Кількість вибулих', x ='Країни',
                                            labels={'Країни':'Країна',}, text_auto=True, 
                                            color='Країни')
emigration.update_layout(
    title_text='Країни з найбільшою кількістю українських емігрантів', # title of plot
    xaxis_title_text='Країни', # xaxis label
    yaxis_title_text='Кількість вибулих', # yaxis label
    
)
emigration.update_traces(textposition='outside', textfont=dict(family='Verdana', size=10))
emigration.update_layout(plot_bgcolor='rgba(0,0,0,0)',  
                  )
emigration

Доволі сумним показником є те, що найбільше людей виїжджали саме в Росію.
Країнами з великою кількістю укрїнських емігрантів є США, Німеччина, країни колишнього СРСР та країни Східної Європи. 

# Міграція за кордон за віком протягом 2019-2021 років

У цьому блоці досліджено, якого віку люди найчастіше мігрують за кордон. Також тут проаналізовано приріст (скорочення) населення, який спричинила така міграція.
Варто зазначити, що беруться до уваги дані лише за 2019-2021 роки.

In [24]:
df_migr= pd.read_excel('migration_abroad.xlsx')

In [32]:
fig = px.bar(df_migr, x="Вік", y="Кількість вибулих", 
      color="Вік", color_discrete_sequence=px.colors.sequential.RdBu,
      animation_frame="Рік", animation_group="Кількість вибулих", 
      range_y=[0,5700], text = 'Кількість вибулих',
      title='Кількість людей, що емігрували за кордон'
      )
fig.update_layout(uniformtext_minsize=8)
fig.update_layout(xaxis_tickangle=-45)

З графіків чітко можна прослідкувати, що за кордон мігрує, переважно, працездатне населення.
Це може означати, що люди цього віку, їдуть шукати кращі можливості.

## Відмінність між кількістю прибулих/вибулих за кордон

In [25]:
year = input('Введіть рік (2019-2021): ')
fig = go.Figure()
fig.add_trace(go.Scatter(x=df_migr['Вік'], y=df_migr['Кількість вибулих'][df_migr['Рік'] == int(year)], 
                        mode='lines+markers', name='Вибули з України', line_color='#d61515'))
fig.add_trace(go.Scatter(x=df_migr['Вік'], y=df_migr['Кількість прибулих'][df_migr['Рік'] == int(year)], 
                        mode='lines+markers', name='Прибули в Україну',  line_color = '#1589d6'))
fig.update_layout(title = f'Міждержавна міграція, дані за {year} рік')
fig.update_yaxes(title_text = 'Кількість міждержавних мігрантів')
fig.update_xaxes(title_text = 'Вік')

Цей графік дає змогу простежити тенденцію міграції в залежності від віку.
Загалом, схильність до міграції простежується у людей віком 16-30 років, найменше мігрують люди старшого віку.
Цікавим є те, що люди молодого віку найбільш схильні як до еміграції, так і до імміграції.
Для того, щоб побачити дані на графіку, потрібно запустити клітинку і ввести рік (2019-2021), інформація про який Вас цікавить. 

## Міграційний приріст/скорочення протягом 2019-2021

In [35]:
fig = px.scatter(df_migr, x="Вік", y="Приріст", animation_frame="Рік", animation_group="Вік",
           color="Вік", hover_name="Вік", size = 'Кількість прибулих', title = 'Міграційний приріст/скорочення протягом 2019-2021')
fig

Графік відображає, як зміювався міграційний приріст протягом цих 3 років. До того ж, він показує приріст конкретних вікових груп. Кожний кружечок відображає окрему вікову групу, а його розмір залежить від кількості людей такого віку, що прибули до України.

# Зміни в етнічному складі населення України

In [26]:
# громадяни яких країн найбільше в'їхали в Україну
# створення dataframe
forreighn_migrants = pd.read_excel("міждержавних_мігрантів_за_країнами_громадянства_2021.xlsx")
forreighn_migrants['Кількість прибулих'].astype(float)
for_pie_chart = forreighn_migrants[['Країни', 'Кількість прибулих']]
index = pd.Index(range(1, 21))
result_for_pie_chart = for_pie_chart.nlargest(20, ['Кількість прибулих'])
result_for_pie_chart = result_for_pie_chart.set_index(index)


In [27]:
# графік(гістограма)
histogram_forreighn_migrants = px.histogram(result_for_pie_chart, x='Країни', y ='Кількість прибулих',
                                            labels={'Країни':'Країна', 'sum of Кількість прибулих':'Кількість прибулих'}, text_auto=True, 
                                            )
histogram_forreighn_migrants.update_layout(
    title_text='Кількість іноземних громадян, що прибули в Україну', # title of plot
    xaxis_title_text='Країни', # xaxis label
    yaxis_title_text='Кількість прибулих', # yaxis label
)
histogram_forreighn_migrants.update_layout(plot_bgcolor='rgba(0,0,0,0)',  
                  )
histogram_forreighn_migrants.update_traces(textposition='inside', textfont=dict(family='Verdana', size=10))
histogram_forreighn_migrants

Найбільше іммігрантів приїхало в Україну з країн Сходу та Африки. Це змінює етнічний склад населення України і робить його більш різноманітним.