# Як за період незалежності змінилось населення України?

**Мета:** заглибитись в тему демографії України, проаналізувати населення, його склад, його кількість, від чого вона змінювалась. Також ми хотіли проаналізувати проблему скорочення населення (причини ситуації) 

# Аналіз населення України за роками з 1991 по 2021 роки

Імпортуємо необхідні бібліотеки

In [20]:
import pandas as pd
import numpy as np
# import chart_studio.plotly as py
import cufflinks as cf
# import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go
# from plotly.offline import download_plotlyjs, init_notebook_mode, plot, iplot
# import plotly
# import matplotlib.pyplot as plt
# %matplotlib inline
from plotly.subplots import make_subplots

from plotly.offline import download_plotlyjs, init_notebook_mode, plot, iplot

init_notebook_mode(connected=True)
cf.go_offline()

### Середня тривалість життя в Україні за роками

За 30 років середня тривалість життя в Україні зросла на 1 рік

In [3]:
#Create graph objects for making more customized plots
df_average_life = pd.read_excel('average_lifetime.xlsx')
# Make multiple line plots
px.line(df_average_life, x='Рік', y=['обидві статі','чоловіки', 'жінки'], labels={'x':'Рік', 'y':'Вік'}, title='Середня тривалість життя в Україні(в роках)')

### Співвідношення чоловіків та жінок в Україні за роками через стовпчасту діаграму

Протягом усього існування Незалежної України співвідношення чоловіків та жінок залишалося стабільним, скорочувалась лиш загальна кількість населення. Із роками різниця між чоловіками і жінкам в Україні зменшується.

In [4]:
df = pd.read_excel('male_female.xlsx')
# Make multiple bar plots
fig = px.bar(df, x='Рік', y=['Чоловіки', 'Жінки'], barmode='group', title='Кількість чоловіків та жінок в Україні(тис. осіб)')
fig.show()

### Динамічна кругова діаграма міського і сільського населення України за роками

Користувачу необхідно ввести рік, для якого буде показана динаміка міського і сільського населення України. Якщо введений рік не входить в діапазон 1991-2021, то буде виведено повідомлення про помилку. Якщо введений рік входить в діапазон 1991-2021, то буде показана динаміка міського і сільського населення України за введений рік. Динаміка за роки незалежності лишається стабільною(кількість міського населення зростає) Приблизний поділ - це 70%, які проживають у містах і 30% - у селах.

In [5]:
# Read the Excel file
df = pd.read_excel('urban_rural.xlsx')

# Get the available years
available_years = df['Рік'].unique()

# Create a function to generate a pie chart
def generate_pie_chart(year):
    # Filter the data for the selected year
    filtered_df = df[df['Рік'] == year]

    # Calculate the total population for urban and rural areas
    urban_population = filtered_df['Міське'].sum()
    rural_population = filtered_df['Сільське'].sum()

    # Create a DataFrame for the pie chart
    data = {'Population': [urban_population, rural_population],
            'Area': ['Міста', 'Сільська місцевість']}
    pie_df = pd.DataFrame(data)

    # Generate the pie chart using Plotly
    fig = px.pie(pie_df, values='Population', names='Area',
                 title=f'Розподіл населення за типом місцевості у {year}(тис. осіб)')

    # Show the chart
    fig.show()

# Ask the user to input the year
selected_year = int(input('Enter the year: '))

# Check if the selected year is available
if selected_year in available_years:
    generate_pie_chart(selected_year)
else:
    print('Invalid year. Please select a valid year from the available options.')


### Лінійна діаграма із населенням України за роками і віковими групами

In [6]:
# Read the data from the Excel sheet
data = pd.read_excel('age_groups.xlsx')

# Extract the necessary columns
years = data['Рік']
age_group_0_17 = data['0-17 років']
age_group_18_plus = data['18 років і старше']
age_group_60_plus = data['60 років і старше']
age_group_65_plus = data['65 років і старше']

# Create the line plot
fig = go.Figure()
fig.add_trace(go.Scatter(x=years, y=age_group_0_17, name='0-17 років'))
fig.add_trace(go.Scatter(x=years, y=age_group_18_plus, name='18+ років'))
fig.add_trace(go.Scatter(x=years, y=age_group_60_plus, name='60+ років'))
fig.add_trace(go.Scatter(x=years, y=age_group_65_plus, name='65+ років'))

# Customize the layout
fig.update_layout(
    title='Населення України за віковими групами (тис. осіб)',
    xaxis_title='Рік',
    yaxis_title='Населення',
    legend_title='Вікові групи'
)

# Display the plot
fig.show()


### Area chart, що зображає причини смерті в Україні

Із діаграми видно, що найчастішою причиною смерті в Україні є серцево-судинні захворювання, а найменшою - туберкульоз. Загальна тенденція смертності із роками зменшується, але від початку 2020 року зростає через появу COVID-19.

In [7]:
# Read the Excel file into a DataFrame
df = pd.read_excel('death_causes.xlsx')

# Prepare the data for visualization
df = df.rename(columns={
    'хвороб системи кровообігу/ blood circulation decease': 'Хвороби кровообігу',
    'новоутворень/tumors': 'Новоутворення',
    'нещасних випадків, отруєнь і травм/accidents, poisoning and traumas': 'Нещасні випадки, отруєння і травми',
    'хвороб органів дихання/respiratory organs': 'Хвороби органів дихання',
    'COVID-19': 'COVID-19'
})

# Create the stacked area chart
fig = px.area(df, x = 'Рік', y=df.columns[1:], title='Причини смерті в Україні (тис. осіб))')
fig.update_layout(
    xaxis_title='Рік',
    yaxis_title='Кількість смертей',
    legend_title='Причини смерті'
)

# Show the chart
fig.show()

### Стовпчаста діаграма, що зображає кількість зареєстрованих і розірваних шлюбів в Україні за роками

Динаміка шлюбів в Україні зменшується. Люди все менше і менше виходять у шлюб. Це може бути пов'язано з тим, що люди все більше і більше віддають перевагу спільному проживанню, а не офіційному шлюбу. При цьому співвідношення розірваних шлюбів до зареєстрованих залишається стабільним. 

In [8]:
# Load the data from the Excel sheet
data = pd.read_excel('born_died.xlsx')

# Create the stacked bar chart using Plotly
fig = go.Figure(data=[
    go.Bar(name='Кількість зареєстрованих шлюбів', x=data['Рік'], y=data['Кількість зареєстрованих шлюбів']),
    go.Bar(name='Кількість зареєстрованих розірвань шлюбів', x=data['Рік'], y=data['Кількість зареєстрованих розірвань шлюбів'])
])

# Customize the chart layout
fig.update_layout(
    title='Кількість шлюбів та розірвань шлюбів в Україні(тис. пар)',
    xaxis_title='Рік',
    yaxis_title='Кількість подій',
    barmode='stack',
    legend_title='Події',
    hovermode='x',
    hoverlabel=dict(bgcolor="white", font_size=12),
)

# Show the chart
fig.show()

### Scatter діаграма, що зображує природний приріст населення України за роками

Діаграма показує, що природний приріст населення України зменшується. Часто він є негативним, що означає, що смертність перебільшує народжуваність. На діаграмі ми бачимо, що позитивний приріст населення був лише у перші роки незалежності, після чого динаміка негативна. Найменш оптимістичним є 2021 рік, так як COVID-19 призвів до зростання смертності.

In [12]:
# Read the Excel data into a pandas DataFrame
data = pd.read_excel('nature_population_grow.xlsx', sheet_name='Sheet1')


# Convert 'Природний приріст, скорочення' column to float
data['Природний приріст, скорочення'] = pd.to_numeric(data['Природний приріст, скорочення'], errors='coerce')

# Scatter plot
fig = go.Figure()
fig.add_trace(go.Scatter(x=data['Рік'], y=data['Природний приріст, скорочення'], mode='markers'))

# Trendline
trendline = np.polyfit(data['Рік'], data['Природний приріст, скорочення'], 1)
fig.add_trace(go.Scatter(x=data['Рік'], y=np.polyval(trendline, data['Рік']), mode='lines', name='Тенденція'))

# Update layout
fig.update_layout(title='Природний приріст, скорочення в Україні(на 1000 наявного населення)',
                  xaxis_title='Рік',
                  yaxis_title='Природний приріст, скорочення')

fig.show()


### Scatter діаграма, що зображує міграційний приріст населення України за роками

Міграційний приріст населення України крутиться навколо 0. Це означає, що кількість людей, які виїжджають з України приблизно дорівнює кількісті людей, які приїжджають в Україну. 

In [13]:
# Read the Excel data into a pandas DataFrame
data = pd.read_excel('nature_population_grow.xlsx', sheet_name='Sheet1')


# Convert 'Природний приріст, скорочення' column to float
data['Міграційний приріст, скорочення'] = pd.to_numeric(data['Міграційний приріст, скорочення'], errors='coerce')

# Scatter plot
fig = go.Figure()
fig.add_trace(go.Scatter(x=data['Рік'], y=data['Міграційний приріст, скорочення'], mode='markers'))

# Trendline
trendline = np.polyfit(data['Рік'], data['Міграційний приріст, скорочення'], 1)
fig.add_trace(go.Scatter(x=data['Рік'], y=np.polyval(trendline, data['Рік']), mode='lines', name='Тенденція'))

# Update layout
fig.update_layout(title='Міграційний приріст, скорочення (на 1000 наявного населення)',
                  xaxis_title='Рік',
                  yaxis_title='Міграційний приріст, скорочення')

fig.show()


### Адміністративно-територіальний поділ України за роками

За роки незалежності адміністративно-територіальний поділ України не змінювався. Зміни є несуттєвими.

In [14]:
# Read the Excel file into a DataFrame
df = pd.read_excel('administration.xlsx')

# Create the figure and specify the chart type
fig = px.bar(df, x='Рік', y=['міста', 'селища міського типу', 'сільські населені пункти'],
             title='Адміністративний поділ України (кількість населених пунктів)',
             labels={'value': 'Наелення', 'variable': 'Тип населеного пункту'})

# Update the layout to add animation and customize other settings
fig.update_layout(xaxis={'type': 'category'}, barmode='group', bargap=0.15,
                  xaxis_title='Рік', yaxis_title='Кількість населених пунктів')

# Add animation settings
fig.update_traces(hovertemplate='Year: %{x}<br>Population: %{y:,}')

# Show the dynamic visualization
fig.show()


### Стовпчаста діаграма, що зображує кількість народжених та померлих в Україні за роками

За роки незалежності кількість народжених в Україні зменшується, а кількість померлих зростає. Це означає, що природний приріст населення України зменшується. Це може бути пов'язано з тим, що люди все більше і більше віддають перевагу спільному проживанню, а не офіційному шлюбу. При цьому співвідношення розірваних шлюбів до зареєстрованих залишається стабільним.

In [18]:
# Read the Excel file into a pandas DataFrame
df = pd.read_excel('born_died.xlsx')

# Create a bar chart using Plotly Express
fig = px.bar(df, x='Рік', y=['Кількість живонароджених', 'Кількість померлих'],
             labels={'value': 'Кількість', 'variable': 'Категорія'},
             title='Народжуваність і смертність в Україні (тис. осіб)')

# Add a slider for the years
fig.update_layout(
    xaxis=dict(
        rangeslider=dict(
            visible=True
        ),
        type='date'
    )
)

# Show the figure
fig.show()


## Живонароджені та помрелі в Україні

In [19]:
init_no_mode(connected=True)
cf.go_offline()
df = pd.read_excel('kjp_reg_u.xls')

NameError: name 'init_no_mode' is not defined

 Наступною секторною діаграмою показано кількість живонароджених людей в 2020 році за областями

In [16]:
px.pie(df, values='Кількість живонароджених 2020', names='Область',
title='Кількість живонароджених в 2020 році',
color_discrete_sequence=px.colors.sequential.RdBu )

Ця діаграма показує кількість живонароджених й померлих людей в 2020 році

In [17]:
px.scatter(df, x='Кількість живонароджених 2020', y='Кількість померлих 2020',
color='Область', size='Кількість живонароджених 2020',
hover_data=['Кількість живонароджених 2020'])

Така діаграма показує кількість живонароджених у 2021 році

In [18]:
px.bar(df, x='Кількість живонароджених 2021', y='Область', color='Кількість живонароджених 2021',
title='Кількість живонароджених 2021')

Ця діаграма показує кількість живонароджених і померлих у 2021 році

In [19]:
fig = px.scatter_3d(df, x='Область', y='Кількість живонароджених 2021',
z='Кількість померлих 2021',
color='Область', opacity=0.9)

fig

## Кількість померлих в Україні за окремими причинами смерті

In [21]:
init_notebook_mode(connected=True)
cf.go_offline()
df = pd.read_excel('kpops1221_ue.xls')
df_dead = pd.read_excel('death.xlsx')

In [26]:
fig = go.Figure(data=go.Scatter(x=df['Хвороба'], y=df['Осіб'], mode='markers'))
fig.update_layout(title='Кількість померлих за окремими причинами смерті в 2021 році')
fig.update_layout(xaxis_tickangle=-30)
fig.show()

Як зазначалось вище, найбільше смертей зумовлено саме серцево-судинними захворюваннями. Теж можемо прослідкувати і на цьому графіку. Найбільшим випадків смертей від ішемічної хвороби серця (більше  300 тис.)

In [27]:
fig = px.treemap(df, path=['Хвороба'], values='Осіб')
fig.update_layout(title='Кількість померлих за окремими причинами смерті в 2021 році')
fig.show()

На цьому графіку також можна помітити також перевагу ІХС(ішемічної хвороби серця), яка спричиняє найбільше випадків смертей від хвороби.

In [28]:
fig = px.bar(df_dead, x='Рік', y='Кількість', color='Кількість')
fig.update_layout(title='Кількість смертей по роках',
                  xaxis_title='Рік', yaxis_title='Кількість смертей')
fig.show() 

На цьому графіку можемо прослідкувати смертність за період 2015-2022 років. Мабуть, очевидно, що за 2022 рік дані не є зовсім повними, адже показник смертності мав би значно перевищувати показники за інші роки. Однак, бачимо, що найбільш показник був досягнутий 2021 році. 

# Загальні зміни кількості населення в Україні за період 2010-2022 роки

У цьому блоці наведена загальна статистика стосовно кількості населення України та його зміна протягом 1 січня 2010 - 1 січня
2022 років.

In [29]:
amount = pd.read_excel("кількість_чоловіків_жінок_2010_2022.xlsx")

In [30]:
fig = px.scatter(amount, x="Рік", y="Всього ", color='Рік', size='Всього ', labels={'Всього ': 'Кількість (млн)'})
fig.update_layout(
    title=dict(text="Зміна кількості населення України", font=dict(size=17))
)
fig.update_layout(plot_bgcolor='rgba(0,0,0,0)',  
                  )
fig.update_layout(
    xaxis=dict(
        showline=True,
        showgrid=False,
        linecolor='rgb(204, 204, 204)',
        linewidth=2,
        ticks='outside',
        tickfont=dict(
            family='Arial',
            size=12,
            color='rgb(82, 82, 82)')))
fig.show()

In [31]:
fig = px.line(amount, x='Рік', y='Кількість', color='Стать', markers=True, labels = {'Кількість':'Кількість, млн'})
fig.update_layout(
    xaxis=dict(
        showline=True,
        showgrid=False,
        linecolor='rgb(204, 204, 204)',
        linewidth=2,
        ticks='outside',
        tickfont=dict(
            family='Arial',
            size=12,
            color='rgb(82, 82, 82)')))
fig.update_layout(plot_bgcolor='rgba(0,0,0,0)',  
                  )
fig.update_layout(title_text='Загальна кількість жінок та чоловіків')
fig

З графіків можемо прослідкувати, що кількість населення скорочується.
Очевидно, найбільшу зміну можна прослідкувати в період 2014-2015 років.
Варто зазначити, що у цей графік не включені дані за сам 2022 рік. Але, спираючись на досвід 2014 року, можемо припустити, що кількість населення скорочуватиметься ще швидшими темпами.

# Міграція (усі потоки) 2002-2021

У цьому блоці проаналізована інформація про міграцію за 2002-2021 роки.

In [32]:
df_general_migr = pd.read_excel('migration_2002-2021.xlsx')
df_general_migr

Unnamed: 0,Рік,Прибули,Вибули,Приріст,Тип місцевості
0,2002,760005,793796,-33791,Міська та сільська
1,2003,762033,786243,-24210,Міська та сільська
2,2004,789379,796994,-7615,Міська та сільська
3,2005,763222,758639,4583,Міська та сільська
4,2006,765882,751637,14245,Міська та сільська
5,2007,758292,741454,16838,Міська та сільська
6,2008,710790,695869,14921,Міська та сільська
7,2009,642819,629372,13447,Міська та сільська
8,2010,683449,667316,16133,Міська та сільська
9,2011,669397,652301,17096,Міська та сільська


In [33]:
fig = px.bar(df_general_migr, x="Тип місцевості", y="Приріст", color="Тип місцевості",
            animation_frame="Рік", animation_group="Тип місцевості", range_y=[-51000, 65500], 
            title = 'Міграційний приріст у різних типах місцевості, дані за 2002-2021 роки')
fig

Графік ілюструє як змінювався приріст населення у різних типах місцевості протягом цього періоду.
Властиво, в основному, міський приріст населення збільшувався приблизно до 2014 року. Проте після початку війни він різко впав. У таблиці з 2014 року не включені дані міграції тимчасово окупованих територій: АР Крим, частини Донецької та Луганської областей.

In [34]:
fig = make_subplots(
    rows=3, cols=1,
    subplot_titles=('Вибулі протягом 2002-2021','Прибулі протягом 2002-2021', "Приріст"))
fig.add_trace(go.Scatter(x=df_general_migr['Рік'], y=df_general_migr['Вибули'][df_general_migr['Тип місцевості'] == 'Міська та сільська'], 
                        mode='lines+markers', name='Вибули з України', line_color='#d61515'), row = 1, col = 1)
fig.add_trace(go.Scatter(x=df_general_migr['Рік'], y=df_general_migr['Прибули'][df_general_migr['Тип місцевості'] == 'Міська та сільська'], 
                        mode='lines+markers', name='Прибули в Україну',  line_color = '#1589d6'), row = 2, col = 1)
fig.add_trace(go.Scatter(x=df_general_migr['Рік'], y=df_general_migr['Приріст'][df_general_migr['Тип місцевості'] == 'Міська та сільська'], 
                        mode='lines+markers', name='Приріст',  line_color = '#41b56c'), row = 3, col = 1)

fig.update_layout(height=750)
fig.update_yaxes(title_text = 'Кількість мігрантів')
fig.update_xaxes(title_text = 'Рік')


Графік дає змогу прослідкувати, що приріст повільно зростає.
Особливим роком був 2012, тоді показник приросту був особливо великим.

## Кількість людей, що виїжджали з Україну та поверталися назад протягом 2002-2021 років

In [35]:
total_in = pd.read_excel("загальна_кількість_прибули_2002_2021.xlsx")
total_out = pd.read_excel("загальна_кількість_вибулих_2002_2021.xlsx")

In [36]:
fig = px.scatter(total_in, y=total_in['Прибулі'], x=total_in['Роки'],
    size=total_in['Прибулі'], size_max=35, log_x=True, labels={'Роки':'Рік', 'Прибулі':'Кількість'})
fig
fig.update_layout(
    title=dict(text="Кількість людей, що прибули в Україну", font=dict(size=30))
)
fig.update_layout(
    xaxis=dict(
        showline=True,
        showgrid=False,
        linecolor='rgb(204, 204, 204)',
        linewidth=2,
        ticks='outside',
        tickfont=dict(
            family='Arial',
            size=12,
            color='rgb(82, 82, 82)')))
fig.update_layout(plot_bgcolor='rgba(0,0,0,0)',  
                  )

In [37]:
total_movement = total_in[['Роки','Прибулі']]
total_movement['Вибулі'] = total_out['Вибулі']

In [38]:
fig = go.Figure()
fig.add_trace(go.Scatter(
    x=total_movement['Роки'],
    y=total_movement['Прибулі'],
    name="Кількість людей, що в'їхали",
      mode='lines+markers',   # this sets its legend entry
))
fig.add_trace(go.Scatter(
    x=total_movement['Роки'],
    y=total_movement['Вибулі'],
    name="Кількість людей, що виїхали",
        mode='lines+markers',      # this sets its legend entry
))

fig.update_layout(
    title="Різниця прибулих/вибулих",
    xaxis_title="Роки",
    yaxis_title="Кількість",
    font=dict(
        size=18
        
    )
)
fig.update_layout(
    xaxis=dict(
        showline=True,
        showgrid=False,
        linecolor='rgb(204, 204, 204)',
        linewidth=2,
        ticks='outside',
        tickfont=dict(
            family='Arial',
            size=12,
            color='rgb(82, 82, 82)')))
fig.update_layout(plot_bgcolor='rgba(0,0,0,0)',  
                  )

З  графіків можемо прослідкувати, що кількість емігрантів з 2002 року скорочувалась. У 2016 році вона досягла свого мінімуму.
Загалом, з 2005 року, кількість людей, що повертаються в Україну є більшою, ніж тих, що виїжджають (не враховуючи ситуації 2022-2023 років)

# Зміни кількості населення в областях протягом 2019-2021 

In [39]:
total_regions_all=pd.read_excel("прибулі_вибулі_області_2019-2021.xlsx")
total_regions=total_regions_all.iloc[0:25]

In [40]:
fig = go.Figure()
fig.add_trace(go.Bar(
    x=total_regions['Область'],
    y=total_regions['Прибулі'],
    name='Кількість прибулих',
))
fig.add_trace(go.Bar(
    x=total_regions['Область'],
    y=total_regions['Вибулі'],
    name='Кількість вибулих',
))
fig.update_layout(
    title="Кількість прибулих/вибулих в областях України",
)
fig.update_layout(plot_bgcolor='rgba(0,0,0,0)',  
                  )

fig.update_layout(barmode='group', xaxis_tickangle=-45)
fig.show()


У східних областях, зокрема Донецька та Луганська, які на момент 2019-2021 років були районами ведення бойових дій, міграційний приріст є від'ємний. На противагу Київська область має найбільший показник приросту.

# Міграційний рух населення за типом місцевості по регіонах.

З даних по роках 2019 - 2021 ми розглядали окремо 2 категорії: сільська та міська місцевості. З кожної категорії, окремо від загального руху населення, виділялась також міждержавна міграція. Дані з держстату були обʼєднані в одну таблицю для зручності роботи.

## Міське населення

In [41]:
df_city = pd.read_excel('migration_terrain.xlsx', sheet_name='Sheet1')
df_city

Unnamed: 0,регіон,кількість прибулих,кількість вибулих,"міграційний приріст, скорочення (-)",тип потоку,рік
0,Вінницька область,13421,12598,823,усі,2019
1,Волинська область,8295,8612,-317,усі,2019
2,Дніпропетровська область,29208,27886,1322,усі,2019
3,Донецька область,14596,20871,-6275,усі,2019
4,Житомирська область,12433,12742,-309,усі,2019
...,...,...,...,...,...,...
145,Хмельницька область,484,143,341,міждержавні,2021
146,Черкаська область,398,230,168,міждержавні,2021
147,Чернівецька область,900,352,548,міждержавні,2021
148,Чернігівська область,24,74,-50,міждержавні,2021


In [42]:
all_migration,  crosscountry_migration = df_city[df_city['тип потоку'].str.contains('усі')], df_city[df_city['тип потоку'].str.contains('міждержавні')]
all_migration

Unnamed: 0,регіон,кількість прибулих,кількість вибулих,"міграційний приріст, скорочення (-)",тип потоку,рік
0,Вінницька область,13421,12598,823,усі,2019
1,Волинська область,8295,8612,-317,усі,2019
2,Дніпропетровська область,29208,27886,1322,усі,2019
3,Донецька область,14596,20871,-6275,усі,2019
4,Житомирська область,12433,12742,-309,усі,2019
...,...,...,...,...,...,...
120,Хмельницька область,10897,9753,1144,усі,2021
121,Черкаська область,8920,9006,-86,усі,2021
122,Чернівецька область,4722,4250,472,усі,2021
123,Чернігівська область,7027,7686,-659,усі,2021


Анімований графік відображає співвідношення між кількістю вибулих та прибулих в міста кожної області. Інформація про внутрішню та зовнішню міграцію. Щоб переглянути дані за різні роки, потрібно перетягнути повзунок.

In [43]:
px.scatter(all_migration, x="кількість прибулих", y="кількість вибулих", animation_frame="рік", 
           animation_group="регіон", color="регіон", hover_name="регіон",
           log_x=True, size_max=55, range_x=[3000,80000], title='Загальне співвідношення прибулих та вибулих в міській місцевості')

Графік аналогічний до попереднього, однак інформація лише про міждержавну міграцію.

In [44]:
px.scatter(crosscountry_migration, x="кількість прибулих", y="кількість вибулих", animation_frame="рік", 
           animation_group="регіон", color="регіон", hover_name="регіон",
           log_x=True, size_max=55, title='Співвідношення міждержавних мігрантів в сільській місцевості')

Теплова мапа відображає загальний міграційний приріст міських місцевостей кожної області.

In [40]:
fig = px.density_heatmap(all_migration, x='рік', y='регіон', z='міграційний приріст, скорочення (-)', title='Загальний міграційний приріст в міській місцевості')
fig.layout.height = 1000

fig

Бачимо, що найбільший приріст, властиво, у Київської області, найменший - у Луганській та Донецькій областях.

Теплова мапа відображає приріст населення міст за рахунок міждержавної міграції. За винятком декількох областей, в яких показники додатні, є більше емігрантів, аніж іммігрантів.

In [45]:
fig = px.density_heatmap(crosscountry_migration, x='рік', y='регіон', z='міграційний приріст, скорочення (-)', title='Міждержавний міграційний приріст в міській місцевості')
fig.layout.height = 1000

fig

Переглянувши графіки, можна побачити, що в більшості міст населення зростає. На це значним чином впливає бажання великої кількості жителів сільської місцевості переїхати в місто, де є значно більше можливостей. Особливо це стає помітно після перегляду графіків з інформацією про сільську місцевість.

## Сільське населення

In [46]:
df_village = pd.read_excel('migration_terrain.xlsx', sheet_name=1)
df_village

Unnamed: 0,регіон,кількість прибулих,кількість вибулих,"міграційний приріст, скорочення (-)",тип потоку,рік
0,Вінницька область,7628,11175,-3547,усі,2019
1,Волинська область,6346,7026,-680,усі,2019
2,Дніпропетровська область,5775,8523,-2748,усі,2019
3,Донецька область,2708,4113,-1405,усі,2019
4,Житомирська область,7798,9156,-1358,усі,2019
...,...,...,...,...,...,...
139,Херсонська область,41,45,1,міждержавні,2021
140,Хмельницька область,41,59,131,міждержавні,2021
141,Черкаська область,41,49,32,міждержавні,2021
142,Чернівецька область,41,110,453,міждержавні,2021


In [47]:
all_migration,  crosscountry_migration = df_village[df_village['тип потоку'].str.contains('усі')], df_village[df_village['тип потоку'].str.contains('міждержавні')]

Анімований графі відображає співвідношення між кількістю вибулих та прибулих в села кожної області. Інформація про внутрішню та зовнішню міграцію. Щоб переглянути дані за різні роки, потрібно перетягнути повзунок.

In [48]:
px.scatter(all_migration, x="кількість прибулих", y="кількість вибулих", animation_frame="рік", 
           animation_group="регіон", color="регіон", hover_name="регіон",
           log_x=True, size_max=55, range_x=[1000,70000], title='Загальне співвідношення прибулих та вибулих в сільській місцевості')

Графік аналогічний до попереднього, однак інформація лише про міждержавну міграцію.

In [49]:
px.scatter(crosscountry_migration, x="кількість прибулих", y="кількість вибулих", animation_frame="рік", 
           animation_group="регіон", color="регіон", hover_name="регіон",
           log_x=True, size_max=55, title='Співвідношення міждержавних мігрантів в сільській місцевості')

Теплова мапа відображає загальний міграційний приріст міських місцевостей кожної області.

In [50]:
fig = px.density_heatmap(all_migration, x='рік', y='регіон', z='міграційний приріст, скорочення (-)', title='Загальний міграційний приріст в сільській місцевості')
fig.layout.height = 1000

fig

Теплова мапа відображає приріст населення міст за рахунок міждержавної міграції. Знову ж таки, як і в ситуації з містами, Київська область має найвищі показники приросту населення.

In [51]:
fig = px.density_heatmap(crosscountry_migration, x='рік', y='регіон', z='міграційний приріст, скорочення (-)', title='Міждержавний міграційний приріст в сільській місцевості')
fig.layout.height = 1000

fig

Що стосується сільської місцевості, то можемо побачити, що кількість населення має відʼємні показники приросту. Винятком є Київська область.

Не можна не помітити, що в сільській місцевості приріст населення за рахунок міждержавних мігрантів або збільшується, або залишається доволі сталим.

# Демографічні зміни, що відбуваються у міській та сільській місцевості
На прикладі даних за 2021 рік показано тенденцію в зміні вікового складу населення у міській та сільській місцевостях.

In [52]:
total_city = pd.read_excel("прибулі_у_місто_2021_загальні.xlsx")
total_village = pd.read_excel("прибулі_у_село_2021_загальні.xlsx")
out_total_village = pd.read_excel("вибулі_село_2021.xlsx")
out_total_city = pd.read_excel("вибулі_місто_2021.xlsx")


In [53]:
fig = go.Figure()

fig.add_trace(go.Funnelarea(
            scalegroup = "second", values = total_village['Прибулі'], 
            textinfo = "value", title = {"position": "top center", "text": "Кількість молодих людей прибулих у село"},
            domain = {"x": [0.55, 1], "y": [0.55, 1]}))

fig.add_trace(go.Funnelarea(
    scalegroup = "second", values = out_total_city['Вибулі'], textinfo = "value",
    title = {"position": "top center", "text": "Кількість молодих людей вибулих з міста"},
    domain = {"x": [0, 0.5], "y": [0, 0.5]}))

fig.add_trace(go.Funnelarea(
    scalegroup = "first", values = total_city['Прибулі'], textinfo = "value",
    title = {"position": "top center", "text": "Кількість молодих людей прибулих у місто"},
    domain = {"x": [0, 0.5], "y": [0.55, 1]}))

fig.add_trace(go.Funnelarea(
    scalegroup = "second", values = out_total_village['Вибулі'], textinfo = "value",
    title = {"position": "top center", "text": "Кількість молодих людей вибулих з ceла"},
    domain = {"x": [0.55, 1], "y": [0, 0.5]}))



fig.update_layout(
            margin = {"l": 200, "r": 200}, shapes = [
            {"x0": 0, "x1": 0.5, "y0": 0, "y1": 0.5},
            {"x0": 0, "x1": 0.5, "y0": 0.55, "y1": 1},
            {"x0": 0.55, "x1": 1, "y0": 0, "y1": 0.5},
            {"x0": 0.55, "x1": 1, "y0": 0.55, "y1": 1}])


fig.update_traces(textfont = {'color': 'white', 'size':15})
fig.update_layout(
    width=900,  # Set the width of the plot
    height=700,  # Set the height of the plot
    margin=dict(l=40, r=40, t=40, b=40),  # Set the margin
)
fig.update_layout(
    title=dict(text="Різниця між притоком і відтоком молодого населення у міській та сільській місцевості", font=dict(size=17))
)
fig.update_layout(legend_title_text='Вік')
fig

In [54]:
# arrived to city
older_to_city = pd.read_excel("старші_прибулі_у_місто_2021.xlsx")

# arrived to village
older_to_village = pd.read_excel("старші_прибулі_у_село_2021.xlsx")


# out of city
older_out_city = pd.read_excel("старші_вибулі_місто_2021.xlsx")

# out of village
older_out_village = pd.read_excel("старші_вибулі_село_2021.xlsx")


In [55]:
fig = go.Figure()

fig.add_trace(go.Funnelarea(
            scalegroup = "second", values = older_to_village['Прибулі'], 
            textinfo = "value", title = {"position": "top center", "text": "Кількість старших людей прибулих у село"},
            domain = {"x": [0.55, 1], "y": [0.55, 1]}, name="прибулі у село"))

fig.add_trace(go.Funnelarea(
    scalegroup = "second", values = older_out_city['Вибулі'], textinfo = "value",
    title = {"position": "top center", "text": "Кількість старших людей вибулих з міста"},
    domain = {"x": [0, 0.5], "y": [0, 0.5]}, name='вибулі з міста'))

fig.add_trace(go.Funnelarea(
    scalegroup = "first", values = older_to_city['Прибулі'], textinfo = "value",
    title = {"position": "top center", "text": "Кількість старших людей прибулих у місто"},
    domain = {"x": [0, 0.5], "y": [0.55, 1]}, name='прибулі у місто'))

fig.add_trace(go.Funnelarea(
    scalegroup = "second", values = older_out_village['Вибулі'], textinfo = "value",
    title = {"position": "top center", "text": "Кількість старших людей вибулих з ceла"},
    domain = {"x": [0.55, 1], "y": [0, 0.5]}, name='вибулі з ceла'))

# fig.update_traces(values=older_out_village['Вік'])


fig.update_layout(
            margin = {"l": 200, "r": 200}, shapes = [
            {"x0": 0, "x1": 0.5, "y0": 0, "y1": 0.5},
            {"x0": 0, "x1": 0.5, "y0": 0.55, "y1": 1},
            {"x0": 0.55, "x1": 1, "y0": 0, "y1": 0.5},
            {"x0": 0.55, "x1": 1, "y0": 0.55, "y1": 1}])


fig.update_traces(textfont = {'color': 'white', 'size':15})
fig.update_layout(
    width=900,  # Set the width of the plot
    height=700,  # Set the height of the plot
    margin=dict(l=40, r=40, t=40, b=40),  # Set the margin
)
fig.update_layout(
    title=dict(text="Різниця між притоком і відтоком старшого населення у міській та сільській місцевості", font=dict(size=17))
)
fig.update_layout(legend_title_text='Вік')

fig

На графіках можна прослідкувати тенденцію, що молоде населення частіше виїжджає із сільської місцевості в міську, шукаючи більше можливостей реалізації. Тоді як люди старшого віку, більш охоче переїжджають з міста в село. 

# Міграція українців закордон

Міграція є великою проблемою сучасної України. У графіках нижче наведені країни, куди люди емігрували протягом 2019-2021 років, а також виведено топ 20 країн за кількістю українських емігрантів.

In [56]:
migration_over_countries = pd.read_excel("міграція_по_країнах_всі_роки.xlsx")
migration_over_countries

Unnamed: 0,Країна,Кількість вибулих,Рік,Кількість прибулих,Континент
0,Австрія,18.0,2019.0,211.0,Країни Європи
1,Албанія,0.0,2019.0,1.0,Країни Європи
2,Андорра,0.0,2019.0,0.0,Країни Європи
3,Бельгія,35.0,2019.0,13.0,Країни Європи
4,Білорусь,122.0,2019.0,401.0,Країни Європи
...,...,...,...,...,...
667,Австралія,5.0,2021.0,2.0,Країни Австралії та Океанії
668,Нова Зеландія,0.0,2021.0,0.0,Країни Австралії та Океанії
669,Соломонові Острови,0.0,2021.0,0.0,Країни Австралії та Океанії
670,Фіджі,0.0,2021.0,0.0,Країни Австралії та Океанії


In [57]:
fig = px.scatter(migration_over_countries, x='Кількість прибулих', y="Кількість вибулих", animation_frame="Рік", 
           animation_group="Країна", color="Країна", hover_name="Країна",
           log_x=True,  size_max=35, size="Кількість вибулих")
fig.update_layout(plot_bgcolor='rgba(0,0,0,0)',  
                  )

In [59]:
migration_2019 = pd.read_excel("міграція_по_країнах_2019.xlsx")
migration_2020 = pd.read_excel("мігррація_по_країнах_2020.xlsx")
migration_2021 = pd.read_excel("міграція_по_країнах_2021.xlsx")
total_migration = pd.DataFrame({'Країни': migration_2019['Країна'], 
                                'Кількість прибулих': migration_2019['Кількість прибулих'] + migration_2020['Кількість прибулих']+ migration_2021['Кількість прибулих'],
                                'Кількість вибулих': migration_2019['Кількість вибулих'] + migration_2020['Кількість вибулих']+ migration_2021['Кількість вибулих']})
top_migration = total_migration.nlargest(20, 'Кількість вибулих')

index = pd.Index(range(1, 21))
top_migration = top_migration.set_index(index)

In [60]:
# графік(гістограма)

emigration = px.histogram(top_migration, y='Кількість вибулих', x ='Країни',
                                            labels={'Країни':'Країна',}, text_auto=True, 
                                            color='Країни')
emigration.update_layout(
    title_text='Країни з найбільшою кількістю українських емігрантів', # title of plot
    xaxis_title_text='Країни', # xaxis label
    yaxis_title_text='Кількість вибулих', # yaxis label
    
)
emigration.update_traces(textposition='outside', textfont=dict(family='Verdana', size=10))
emigration.update_layout(plot_bgcolor='rgba(0,0,0,0)',  
                  )
emigration

Доволі сумним показником є те, що найбільше людей виїжджали саме в Росію.
Країнами з великою кількістю укрїнських емігрантів є США, Німеччина, країни колишнього СРСР та країни Східної Європи. 

# Міграція за кордон за віком протягом 2019-2021 років

У цьому блоці досліджено, якого віку люди найчастіше мігрують за кордон. Також тут проаналізовано приріст (скорочення) населення, який спричинила така міграція.
Варто зазначити, що беруться до уваги дані лише за 2019-2021 роки.

In [61]:
df_migr= pd.read_excel('migration_abroad.xlsx')

In [62]:
fig = px.bar(df_migr, x="Вік", y="Кількість вибулих", 
      color="Вік", color_discrete_sequence=px.colors.sequential.RdBu,
      animation_frame="Рік", animation_group="Кількість вибулих", 
      range_y=[0,5700], text = 'Кількість вибулих',
      title='Кількість людей, що емігрували за кордон'
      )
fig.update_layout(uniformtext_minsize=8)
fig.update_layout(xaxis_tickangle=-45)

З графіків чітко можна прослідкувати, що за кордон мігрує, переважно, працездатне населення.
Це може означати, що люди цього віку, їдуть шукати кращі можливості.

## Відмінність між кількістю прибулих/вибулих за кордон

In [63]:
year = input('Введіть рік (2019-2021): ')
fig = go.Figure()
fig.add_trace(go.Scatter(x=df_migr['Вік'], y=df_migr['Кількість вибулих'][df_migr['Рік'] == int(year)], 
                        mode='lines+markers', name='Вибули з України', line_color='#d61515'))
fig.add_trace(go.Scatter(x=df_migr['Вік'], y=df_migr['Кількість прибулих'][df_migr['Рік'] == int(year)], 
                        mode='lines+markers', name='Прибули в Україну',  line_color = '#1589d6'))
fig.update_layout(title = f'Міждержавна міграція, дані за {year} рік')
fig.update_yaxes(title_text = 'Кількість міждержавних мігрантів')
fig.update_xaxes(title_text = 'Вік')

Цей графік дає змогу простежити тенденцію міграції в залежності від віку.
Загалом, схильність до міграції простежується у людей віком 16-30 років, найменше мігрують люди старшого віку.
Цікавим є те, що люди молодого віку найбільш схильні як до еміграції, так і до імміграції.
Для того, щоб побачити дані на графіку, потрібно запустити клітинку і ввести рік (2019-2021), інформація про який Вас цікавить. 

## Міграційний приріст/скорочення протягом 2019-2021

In [57]:
fig = px.scatter(df_migr, x="Вік", y="Приріст", animation_frame="Рік", animation_group="Вік",
           color="Вік", hover_name="Вік", size = 'Кількість прибулих', title = 'Міграційний приріст/скорочення протягом 2019-2021')
fig

Графік відображає, як зміювався міграційний приріст протягом цих 3 років. До того ж, він показує приріст конкретних вікових груп. Кожний кружечок відображає окрему вікову групу, а його розмір залежить від кількості людей такого віку, що прибули до України.

# Зміни в етнічному складі населення України

In [58]:
# громадяни яких країн найбільше в'їхали в Україну
# створення dataframe
forreighn_migrants = pd.read_excel("міждержавних_мігрантів_за_країнами_громадянства_2021.xlsx")
forreighn_migrants['Кількість прибулих'].astype(float)
for_pie_chart = forreighn_migrants[['Країни', 'Кількість прибулих']]
index = pd.Index(range(1, 21))
result_for_pie_chart = for_pie_chart.nlargest(20, ['Кількість прибулих'])
result_for_pie_chart = result_for_pie_chart.set_index(index)


In [59]:
# графік(гістограма)
histogram_forreighn_migrants = px.histogram(result_for_pie_chart, x='Країни', y ='Кількість прибулих',
                                            labels={'Країни':'Країна', 'sum of Кількість прибулих':'Кількість прибулих'}, text_auto=True, 
                                            )
histogram_forreighn_migrants.update_layout(
    title_text='Кількість іноземних громадян, що прибули в Україну', # title of plot
    xaxis_title_text='Країни', # xaxis label
    yaxis_title_text='Кількість прибулих', # yaxis label
)
histogram_forreighn_migrants.update_layout(plot_bgcolor='rgba(0,0,0,0)',  
                  )
histogram_forreighn_migrants.update_traces(textposition='inside', textfont=dict(family='Verdana', size=10))
histogram_forreighn_migrants

Найбільше іммігрантів приїхало в Україну з країн Сходу та Африки. Це змінює етнічний склад населення України і робить його більш різноманітним.

# Формування приросту (скорочення) чисельності населення по регіонах (дані за 2022 рік)

Ми окремо виділили 2022 рік, оскільки він став переломним для України. Приріст населення за смнулий рік у всіх областях, окрім Київської, відʼємний, причому великою мірою через велике скорочення природнього прирост населення. Очевидно, що причиною стало зростання смертності через російську агресію. Що стосується міграційного приросту, то він також знизився, порівняно з минулими роками

In [66]:
df = pd.read_excel('fp_0122_ue.xls', sheet_name=0)
df

Unnamed: 0,регіон,"Загальний приріст, скорочення (-)","природний приріст, скорочення (-)/","міграційний приріст, скорочення (-)"
0,Україна,-36904,-39186,2282
1,Вінницька,-1777,-1852,75
2,Волинська,-586,-578,-8
3,Дніпропетровська,-3334,-3668,334
4,Донецька,-2967,-2732,-235
5,Житомирська,-1468,-1315,-153
6,Закарпатська,-755,-862,107
7,Запорізька,-2140,-2038,-102
8,Івано-Франківська,-1257,-1242,-15
9,Київська,463,-1810,2273


Стовпчаста діарама про загальний приріст населення

In [67]:
df_copy = df[~df['регіон'].str.contains('Україна')]
fig = px.bar(df_copy, y='Загальний приріст, скорочення (-)', x='регіон', text='Загальний приріст, скорочення (-)', color='регіон', title='Загальний приріст населення')
fig.update_traces(texttemplate='%{text:.2s}', textposition='outside')
fig.update_layout(uniformtext_minsize=8)
fig.update_layout(xaxis_tickangle=-45)
fig.layout.width = 900
fig.layout.height = 600
fig


Стовпчаста діаграма про природній приріст населення

In [68]:
df_copy = df[~df['регіон'].str.contains('Україна')]
fig = px.bar(df_copy, y='природний приріст, скорочення (-)/', x='регіон', text='природний приріст, скорочення (-)/', color='регіон', title='Природній приріст населення')
fig.update_traces(texttemplate='%{text:.2s}', textposition='outside')
fig.update_layout(uniformtext_minsize=8)
fig.update_layout(xaxis_tickangle=-45)
fig.layout.width = 900
fig.layout.height = 600
fig

Стовпчаста діаграма про міграційний приріст населення

In [69]:
df_copy = df[~df['регіон'].str.contains('Україна')]
fig = px.bar(df_copy, y='міграційний приріст, скорочення (-)', x='регіон', text='міграційний приріст, скорочення (-)', color='регіон', title='Міграційний приріс населення')
fig.update_traces(texttemplate='%{text:.2s}', textposition='outside')
fig.update_layout(uniformtext_minsize=8)
fig.update_layout(xaxis_tickangle=-45)
fig.layout.width = 900
fig.layout.height = 600
fig

# Загальні коефіцієнти природного руху населення за типом місцевості по регіонах.

## Міська місцевість

In [64]:
df_city = pd.read_excel('natural_movements.xlsx', sheet_name=0)
df_city = df_city.replace(['...'], 0)
df_city['регіон'] = df_city['регіон'].str.split().str[0]
df_city

Unnamed: 0,регіон,живонаро-джених,померлих,"природний приріст, скорочення (-)",шлюбів,розірвань шлюбів,рік
0,Вінницька,7.9,11.8,-3.9,7.1,0,2019
1,Волинська,9,11.2,-2.2,6.1,0,2019
2,Дніпропетровська,6.9,15.5,-8.6,6.8,0,2019
3,Донецька,0,0,0,0,0,2019
4,Житомирська,7.6,14,-6.4,6.8,0,2019
...,...,...,...,...,...,...,...
70,Хмельницька,7,15.3,-8.3,5.5,0,2021
71,Черкаська,5.8,17.6,-11.8,7.3,0,2021
72,Чернівецька,7.3,14.8,-7.5,5.1,0,2021
73,Чернігівська,5.7,18.7,-13,5.3,0,2021


Лінійний графік відображає природній приріс населення в містах.

In [65]:
fig = px.line(df_city, x='рік', y='природний  приріст, скорочення (-)', color='регіон', title='Природній приріст міського населення')
fig.layout.height = 800
fig.show()

## Сільська місцевість

In [66]:
df_village = pd.read_excel('natural_movements.xlsx', sheet_name=1)
df_village = df_village.replace(['...'], 0)
df_village['регіон'] = df_village['регіон'].str.split().str[0]
df_village

Unnamed: 0,регіон,живонаро-джених,померлих,"природний приріст, скорочення (-)",шлюбів,розірвань шлюбів,рік
0,Вінницька,7.4,19.5,-12.1,4.9,0,2019
1,Волинська,11.3,14.8,-3.5,5.7,0,2019
2,Дніпропетровська,8,18.4,-10.4,4.1,0,2019
3,Донецька,0,0,0,0,0,2019
4,Житомирська,8.4,19.9,-11.5,4.6,0,2019
...,...,...,...,...,...,...,...
70,Хмельницька,7,24.2,-17.2,4.3,0,2021
71,Черкаська,5.9,22.4,-16.5,2.6,0,2021
72,Чернівецька,9.9,17.1,-7.2,5.9,0,2021
73,Чернігівська,5.1,28.4,-23.3,3.3,0,2021


Лінійний графік, аналогічний до попереднього, але відображає приріст в сільській місцевості.

In [67]:
fig = px.line(df_village, x='рік', y='природний  приріст, скорочення (-)', color='регіон', title='Природній приріст сільського населення')
fig.layout.height = 800
fig.show()

В обох випадках міської та сільскї місцевості, індекс природнього приросту населення за досліджувані роки є відʼємним. Що ще важливіше, з кожним роком він все знижується.

# Висновок

Отож, що ми побачили з нашого дослідження:

1) На жаль, ще й до повномасштабного вторгнення приріст населення з кожним роком все більше знижувався.
2) Це зумовлено такими факторами, як висока смертність та значна міграція.
3) Найчастіше високу смертність зумовлює ІХС. Це означає, що для його зменшення потрібно покращувати рівень медицини, а також стимулювати здоровий спосіб життя. 
4) Також кількість міського населення стабільно зростає, у той час як кількість сільського - спадає. Це відбувається тому, що працездатне населення часто переїжджає із села в місто, шукаючи більших можливостей самореалізації.
5) Стосовно етнічного складу, то він змінюється, проте з невеликими темпами. 