In [None]:
import pandas as pd
import altair as alt
import geopandas as gpd

In [None]:
world = gpd.read_file('world-countries.json')
df = pd.read_csv('population_prospects.csv')

In [None]:
df_2000 = df[(df['variant']=='Estimates') & (df['year']==2000)]
df_2100 = df[(df['variant']=='Medium variant') & (df['year']==2100)]
df_2100.columns = ['variant', 'country', 'country_code', 'parent_code', 'year','estimated_population']


In [None]:
df_with_estimated = df_2000.copy()
df_with_estimated = df_with_estimated.merge(df_2100[["country_code", "estimated_population"]], on= "country_code")
df_with_estimated.loc[df_with_estimated["country"] == "Russian Federation", "country"] = "Russia"

In [None]:
df_with_estimated.loc[:, 'difference_word'] = ''

df_with_estimated.loc[:, 'difference'] = ''

df_with_estimated['population'] = df_with_estimated.apply(lambda x: round(x['population']), axis=1)
df_with_estimated['estimated_population'] = df_with_estimated.apply(lambda x: round(x['estimated_population']), axis=1)

df_with_estimated['difference_word'] = df_with_estimated.apply(lambda x: 'more' if x['estimated_population']-x['population'] > 0 else 'less', axis=1)

df_with_estimated['difference'] = df_with_estimated.apply(lambda x: x['estimated_population']-x['population'], axis=1)



**- В яких країнах світу населення у 2100 році буде більшим, ніж було у 2000 році, а в яких меншим?**
Для цього питання я вирішила зробити просту візуалізацію та закодувати кольором лише три значення - населення виросте, населення зменшиться або населення не зміниться - та помітити на карті країни відповідними кольорами. Мінус такої візуалізації що вона взагалі ніяк не розказує нам на скільки зміниться населення. Для цього я зробила тултіп, що при наведенні на країну відповідно з'являється її назва та кількісна зміна в населенні.

In [None]:
alt.Chart(world).transform_lookup(
    lookup = 'name',
    from_ = alt.LookupData(data = df_with_estimated, 
                           key = 'country',
                           fields=['difference_word', 'country', 'difference']),
    default = 'null'
).project(type = 'equalEarth'
).mark_geoshape().encode(
    color = alt.Color('difference_word:N'),
    tooltip = [
        alt.Tooltip('country:N'),
        alt.Tooltip('difference:N')
    ]
).properties(width = 950, height = 500, background = '#F9F9F9', padding = 25)

In [None]:
df_with_estimated.loc[:, 'difference_percentage'] = ''
df_with_estimated['difference_percentage'] = df_with_estimated.apply(lambda x: 
                                                        round(100*(x['estimated_population']-x['population'])/x['population']), axis=1)


**- На скільки відсотків збільшиться або зменшиться населення кожної країни у 2100 році у порівнянні з 2000 роком?**
Для цієї візуалізації я вибрала кольорову схему turbo через те що в ній багато контрастних кольорів, що дозволяє дуже швидко зрозуміти в яких країнах як зміниться населення - одразу видно що в Африці населення дуже виросте. Недолік такої візуалізації в тому, що різниця між -50 та +50 відсотків населення не дуже помітна і розділити такі країни візуально доволі складно. 

In [None]:
alt.Chart(world).transform_lookup(
    lookup = 'name',
    from_ = alt.LookupData(data = df_with_estimated, 
                           key = 'country',
                           fields=['difference_percentage', 'country']),
    default = 'null'
).project(type = 'equalEarth'
).mark_geoshape().encode(
    color = alt.Color('difference_percentage:Q', scale = alt.Scale(scheme = 'turbo'), bin = alt.Bin(step = 50)),
    tooltip = [
        alt.Tooltip('country:N'),
        alt.Tooltip('difference_percentage:N')
    ]
).properties(width = 950, height = 500, background = '#F9F9F9', padding = 25)

**- Яким буде населення країн світу у 2100 році?**
Я вибрала такий самий графік та кольорову схему як у минулому питанні. Кольорова схема turbo містить в собі багато контрастних кольорів і гарно підходить для того щоб описувати великий інтервал чисел. Також на візуалізації є тултіпи - при наведенні на конкретну країну показується назва країни та прогноз кількості населення.

In [None]:
alt.Chart(world).transform_lookup(
    lookup = 'name',
    from_ = alt.LookupData(data = df_with_estimated, 
                           key = 'country',
                           fields=['estimated_population', 'country']),
    default = 'null'
).project(type = 'equalEarth'
).mark_geoshape().encode(
    color = alt.Color('estimated_population:Q', scale = alt.Scale(scheme = 'turbo'), bin = alt.Bin(step = 50)),
    tooltip = [
        alt.Tooltip('country:N'),
        alt.Tooltip('estimated_population:N')
    ]
).properties(width = 950, height = 500, background = '#F9F9F9', padding = 25)