# Inspirationsuppgift: Plottar med Gapminder-data


I denna uppgift ska vi jämföra olika länders koldioxidutsläpp och några olika sätt man kan mäta det på. 

Vi kommer inte förklara detaljerna i programmeringen, men du kommer se vad programmering kan användas till.

För att kolla på utsläppen måste vi först ladda ner data. Kör kodrutan nedan

In [None]:
#@title Ladda ner datafiler { display-mode: "form" }
import plotly.express as px
import plotly.graph_objects as go
import pandas as pd
import math
url_pop = 'https://raw.githubusercontent.com/open-numbers/ddf--gapminder--population_historic/master/ddf--datapoints--population_total--by--geo--time.csv'
url_co2_ton_per_cap = 'https://raw.githubusercontent.com/open-numbers/ddf--gapminder--co2_emission/master/ddf--datapoints--co2_emissions_tonnes_per_person--by--country--year.csv'
url_income_ppp = 'https://raw.githubusercontent.com/open-numbers/ddf--gapminder--gdp_per_capita_cppp/master/ddf--datapoints--income_per_person_gdppercapita_ppp_inflation_adjusted--by--geo--time.csv'
url_country_co2_year = 'https://raw.githubusercontent.com/open-numbers/ddf--gapminder--co2_emission/master/ddf--datapoints--yearly_co2_emissions_1000_tonnes--by--country--year.csv'
url_kumu_co2 = 'https://raw.githubusercontent.com/open-numbers/ddf--gapminder--co2_emission/master/ddf--datapoints--cumulative_co2_emissions_tonnes--by--country--year.csv'
url_country_info = 'https://raw.githubusercontent.com/open-numbers/ddf--open_numbers/master/ddf--entities--geo--country.csv'

co2_per_cap = pd.read_csv(url_co2_ton_per_cap, error_bad_lines=False)
income_per_cap = pd.read_csv(url_income_ppp, error_bad_lines=False)
country_co2 = pd.read_csv(url_country_co2_year, error_bad_lines=False)
country_population = pd.read_csv(url_pop, error_bad_lines=False)
kumu_co2 = pd.read_csv(url_kumu_co2, error_bad_lines=False)
country_info = pd.read_csv(url_country_info, error_bad_lines=False)

country_info = country_info[['country', 'name', 'world_4region']]
income_per_cap = income_per_cap.rename(columns={'geo': 'country', 'time':'year', 'income_per_person_gdppercapita_ppp_inflation_adjusted': 'gdpPercap'})
income_per_cap = income_per_cap.merge(country_info, on='country')
co2_per_cap = co2_per_cap.rename(columns={'co2_emissions_tonnes_per_person': 'co2Percap'})
co2_per_cap = co2_per_cap.merge(country_info, on='country')
country_co2 = country_co2.merge(country_info, on='country')
country_co2 = country_co2.rename(columns={'yearly_co2_emissions_1000_tonnes': 'yearly_emissions_tonnes'})
country_co2['yearly_emissions_tonnes'] = country_co2["yearly_emissions_tonnes"].map(lambda x: round(x*1000))
kumu_co2 = kumu_co2.merge(country_info, on='country')
country_population = country_population.rename(columns={'time': 'year', 'geo': 'country', 'population_total': 'population'})

Vi börjar med att visa hela världens årliga utsläpp fram till 2014, den första datan började samlas in redan år 1800. 

Koden nedanför ritar upp ett stapeldiagram. Välj vilket år vi ska börja med genom att ändra värdet av variabeln `from_year`. Ta gärna ett år långt bak i tiden så ser du hela utvecklingen.

Resten av koden som står i rutan ritar upp grafen.

In [None]:
# skriv in ett årtal!
from_year = 1950

# välj ut år efter from_year
country_co2_from_year = country_co2[country_co2['year'] >= from_year] 

# skapa och rita figuren
fig = px.bar(country_co2_from_year, x="year", y="yearly_emissions_tonnes",
             labels={"yearly_emissions_tonnes": "co2-utsläpp i tusentals ton",
                     "year": "år"})
fig.update_traces(hovertemplate=None, hoverinfo='skip')
fig.show()

Ländernas utsläpp staplas på varandra i diagrammet, vilket resulterar i vita streck. Vi kan nu se hur koldioxidutsläppen har ändrat sig över åren. Hur ser utvecklingen ut?

Om du väljer ett år tidigt år kan du bland annat se att koldioxidutsläppen minskade kring 1990 och kring 1945. Kan du komma på någon bra förklaring till detta?

Enheten på y-axeln är tusentals ton, B står för miljarder. Kan du komma fram till hur ungefär hur mycket koldioxid vi släppte ut år 2014? Det är det sista året i grafen, ta bara fram en ungefärlig uppskattning.


<details>
<summary markdown="span">
Svar
</summary>
<p>
År 2014 släppte vi ut strax under 35 miljarder ton koldioxid.
</p>
</details>

Hur mycket blir det per person? Räkna med att det ungefär fanns 7 miljarder människor år 2014.

<details>
<summary markdown="span">
Svar
</summary>
<p>
Vi släppte ut cirka 5 ton per person under 2014
</p>
</details>


Vi ska nu kolla på vilket land som släppte ut mest under ett specifikt år med hjälp av ett cirkeldiagram. Sätt ett värde på variabeln `year` nedan. Förslagsvis kan du kolla på ditt födelseår.

In [None]:
#Testar att bli av med värden när man hovrar. Behövde göras med go istället för px.

year = 1992

# välj ut data från det valda året
country_co2_year = country_co2[country_co2['year'] == year]

total_co2 = sum(country_co2_year['yearly_emissions_tonnes'])

# rita ut cirkeldiagrammet
fig = go.Figure(data=[go.Pie(labels=country_co2_year['name'],
                             values=country_co2_year['yearly_emissions_tonnes'])])
fig.update_traces(hoverinfo='label+percent', textposition='inside', textinfo='percent')

fig.update_layout(
    title_text='Totalt utsläpp ' + str(total_co2) + ' ton CO2 år ' + str(year)
)
fig.show()

Vilket släppte ut mest koldioxid under för ditt år? Hovra över diagrammet för att se vilken tårtbit som tillhör vilket land. 

Vi ska nu kolla lite närmare på 2014. Byt ut `year` till 2014 och kör kodrutan igen. Vi ser då hur det såg ut under 2014.

Vilket land släppte ut mest under 2014? Hur mycket släppte de ut?

<details>
<summary markdown="span">
Svar
</summary>
<p>
Kina släppte ut mest, cirka 10 miljarder ton koldioxid.
</p>
</details>

# Kumulativa utsläpp

Från cirkeldigrammet över utsläppen för år 2014 verkar det kanske som att Kina är den största utsläppsboven. Den höga koldioxidhalten i atmosfären beror på att vi har släppt ut stora mängder koldioxid i över hundra år. 

Ett annat sätt att kolla på koldioxidutsläpp blir då att se på den totala mängden koldioxid varje land har släppt ut. Vi kallar detta för kumulativa koldioxidutsläpp. Som tidigare så visar vi utsläppen med ett cirkeldiagram. 



In [None]:
# välj ut kumulativa utsläpp fram till 2014
kumu_co2 = kumu_co2[kumu_co2['year'] == 2014]

# rita diagrammet
fig = px.pie(kumu_co2, values="cumulative_co2_emissions_tonnes", names='name')
fig.update_traces(textposition='inside', textinfo='percent')
fig.show()

Andelen ser nu annorlunda ut. Kina har forfarande stora utsläpp men USA står för den största delen med ett utsläpp på 376 miljarder ton. 

Vi ska nu kolla lite närmare på Storbritannien. Hur andel andel av utsläppen står Storbritannien för i den kumulativa datan? Hur stor är andelen för datan över 2014?

<details>
<summary markdown="span">
Svar
</summary>
<p>
Storbritannien stod för 1,23% av utsläppen år 2014 men hela 5,27% i den kumulativa datan. 
</p>
</details>

Kommer du på någon förklaring till detta?

<details>
<summary markdown="span">
Svar
</summary>
<p>
Ett möjligt förklaring är att Storbritannien, Tyskland och andra västeuropeiska länder industraliserades tidigt och har därför "hunnit" släppa ut mer koldioxid än länder som Indien, vars industrialisering kom senare.
</p>
</details>


# Utsläpp per capita

Nu ska vi kolla på hur mycket utsläpp som varje land släpper ut, per person. Välj igen ett år som du vill kolla på. 

In [None]:
# välj ett år!
year = 2014

# tar fram data för det valda året
co2_per_cap_year = co2_per_cap[co2_per_cap['year'] == year]

# ritar digrammet
fig = px.bar(co2_per_cap_year, x="name", y="co2Percap",
             labels={"yearly_emissions_tonnes": "co2-utsläpp i tusentals ton",
                     "year": "år"},
             color="world_4region")
fig.show()

Vad står färgerna för? 
<details>
<summary markdown="span">
Svar
</summary>
<p>
Vi delar upp världens länder i fyra delar: Afrika, Amerika (Syd- och nordamerika), Asien (med Australien) och Europa

Varje färg står för en sådan del. 
</p>
</details>

---
Testa några olika år. Kan du se några skillnader mot tidigare grafer? Vilka länder verkar släppa ut mest koldioxid per capita? Har de något gemensamt? 


Vi ska nu kolla på hur de olika länderna står sig mot hela världens medelvärde. Vi gör detta genom att dela upp länderna i två kategorier: de som släpper ut mer än medelvärdet per person och de som släpper ut mindre per person. 

Sedan visar vi detta på en karta där de olika kategorierna representeras av olika färger. 

Fyll i medelutsläppet i ton per år nedan, ändra alltså värdet på variabeln `average_co2`. 



In [None]:


# välj värdet som vi ska 
average_co2 = 5
co2_per_cap_year.loc[: , 'country'] = co2_per_cap_year['country'].map(lambda s: s.upper())
co2_per_cap_year['emission_category'] = co2_per_cap_year.apply(lambda row: 1 if row.co2Percap > average_co2 else 2, axis=1)

max_val = math.ceil(max(co2_per_cap_year['co2Percap']))
mid_val = co2_per_cap_year['co2Percap'].mean() / max_val
fig = px.choropleth(co2_per_cap_year, locations="country",
                    color="emission_category",
                    hover_name="co2Percap" # column to add to hover information
                    )
fig.update(layout_coloraxis_showscale=False)
fig.show()


Ser du några mönster? Finns det något gemensamt med länder som, per capita,  släpper ut mindre än medelvärdet? Hur är det med länder som släpper ut mycket per capita?

Något man måste tänka på är att denna data endast visar territoriella utsläpp, alltså utsläppen som sker inom ett lands gränser. När vi i Sverige köper en t-shirt som har tillverkats i Bangladesh så räknas de utsläpp som krävdes för att tillverka tröjan till Bangladeshs siffror. 

Om man istället skulle kolla på konsumptionsbaserade utsläpp så skulle länder som Sverige ligga över medelvärdet av utsläpp per capita.

# Avslutning

Vi har nu kollat på tre olika sätt man kan jämföra koldioxidutsläpp mellan länder: totala utsläpp, kumulativa utsläpp och per-capita utsläpp. 

