## 1. Swedish demographic data

In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns
import plotly_express as px

# a) Read in the table under "Befolkningsstatistik sedan 1900" into a DataFrame

# thousands=' ' to avoid ValueError: Unable to parse string "1 000" at position 0
swedish_demographics = pd.read_html("https://sv.wikipedia.org/wiki/Sveriges_demografi", decimal=',', thousands=' ')[5] 
swedish_demographics.head()

Unnamed: 0.1,Unnamed: 0,Medel- folkmängd,Födda,Döda,Naturlig befolkningsförändring,Nativitet (per 1000),Dödstal (per 1000),Naturlig befolkningsförändring (per 1000),Total fertilitet
0,1900,5117000.0,138139,86146,51993,27.0,16.8,10.2,4.02
1,1901,5156000.0,139370,82772,56598,27.0,16.1,11.0,4.04
2,1902,5187000.0,137364,79722,57642,26.5,15.4,11.1,3.95
3,1903,5210000.0,133896,78610,55286,25.7,15.1,10.6,3.82
4,1904,5241000.0,134952,80152,54800,25.7,15.3,10.5,3.83


In [2]:
swedish_demographics.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 122 entries, 0 to 121
Data columns (total 9 columns):
 #   Column                                     Non-Null Count  Dtype  
---  ------                                     --------------  -----  
 0   Unnamed: 0                                 122 non-null    int64  
 1   Medel- folkmängd                           122 non-null    float64
 2   Födda                                      122 non-null    int64  
 3   Döda                                       122 non-null    int64  
 4   Naturlig befolkningsförändring             122 non-null    int64  
 5   Nativitet (per 1000)                       122 non-null    float64
 6   Dödstal (per 1000)                         122 non-null    float64
 7   Naturlig befolkningsförändring (per 1000)  122 non-null    float64
 8   Total fertilitet                           121 non-null    float64
dtypes: float64(5), int64(4)
memory usage: 8.7 KB


In [3]:
swedish_demographics.shape

(122, 9)

In [4]:
# specify which columns and rows has missing values
swedish_demographics.isnull().sum()

Unnamed: 0                                   0
Medel- folkmängd                             0
Födda                                        0
Döda                                         0
Naturlig befolkningsförändring               0
Nativitet (per 1000)                         0
Dödstal (per 1000)                           0
Naturlig befolkningsförändring (per 1000)    0
Total fertilitet                             1
dtype: int64

In [5]:
swedish_demographics.describe()

Unnamed: 0.1,Unnamed: 0,Medel- folkmängd,Födda,Döda,Naturlig befolkningsförändring,Nativitet (per 1000),Dödstal (per 1000),Naturlig befolkningsförändring (per 1000),Total fertilitet
count,122.0,122.0,122.0,122.0,122.0,122.0,122.0,122.0,121.0
mean,1960.5,7457232.0,111240.901639,82102.581967,29162.663934,15.672131,11.27623,4.387705,2.253884
std,35.362409,1445365.0,14747.325631,9506.98773,18687.779132,4.64141,1.833168,3.36252,0.659067
min,1900.0,5117000.0,85020.0,63741.0,-6553.0,10.0,8.7,-0.7,1.5
25%,1930.25,6136250.0,98636.5,73334.25,15212.5,11.825,10.0,2.2,1.79
50%,1960.5,7500000.0,110981.0,80089.0,26784.5,14.35,10.8,3.45,2.0
75%,1990.75,8602739.0,121599.25,91151.25,43798.5,18.0,11.775,6.35,2.43
max,2021.0,10415810.0,139505.0,104594.0,64967.0,27.0,18.0,11.9,4.04


In [6]:
swedish_demographics.rename(columns={'Unnamed: 0': 'År'}, inplace=True)
swedish_demographics.head()

Unnamed: 0,År,Medel- folkmängd,Födda,Döda,Naturlig befolkningsförändring,Nativitet (per 1000),Dödstal (per 1000),Naturlig befolkningsförändring (per 1000),Total fertilitet
0,1900,5117000.0,138139,86146,51993,27.0,16.8,10.2,4.02
1,1901,5156000.0,139370,82772,56598,27.0,16.1,11.0,4.04
2,1902,5187000.0,137364,79722,57642,26.5,15.4,11.1,3.95
3,1903,5210000.0,133896,78610,55286,25.7,15.1,10.6,3.82
4,1904,5241000.0,134952,80152,54800,25.7,15.3,10.5,3.83


In [7]:
fig = px.line(
    swedish_demographics,
    x="År",
    y="Medel- folkmängd",
    title="Medel folkmängd i Sverige",
)
fig.show()


In [8]:
fig = px.line(
    swedish_demographics,
    x="År",
    y="Naturlig befolkningsförändring",
    title="Naturlig befolkningsförändring i Sverige",
)
fig.show()

In [13]:
fig = px.line(
    swedish_demographics,
    x="År",
    y=["Nativitet (per 1000)", "Dödstal (per 1000)"],
    title="Nativitet och dödstal i Sverige",
    labels={"value": "Antal per 1000", "variable": "År"},
)
fig.show()