# **Laboratorijska vježba 1**: Zadaci za samostalni rad
## **Podaci iz Svjetskog izvješća o sreći**

Svjetsko izvješće o sreći godišnja je publikacija Mreže rješenja za održivi razvoj Ujedinjenih naroda (engl. *United Nations Sustainable Development Solutions Network*). Sadrži članke i ljestvice nacionalne sreće na temelju ocjena vlastitog života ispitanika, koje izvješće također povezuje s različitim životnim čimbenicima.

U ovoj laboratorijskoj vježbi istražit ćemo sreću u različitim zemljama i povezana obilježja. Skupovi podataka koje ćemo koristiti dostupni su u *Data/happiness2020.csv* i *Data/countries_info.csv*.

U nastavku je dan sažetak stupaca (značajki) u skupu podataka:

**happines2020.csv**

*   country - naziv države
*   happiness_score - ocjena sreće
*   social_support - socijalna podrška (ublažavanje učinaka nejednakosti)
*   healthy_life_expectancy - očekivanji zdravi životni vijek
*   freedom_of_choices - sloboda donošenja životnih izbora
*   generosity - velikodušnost (milosrđe, volonteri)
*   perceptrion_of_corruption - percepcija korupcije
*   world_region - regija države u svijetu

**countries_info.csv**

*   country_name - naziv države
*   area - površina u kvadratnim miljama
*   population - broj stanovnika
*   literacy - postotak pismenih stanovnika




In [None]:
!head Data/countries_info.csv

In [None]:
import pandas as pd

DATA_FOLDER = 'Data/'

HAPPINESS_DATASET = DATA_FOLDER+"happiness2020.csv"
COUNTRIES_DATASET = DATA_FOLDER+"countries_info.csv"

## **Zadatak 1: Učitavanje podataka**

Učitajte 2 skupa podataka u Pandas DataFrame-ove (zvane *happiness* i *countries*) te prikažite prve retke. Koristite ispravnu metodu za učitavanje podataka i provjerite jesu li podaci u očekivanom formatu.

In [None]:
countries = pd.read_csv("Data/countries_info.csv", sep=',')
happiness = pd.read_csv("Data/happiness2020.csv", sep=',')
countries
happiness

## **Zadatak 2: Spajanje podataka**

Kreirajte DataFrame pod nazivom *country_features* spajanjem prethodno stvorena 2 DataFrame-a. Redak novog DataFrame-a mora opisivati sve značajke koje imamo o nekoj državi.


In [None]:
happiness.rename(columns={"country": "country_name"}, inplace=True)
happiness['country_name'] = happiness['country_name'].apply(str.lower)
country_features = pd.merge(countries, happiness)
country_features

## **Zadatak 3: Gdje su ljudi sretniji?**

Ispišite prvih 10 država na temelju njihove ocjene sreće (što je veća ocjena, država je sretnija).


In [None]:
country_features.sort_values(by=['happiness_score'], ascending=False).head(11)

Zanima nas u kojoj su regiji svijeta ljudi sretniji.

Izradite i ispišite DataFrame s:
1.   Prosječnom ocjenom sreće
2.   Brojem zemalja za svaku svjetsku regiju.

Poredajte rezultat da biste prikazali rangiranje sreće.

In [None]:
countries = pd.read_csv("Data/countries_info.csv", sep=',')
happiness = pd.read_csv("Data/happiness2020.csv", sep=',')
happiness.rename(columns={"country": "country_name"}, inplace=True)
happiness['country_name'] = happiness['country_name'].apply(str.lower)
region_happiness = pd.merge(countries, happiness)
region_happiness = region_happiness.groupby(region_happiness.world_region)
region_count = region_happiness['country_name'].count()
region_happiness_mean = region_happiness['happiness_score'].agg('mean')

In [None]:
region_count

In [None]:
region_happiness_mean

Najbolje rangirana regija ima samo nekoliko država! Koje su to i koji je njihov rezultat sreće?

In [None]:
happiest_region = region_happiness_mean.sort_values(ascending=False).head(1).index[0]
country_features.query('world_region == @happiest_region').loc[:, ['country_name', 'happiness_score']]

## **Zadatak 4: Koliko je svijet pismen?**

Ispišite nazive država s razinom pismenosti od 100%.

Za svaku zemlju ispište naziv i regiju svijeta u formatu: {ime regije}-{ime zemlje} ({ocjena sreće}).


In [None]:
literacy_rate = "100,0"
country_features.query('literacy == @literacy_rate').loc[:, ['world_region', 'country_name', 'happiness_score']]

Koliki je globalni prosjek razine pismenosti?

Izračunajte udio zemalja s razinom pismenosti ispod 50%. Ispišite vrijednost u postotcima, formatiranu s 2 decimale.

In [None]:
literacy_rate = "50,0"
number_of_countries_with_low_literacy_rates = len(country_features.query("literacy<=@literacy_rate"))
number_of_all_countries = len(country_features)

print("%.2f" % (number_of_countries_with_low_literacy_rates / number_of_all_countries *100))

Ispišite neobrađeni broj i postotak nepismenog svjetskog stanovništva.

## **Zadatak 5: Gustoća naseljenosti**

Dodajte DataFrame-u *country_features* novi stupac zvan *population_density* koji se dobije dijeljenjem stupca *population* sa stupcem *area*.

In [None]:
country_features['population_density'] = country_features['population']/country_features['area']
country_features

Koji je rezultat sreće za 3 države s najnižom gustoćom naseljenosti?

In [None]:
country_features.sort_values('population_density').head(3)['happiness_score']

## **Zadatak 6: Zdravi i sretni?**

Iscrtajte na raspršeni dijagram (engl. *scatter plot*) ocjenu sreće (x os) i očekivano trajanje zdravog života (y os).

In [None]:
country_features.plot.scatter(x='happiness_score', y='healthy_life_expectancy')