### Tiedekurssin malliraportti

# Onko demokratialla ja naisten oikeudella uudelleenavioitua yhteys?

## 1. Alustus ja hypoteesi

Muotoile alustava tutkimuskysymys – mitä haluaisit tietää tai selvittää? Mistä lähdet etsimään asiaan liittyvää dataa? Minkälaista dataa löysit? Nyt muodosta lopullinen tutkimuskysymys löytämäsi datan perusteella, mihin kysymykseen voit saada suoran vastauksen käsissäsi olevan datan avulla?

Mietitään tutkimuskysymyksen hypoteesi valmiiksi – minkälaisen lopputuloksen ajattelet saavasi? Mihin nämä ajatukset tai oletukset perustuvat? Miten erilaiset asiat linkittyvät toisiinsa (esimerkiksi tässä tapauksessa naimisiinmeno ja demokratia), onko niillä yhteys? Minkälaiset tekijät tulee ottaa huomioon tätä kysymystä tutkiessa?

Esittele tässä myös tutkimuksesi välivaiheet – minkälaista tietoa tarvitset ensin, mihin edetään loppua kohden?

<font color='darkblue'>
(Lähdin miettimään, että onkohan demokratialla ja naisten oikeuksilla yhteys. Selasin databank.worldbank.org -nettisivuja, että minkälaista mielenkiintoista dataa olisi tarjolla, kunnes keksin oman tutkimuskysymykseni.)
    
Tässä raportissa pohditaan, vaikuttaako naisten oikeuteen mennä uudestaan naimisiin valtion valtiojärjestys. Naisten oikeutta avioitua uudelleen verrataan miesten oikeuteen tehdä samoin. Tarkastellaan, onko valtiojärjestystä muuttaneiden valtioiden keskuudessa havaittavissa muutosta naisten oikeuksissa uudelleenavioitua, sekä onko demokraattisilla valtioilla yleisempää uudelleenavioitumisen tasa-arvoisuus.
    
Demokratia, eli kansantasavalta, on poliittinen järjestelmä, jossa kansalla on oikeus vaikuttaa valtion yhteisiin asioihin joko suoraan, tai valitsemalla vaalien avulla kansan joukosta edustajat. [1] Tässä raportissa viitataan ei-demokratiana valtioihin, jotka pohjautuvat oligargiaan, autokratiaan, teokratiaan tai anarkiaan, eikä niitä eritellä sen tarkemmin toisistaan. Pohdin, että vaikka avioliitolla on kirkollinen historia, demokraattiset valtiot ovat tunnettuja ihmisoikeuksien ajamisesta. Tasa-arvoinen oikeus uudelleenavioitua voisi siis liittyä demokraattiseen valtiojärjestykseen.
    
Tämän pohdinnan tueksi tarvitsen muutamia erilaisia kuvaajia – maailmankartan, jossa näytetään demokratian levinneisyys nykyhetkessä; maailmankartan, jossa näytetään uudelleenavioitumisen tasa-arvoisuus nykyhetkessä; sekä kuvaajat, joissa näytetään valtioikohtaisesti mahdollinen demokratian alkamisvuosi sekä mahdollinen uudelleenavioitumisen tasa-arvoistumisen muutosvuosi. Näiden kuvaajien avulla voin tarkastella, löytyykö näiden kahden aiheen väliltä yhteys.
</font>

## 2. Datan käsittely

Tehdään halutut laskut, kuvaajat ja taulukot, joita halutaan tarkastella tämän kysymyksen tiimoilta. Mieti jokaisen kuvaajan / taulukon kohdalla, minkälaista uutta tietoa tämä antaa sinulle.

### 2.1 Alustus

In [None]:
# Analyysiin tarvittavat kirjastot. 
import pandas as pd
import numpy as np
import geopandas as gpd
import matplotlib.pyplot as plt

In [None]:
# Luetaan geometrinen data valtioille ja tallennetaan tiedot muuttujaan 'world'
world = gpd.read_file(gpd.datasets.get_path('naturalearth_lowres'))

# Tulostetaan muutama ensimmäinen rivi datasta
print(world.head())

In [None]:
# Piirretään maailmankartta, niin nähdään että kaikki toimii niin kuin pitääkin.
world.plot()

### 2.2 Demokratia-aineiston käsittely

In [None]:
# Käsitellään ensin demokratia-aineistoa. Muokataan datasettiä niin, että saadaan ymmärrys siitä,
# kuinka laajasti demokratia on levinnyt maailmalla.

# Ensin ladataan tiedosto ja tiputetaan ylimääräiset sarakkeet pois.
demokratia = pd.read_csv('https://raw.githubusercontent.com/opendata-education/Maantiede/main/materiaali/data/age-of-electoral-democracy.csv')
demokratia.drop('Code', inplace=True, axis=1)

# Jätetään ainoastaan vuoden 2020 tiedot valtiojärjestyksestä muuttujaan demokratia2020
demokratia2020 = demokratia.drop_duplicates(
  subset = ['Entity'],
  keep = 'last').reset_index(drop = True)

# Muutetaan 'not an electoral democracy' -sarakkeet luvuksi 0.
demokratia2020.loc[demokratia2020['Age of electoral democracy'] == 'not an electoral democracy', 
                   'Age of electoral democracy'] = 0
# Muutetaan tarpeelliset valtiot samannimisiksi eri listoissa
demokratia2020.loc[demokratia2020['Entity'] == 'United States', 
                   'Entity'] = 'United States of America'

# Muutetaan Age of electoral democracy -sarakkeen luvut numeroiksi
demokratia2020['Age of electoral democracy'] = pd.to_numeric(demokratia2020['Age of electoral democracy']
                                                             , errors='coerce')

# Yhdistetään demokratia2020 -tiedot world-tietoihin
data = world.merge(demokratia2020, left_on='name', right_on='Entity')

# congo = demokratia2020.loc[demokratia2020['Entity']=='Congo'] # tällä voidaan tarkistaa jos joku maa puuttuu


In [None]:
# Piirretään kuvaaja, jossa tumman sininen edustaa vanhempaa historiaa demokratiana ja tumman punainen edustaa
# ei-demokratiaa.

data.plot(column='Age of electoral democracy', figsize=(50,20), cmap='coolwarm_r', legend=True, k=10) # 10 väriä
plt.title("Kuva 1: Valtioiden demokratian ikä vuosina vuonna 2020. \n", fontsize = 20);

# Kongon, Ugandan ja Keski-Afrikan tasavallan tiedot ei tule, syy epäselvä.

### 2.3 Uusavioliitto-aineiston käsittely

In [None]:
# Tehdään sama tarkastelu naimisiinmenosta. Ensin tarkastellaan vuoden 2020 tietoja.

# Luetaan tiedosto ja tiputetaan turhat sarakkeet pois.
naimisiin = pd.read_csv('https://raw.githubusercontent.com/opendata-education/Maantiede/main/materiaali/data/rights-to-remarry.csv')
to_drop_2 = ['Series Name', 'Series Code', 'Country Code']
naimisiin.drop(to_drop_2, inplace=True, axis=1)

# Muutetaan .. -tiedot NaN:ksi. Lisäksi muutetaan eriävät valtioiden nimet samoiksi.
naimisiin = naimisiin.replace('..',np.nan)
naimisiin.loc[naimisiin['Country Name'] == 'United States', 
                   'Country Name'] = 'United States of America'
naimisiin.loc[naimisiin['Country Name'] == 'Russian Federation', 
                   'Country Name'] = 'Russia'
naimisiin.loc[naimisiin['Country Name'] == 'Iran, Islamic Rep.', 
                   'Country Name'] = 'Iran'

# Kootaan muuttuja, jossa on vain valtioiden nimet ja vuoden 2020 tiedot numeroina.
naimisiin2020 = naimisiin[['Country Name', '2020 [YR2020]']]
naimisiin2020['2020 [YR2020]'] = pd.to_numeric(naimisiin2020['2020 [YR2020]']
                                                             , errors='coerce')
russia = naimisiin.loc[naimisiin['Country Name'] == 'Russia']

# Yhdistetään naimisiin2020 -tiedot world-tietoihin.
data_2 = world.merge(naimisiin2020, left_on='name', right_on='Country Name')

print(data_2)
print(data_2.dtypes)

In [None]:
# Piirretään kuvaaja, jossa tummansininen tarkoittaa miesten ja naisten kesken tasa-arvoista oikeutta
# uudelleenavioitua kyseisessä valtiossa. Punaisten valtioiden kohdalla naisilla ei ole samaa oikeutta
# kuin miehillä.

data_2.plot(column='2020 [YR2020]', figsize=(50,20), cmap='coolwarm_r', legend=True, k=2) # 2 väriä
plt.title("Kuva 2: Valtioiden tasa-arvoinen oikeus uudelleen avioitua vuonna 2020. \n", fontsize = 20);

### 2.4 Aineistojen muutosvuosien käsittely

In [None]:
# Tarkastellaan sitä hetkeä, kun valtiot ovat muuttuneet demokratioiksi.
# Tämä voidaan tehdä yksinkertaisimmillaan esimerkiksi niin, että tallennetaan valtioiden viimeinen vuosi
# ei-demokratiana. Yksinkertaisuuden vuoksi jätetään huomiotta valtiot, jotka ovat olleet demokratioita koko ajan.

# Muistiin: asioita joita ei huomioida: valtiot jotka on muuttunu diktatuuri - demokratia - diktatuuri jne.
# Huomioidaan vain siis viimeisin muutos! Valtiot kuten Albania on voinut olla demokraattisia välissä.


# Tallennetaan muuttujaan ne valtiot, jotka ovat olleet ei-demokratioita jossain vaiheessa tarkasteluajanjaksolla,
# sekä kyseisen valtion viimeisen vuosi ennen demokratiaa.
demokratia_alku = demokratia[(demokratia['Age of electoral democracy']=='not an electoral democracy')]
demokratia_alku = demokratia_alku.groupby(['Entity', 'Age of electoral democracy']).last().reset_index()
demokratia_alku['Year'] = pd.to_numeric(demokratia_alku['Year']
                                                             , errors='coerce')

demokratia_alku.head(10)


In [None]:
# Tehdään muuttuja, joka sisältää sen vuoden, jolloin uudelleenavioliitto on muuttunut epätasa-arvoisesta 
# tasa-arvoisempaan, eli jolloin naisella ja miehellä on ollut samat oikeudet. Ne valtiot, joilla on ollut koko
# tarkastelujakson ajan tasa-arvoiset oikeudet tässä asiassa, näkyvät kuvaajassa muutosvuotena 2020.

# Muokataan datatiedostoa niin, että useamman sarakkeen sijasta sillä on vain kaksi saraketta.
# Muutetaan .. - arvot NaN-arvoiksi
# Säilytetään ainoastaan ne rivit, jolloin on ollut viimeinen vuosi ennen tasa-arvoisempaa uusavioliitto-oikeutta.
naimisiin_muutos = naimisiin.melt(id_vars = ['Country Name'], value_name = 'arvo')
naimisiin_muutos = naimisiin_muutos.replace('..',np.nan)
naimisiin_muutos = naimisiin_muutos.groupby(['Country Name', 'arvo']).last().reset_index()
naimisiin_muutos = naimisiin_muutos.groupby(['Country Name']).first().reset_index()

# Poistetaan vuosiluvuosta vuositunnus.
naimisiin_muutos['variable'] = naimisiin_muutos['variable'].str[:4]
naimisiin_muutos['variable'] = pd.to_numeric(naimisiin_muutos['variable']
                                                             , errors='coerce')

# Yhdistetään demokratian alku-tiedot uusavioliiton muutos-tietoihin.
data_3 = demokratia_alku.merge(naimisiin_muutos, left_on='Entity', right_on='Country Name', how='left')
data_3 = data_3.dropna().reset_index()

# data_3 sisältää 153 riviä dataa. Käsittelyn helpottamiseksi jaetaan se neljään osaan.
osa_1 = data_3.iloc[:50,:];
osa_2 = data_3.iloc[50:100,:];
osa_3 = data_3.iloc[100:153,:];


In [None]:
plt.subplots(figsize = (30,10))

# Piirretään kuvaajat kaikista kolmesta osasta.

plt.subplot(311)
plt.plot(osa_1['Entity'], osa_1['Year'], alpha = 1, color='g', label='ei-demokratian loppuvuosi')
plt.plot(osa_1['Entity'], osa_1['variable'], alpha = 1, color='r', label='epätasa-arvoisen uudisavioliiton loppuvuosi')
plt.xticks(rotation=30, ha='right');
plt.legend(loc = "lower left", fontsize = 16)
plt.xlabel('Valtion nimi')
plt.ylabel('Vuosi')

plt.title("Kuva 3: Valtiokohtaiset muutokset valtiojärjestyksen ja tasa-arvoisen uudisavioliitto-oikeuden osalta. \n", fontsize = 20)

plt.subplot(312)
plt.plot(osa_2['Entity'], osa_2['Year'], alpha = 1, color='g', label='ei-demokratian loppuvuosi')
plt.plot(osa_2['Entity'], osa_2['variable'], alpha = 1, color='r', label='epätasa-arvoisen uudisavioliiton loppuvuosi')
plt.xticks(rotation=30, ha='right');
plt.legend(loc = "lower left", fontsize = 16)
plt.xlabel('Valtion nimi')
plt.ylabel('Vuosi')

plt.subplot(313)
plt.plot(osa_3['Entity'], osa_3['Year'], alpha = 1, color='g', label='ei-demokratian loppuvuosi')
plt.plot(osa_3['Entity'], osa_3['variable'], alpha = 1, color='r', label='epätasa-arvoisen uudisavioliiton loppuvuosi')
plt.xticks(rotation=30, ha='right');
plt.legend(loc = "lower left", fontsize = 16)
plt.xlabel('Valtion nimi')
plt.ylabel('Vuosi')

plt.tight_layout(h_pad=2)


In [None]:
# Kokeillaan vaihtoehtoista kuvajaa pylväsdiagrammina, jos se olisikin selkämpi kuin ensimmäinen yritys.

osa_1.plot(x='Entity', y=['Year', 'variable'], figsize = (30,10), kind="bar")
plt.ylim(1800, 2025)
plt.xticks(rotation=30, ha='right');

plt.title("Kuva 4: Valtiokohtaiset muutokset valtiojärjestyksen ja tasa-arvoisen uudisavioliitto-oikeuden osalta. \n", fontsize = 20)

osa_2.plot(x='Entity', y=['Year', 'variable'], figsize = (30,10), kind="bar")
plt.ylim(1800, 2025)
plt.xticks(rotation=30, ha='right');

osa_3.plot(x='Entity', y=['Year', 'variable'], figsize = (30,10), kind="bar")
plt.ylim(1800, 2025)
plt.xticks(rotation=30, ha='right');


## 3. Analyysi

Analysoi tekemiäsi kuvaajia ja taulukoita, minkälaiseen tulkintaan päädyt? Oliko lopputulos hypoteesin mukainen vai ei? Mikä voisi perustella saadun lopputuloksen? Voitko kenties antaa jotain tarkentavia laskuja kuvaajiesi tueksi?

Ohjeita:
- Viittaa kuvaajiin ja taulukoihin oikealla tavalla, kun puhut niistä
- Selitä auki esimerkiksi yksiköt ja muut ymmärtämisen kannalta oleelliset asiat

<font color='darkblue'>
Tässä raportissa analysoitiin yhteyttä demokratian ja tasa-arvoisen uudisavio-oikeuden välillä. Kuvasta 1 huomataan, että vuonna 2020 ei-demokraattiset valtiot keskittyvät Aasian ja Afrikkaan, kun taas demokraattisia valtioita on enemmistö Euroopassa, Etelä- ja Pohjois-Amerikassa sekä Australiassa. Kaikista vanhimpana demokraattisena alueena esiintyy Australia, jota seuraavat Pohjois-Amerikka sekä Euroopan pohjoisosa.
    
Vastaavasti Kuvasta 2 huomataan, että naisten samanarvoinen oikeus uudelleenavioitua miehiin verrattuna ei täyty Pohjois-Afrikassa, Lähi-Idässä, Kaakkois-Aasiassa sekä yksittäisissä Etelä-Amerikan valtioissa ja Italiassa. Näitä kahta kuvaajaa vertailemalla voidaan todeta, että jonkinasteista päällekkäisyyttä on havaittavissa – suurin osa niistä valtioista, joissa tasa-arvoinen uudelleenaviointioikeus ei täyty, ei ole myöskään demokraattisia valtioita.
    
Jotta voidaan tarkastella onko näillä kahdella asialla yhteys toisiinsa, tarkastellaan Kuvaajaa 3. Jotta voitaisiin todeta, että tämmöinen yhteys olisi olemassa, niin niiden valtioiden kohdalla, joiden valtiojärjestys on muuttunut ei-demokratiasta demokratiaan, pitäisi löytyä muutamaa vuotta myöhemmin tapahtunut muutos uudelleenavio-oikeuden kohdalla. Kuvaajasta 3 nähdään, että yksittäisten valtioiden kohdalla tämä pitää paikkaansa – esimerkiksi Itävallassa, Belgiassa, Brasiliassa, Kolumbiassa, Kreikassa, Espanjassa ja Meksikossa.
    
Tässä analyysissa jätetään huomioimatta ne valtiot joista ei löytynyt dataa jommasta kummasta aiheesta. Lisäksi jätetään huomioimatta ne valtiot, jotka ovat vaihdelleet demokratian ja ei-demokratian väliltä – ainoastaan viimeisin muutos demokratiaksi on otettu tarkasteluun. Myös osan Afrikan valtioiden tietoja ei onnistuttu ottamaan mukaan kuvaajiin 1 ja 2.
<font/>

## 4. Luotettavuuden arviointi

Raportissa on hyvä pohtia omien tulosten luotettavuutta. Voit miettiä tässä kohdassa seuraavia kysymyksiä:
- Mistä saamasi data on peräisin? Kuinka luotettava lähde on, esimerkiksi millä tavalla tiedot on kerätty ja onko datan takana jokin maksava asiakas?
- Poikkeaako data yleisestä ymmärryksestä? Voisiko joku tietty taho hyötyä tästä tiedosta?
- Miltä tekemäsi kuvaajat ja taulukot vaikuttavat? Mitä lukija voi ymmärtää pelkästään niitä tarkastelemalla? Onko lukuarvojen suuruuden järkeviä (esimerkiksi litran maitopurkissa ei voi olla sataa litraa nestettä)?
- Löytyykö netistä muita tutkimuksia tai artikkeleita, jotka käsittelevät tai sivuavat tätä aihetta? Onko siellä saadut tulokset kanssasi samaa vai eri mieltä? 
- Omien laskujen oikeellisuus – pohdi, minkälaisia laskuvirheitä tai tulkintavirheitä datan käsittelysi tai analyysisi voi sisältää.
- Tuo selkeästi ilmi ne (erikois)tilanteet, jotka jouduit jättämään pois käsittelystä. Mitä kaikkea tässä ei otettu huomioon?

<font color='darkblue'>
Tulosten luotettavuuden parantamiseksi tarvittaisiin lisää kuvaajia sekä laskuja, jotka havainnollistaisivat tarkemmin eri valtioiden valtiojärjestyksen kytköksen uudisavio-oikeuksiin. Tämä voitaisiin tehdä niin, että tarkasteltaisiin valtioiden näitä tietoja myös muiden vuosien kohdalta, kuin vain vuodelta 2020. Lisäksi tarkempia laskuja voisi laskea esimerkiksi kuinka monta prosenttia valtioista, joiden valtiojärjestys muuttuu ei-demokratiasta demokratiaksi, muuttavat uudisavio-oikeuden tasa-arvoisemmaksi.
    
Tämän raportin data on peräisin avointa dataa tarjoavilta nettisivuilta [2][3]. Kuvaajat vaikuttavat realistisilta, vaikkakin niiden toteuttamiseksi on jouduttu tekemään hyvinkin karkeaa karsintaa, mikä voi osaltaan vaikuttaa lopputulokseen lisäämällä epätarkkuutta. Tiedon käsittelyn vuoksi myös kaikki kiinnostavat valtiot, jotka ovat vaihtaneet valtiojärjestystä useamman kerran, on jouduttu jättämään pois. Näiden erillinen tarkastelu voisi tuoda lisää tietoa aiheesta. Kuvaajaa 3 varten tarvittavt tiedot olisi voinut myös käsitellä toisin päin, niin että kuvaajasta näkyisi valtion ensimmäinen vuosi demokratiana sekä ensimmäinen vuosi tasa-arvoisena uusavioliitto-oikeutena. Tämä todennäköisesti lisäisi kuvaajan ymmärrettävyyttä.
<font/>

## 5. Lopputulokset

Kasaa vielä selkeästi yhteen saamasi lopputulokset ilman analysointia.


<font color='darkblue'>
Hypoteesi toteutui tiettyjen Eurooppalaisten ja Etelä-Amerikkalaisten valtioiden kohdalla, kuten Itävallassa ja Brasiliassa. Kuitenkin suuremmassa osassa tarkasteluja valtioita hypoteesin mukaista oletusta ei voitu havaita.
<font/>

## 6. Lähteet

Muista merkitä lähteet
- käyttämällesi datalle (esimerkiksi nettisivu, keneltä data on peräisin)
- mikäli olet käyttänyt hypoteesissa / analyysissa / luotettavuuden arvioinnissa ulkopuolisia lähteitä

<font color='blue'>
[1] https://www.oph.fi/fi/oppimateriaali/miina-ja-ville-opettajan-oppaita/miina-ville-ja-kulttuurin-arvoitus-16
<br>
[2] https://ourworldindata.org/democracies-age
<br>
[3] https://databank.worldbank.org/source/gender-statistics#
</font>