# Viivakuvaaja 1 - data yhdeltä riviltä

### Tämä pohja on tehty sinulle muokattavaksi.

Usein esimerkiksi valtioihin liittyvät asiat ja erilaiset listaukset keskenään vertailtavista asioista, kuten ruoka-aineiden hiilidioksidipäästöistä, on annettu listattuna datatiedostona. Tällöin voidaan haluta nostaa sieltä yksi rivi kerrallaan tarkasteluun, ja kenties lisätä kuvaajaan toisen rivin tiedot vertailun vuoksi. Tässä käytetään esimerkkinä [täältä](https://www.gapminder.org/data/) löydettyä dataa, mistä nähdään valtiokohtaiset energiankulutukset asukasta kohden vuosina 1960 - 2015.

Voit käyttää tätä tiedostoa mallipohjana, jos haluat tehdä viivakuvaajan jonkin datatiedoston rivistä. Luet vain oman datatiedoston, muokkailet vähän muuttujien nimiä ja lisäät sopivat tekstit ympärille. Jos tulee ongelmia joihin ei Googlesta tunnu löytyvän vastausta, niin meille voi laittaa sähköpostia matalalla kynnyksellä. 

In [None]:
# Ladataan tietokirjastot käyttöön.

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

In [None]:
# Luetaan csv-tiedosto, joka on ladattu GitHubiin.
# Head-komennolla nähdään, miltä valittu datatiedosto näyttää.

energia_per_asukas = pd.read_csv('https://raw.githubusercontent.com/opendata-education/Harjoittelu/main/data/energy_use_per_person.csv')
energia_per_asukas.head()

In [None]:
# Tällä komennolla voidaan selvittää, millä rivillä haluttu maa on tässä tiedostossa.

energia_per_asukas.loc[energia_per_asukas['country'] == 'Finland']

In [None]:
# Valmistellaan kuvaajan x-akselin data, eli kerätään datatiedoston sarakkeiden otsikot yhteen listaan.
# np.float_ -komennon sijasta voi käyttää myös np.int_-komentoa. Tämän tarkoituksena on muuttaa listassa olevat
# numerot luvuiksi. Homma toimii oikein, kun vuosilukujen ympärille ei jää näitä '' hipsuja.

# values-komennon hakasulkeissa oleva [1:] tarkoittaa sitä, että valitaan sarakkeet numerosta 1 lähtien viimeiseen
# sarakkeeseen saakka. Koska ensimmäinen sarake on numero 0, niin tällä tavalla voidaan tiputtaa 'country'-sarake
# pois, koska sitähän me ei tässä tapauksessa haluta mukaan. Jos haluaisit valita esimerkiksi vuodet 1960-1969,
# komennoksi tulisi values[1:11].

vuosi = list(np.float_(energia_per_asukas.columns.values[1:]))
vuosi

In [None]:
# Valmistellaan y-akselin data. Valitaan loc-komennon hakasulkeisiin halutun maan rivinumero, joka
# selvitettiin aikaisemmin. Suomen tapauksessa siis 51.

suomi = energia_per_asukas.loc[51]
suomi = list(np.float_(suomi[1:]))
suomi

In [None]:
# Tiedot on kerätty, voidaan siis piirtää viivakuvaaja plt.plot(x,y) -komennolla.

plt.plot(vuosi, suomi)
plt.title('Otsikko')
plt.xlabel('x-akselin nimi')
plt.ylabel('y-akselin nimi')
plt.show()

#### Jos haluat lisätä toisen rivin tiedot kuvaajaan, tässä siihen koodi:

Vertaillaan suomalaisten energiankulutusta esimerkiksi intialaisten energiankulutukseen.

In [None]:
# Etsitään datatiedostosta Intia.

energia_per_asukas.loc[energia_per_asukas['country'] == 'India']

In [None]:
# Valmistellaan toinen y-akselin data, molemmilla on sama x-akselin data. 

intia = energia_per_asukas.loc[72]
intia = list(np.float_(intia[1:]))
intia

In [None]:
# Piirretään molemmat viivat, lisätään halutut värit ja viivojen nimet.

plt.plot(vuosi, suomi, color='blue', label='Suomi')
plt.plot(vuosi, intia, color='red', label='Intia')

plt.title('Otsikko')
plt.xlabel('x-akselin nimi')
plt.ylabel('y-akselin nimi')

plt.legend() # Tulostaa viivojen nimet
plt.show()