# Valdeltagande i Sveriges riksdagsval 2018

I den här uppgiften ska vi kolla på statistik för valdeltagande i olika kommuner i Sveriges riksdagsval 2018. Alltså hur stor andel av de som fick rösta i varje kommun som faktiskt gjorde det. För att klara uppgiften behöver du ha lite koll på for-loopar och if-satser samt list-slicing.

![Bild på valsedlar](https://upload.wikimedia.org/wikipedia/commons/4/4f/Swedish_election_ballots_2014.jpg)
[Foto](https://sv.m.wikipedia.org/wiki/Fil:Swedish_election_ballots_2014.jpg) av SergeWoodzing / [CC BY-SA](https://creativecommons.org/licenses/by-sa/3.0/deed.sv)

Vi kommer att sortera datan dels efter valdeltagande, dels efter kommunnamn. Först görs detta med en egen algoritm, men vi kommer i slutet kolla på hur man kan göra samma sak med pythons inbyggda bibliotek.

# Ladda ner data

Vi börjar med att ladda ner data.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
!wget https://github.com/lunduniversity/schoolprog-satellite/raw/master/exercises/valdeltagande/valdeltagande_riksdagsval_2018.xlsx -q

voting='valdeltagande_riksdagsval_2018.xlsx'
df = pd.read_excel(voting, skiprows=3, nrows=290,usecols=[0,3,4])
tabell = df.values.tolist() #Skapar en matris med innehållet från excel-filen

# Ta bort kommunkoder som ligger före kommunnamnen.
for row in range(len(tabell)):
  tabell[row][0] = tabell[row][0][5:]
pd.DataFrame(tabell) #Printad som tabell

Nu har vi en tabell över valdeltagandet i valet 2018. Den första kolumnen visar kommunnamnet. Den andra kolumnen visar hur många som röstade i kommunen. Den tredje kolumnen visar antalet procent av de röstberättigade som röstade.

# Sortering

Vårt mål är att skapa en ny tabell sorterad efter hur många procent av de röstberättigade som röstade i varje kommun.

Först kopierar vi innehållet från `tabell` till `vote_sorted_tabell`. Innehållet är förstås inte sorterat än.

Sorteringen kan vi göra genom att först gå igenom hela listan och hitta kommunen med störst andel röstande, och lägga den kommunen först. Då vet vi att den ligger på rätt plats och kan bortse från den i fortsättningen. Vi går sedan igenom resterande kommuner och hittar kommunen med störst andel röstande utav dem, och lägger den på platsen precis efter den första och så vidare.

Detta kan vi också se som att vi har två index i varsin for-loop. Det första indexet går från vänster till höger. För varje steg av det första indexet går det andra indexet igenom listan till höger om det första och byter plats på element om de är i fel ordning jämfört med elementet vid det första indexet. Det vill säga om det högra elementet är större än det vänstra. Även om vi kanske inte på en gång lägger det största elementet på den första positionen, kommer vi ha gjort det när vi gått igenom hela listan med det andra indexet.

Koden med kopieringen och looparna finns redan. Du får i uppgift att skriva koden som byter plats på elementen om de är i fel ordning.

In [None]:
vote_sorted_tabell = tabell.copy()

# index1 till vänster, index2 går igenom listan till höger om index1.
for index1 in range(len(vote_sorted_tabell) - 1):
  for index2 in range(index1 + 1, len(vote_sorted_tabell)):
    
    # Skapa item1 och item2, elementen som ligger på index1 och index2 i vote_sorted_tabell 
    item1 = ???
    item2 = ???

    # Om item2 har större valdeltagande i procent än item1, byt plats på dem. Det vill 
    # säga stoppa in item2 på index1 och item1 på index2 i vote_sorted_tabell. 
    if ???:
      ???
      ???
  
# Kolla att sorteringen fungerade
print(vote_sorted_tabell)

<details>
<summary markdown="span">
Lösning
</summary>
<p>

```python
        item1 = vote_sorted_tabell[index1]
        item2 = vote_sorted_tabell[index2]
        # På index 2 ligger valdeltagandet i procent.
        if item2[2] > item1[2]:
          vote_sorted_tabell[index1] = item2
          vote_sorted_tabell[index2] = item1
```
</p>
</details>

Kör koden och kolla att sorteringen blir som du förväntar dig. Kommunen med högst valdeltagande ska hamna först. 

Försök förstå koden och varför sorteringen fungerar. Sorteringsalgoritmen är en modifierad Urvalssortering. Du kan läsa mer om urvalssortering på [Wikipedia](https://sv.wikipedia.org/wiki/Urvalssortering).

Nu när du har en sorterad lista kan du tydligare se vilka kommuner som har ett bra eller dåligt valdeltagande.

Vilken kommun har störst valdeltagande? Vilken kommun har minst valdeltagande?

In [None]:
print(???)

<details>
<summary markdown="span">
Tips
</summary>
<p>
Kolla i början och slutet av <code>vote_sorted_tabell</code>.
</p>
</details>

<details>
<summary markdown="span">
Svar
</summary>
<p>
Lomma har störst valdeltagande på 95%. Haparanda har minst på 76%. 
</p>
</details>

Kan du ta reda på vad mediantalet för valdeltagandet är?
Kolla på det första tipset om du inte vet vad median betyder.

In [None]:
print(???)

<details>
<summary markdown="span">
Tips 1
</summary>
<p>
Median kan ses som mittentalet. Det innebär att man sorterar talen och sen tar talet i mitten av den sorterade sekvensen. T.ex. om man har talen 3,7,1,4,10 så blir det sorterat 1,3,4,7,10. Då är 4 i mitten och därmed median. Om sekvensen har ett jämnt antal element så finns det två tal i mitten. Medianen blir då medelvärdet av dessa två.
</p>
</details>

<details>
<summary markdown="span">
Tips 2
</summary>
<p>
Vi har 290 kommuner totalt. Då är index 144 och 145 i mitten.
</p>
</details>

<details>
<summary markdown="span">
Svar
</summary>
<p>
Mediantalet är 88%. Det kan man komma fram till genom att skriva <code>print(vote_sorted_tabell[144])</code> och <code>print(vote_sorted_tabell[145])</code>. Båda värdena är 88%. Hade de varit olika hade vi behövt ta medelvärdet av de två mittentalen för att få mediantalet.
</p>
</details>

Nu vet du det högsta och lägsta valdeltagandet, samt medianen.

Tycker du att valdeltagandet var bra eller dåligt i Sverige? Vad kan det bli för problem i ett land om valdeltagandet är lågt? 

Ett av FNs globala mål handlar om att ha [fredliga och inkluderande samhällen](https://www.globalamalen.se/om-globala-malen/mal-16-fredliga-och-inkluderande-samhallen/). Ett sätt att se till att ha ett inkluderande samhälle är att så många som möjligt är med och bestämmer. 



## Sortera i bokstavsordning

Det kan vara svårt att hitta en specifik kommun i listorna. Om vi kunde sortera dem i bokstavsordning efter kommunnamn hade det varit lättare. Smidigt nog kan man jämföra strängar (text) på ungefär samma sätt som tal i python, fast man kollar då på bokstavsordningen. En sträng som är tidigare i bokstavsordning ses som mindre än en sträng som ska hamna senare.

In [None]:
print(5 < 7) #True
print(7 < 5) #False
print("hej" < "nej") #True
print("axy" > "zab") #False
print("a" < "b") #True

Använd din tidigare kod för att sortera på valdeltagande i kodrutan här nedanför. Ändra den så att den skapar en annan tabell `kommun_sorted_tabell` och sorterar på kommunnamn istället för valdeltagande. Eftersom `'a'` anses mindre än `'b'` ska vi nu lägga små istället för stora element i början av listan för att få en vanlig alfabetisk sortering.

In [None]:
kommun_sorted_tabell = tabell.copy()

# Avänd din tidigare kod men ändra så att det sorteras på kommun istället.


<details>
<summary markdown="span">
Lösning
</summary>
<p>

```python
kommun_sorted_tabell = tabell.copy()

# index1 till vänster, index2 går igenom listan till höger om index1.
for index1 in range(len(kommun_sorted_tabell) - 1):
  for index2 in range(index1 + 1, len(kommun_sorted_tabell)):
    
    item1 = kommun_sorted_tabell[index1]
    item2 = kommun_sorted_tabell[index2]

    # Om item2 har mindre kommun än item1 enligt alfabetisk ordning, byt plats på dem. Det vill 
    # säga stoppa in item2 på index1 och item1 på index2 i kommun_sorted_tabell. 
    if item2[0] < item1[0]:
      kommun_sorted_tabell[index1] = item2
      kommun_sorted_tabell[index2] = item1
  
# Kolla att sorteringen fungerade
print(kommun_sorted_tabell)
```
</p>
</details>

Nu borde det vara lättare för dig att hitta till exempel din egen kommun. Hur var valdeltagandet där?

# Pythons inbyggda sortering

Att själv implementera en sorteringsalgoritm när man programmerar är väldigt ovanligt. Oftast använder man en färdig sortering som tillhandahålls av språket eller något bibliotek man använder. Det är för att sorteringar kan bil ganska komplicerade om man vill att de ska vara så snabba som möjligt. I python finns det en funktion `sort` som kan hjälpa en med just detta.

Istället för att skriva sorteringen för kommuner som innan kan man göra på följande sätt:

In [None]:
kommun_sorted_tabell = tabell.copy()
kommun_sorted_tabell.sort()
print(kommun_sorted_tabell)

Det var ju smidigt. Men hur ska vi göra om vi vill sortera efter valdeltagande, som vi gjorde innan?

I den här sorteringen så sorterades raderna i tabellen automatiskt på det första elementet, det vill säga kommunen.

För att sortera på något annat måste man explicit berätta det. Det kan göras på följande vis:

In [None]:
def sorterings_nyckel(rad):
  return rad[2] #Sortera på valdeltagande

vote_sorted_tabell = tabell.copy()
vote_sorted_tabell.sort(key = sorterings_nyckel)
print(vote_sorted_tabell)

Vi skickar med en nyckel, `key`, som säger hur listan ska sorteras. Som nyckel skickar vi in `sorterings_nyckel`, som i sin tur talar om att listan ska sorteras på valdeltagande. `sort` får alltså en parameter `key` som är en funktion som anropas på varje element i listan. Sen sorteras elementen i listan på de returnerade värdena.

Listan blir nu sorterad med minst valdeltagande först. Det är för att python alltid sorterar i stigande ordning. Om vi vill ha det i minskande ordning kan vi använda ett litet knep: Vi byter tecken på värdena som `sorterings_nyckel` returnerar. Då blir stora tal, t.ex. 95, en nyckel som är mycket liten, -95.

In [None]:
def sorterings_nyckel(rad):
  return -rad[2] #Sortera på valdeltagande, vänd ordning

vote_sorted_tabell = tabell.copy()
vote_sorted_tabell.sort(key = sorterings_nyckel)
print(vote_sorted_tabell)

Notera att själva värdena i listan inte har bytt tecken. Det är för att nyckeln bara säger vad `sort` ska sortera på, det ändrar inte de faktiska elementen i listan. Det finns även en parameter `reverse` som vi kan använda för att vända på listan. Testa att ta bort minustecknet och ändra den 5:e raden till `vote_sorted_tabell.sort(key = sorterings_nyckel, reverse = True)`.

Som vi såg längre upp kunde vi strunta i att skicka parametern `key` till `sort`, så sorterades det på kommunnamn. Vi kan dock få det att sorteras på kommunnamn även om vi använder `key`. Fyll i vad som ska användas som nyckel så att listan blir sorterad i bokstavsordning.

In [None]:
def sorterings_nyckel(rad):
  return ??? #Hur ska vi sortera på kommunnamn?

kommun_sorted_tabell = tabell.copy()
kommun_sorted_tabell.sort(key = sorterings_nyckel)
print(kommun_sorted_tabell)

<details>
<summary markdown="span">
Lösning
</summary>
<p>

```python
def sorterings_nyckel(rad):
  return rad[0]
```
</p>
</details>

Kanske ser du att ändringarna vi gör här är ungefär samma som ändringarna från att sortera på valdeltagande till att sortera på kommunnamn när vi skrev sorteringen själv tidigare. Det är lite det som är poängen också. Till funktionen `sort` behöver man bara skicka hur listan ska sorteras, sen sköter `sort` själva sorteringen.

Som sista uppgift ska du få sortera kommunerna på total röstberättigad befolkning. Vi börjar som övning med att räkna ut den totala röstberättigade befolkningen för en kommun. I Borås var det 79845 som röstade, och 88% av de röstberättigade röstade. Hur många var röstberättigade i Borås?




In [None]:
#Kan skriva kod för att räkna om du vill

<details>
<summary markdown="span">
Tips
</summary>
<p>
Använd ett samband mellan antalet röstberättigade personer, antalet som röstat, och hur många procent av den röstberättigade befolkningen som röstat.
</p>
</details>

<details>
<summary markdown="span">
Svar
</summary>
<p>
79845*100/88 ≈ 90733 personer
</p>
</details>

Skriv nu kod som sorterar kommunerna efter hur stor röstberättigad befolkning de har. 

In [None]:
def sorterings_nyckel(rad):
  return ??? #Hur ska vi räkna ut hur många röstberättigade det är i varje kommun?

voters_sorted_tabell = tabell.copy()
voters_sorted_tabell.sort(key = sorterings_nyckel)
print(voters_sorted_tabell)

<details>
<summary markdown="span">
Lösning
</summary>
<p>
Det här blir stigande ordning. Vill man ha minskande ordning får man sätta in ett minustecken.

```python
def sorterings_nyckel(rad):
  return rad[1]*100/rad[2]
```
</p>
</details>

#Extrauppgift - Hitta på något att sortera på

Om du vill så kan du sortera på något mer sätt. Du får gärna hitta på någon sorteringsordning själv, du kan också prova något av dessa kluriga alternativ:

*   Sortera på ökande valdeltagande, men din egen kommun ska alltid hamna först.
*   Sortera i omvänd bokstavsordning, kommuner som börjar på "Ö" ska komma först.
*   Sortera i bokstavsordning, men det är i bokstavsordning för någon som läser alla ord baklänges. Kommuner som slutar på "a" ska komma först.
*   Sortera i ökande ordning på hur mycket valdeltagandet skiljer sig från median-valdeltagandet. Tips! `abs(a-b)` ger den positiva skillnaden mellan talen a och b i python. Minns du vad medianvärdet var?



In [None]:
def sorterings_nyckel(rad):
  return ??? #Gör en egen sortering!

my_sorted_tabell = tabell.copy()
my_sorted_tabell.sort(key = sorterings_nyckel)
print(my_sorted_tabell)

Du kan även göra sorteringen helt från grunden, som vi gjorde i början av uppgiften.

In [None]:
my_sorted_tabell = tabell.copy()

# index1 till vänster, index2 går igenom listan till höger om index1.
for index1 in range(len(my_sorted_tabell) - 1):
  for index2 in range(index1 + 1, len(my_sorted_tabell)):
    
    item1 = ???
    item2 = ???
 
    if ???:
      ???
      ???
  
# Kolla att sorteringen fungerade
print(my_sorted_tabell)

Vilket sätt att sortera tycker du är smidigast?

# Minns du vad du har gått igenom? Nu är det dags för ett quiz!

In [None]:
#@title Kör rutan för att öppna quizet!
!wget https://raw.githubusercontent.com/lunduniversity/schoolprog-satellite/master/for_developers/quiz.py --quiet
!wget https://raw.githubusercontent.com/lunduniversity/schoolprog-satellite/master/exercises/valdeltagande/quiz_valdeltagande.json --quiet
import json
import quiz

with open("quiz_valdeltagande.json") as f:
  quiz_dict = json.load(f)
quiz.main(quiz_dict)

Fördjupning / Projektidéer

*   Räkna ut hur många som var röstberättigade i hela Sverige år 2018
*   Kan du hitta siffror på hur valdeltagandet i Sverige sett ut de senaste valen? Hur har det förändrats?
*   Undersök valdeltagandet (voter turnout) i något annat land. 
*   Hitta siffror för valdeltagande i det senaste EU-valet. Vad tror du den stora skillnaden beror på?