# Analys av könsfördelningen bland EU-kandidaterna
av [Anna Norberg](https://twitter.com/annanorberg)

Grunddata kommer från Valmyndigheten och har bearbetats något innan den läses in här. Bland annat har kolumnen "Kön" lagts till och beräknats utifrån personnummer. Om tredje siffran i de fyra sista siffrorna i personnumret är jämn har personen tilldelats könet "kvinna" och beteckningen "K" och om siffran är ojämn har personen tilldelats könet "man" förkortat "M".  

Resultatet av analysen har använts som underlag till en artikel som skickades ut till Nyhetsbyrån Sirens kunder den 25 mars 2019.

In [12]:
library(tidyr)
library(dplyr)
library(openxlsx)
library(readxl)

**Läs in Excelfilen.**

In [13]:
df1 <- read_excel("data/raw-kandidater2.xlsx", sheet=1)
head(df1)

Län,Kommun,Parti,Namn,Kön
Stockholms län,Stockholm,Liberalerna (tidigare Folkpartiet),Abdukadir Salad Ali,M
Södermanlands län,Katrineholm,Arbetarepartiet-Socialdemokraterna,Abdulahi Abdulle Hassan,M
Stockholms län,Stockholm,Centerpartiet,Abir Al-Sahlani,K
Stockholms län,Lidingö,Alternativ för Sverige,Adam Berg,M
Blekinge län,Karlskrona,Kristdemokraterna,Adam Jansson,M
Gävleborgs län,Hudiksvall,Moderaterna,Adam Rydstedt,M


**Beräkna andel kvinnor och andel män bland kandidaterna på kommunnivå.**

In [25]:
kommun <- df1 %>%  
group_by(Kommun) %>% 
summarize("Antal kvinnor"=sum(Kön=="K"),
          "Antal män"=sum(Kön=="M"),
          "Totalt"=sum(Kön=="K"|Kön=="M")) %>% 
    mutate(`Andel kvinnor (%)`=round((`Antal kvinnor`/Totalt)*100),
           `Andel män (%)`=round((`Antal män`/Totalt)*100))

In [26]:
head(kommun)

Kommun,Antal kvinnor,Antal män,Totalt,Andel kvinnor (%),Andel män (%)
Ale,,,,,
Alingsås,2.0,1.0,3.0,67.0,33.0
Alvesta,,,,,
Aneby,,,,,
Arboga,,,,,
Arjeplog,,,,,


**Beräkna andel kvinnor och andel män bland kandidaterna på länsnivå.**

In [27]:
lan <- df1 %>%
group_by(Län) %>%
summarize("Antal kvinnor"=sum(Kön=="K", na.rm=TRUE), 
          "Antal män"=sum(Kön=="M", na.rm=TRUE), 
          "Totalt"=sum(Kön=="K"|Kön=="M", na.rm=TRUE)) %>% 
    mutate(`Andel kvinnor (%)`=round((`Antal kvinnor`/Totalt)*100), 
           `Andel män (%)`=round((`Antal män`/Totalt)*100))

In [28]:
head(lan)

Län,Antal kvinnor,Antal män,Totalt,Andel kvinnor (%),Andel män (%)
Blekinge län,3,4,7,43,57
Dalarnas län,6,6,12,50,50
Gotlands län,6,3,9,67,33
Gävleborgs län,3,7,10,30,70
Hallands län,3,6,9,33,67
Ingen svensk adress,0,1,1,0,100


**Sortera efter andel kvinnor.**

In [29]:
lan <- arrange(lan, desc(`Andel kvinnor (%)`))
head(lan)

Län,Antal kvinnor,Antal män,Totalt,Andel kvinnor (%),Andel män (%)
Västmanlands län,7,2,9,78,22
Gotlands län,6,3,9,67,33
Örebro län,6,3,9,67,33
Uppsala län,9,7,16,56,44
Västerbottens län,10,8,18,56,44
Södermanlands län,6,5,11,55,45


**Beräkna andel kvinnor och andel män bland kandidaterna per parti.**

In [30]:
parti <- df1 %>% 
group_by(Parti) %>% 
summarize("Antal kvinnor"=sum(Kön=="K"), 
          "Antal män"=sum(Kön=="M"), 
          "Totalt"=sum(Kön=="K"|Kön=="M")) %>% 
    mutate(`Andel kvinnor (%)`=round((`Antal kvinnor`/Totalt)*100), 
           `Andel män (%)`=round((`Antal män`/Totalt)*100))  

In [31]:
head(parti)

Parti,Antal kvinnor,Antal män,Totalt,Andel kvinnor (%),Andel män (%)
,,,,,
Alternativ för Sverige,3.0,7.0,10.0,30.0,70.0
Arbetarepartiet-Socialdemokraterna,19.0,18.0,37.0,51.0,49.0
Centerpartiet,23.0,34.0,57.0,40.0,60.0
Direktdemokraterna,1.0,9.0,10.0,10.0,90.0
Djurens parti,3.0,2.0,5.0,60.0,40.0


**Sortera efter andel kvinnor.**

In [32]:
parti <- arrange(parti, desc(`Andel kvinnor (%)`))
head(parti)

Parti,Antal kvinnor,Antal män,Totalt,Andel kvinnor (%),Andel män (%)
Vänsterpartiet,24,14,38,63,37
Djurens parti,3,2,5,60,40
Feministiskt initiativ,3,2,5,60,40
Miljöpartiet de gröna,21,19,40,52,48
Sverigedemokraterna,15,14,29,52,48
Arbetarepartiet-Socialdemokraterna,19,18,37,51,49


**Hur ser det ut totalt sett?**

In [33]:
riket <- df1 %>%
summarize("Antal kvinnor"=sum(Kön=="K", na.rm=TRUE), 
              "Antal män"=sum(Kön=="M", na.rm=TRUE), 
              "Totalt"=sum(Kön=="K"|Kön=="M", na.rm=TRUE)) %>% 
  mutate(`Andel kvinnor (%)`=round((`Antal kvinnor`/Totalt)*100), 
         `Andel män (%)`=round((`Antal män`/Totalt)*100))
head(riket)

Antal kvinnor,Antal män,Totalt,Andel kvinnor (%),Andel män (%)
191,229,420,45,55


**Sortera rådata efter län och kommun.**

In [36]:
df1 <- arrange(df1, Län, Kommun)

**Gör ny Excelfil med alla tabeller.**

In [40]:
wb<-createWorkbook()

addWorksheet(wb, "Per län")
addWorksheet(wb, "Per kommun")
addWorksheet(wb, "Per parti")
addWorksheet(wb, "Riket")
addWorksheet(wb, "Rådata")

writeData(wb, sheet="Per län", lan, startCol=1, startRow=5, rowNames=FALSE)
writeData(wb, sheet="Per kommun", kommun, startCol=1, startRow=5, rowNames=FALSE)
writeData(wb, sheet="Per parti", parti, startCol=1, startRow=5, rowNames=FALSE)
writeData(wb, sheet="Riket", riket, startCol=1, startRow=5, rowNames=FALSE)
writeData(wb, sheet="Rådata", df1, startCol=1, startRow=1, rowNames=FALSE)

titleStyle <- createStyle(fontSize=15, halign="left", textDecoration="bold", numFmt="@")
titlecells <- expand.grid(row=1:3, col=1)

addStyle(wb, "Per län", rows=titlecells$row, cols=titlecells$col, style=titleStyle)
addStyle(wb, "Per kommun", rows=titlecells$row, cols=titlecells$col, style=titleStyle)
addStyle(wb, "Per parti", rows=titlecells$row, cols=titlecells$col, style=titleStyle)
addStyle(wb, "Riket", rows=titlecells$row, cols=titlecells$col, style=titleStyle)

head1 <- c("Könsfördelningen bland EU-kandidaterna per län", "Källa: Valmyndigheten.", "Sorterat efter andel kvinnor.")
head2 <- c("Könsfördelningen bland EU-kandidaterna per kommun", "Källa: Valmyndigheten.", "Sorterat efter kommun i bokstavsordning.")
head3 <- c("Könsfördelningen bland EU-kandidaterna per parti", "Källa: Valmyndigheten.", "Sorterat efter andel kvinnor.")
head4 <- c("Könsfördelningen bland EU-kandidaterna", "Källa: Valmyndigheten.")

writeData(wb, sheet="Per län", head1)
writeData(wb, sheet="Per kommun", head2)
writeData(wb, sheet="Per parti", head3)
writeData(wb, sheet="Riket", head4)

headerStyle <- createStyle(fontSize=12, halign="left", textDecoration="bold")
addStyle(wb, 1, headerStyle, rows=5, cols=1:6, gridExpand=TRUE)
addStyle(wb, 2, headerStyle, rows=5, cols=1:6, gridExpand=TRUE)
addStyle(wb, 3, headerStyle, rows=5, cols=1:6, gridExpand=TRUE)
addStyle(wb, 4, headerStyle, rows=5, cols=1:5, gridExpand=TRUE)

nrStyle <- createStyle(numFmt="0")
addStyle(wb, 1, style=nrStyle, cols=6, rows=6:296, gridExpand=TRUE)
addStyle(wb, 2, style=nrStyle, cols=6, rows=6:296, gridExpand=TRUE)
addStyle(wb, 3, style=nrStyle, cols=6, rows=6:296, gridExpand=TRUE)
addStyle(wb, 4, style=nrStyle, cols=5, rows=6:296, gridExpand=TRUE)
addStyle(wb, 5, style=nrStyle, cols=5, rows=6:296, gridExpand=TRUE)

setColWidths(wb, sheet=1, cols=1:6, widths="25", ignoreMergedCells=TRUE)
setColWidths(wb, sheet=2, cols=1:6, widths="25", ignoreMergedCells=TRUE)
setColWidths(wb, sheet=3, cols=1:6, widths="25", ignoreMergedCells=TRUE)
setColWidths(wb, sheet=4, cols=1:6, widths="25", ignoreMergedCells=TRUE)
setColWidths(wb, sheet=5, cols=1:6, widths="25", ignoreMergedCells=TRUE)

saveWorkbook(wb, "output/kandidatergender.xlsx", overwrite=TRUE)