In [None]:
library(jsonlite)
library(tidyverse)
library(ggplot2)
library(dplyr)

# Oppgave 1
# Importerer jsonfilen - lager det til et datasett

json <- "https://static01.nyt.com/newsgraphics/2021/12/20/us-coronavirus-deaths-2021/ff0adde21623e111d8ce103fedecf7ffc7906264/scatter.json"

# Gjør det om til et datasett og bruker fromJSON pga det er en jsonfil

df <- fromJSON(json)

# Lager et nytt navn til datasettet

COVID <- df

# Bruker mutate til å finne gjennomsnittlig prosent av full vaksinerte

COVID <- COVID %>% 
  mutate(fully_vaccinated = fully_vaccinated_pct_of_pop*100)

# Forkorter ned navnene for å få et bedre plott som er mer forståelig og pent

COVID <- COVID %>%
  mutate(short_name = abbreviate(COVID$name, minlength=2))

# Lager et plott som er tilnærmet lik det som er på nettsiden

COVID %>% ggplot(aes(x= fully_vaccinated, y= deaths_per_100k)) +
  geom_point(aes(colour=name)) + 
  geom_smooth(method="loess", se=F) +
  labs(title= "Covid-19 relaterte dødsfall i USA i forhold til vaksinerte og uvaksinerte", 
       x= "Prosent av populasjonen fullvaksinert", 
       y= "Dødsfall pr 100 000") +
  theme_gray()+ 
  geom_text(aes(label = short_name), adj = -0.2, cex = 3.5)+
  annotate("text", x= 60, y =17, 
           label = "      <-- Lower vaccination rate, 
higher death rate",
           col = "black",
           size = 4) +
  annotate("text", x= 73, y =9, 
           label = "       <--  Higher vaccination rate, 
lower death rate",
           col = "black",
           size = 4)+
  scale_x_continuous(breaks = c(45,50,55,60,65,70,75,80),
                     labels = function(x) paste0(x, "%"))


# Oppgave 2
# Bruker funksjonen lm funkjsonen til å finne standardavviket i plottet (Standardavviket er et mål for spredningen av verdiene i et datasett)

lm(deaths_per_100k ~ fully_vaccinated, data = COVID)

# Lager plott for standardavviket og et forbedret plott.

COVID %>% ggplot(aes(x= fully_vaccinated, y= deaths_per_100k)) +
  geom_point(aes(colour=name)) + 
  geom_smooth(method= lm) +
  labs(title= "Covid-19 relaterte dødsfall i USA i forhold til vaksinerte og uvaksinerte", 
       x= "Prosent av populasjonen fullvaksinert", 
       y= "Dødsfall pr 100 000") +
  theme_gray() +
  geom_text(aes(label = short_name), adj = -0.2, cex = 3.5)+
  annotate("text", x= 60, y =17, 
           label = "       <- Lower vaccination rate, 
higher death rate",
           col = "black",
           size = 4) +
  annotate("text", x= 73, y =9, 
           label = "       <- Higher vaccination rate, 
lower death rate",
           col = "black",
           size = 4)+
  scale_x_continuous(breaks = c(45,50,55,60,65,70,75,80),
                     labels = function(x) paste0(x, "%"))

