# SOK-1006 V24
## Mappeoppgave 2 - Detaljhandel i Norge

## Teller 50% av karakteren i faget.

### Innleveringsfrist fredag 07. juni 2024 kl 14.00 i Wiseflow

### 1. Bakgrunn

Detaljhandel beskriver salg av varer til individer eller husholdninger. Her er en overskrift fra [Dagens Næringsliv, 27. mars 2024](https://www.dn.no/handel/ssb/shopping/marginal-oppgang-for-detaljhandelen/2-1-1618069)            


![image.png](attachment:938a8200-ce4f-45f8-ba99-b859e7fd9641.png)

Her nevnes både varehandelen, detaljhandelen og dagligvarer i samme sak. For å vite hvordan disse begrepene henger sammen må man vite noe om [Næringsgruppering](https://www.ssb.no/klass/klassifikasjoner/6/koder). Denne lenken fører til Næringsgrupperingen som brukes i Norge (SN2007). I kategori G finner man "Varehandel, reparasjon av motorvogner", og dersom du utvider gruppe G får man 3 nye undergrupper. Vi er interessert i undergruppe 47 - Detaljhandel, unntatt med motorvogner. Dersom du klikker på plusstegnet ved siden av tallet 47 får du opp nye undergrupper, og laveste gruppe beskrives med fem siffer. Ved å trykke på "i" ikonet kan du få informasjon om hva hver gruppe inneholder.       

I denne oppgaven skal vi beskrive detaljhandel i Norge, samt estimere en produktfunksjon for denne gruppen som vi skal bruke i videre analyse.


### 2. Instruksjoner og oppgaver

Mappeoppgaven besvares individuelt. Det er ikke tillatt å samarbeide med andre om utvikling av tekst og kode. Kode som du henter fra andre kilder må siteres - se [MIT retningslinjer](https://integrity.mit.edu/handbook/writing-code) som gir en god pekepinn. 

**ChatGPT/KI**          

Det er lov å bruke KI tjenester som ChatGPT til å renskrive tekst og/eller kode. Dersom du gjør dette **MÅ** du levere et appendiks til besvarelsen som viser hvordan du har brukt dette hjelpemidlet; du kan for eksempel beskrive hvordan du har gått frem, og liste opp de spørsmålene som du har brukt for å komme frem til din besvarelse. Dersom du ikke leverer et slikt appendiks er implikasjonen at du ikke har brukt KI som hjelpemiddel. Du er selv ansvarlig for å sjekke innholdet i besvarelsen fra KI-verktøyet (ikke alt er riktig!), og du må passe på at besvarelsen din flyter godt (det vil trekke ned dersom sensoren ser tydelige forskjeller mellom egen tekst og tekst som er generert av KI). [UiTs retningslinjer om KI og eksamen](https://uit.no/eksamen#modal_811784) gjelder.        

Dere skal levere tre ting i Wiseflow:      
- en GitHub lenke til en Jupyter notatblokk (eller annen kildefil) som inneholder både Python-kode og tekst      
- en PDF fil av Jupyter notatblokken (med evt appendiks om bruk av KI)
- en PDF fil med din analyse uten kode (dvs lag en Quarto fil som du kompilerer som PDF). **Denne skal være på maksimum 20 sider inkludert figurer**.           

Husk

1. å merke alle filene med ditt kandidatnummer.
2. å prøve å kompilere din notatblokk som PDF underveis (ikke vent til fristen nærmer seg!)    

### Oppgavene


#### Oppgave 1 - Kartlegging av detaljhandel i Norge

i) Gi en definisjon av detaljhandelen i Norge.      

ii) Finn data hos Statistisk sentralbyrå som beskriver utviklingen av detaljhandelen i Norge. Last ned disse ved hjelp av en API, og lag fine, illustrative figurer som du beskriver nøye. Tabell 12937 gir for eksempel data fra 2017-2022 om antall bedrifter, sysselsatte, omsetning og lønn, delt i region. *Husk å justere nominelle verdier for prisstigning over tid (i hele oppgaven)*. Mye data er ellers tilgjengelig fra [SSB sin side om varehandel](https://www.ssb.no/varehandel-og-tjenesteyting/varehandel).                 

iii) Se på [Tabell 07312, SSB](https://www.ssb.no/statbank/table/07312/) som viser omsetning i detaljhandel fra 2008-2023. Ved å velge "4-siffernivå" (47.xx) kan man se på utviklingen i detaljhandel av enkelte produkter (klær, kjøtt, aviser, brukte varer osv) samt netthandel (47.91).       

iiiA) Velg ut noen produkter og vis hvordan omsetning av disse har utviklet seg over tid. Prøve gjerne å gi en forklaring på denne utviklingen.        
iiiB) Vis hvordan netthandelen har utviklet seg over tid, samt hvilken andelen av den totale omsetningen for detaljhandel denne kategorien utgjør.      

For inspirasjon kan du se på [Store forskjeller mellom bransjene i detaljhandelen, SSB, 01.02.21](https://www.ssb.no/varehandel-og-tjenesteyting/artikler-og-publikasjoner/store-forskjeller-mellom-bransjene-i-detaljhandelen)



#### Oppgave 2 - Produktfunksjon for detaljhandel

I denne oppgaven skal du estimere en produktfunksjon for detaljhandel i Norge. Vi antar at produktfunksjonen tar Cobb-Douglas form:

\begin{equation}
   x = ZN^aK^{b}\;\;(1)
\end{equation}


hvor $x$ er enheter ferdigprodukt, $N$ er enheter arbeidskraft, $K$ er enheter kapital og $Z>0, a>0, b>0$ er konstante tall.



[Tabell 12910, SSB](https://www.ssb.no/statbank/table/12910/) inneholder data etter næring på blant annet Produksjonsverdi, Lønnskostnader og Bruttoinvesteringer (alle i mill NOK). Følgende kode kan brukes for å laste ned disse dataene for detaljhandel for 2022.

In [1]:
# last inn pakker

import json
import pandas as pd
import requests
from pyjstat import pyjstat

# Lim in PostUrl som spørringen skal postes mot
postUrl = "https://data.ssb.no/api/v0/no/table/12910/"

# spørring fra SSB

apiQuery = {
  "query": [
    {
      "code": "NACE2007",
      "selection": {
        "filter": "vs:NACE2007StrNaringUndGr",
        "values": [
          "47.111",
          "47.112",
          "47.190",
          "47.210",
          "47.220",
          "47.230",
          "47.241",
          "47.242",
          "47.251",
          "47.259",
          "47.260",
          "47.291",
          "47.292",
          "47.299",
          "47.300",
          "47.410",
          "47.420",
          "47.430",
          "47.510",
          "47.521",
          "47.522",
          "47.523",
          "47.524",
          "47.529",
          "47.531",
          "47.532",
          "47.533",
          "47.540",
          "47.591",
          "47.592",
          "47.593",
          "47.594",
          "47.599",
          "47.610",
          "47.620",
          "47.630",
          "47.641",
          "47.642",
          "47.650",
          "47.710",
          "47.721",
          "47.722",
          "47.730",
          "47.740",
          "47.750",
          "47.761",
          "47.762",
          "47.771",
          "47.772",
          "47.781",
          "47.782",
          "47.789",
          "47.791",
          "47.792",
          "47.799",
          "47.810",
          "47.820",
          "47.890",
          "47.911",
          "47.912",
          "47.913",
          "47.914",
          "47.915",
          "47.916",
          "47.917",
          "47.919",
          "47.990"
        ]
      }
    },
    {
      "code": "ContentsCode",
      "selection": {
        "filter": "item",
        "values": [
          "Produksjonsverdi",
          "Lonnskost",
          "BruttoInvesteringer"
        ]
      }
    },
    {
      "code": "Tid",
      "selection": {
        "filter": "item",
        "values": [
          "2022"
        ]
      }
    }
  ],
  "response": {
    "format": "json-stat2"
  }
}


# Funksjon for å konvertere uttrekket til 2 dataframes, tar 2 paramtre (SSB)

def apiToDataframe(postUrl, query):

    # postUrl som spørringen skal postes mot
    # Spørringen og endepunktet til API-et kan hentes fra Statistikkbanken.

    res = requests.post(postUrl, json=query)
    # legger resultat i ds. DS har i tillegg en del metadata
    ds = pyjstat.Dataset.read(res.text)
    # skriver resultatet til to dataframes
    # først dataframe med tekst
    df = ds.write('dataframe')
    # deretter dataframe med koder
    df_id = ds.write('dataframe', naming='id')
    # returnerer også ds i tilfelle en trenger metadata
    return df, df_id, ds


df, df_id, ds = apiToDataframe(postUrl, apiQuery)

df

Unnamed: 0,næring (SN2007),foretak/bedrift,statistikkvariabel,år,value
0,Butikkhandel med bredt vareutvalg med hovedvek...,Foretak,Produksjonsverdi (mill. kr),2022,52149.6
1,Butikkhandel med bredt vareutvalg med hovedvek...,Foretak,Lønnskostnader (mill. kr),2022,22215.3
2,Butikkhandel med bredt vareutvalg med hovedvek...,Foretak,Bruttoinvesteringer (mill. kr),2022,3807.0
3,Butikkhandel med bredt vareutvalg med hovedvek...,Bedrifter,Produksjonsverdi (mill. kr),2022,49435.7
4,Butikkhandel med bredt vareutvalg med hovedvek...,Bedrifter,Lønnskostnader (mill. kr),2022,21116.2
...,...,...,...,...,...
397,Detaljhandel utenom utsalgssted ellers,Foretak,Lønnskostnader (mill. kr),2022,532.4
398,Detaljhandel utenom utsalgssted ellers,Foretak,Bruttoinvesteringer (mill. kr),2022,83.3
399,Detaljhandel utenom utsalgssted ellers,Bedrifter,Produksjonsverdi (mill. kr),2022,1611.6
400,Detaljhandel utenom utsalgssted ellers,Bedrifter,Lønnskostnader (mill. kr),2022,532.0


#### Oppgave 2 fortsetter

Datasettet inneholder to rader for hver underkategori (én verdi for foretak, og én for bedrifter). Vi skal slå disse verdiene sammen, droppe et par overflødige kolonner, samt pivot slik at vi ender opp med et datasett som jeg har kalt `data`. (Jeg har også fjernet observasjoner som er null).



In [2]:
# slå sammen verdier for foretak og bedrift

df_sum = df.groupby(['næring (SN2007)', 'statistikkvariabel']).sum().reset_index()

# dropp kolonner

df_sum = df_sum.drop(columns=['foretak/bedrift', 'år'])

# pivot

df_pivot = df_sum.pivot_table(index='næring (SN2007)', columns='statistikkvariabel', values='value')

# lag en kopi av datasettet

data = df_pivot.copy()

# fjern rader med verdier lik 0

data = data.drop(data[data.eq(0).any(axis=1)].index)

#vis datasettet

data

statistikkvariabel,Bruttoinvesteringer (mill. kr),Lønnskostnader (mill. kr),Produksjonsverdi (mill. kr)
næring (SN2007),Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Butikkhandel ikke nevnt annet sted,189.3,2331.1,5892.0
Butikkhandel med antikviteter,0.1,30.4,110.1
Butikkhandel med apotekvarer,311.9,10713.4,18990.5
Butikkhandel med audio- og videoutstyr,31.6,398.8,848.6
Butikkhandel med bakervarer og konditorvarer,62.2,1282.5,2792.3
...,...,...,...
Postordre-/Internetthandel med helsekost,12.2,248.1,2111.4
"Postordre-/Internetthandel med tekstiler, utstyrsvarer, klær, skotøy, reiseeffekter og lærvarer",109.4,1137.9,6152.3
"Postordre-/internetthandel med bøker, papir, aviser og blader",6.1,114.6,483.2
Torghandel med andre varer,2.8,19.8,48.8


#### Oppgave 2 forsetter

Nå har vi et datasett med 61 observasjoner på 3 variabler. **For å besvare disse spørsmålene kan forelesningsnotater 10, 12 og 13 være til hjelp**.        

i) Bruk datasettet til å estimere $Z>0, a>0, b>0$ i (1), og forklar nøye hva hvert tall representerer. Forklar nøye hvordan du evt transformerer (1) før du estimerer.        

ii) Hva menes med skalautbytte, og hvordan kan man avgjøre skalautbytte for en produktfunksjon av type Cobb-Douglas?      

iii) Hvilken skalaegenskap har produktfunksjonen for detaljhandel som du har estimert? Hvordan forklarer du dette (dvs er svaret intuitivt rimelig utfra type næring som vanligvis har denne type skalautbytte)?          

iv) Hvilke svakheter har denne analysen?


#### Oppgave 3 - Tilbud til en gjennomsnittlig bedrift i denne næringsgruppe


Butikken "Helt midt på treet" er en ganske *gjennomsnittlig* bedrift i en bransje i detaljhandelen. I denne sammenhengen betyr gjennomsnittlig følgende:       

- $Z, a, b$ som du fant i oppgave 2 beskriver produktfunksjonen til bedriften.
- Én timeslønn i denne bedriften tilsvarer gjennomsnittet for detaljhandelen.
- På kort sikt har bedriften kapitalutgifter som tilsvarer gjennomsnittet for detaljhandelen.

I praksis betyr dette at du kan bruke dine estimat på $Z, a, b$ (ta 2 desimalplasser) som bedriftens produktfunksjon i (1), at timelønna er 287 kr i 2022, og at kapitalutgiften er gjennomsnittet av det som du har i datasettet (som du må finne). (Tabell 11421, SSB gir gjennomsnittlig månedslønn i 2022 for en ansatt i gruppe 47 Detaljhandel som 41 290 kr. SSB sier videre at en ansatt i full stilling arbeider 230 dager i året, som utgjør 19.2 dager i snitt pr måned, eller (19.2*7.5=) 144 timer pr måned).          

Vi går ut fra at "Helt midt på treet" har følgende produktfunksjon:


\begin{equation}
   y = ZL^aK_0^{b}\;\;(2)
\end{equation}

Her er $y$ *antall enheter produsert*, $L$ *antall timer arbeidskraft*, mens $K_0$ er kapitalutgiften til bedriften i mill. NOK. (Legg merke til at vi nå blander fysiske og monetære enheter).          

i) Skriv et uttrykk for bedriftens variable kostnader og totale kostnader på kort sikt som en funksjon av mengde produsert ($y$). (Som vi har sett før har Sympy problemer med å løse ligninger av formen $Y=\alpha X^\beta$ for $X$. Dette kan vi løse selv som $X=(\frac{Y}{\alpha})^{\frac{1}{\beta}}$).       

ii) Finn uttrykk for bedriftens grensekostnad og gjennomsnittskostnad (total og variabel).        

iii) Bruk ditt svar til ii) for å tegne bedriftens tilbudskurve i en figur. Forklar figuren nøye.        

iv) Anta at lønnsoppgjøret gir arbeidere i "Helt midt på treet" en lønnsøkning på 5%. Vis hvordan dette påvirker bedriftens tilbud, og forklar intuisjonen bak endringen.


### 3. Bedømmelse

Formålet med oppgaven er å gi dere trening i å

- kartlegge en næringsgruppe

- finne og anvende data, samt lage figurer ved hjelp av Python-kode

- operasjonalisere mikroøkonomiske begrep, teori og data i en selvstendig analyse

- gi presiser forklaringer på utføringen av formell mikroøkonomisk analyse, og trekke konklusjoner basert på analysen.


Oppgaven bedømmes ut fra følgende kriterier:

1. evne til å gi kortfattede og presise definisjoner av grunnbegreper i mikroøkonomi
2. evne til å anvende mikroøkonomiske begrep og bruke disse til å analysere en bedrift/gruppe med bedrifter
3. evne til å skrive konsist og presist for å forklare stegene i en formell mikroøkonomisk analyse
4. at analysen utføres på en faglig god måte ved hjelp av Python kode
5. at forklaringene til figurene er presise og gode
6. at Python-koden dere bruker til å løse oppgaven er oversiktlig og godt dokumentert.    

### 4. Tilbakemelding underveis - presentasjon av besvarelsen

Som et **obligatorisk arbeidskrav** må dere presentere prosjektet for Derek. Dere vil få tilbakemelding på innholdet og presentasjonen for å hjelpe med den videre utviklingen av prosjektet. Aktuelle datoer er 29. mai og 30. mai. [Her kan dere registrere tidspunkt](https://docs.google.com/document/d/1rJeIZBqYSVFDJlk_jOj1u9Uw_x8u8RZ4RqoUnWsGJkM/edit?usp=sharing).


Lykke til!