# SOK-1006 V25
## Arbeidskrav 6 - Detaljhandel i Norge: Estimering av en produktfunksjon

Tilpasset fra mappeoppgave 2 v24.



### 1. Bakgrunn

Detaljhandel beskriver salg av varer til individer eller husholdninger. Her er en overskrift fra [Dagens Næringsliv, 27. mars 2024](https://www.dn.no/handel/ssb/shopping/marginal-oppgang-for-detaljhandelen/2-1-1618069)            


![image.png](attachment:938a8200-ce4f-45f8-ba99-b859e7fd9641.png)

Her nevnes både varehandelen, detaljhandelen og dagligvarer i samme sak. For å vite hvordan disse begrepene henger sammen må man vite noe om [Næringsgruppering](https://www.ssb.no/klass/klassifikasjoner/6/koder). Denne lenken fører til Næringsgrupperingen som brukes i Norge (SN2007). I kategori G finner man "Varehandel, reparasjon av motorvogner", og dersom du utvider gruppe G får man 3 nye undergrupper. Vi er interessert i undergruppe 47 - Detaljhandel, unntatt med motorvogner. Dersom du klikker på plusstegnet ved siden av tallet 47 får du opp nye undergrupper, og laveste gruppe beskrives med fem siffer. Ved å trykke på "i" ikonet kan du få informasjon om hva hver gruppe inneholder.       

I denne oppgaven skal vi estimere en produktfunksjon for detaljhandelen.





### Oppgave 1 - Kartlegging av detaljhandel i Norge

Hva menes med varehandel og detaljhandel?      


### Oppgave 2 - Produktfunksjon for detaljhandel

I denne oppgaven skal du estimere en produktfunksjon for detaljhandel i Norge. Vi antar at produktfunksjonen tar Cobb-Douglas form:

\begin{equation}
   x = ZN^aK^{b}\;\;(1)
\end{equation}


hvor $x$ er enheter ferdigprodukt, $N$ er enheter arbeidskraft, $K$ er enheter kapital og $Z>0, a>0, b>0$ er konstante tall.



[Tabell 12910, SSB](https://www.ssb.no/statbank/table/12910/) inneholder data etter næring på blant annet Produksjonsverdi, Lønnskostnader og Bruttoinvesteringer (alle i mill NOK). Følgende kode kan brukes for å laste ned disse dataene for detaljhandel for 2022.

In [2]:
# last inn pakker

import json
import pandas as pd
import requests
from pyjstat import pyjstat

# Lim in PostUrl som spørringen skal postes mot
postUrl = "https://data.ssb.no/api/v0/no/table/12910/"

# spørring fra SSB

apiQuery = {
  "query": [
    {
      "code": "NACE2007",
      "selection": {
        "filter": "vs:NACE2007StrNaringUndGr",
        "values": [
          "47.111",
          "47.112",
          "47.190",
          "47.210",
          "47.220",
          "47.230",
          "47.241",
          "47.242",
          "47.251",
          "47.259",
          "47.260",
          "47.291",
          "47.292",
          "47.299",
          "47.300",
          "47.410",
          "47.420",
          "47.430",
          "47.510",
          "47.521",
          "47.522",
          "47.523",
          "47.524",
          "47.529",
          "47.531",
          "47.532",
          "47.533",
          "47.540",
          "47.591",
          "47.592",
          "47.593",
          "47.594",
          "47.599",
          "47.610",
          "47.620",
          "47.630",
          "47.641",
          "47.642",
          "47.650",
          "47.710",
          "47.721",
          "47.722",
          "47.730",
          "47.740",
          "47.750",
          "47.761",
          "47.762",
          "47.771",
          "47.772",
          "47.781",
          "47.782",
          "47.789",
          "47.791",
          "47.792",
          "47.799",
          "47.810",
          "47.820",
          "47.890",
          "47.911",
          "47.912",
          "47.913",
          "47.914",
          "47.915",
          "47.916",
          "47.917",
          "47.919",
          "47.990"
        ]
      }
    },
    {
      "code": "ContentsCode",
      "selection": {
        "filter": "item",
        "values": [
          "Produksjonsverdi",
          "Lonnskost",
          "BruttoInvesteringer"
        ]
      }
    },
    {
      "code": "Tid",
      "selection": {
        "filter": "item",
        "values": [
          "2022"
        ]
      }
    }
  ],
  "response": {
    "format": "json-stat2"
  }
}


# Funksjon for å konvertere uttrekket til 2 dataframes, tar 2 paramtre (SSB)

def apiToDataframe(postUrl, query):

    # postUrl som spørringen skal postes mot
    # Spørringen og endepunktet til API-et kan hentes fra Statistikkbanken.

    res = requests.post(postUrl, json=query)
    # legger resultat i ds. DS har i tillegg en del metadata
    ds = pyjstat.Dataset.read(res.text)
    # skriver resultatet til to dataframes
    # først dataframe med tekst
    df = ds.write('dataframe')
    # deretter dataframe med koder
    df_id = ds.write('dataframe', naming='id')
    # returnerer også ds i tilfelle en trenger metadata
    return df, df_id, ds


df, df_id, ds = apiToDataframe(postUrl, apiQuery)

df

Unnamed: 0,næring (SN2007),foretak/bedrift,statistikkvariabel,år,value
0,Butikkhandel med bredt vareutvalg med hovedvek...,Foretak (hovedenheter),Produksjonsverdi (mill. kr),2022,52149.6
1,Butikkhandel med bredt vareutvalg med hovedvek...,Foretak (hovedenheter),Lønnskostnader (mill. kr),2022,22215.3
2,Butikkhandel med bredt vareutvalg med hovedvek...,Foretak (hovedenheter),Bruttoinvesteringer (mill. kr),2022,3807.0
3,Butikkhandel med bredt vareutvalg med hovedvek...,Bedrifter (underenheter),Produksjonsverdi (mill. kr),2022,49435.7
4,Butikkhandel med bredt vareutvalg med hovedvek...,Bedrifter (underenheter),Lønnskostnader (mill. kr),2022,21116.2
...,...,...,...,...,...
397,Detaljhandel utenom utsalgssted ellers,Foretak (hovedenheter),Lønnskostnader (mill. kr),2022,532.4
398,Detaljhandel utenom utsalgssted ellers,Foretak (hovedenheter),Bruttoinvesteringer (mill. kr),2022,83.3
399,Detaljhandel utenom utsalgssted ellers,Bedrifter (underenheter),Produksjonsverdi (mill. kr),2022,1611.6
400,Detaljhandel utenom utsalgssted ellers,Bedrifter (underenheter),Lønnskostnader (mill. kr),2022,532.0


### Oppgave 2 fortsetter

Datasettet inneholder to rader for hver underkategori (én verdi for foretak, og én for bedrifter). Vi skal slå disse verdiene sammen, droppe et par overflødige kolonner, samt pivot slik at vi ender opp med et datasett som jeg har kalt `data`. (Jeg har også fjernet observasjoner som er null).



In [3]:
# slå sammen verdier for foretak og bedrift

df_sum = df.groupby(['næring (SN2007)', 'statistikkvariabel']).sum().reset_index()

# dropp kolonner

df_sum = df_sum.drop(columns=['foretak/bedrift', 'år'])

# pivot

df_pivot = df_sum.pivot_table(index='næring (SN2007)', columns='statistikkvariabel', values='value')

# lag en kopi av datasettet

data = df_pivot.copy()

# fjern rader med verdier lik 0

data = data.drop(data[data.eq(0).any(axis=1)].index)

#vis datasettet

data

statistikkvariabel,Bruttoinvesteringer (mill. kr),Lønnskostnader (mill. kr),Produksjonsverdi (mill. kr)
næring (SN2007),Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
Butikkhandel ikke nevnt annet sted,189.3,2331.1,5892.0
Butikkhandel med antikviteter,0.1,30.4,110.1
Butikkhandel med apotekvarer,311.9,10713.4,18990.5
Butikkhandel med audio- og videoutstyr,31.6,398.8,848.6
Butikkhandel med bakervarer og konditorvarer,62.2,1282.5,2792.3
...,...,...,...
Postordre-/Internetthandel med helsekost,12.2,248.1,2111.4
"Postordre-/Internetthandel med tekstiler, utstyrsvarer, klær, skotøy, reiseeffekter og lærvarer",109.4,1137.9,6152.3
"Postordre-/internetthandel med bøker, papir, aviser og blader",6.1,114.6,483.2
Torghandel med andre varer,2.8,19.8,48.8


### Oppgave 2 fortsetter

Nå har vi et datasett med 61 observasjoner på 3 variabler.        

i) Bruk datasettet til å estimere $Z>0, a>0, b>0$ i (1), og forklar nøye hva hvert tall representerer. Forklar nøye hvordan du evt transformerer (1) før du estimerer.        

ii) Hva menes med skalautbytte, og hvordan kan man avgjøre skalautbytte for en produktfunksjon av type Cobb-Douglas?      

iii) Hvilken skalaegenskap har produktfunksjonen for detaljhandel som du har estimert? Hvordan forklarer du dette (dvs er svaret intuitivt rimelig utfra type næring som vanligvis har denne type skalautbytte)?          

iv) Hvilke svakheter har denne analysen?
