# Spørring som både gir tekst(navn) og kode(ID) fra JSON-stat
### eksempel HS-koder utenrikshandel

### Importerer biblioteker
Bruker [pyjstat](https://pypi.org/project/pyjstat/) og pandas. Pandas lastes som del av pyjstat

In [1]:
from pyjstat import pyjstat
import requests

### URL med tabellens metadata, som vi skal poste spørringen mot

In [2]:
tabid = "08799" # 
lang = "no" # language code can also be "en"
POST_URL = "https://data.ssb.no/api/v0/" + lang + "/table/" + tabid  # 'https://data.ssb.no/api/v0/no/table/08799'

Spørring, kan tas fra konsoll: Import / eksport alle varkoder til US, ca. 65000 celler. Max grense for en spørring i PxWebApi er 800.000 celler, inkl tomme celler

In [3]:
json_q = {
  "query": [
    {
      "code": "Varekoder",
      "selection": {
        "filter": "all",
        "values": [
          "*"
        ]
      }
    },
    {
      "code": "ImpEks",
      "selection": {
        "filter": "item",
        "values": [
          "1",
          "2"
        ]
      }
    },
    {
      "code": "Land",
      "selection": {
        "filter": "item",
        "values": [
          "US"
        ]
      }
    },
    {
      "code": "ContentsCode",
      "selection": {
        "filter": "item",
        "values": [
          "Mengde1",
          "Verdi",
          "Mengde2"
        ]
      }
    },
    {
      "code": "Tid",
      "selection": {
        "filter": "item",
        "values": [
          "2020M05"
        ]
      }
    }
  ],
  "response": {
    "format": "json-stat2"
  }
}


### Poster spørringen

In [4]:
res = requests.post(POST_URL, json=json_q)

### Leser JSON-stat resultatet med biblioteket pyjstat
Lagrer det som datasett ds.

In [5]:
ds = pyjstat.Dataset.read(res.text)

In [6]:
type(ds)

pyjstat.pyjstat.Dataset

Se datasettet ds

In [7]:
ds

Dataset([('class', 'dataset'),
         ('label',
          '08799: Utenrikshandel med varer, etter varenummer, import/eksport, land, statistikkvariabel og måned'),
         ('source', 'Statistisk sentralbyrå'),
         ('updated', '2021-04-13T22:00:00Z'),
         ('id', ['Varekoder', 'ImpEks', 'Land', 'ContentsCode', 'Tid']),
         ('size', [10770, 2, 1, 3, 1]),
         ('dimension',
          OrderedDict([('Varekoder',
                        OrderedDict([('label', 'varenummer'),
                                     ('category',
                                      OrderedDict([('index',
                                                    OrderedDict([('00000011',
                                                                  0),
                                                                 ('00000031',
                                                                  1),
                                                                 ('00000032',
                      

### Henter noen overordnete metadata fra JSON-stat datasettet

In [8]:
tittel = ds['label']
print(tittel)

08799: Utenrikshandel med varer, etter varenummer, import/eksport, land, statistikkvariabel og måned


Sist Oppdatert som GMT

In [9]:
last_update = ds['updated']
print(last_update)

2021-04-13T22:00:00Z


Henter kilde

In [10]:
source = ds['source']
print(source)

Statistisk sentralbyrå


Roles gir noen snarveier

In [11]:
ds_roles = ds['role']
print(ds_roles)

OrderedDict([('time', ['Tid']), ('metric', ['ContentsCode']), ('geo', ['Land'])])


### Lager dataframes
Vi må lage to dataframes, en med tekst og en med ID. Pyjstat tillater bare enten/eller

In [12]:
hstrade = ds.write('dataframe')
hstrade_id = ds.write('dataframe', naming='id')

In [13]:
hstrade.head()

Unnamed: 0,varenummer,import/eksport,land,statistikkvariabel,måned,value
0,"(m1=kg, m2=nei) Uspesifiserte varer, tollbare",Import,USA,Mengde 1 (M1),2020M05,0
1,"(m1=kg, m2=nei) Uspesifiserte varer, tollbare",Import,USA,Verdi (kr),2020M05,0
2,"(m1=kg, m2=nei) Uspesifiserte varer, tollbare",Import,USA,Mengde 2 (M2),2020M05,0
3,"(m1=kg, m2=nei) Uspesifiserte varer, tollbare",Eksport,USA,Mengde 1 (M1),2020M05,0
4,"(m1=kg, m2=nei) Uspesifiserte varer, tollbare",Eksport,USA,Verdi (kr),2020M05,0


In [14]:
hstrade_id.head()

Unnamed: 0,Varekoder,ImpEks,Land,ContentsCode,Tid,value
0,11,1,US,Mengde1,2020M05,0
1,11,1,US,Verdi,2020M05,0
2,11,1,US,Mengde2,2020M05,0
3,11,2,US,Mengde1,2020M05,0
4,11,2,US,Verdi,2020M05,0


### Lager en ny kolonne med både HS varekode og tekst slått sammen

In [15]:
hstrade['hstrade_combi'] = hstrade_id['Varekoder'] + ' ' + hstrade['varenummer']

INFO:numexpr.utils:NumExpr defaulting to 8 threads.


In [16]:
hstrade.columns

Index(['varenummer', 'import/eksport', 'land', 'statistikkvariabel', 'måned',
       'value', 'hstrade_combi'],
      dtype='object')

### Lager en ny dataframe som bare har med kolonnene vi ønsker, i ny rekkefølge. 
Merk doble [[ ]] for å lage dataframe

In [17]:
hstrade_new = hstrade[['hstrade_combi', 'import/eksport', 'land', 'statistikkvariabel', 'måned',
       'value']]

In [18]:
hstrade_new.tail()

Unnamed: 0,hstrade_combi,import/eksport,land,statistikkvariabel,måned,value
64615,"99999999 (m1=kg, m2=nei) Sum alle varenumre me...",Import,USA,Verdi (kr),2020M05,39228737
64616,"99999999 (m1=kg, m2=nei) Sum alle varenumre me...",Import,USA,Mengde 2 (M2),2020M05,0
64617,"99999999 (m1=kg, m2=nei) Sum alle varenumre me...",Eksport,USA,Mengde 1 (M1),2020M05,46531687
64618,"99999999 (m1=kg, m2=nei) Sum alle varenumre me...",Eksport,USA,Verdi (kr),2020M05,137474174
64619,"99999999 (m1=kg, m2=nei) Sum alle varenumre me...",Eksport,USA,Mengde 2 (M2),2020M05,0
