# Hente og sende data på Internett

Python er mye brukt for å lage web applikasjoner men også for å utveklse data på internett.<br>
På nettet er det en uendelighet av dataportaler. Det kan være værdata, børskurser, statistikk, kartdata og register på det alle meste.

Data fra dataportaler kommer som oftest i [JSON](https://www.json.org/) eller [XML](https://no.wikipedia.org/wiki/XML) format.

## JSON Data fra webservice

JSON formatet er nesten helt likt en Python Dict, det er derfor ekstra lett å arbeide med.

Her er et eksempel på hvordan vi veldig enkelt kan hente kursen på dollar fra [Floatrates](http://www.floatrates.com/)

In [1]:
import requests
r = requests.get('http://www.floatrates.com/daily/usd.json')
print('1 USD er', r.json()['nok']['rate'], 'NOK') 

1 USD er 8.5678100737398 NOK


*Oppgave: .json() funksjonen konverterer JSON data vi mottok til en dict. I eksempelet bruker jeg indeksen 'nok' og deretter 'rate' i denne ordlisten for å hente ut for norske kroner. List ut alle valuta som kommer i ordlisten. Hint: Prøv deg frem ved å bare printe .json() og .json['nok']*

### Åpne offentlige data i Norge

Det offentlige i Norge har mye åpne data tilgjengelig. En kan finne mye på [data.norge.no](http://data.norge.no/)<br>Telemark.

## Webskraping

[Beautiful Soup](https://www.crummy.com/software/BeautifulSoup/bs4/doc/) er et Pyton bibliotek for å trekke data ut av HTML og XML.
Vi kan f.eks. trekke ut de siste nyhetssakene fra nrk.no med koden under.
<img  src="https://notebooks.azure.com/sauce1971/libraries/vgdatapythonmaster/raw/img%2Fnrk_nyheter.png">

In [1]:
import requests
from bs4 import BeautifulSoup
r = requests.get('https://www.nrk.no/nyheter/')
soup = BeautifulSoup(r.text, 'html.parser')

for bulletin_title in soup.find_all('h2', class_= 'bulletin-title'): # Finner alle HTML h2 elementer med classen bulletin-title
    print(bulletin_title.text)

Pågrepet etter ran i museum
Vekst i norsk økonomi
Julegaver for millioner
Åpen for å flytte politiavdeling
Sp trekker seg fra forhandlingene
Hentar inn over ein halv milliard
Krisepakke til Svalbard 
Starter sprengning ved Huseby skole
FBI: Økning i hatkriminalitet i USA
Fem nye smittetilfeller


Beautiful Soup lar deg navigere rundt i XML/HTML Treet. I eksempelet nedenfor plukker vi også opp tidspunktet for nyhetssaken.

In [None]:
import requests
from bs4 import BeautifulSoup
r = requests.get('https://www.nrk.no/nyheter/')
soup = BeautifulSoup(r.text, 'html.parser')
for bulletin_title in soup.find_all('h2', class_= 'bulletin-title'):
    title = bulletin_title.text
    # Vi navigerer til forelder noden og bruker find for å finne elementet med classen bulletin-publish-time
    publish_time = bulletin_title.parent.find(class_='bulletin-publish-time').text 
    print(publish_time, title)

*Oppgave: Skriv også ut de 100 første bokstavene av selve teksten til artikkelen.*

## Data i XML format

### api.met.no

Meteorolgisk institutt lar deg bruke det meste av sine [data helt gratis](https://api.met.no/). Akkurat på samme måte som de blir brukt på yr.no eller i yr appen. Mye av disse dataene er foreløpig bare i XML format.

[Nowcast](https://api.met.no/weatherapi/nowcast/0.9/documentation) Gir deg regn for de nærmeste timene.

In [2]:
import requests
from bs4 import BeautifulSoup
r = requests.get('https://api.met.no/weatherapi/nowcast/0.9/?lat=59.173551&lon=9.620759')
soup = BeautifulSoup(r.text, 'xml')
for data in soup.find_all('time'):
    from_time = data['from'][11:16]
    precipitation = data.find('precipitation')['value']
    print(from_time, precipitation, 'mm')

07:45 0.4 mm
07:50 0.5 mm
07:55 0.8 mm
08:00 0.6 mm
08:05 0.4 mm
08:10 0.3 mm
08:15 0.2 mm
08:20 0.1 mm
08:25 0.1 mm
08:30 0.1 mm
08:35 0.0 mm
08:40 0.0 mm
08:45 0.0 mm
08:50 0.0 mm
08:55 0.0 mm
09:00 0.0 mm
09:05 0.0 mm
09:10 0.0 mm
09:15 0.0 mm
09:20 0.0 mm
09:25 0.0 mm
09:30 0.0 mm
09:35 0.0 mm


*Oppgave: Analyser dataene fra Nowcast og gi et varsel om det snart blir regn eller ikke.*

*Oppgave: Fortell hvor lenge det er til det eventuelt kommer noe regn. Hint: Du må bruke [datetime.strptime()](https://docs.python.org/3/library/datetime.html?highlight=datetime#datetime.datetime.strptime) for å gjøre from_time om til et datetime objekt. (Google ekspempler på bruk av strptime).*

*Oppgave: Lag et stolpediagram som viser nedbør de nærmeste timene. Kan f.eks. lese [denne](https://pythonprogramming.net/bar-chart-histogram-matplotlib-tutorial/) for å se hvordan.*