# 🔮 Prediktiv analyse

I denne notebooken skal vi forsøke å bruke værdataene fra Frost til å forutsi fremtidige klima- eller miljøforhold. Dette er siste steg i prosjektet, og bygger på:
- Rensede og strukturerte data
- Forståelse av sammenhenger i dataene
- Resultater fra tidligere analyser og visualiseringer

Vi fokuserer på å bruke **enkel lineær regresjon** til å forutsi utvikling i én eller flere variabler, og reflekterer rundt både metode, tolkning og begrensninger.

---

## 📌 Mål

- Forutsi én eller flere værvariabler frem i tid
- Vurdere hvor god modellen er
- Utforske hvordan regresjonsanalyse kan brukes i miljødata
- Reflektere over nytteverdi, usikkerhet og forbedringspotensial

---

## 🧱 Forslag til struktur

---

### 1. 📘 Innledning

- Kort om hva prediktiv analyse er
- Hva vi forsøker å forutsi og hvorfor
- Hvilket datasett vi bruker
- Valg av metode (lineær regresjon)
- Begrensninger (for enkel modell, kun én variabel osv.)

> Eksempel:  
> «I denne analysen ønsker vi å bruke historisk værdata til å forutsi utviklingen i temperatur i Trondheim. Dette gir oss innsikt i hvordan klimaet har utviklet seg, og hvordan det potensielt kan se ut fremover.»

---

### 2. 📂 Forberedelse av data

- Importer data fra `frost.db` (SQL-spørring til tabellen `weather_data`)
- Velg én av variablene som skal predikeres (f.eks. `mean_air_temperature`)
- Opprett en tidsbasert numerisk indeks (`days_since_start`, `årstall`, osv.)
- Del opp i trenings- og testdata (f.eks. 80/20-splitt)

---

### 3. 📈 Bygg og tren modell

- Bruk `scikit-learn` sin `LinearRegression`
- Tren modellen på treningsdata
- Lag prediksjoner på testsett
- Lag graf: faktisk vs. predikert

---

### 4. 🧪 Evaluer modellen

- Metrikker: `mean_squared_error`, `r2_score`
- Refleksjon:
  - Er modellen god?
  - Er det systematiske feil?
  - Ville en mer avansert modell gjort det bedre?

---

### 5. 🔭 Prediker fremtidige verdier

- Forleng tidsaksen med 1–5 år
- Lag prediksjoner fremover i tid
- Visualiser prediksjon med usikkerhet hvis ønskelig

> Tips: Lag én graf som viser:
> - historiske verdier
> - testsett og modellprediksjon
> - fremtidig estimert trend

---

### 6. 💬 Refleksjon og vurdering

**Spørsmål du kan svare på i tekst:**

- Hva viser modellen?
- Hvor troverdig er den?
- Hvilke antagelser gjør vi?
- Hva kunne vært gjort bedre?
- Hva ville vært neste steg?

**Eksempeltekst:**
```markdown
Modellen viser en svak økning i temperatur de siste årene, og predikerer videre økning. Samtidig vet vi at lineær regresjon forutsetter konstant trend og ikke tar høyde for sesongvariasjoner. Modellen gir en indikasjon på retning, men bør utvides med flere funksjoner og en mer kompleks algoritme for å være pålitelig.
```

---

## 💡 Ekstra idéer (hvis du har tid)

- Bruk flere «features» (f.eks. også nedbør og vind som forklaringsvariabler)
- Test `PolynomialRegression` (for å fange opp kurver)
- Lag en interaktiv visualisering (f.eks. `plotly`)
- Sammenlign byer eller år
- Bruk `statsmodels` for mer statistisk innsikt (p-verdi, konfidensintervall)

---

## 📦 Biblioteker du antakelig vil bruke

```python
import pandas as pd
import numpy as np
import sqlite3
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
from sklearn.model_selection import train_test_split
```

---

## ✅ Husk underveis:

- Dokumentér valg du tar underveis, og hvorfor
- Ikke fokuser på «perfekt modell» – vis forståelse og refleksjon
- Bruk grafene til å vise resultater, ikke bare skrive dem

