# Ordinary Least Squares (OLS)

Ordinary Least Squares (OLS) är en metod för att estimera koefficienterna i en linjär regressionsmodell.

## Grundprinciper för OLS
1. **Mål**: OLS syftar till att minimera summan av de kvadrerade skillnaderna mellan de observerade värdena och de värden som förutsägs av modellen.

2. **Modell**: Den linjära modellen kan skrivas som:
   $$y = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + ... + \beta_n x_n + \epsilon$$
   där:
   - $y$ är den beroende variabeln (det vi försöker förutsäga).
   - $x_1, x_2, ..., x_n$ är de oberoende variablerna (de faktorer som påverkar $y$).
   - $\beta_0, \beta_1, ..., \beta_n$ är koefficienterna som vi vill estimera.
   - $\epsilon$ är feltermen.

3. **Minimering av residualerna**: OLS beräknar koefficienterna ($\beta$) genom att minimera följande funktion:
   $$\text{Minimera} \sum (y_i - \hat{y}_i)^2$$
   där $y_i$ är de observerade värdena och $\hat{y}_i$ är de förutsagda värdena från modellen.

4. **Lösning**: Den optimala lösningen för koefficienterna kan hittas genom att använda matriser och derivator. Resultatet ger oss de värden på $\beta$ som minimerar summan av kvadraterna av residualerna.

## Tillämpningar
OLS används ofta inom statistik och maskininlärning för att analysera relationer mellan variabler och för att göra förutsägelser. Den är enkel att implementera och förstå, vilket gör den populär inom många områden, inklusive ekonomi, biologi och samhällsvetenskap.

In [1]:
import numpy as np
import pandas as pd
import statsmodels.api as sm

# Exempeldata
data = {
    'X': [1, 2, 3, 4, 5],
    'Y': [2, 3, 5, 7, 11]
}  
df = pd.DataFrame(data)

# Lägg till en konstant för interceptet
X = sm.add_constant(df['X'])

# Skapa OLS-modellen
model = sm.OLS(df['Y'], X)
results = model.fit()

# Visa resultaten
print(results.summary())

                            OLS Regression Results                            
Dep. Variable:                      Y   R-squared:                       0.945
Model:                            OLS   Adj. R-squared:                  0.927
Method:                 Least Squares   F-statistic:                     51.86
Date:                Tue, 21 Jan 2025   Prob (F-statistic):            0.00552
Time:                        12:23:03   Log-Likelihood:                -5.6451
No. Observations:                   5   AIC:                             15.29
Df Residuals:                       3   BIC:                             14.51
Df Model:                           1                                         
Covariance Type:            nonrobust                                         
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
const         -1.0000      1.013     -0.987      0.3

  warn("omni_normtest is not valid with less than 8 observations; %i "
