In [2]:
import numpy as np
from scipy import stats
from statistiska_metoder_test import LinearRegression  # Importera klassen

# Läs in data från CSV med numpy
data = np.loadtxt('C:/Programering/It högskolan/Statistiska-Metoder/Data/Small-diameter-flow.csv', delimiter=',', skiprows=1)
X = data[:, :-1]  # Funktioner
y = data[:, -1]   # Målvariabel

# Skapa en instans av LinearRegression
model = LinearRegression(X, y)
model.fit()

# Skriv ut resultaten
print('Antal prover n:', model.n)
print('Koefficienter b:', model.beta)
print('Varians:', model.variance())
print('Standardavvikelse:', model.standard_deviation())
print('P-värden:', model.significance())
print('R²-värde:', model.r_squared())

Antal prover n: 198
Koefficienter b: [ 1.94355173e+00  1.28130021e-03  6.67201543e-01 -5.48224778e-01
 -1.97810389e+00  3.15896648e-01]
Varians: 0.2286582424814866
Standardavvikelse: 0.47818222727479803
P-värden: [0.0, 0.9699616841762471, 0.0, 0.0, 0.0, 0.0]
R²-värde: 0.07172851421308868


# Resultat av Linear Regression
Denna notebook presenterar resultaten från en linjär regression som utförts på datasetet Small-diameter-flow.csv.

# Antal prover
Denna cell visar antalet prover som används i modellen. Det beräknas som antalet rader i datamängden.
$$ n = \text{antal rader i } X $$

In [3]:
print('Antal prover n:', model.n)

Antal prover n: 198


# Koefficienter
Koefficienterna \( b \) representerar sambandet mellan varje oberoende variabel och den beroende variabeln. Dessa värden visar hur mycket den beroende variabeln förväntas förändras när den oberoende variabeln ökar med en enhet. Koefficienterna beräknas med hjälp av formeln:
$$ b = (X^T X)^{-1} X^T y $$

In [4]:
print('Koefficienter b:', model.beta)

Koefficienter b: [ 1.94355173e+00  1.28130021e-03  6.67201543e-01 -5.48224778e-01
 -1.97810389e+00  3.15896648e-01]


# Varians
Variansen av residualerna visar hur mycket avvikelse det finns mellan de observerade värdena och de förutsagda värdena. Variansen beräknas med formeln:
$$ \text{Varians} = \frac{1}{n} \sum (y_i - \hat{y}_i)^2 $$

In [5]:
print('Varians:', model.variance())

Varians: 0.2286582424814866


# Standardavvikelse
Standardavvikelsen beräknas som:
$$ \text{Standardavvikelse} = \sqrt{\text{Varians}} $$

In [6]:
print('Standardavvikelse:', model.standard_deviation())

Standardavvikelse: 0.47818222727479803


# P-värden
P-värdena beräknas med hjälp av t-värdena:
$$ p = 2 \times (1 - T(n-1)) $$

In [7]:
print('P-värden:', model.significance())

P-värden: [0.0, 0.9699616841762471, 0.0, 0.0, 0.0, 0.0]


# R²-värde
R² beräknas som:
$$ R^2 = 1 - \frac{\text{SS}_{\text{residual}}}{\text{SS}_{\text{total}}} $$

In [8]:
print('R²-värde:', model.r_squared())

R²-värde: 0.07172851421308868
