# Introduzione a NumPy per l'Algebra Lineare

**NumPy** (Numerical Python) e' la libreria fondamentale per il calcolo numerico in Python.
Fornisce l'oggetto `ndarray` (array n-dimensionale) e centinaia di funzioni per operazioni
matematiche, statistiche e di algebra lineare.

In data analysis, NumPy e' il motore che sta sotto a pandas, scikit-learn e molte altre librerie.
Comprendere gli array e le operazioni vettoriali e' essenziale per lavorare in modo efficiente.

---

In [2]:
import numpy as np

## 1. Creare array

Un **array NumPy** e' una griglia di valori tutti dello stesso tipo.
Un array 1D rappresenta un vettore (una colonna di dati), un array 2D una matrice (una tabella).

### 1.1 Da liste Python

In [None]:
# Vettore: fatturato mensile (migliaia di euro)
fatturato = np.array([120, 135, 148, 110, 162, 175, 190, 155, 143, 168, 180, 195])
fatturato

In [None]:
# Matrice: ogni riga e' un trimestre, ogni colonna un mese del trimestre
fatturato_trim = np.array([
    [120, 135, 148],   # Q1
    [110, 162, 175],   # Q2
    [190, 155, 143],   # Q3
    [168, 180, 195],   # Q4
])
fatturato_trim

### 1.2 Funzioni di creazione

In [None]:
# Vettore di zeri (es. inizializzare un accumulatore)
np.zeros(5)

In [None]:
# Matrice di uni (es. matrice di pesi iniziali)
np.ones((3, 4))

In [None]:
# Matrice identita' (fondamentale in algebra lineare)
np.eye(3)

In [None]:
# Sequenza regolare (es. mesi da 1 a 12)
np.arange(1, 13)

In [None]:
# Intervallo con n punti equispaziati (es. soglie per un modello)
np.linspace(0, 1, 5)

In [None]:
# Matrice di valori costanti
np.full((2, 3), 999)

### 1.3 Array casuali (utili per simulazioni e test)

In [None]:
rng = np.random.default_rng(42)  # generatore con seed per riproducibilita'

# 10 valori casuali uniformi tra 0 e 1
rng.random(10)

In [None]:
# 1000 valori da distribuzione normale (media=50000, std=15000)
# Simuliamo i redditi di un campione
redditi_simulati = rng.normal(loc=50000, scale=15000, size=1000)
redditi_simulati[:10]  # primi 10

In [None]:
# Interi casuali: simulare punteggi di soddisfazione da 1 a 5
punteggi = rng.integers(low=1, high=6, size=20)
punteggi

### Esercizi sulla creazione di array

**Esercizio 1.1** - Crea un array 1D con le spese mensili di un'azienda (inventa 12 valori).

**Esercizio 1.2** - Crea una matrice 5x3 di zeri e una matrice identita' 4x4.

**Esercizio 1.3** - Genera un array di 500 valori casuali da una distribuzione normale
con media 100 e deviazione standard 20. Rappresentano i tempi di risposta (in ms) di un server.

In [None]:
# Scrivi qui la tua soluzione


---
## 2. Proprieta' degli array

Conoscere la forma e il tipo dei dati e' il primo passo di qualsiasi analisi.

In [None]:
fatturato_trim.shape  # (righe, colonne)

In [None]:
fatturato_trim.ndim  # numero di dimensioni

In [None]:
fatturato_trim.size  # numero totale di elementi

In [None]:
fatturato_trim.dtype  # tipo di dato

In [None]:
# Creare un array con tipo specifico
percentuali = np.array([12.5, 33.0, 7.8], dtype=np.float32)
percentuali.dtype

### 2.1 Reshape

`reshape` cambia la forma di un array senza modificare i dati.
Il numero totale di elementi deve rimanere lo stesso.

In [None]:
# Da vettore 12 elementi a matrice 4x3 (4 trimestri, 3 mesi)
fatturato.reshape(4, 3)

In [None]:
# Da vettore 12 a matrice 3x4 (3 quadrimestri, 4 mesi)
fatturato.reshape(3, 4)

In [None]:
# Usare -1 per far calcolare una dimensione automaticamente
fatturato.reshape(2, -1)  # 2 righe, colonne calcolate: 12/2 = 6

In [None]:
# Appiattire una matrice in un vettore
fatturato_trim.flatten()

### 2.2 Trasposta

La **trasposta** scambia righe e colonne. In algebra lineare e' un'operazione fondamentale.

In [None]:
fatturato_trim.T

In [None]:
# Shape originale vs trasposta
fatturato_trim.shape, fatturato_trim.T.shape

### Esercizi su proprieta' e reshape

**Esercizio 2.1** - Crea un array di 24 elementi (da 1 a 24 con `arange`). Fai il reshape
in una matrice 6x4, poi in una matrice 4x6. Verifica shape e size per entrambe.

**Esercizio 2.2** - Crea una matrice 3x5 con valori casuali. Calcolane la trasposta
e verifica che la shape sia diventata 5x3.

In [None]:
# Scrivi qui la tua soluzione


---
## 3. Indicizzazione e slicing

Come per le liste Python, possiamo selezionare porzioni di un array.
Con le matrici, usiamo due indici: `[riga, colonna]`.

### 3.1 Array 1D

In [None]:
fatturato

In [None]:
# Primo trimestre
fatturato[:3]

In [None]:
# Ultimo trimestre
fatturato[-3:]

In [None]:
# Mesi pari (ogni 2 a partire dal secondo, indice 1)
fatturato[1::2]

### 3.2 Array 2D

In [None]:
fatturato_trim

In [None]:
# Singolo elemento: Q2, secondo mese (riga 1, colonna 1)
fatturato_trim[1, 1]

In [None]:
# Intera riga: tutti i mesi del Q3 (riga 2)
fatturato_trim[2]

In [None]:
# Intera colonna: primo mese di ogni trimestre (colonna 0)
fatturato_trim[:, 0]

In [None]:
# Sotto-matrice: Q1 e Q2, primi due mesi
fatturato_trim[:2, :2]

### 3.3 Indicizzazione booleana (filtri)

Questa tecnica e' alla base del filtraggio dati in pandas.
Creiamo una **maschera booleana** e la usiamo per selezionare gli elementi.

In [None]:
# Quali mesi hanno fatturato sopra 160?
maschera = fatturato > 160
maschera

In [None]:
# Selezionare solo quei valori
fatturato[maschera]

In [None]:
# In forma compatta
fatturato[fatturato > 160]

In [None]:
# Combinare condizioni con & (and) e | (or)
fatturato[(fatturato > 130) & (fatturato < 170)]

In [None]:
# Quanti mesi sopra 160?
np.sum(fatturato > 160)

### 3.4 Fancy indexing

Possiamo usare un array di indici per selezionare elementi specifici.

In [None]:
# Selezionare il primo, quarto e ultimo mese
indici = [0, 3, 11]
fatturato[indici]

In [None]:
# Indici dei valori ordinati (utile per ranking)
np.argsort(fatturato)

In [None]:
# I 3 mesi con fatturato piu' alto
top3_indici = np.argsort(fatturato)[-3:]
fatturato[top3_indici]

### Esercizi su indicizzazione e slicing

**Esercizio 3.1** - Dalla matrice `fatturato_trim`, estrai: (a) l'intero Q4,
(b) l'ultimo mese di ogni trimestre, (c) il sotto-blocco Q3-Q4 con gli ultimi 2 mesi.

**Esercizio 3.2** - Genera 100 valori casuali da una normale (media=75, std=10)
che rappresentano voti di un esame. Filtra i voti insufficienti (< 60) e conta quanti sono.

**Esercizio 3.3** - Dato un array di fatturato, trova gli indici dei 5 valori piu' bassi
usando `argsort`.

In [None]:
# Scrivi qui la tua soluzione


---
## 4. Operazioni vettoriali e broadcasting

La potenza di NumPy sta nelle **operazioni vettoriali**: le operazioni si applicano
elemento per elemento senza bisogno di cicli `for`. Questo e' molto piu' veloce
e molto piu' leggibile.

### 4.1 Operazioni aritmetiche elemento per elemento

In [None]:
ricavi = np.array([500, 620, 480, 710, 550])
costi  = np.array([320, 410, 350, 490, 380])

# Profitto per ogni periodo
profitto = ricavi - costi
profitto

In [None]:
# Margine percentuale
margine = (profitto / ricavi) * 100
margine

In [None]:
# Confronto: con le liste Python avremmo dovuto scrivere un ciclo
# [ricavi[i] - costi[i] for i in range(len(ricavi))]

### 4.2 Broadcasting

Il **broadcasting** permette di fare operazioni tra array di forme diverse,
quando le dimensioni sono compatibili. NumPy "estende" automaticamente
l'array piu' piccolo.

In [None]:
# Applicare l'IVA al 22% a tutti i prezzi
prezzi_netti = np.array([100, 250, 75, 430])
prezzi_ivati = prezzi_netti * 1.22
prezzi_ivati

In [3]:
# Broadcasting con matrice: ogni riga e' un negozio, ogni colonna un prodotto
vendite = np.array([
    [10, 25, 8],
    [15, 30, 12],
    [7,  20, 15],
])

# Prezzo unitario per ogni prodotto
prezzi = np.array([50, 12, 85])

# Ricavo per negozio e prodotto (broadcasting: prezzi si applica a ogni riga)
ricavi_matrice = vendite * prezzi
ricavi_matrice

array([[ 500,  300,  680],
       [ 750,  360, 1020],
       [ 350,  240, 1275]])

### 4.3 Funzioni universali (ufunc)

In [None]:
rendimenti = np.array([0.05, 0.12, -0.03, 0.08, -0.01, 0.15])

# Valore assoluto
np.abs(rendimenti)

In [None]:
# Radice quadrata (es. per calcolare deviazione standard)
varianze = np.array([25, 144, 9, 64])
np.sqrt(varianze)

In [None]:
# Logaritmo naturale (usato per rendimenti logaritmici)
prezzi_serie = np.array([100, 105, 103, 110, 108])
rendimenti_log = np.log(prezzi_serie[1:] / prezzi_serie[:-1])
rendimenti_log

In [None]:
# Esponenziale
np.exp(rendimenti_log)

In [None]:
# Arrotondamento
np.round(margine, 1)

### Esercizi su operazioni vettoriali

**Esercizio 4.1** - Crea due array: `prezzi_2023` e `prezzi_2024` con 5 valori ciascuno.
Calcola la variazione percentuale anno su anno per ogni prodotto.

**Esercizio 4.2** - Data la matrice `vendite` e il vettore `prezzi` definiti sopra,
calcola il ricavo totale per ogni negozio (somma per riga della matrice dei ricavi).

**Esercizio 4.3** - Genera un array di 10 valori e normalizzalo nell'intervallo [0, 1]
usando la formula: `(x - min) / (max - min)`.

In [None]:
# Scrivi qui la tua soluzione


---
## 5. Funzioni statistiche

NumPy offre funzioni statistiche fondamentali, sia su array 1D sia lungo
gli assi di matrici.

### 5.1 Statistiche di base

In [None]:
fatturato

In [None]:
np.mean(fatturato)  # media

In [None]:
np.median(fatturato)  # mediana

In [None]:
np.std(fatturato)  # deviazione standard

In [None]:
np.var(fatturato)  # varianza

In [None]:
np.min(fatturato), np.max(fatturato)

In [None]:
np.percentile(fatturato, [25, 50, 75])  # quartili

### 5.2 Statistiche lungo un asse

Con le matrici, possiamo calcolare statistiche per riga (`axis=1`)
o per colonna (`axis=0`).

- `axis=0`: l'operazione "collassa" le righe, il risultato ha una riga (un valore per colonna)
- `axis=1`: l'operazione "collassa" le colonne, il risultato ha una colonna (un valore per riga)

In [None]:
fatturato_trim

In [None]:
# Media per colonna (media di ogni mese del trimestre)
np.mean(fatturato_trim, axis=0)

In [None]:
# Media per riga (media di ogni trimestre)
np.mean(fatturato_trim, axis=1)

In [None]:
# Totale per riga: fatturato per trimestre
np.sum(fatturato_trim, axis=1)

In [None]:
# Massimo per colonna: il mese migliore in ciascuna posizione trimestrale
np.max(fatturato_trim, axis=0)

### 5.3 Somme cumulative e differenze

In [None]:
# Fatturato cumulato mese per mese
np.cumsum(fatturato)

In [None]:
# Differenze tra mesi consecutivi
np.diff(fatturato)

### Esercizi sulle statistiche

**Esercizio 5.1** - Genera 1000 valori da una distribuzione normale (media=170, std=10)
che simulano le altezze (in cm) di un campione. Calcola media, mediana, std e quartili.

**Esercizio 5.2** - Data la matrice `fatturato_trim`, trova:
(a) il trimestre con il fatturato totale piu' alto, (b) il mese con la media piu' alta.

In [None]:
# Scrivi qui la tua soluzione


---
## 6. Algebra lineare: operazioni con vettori

In data analysis e machine learning, i dati sono spesso rappresentati come vettori e matrici.
Ogni osservazione e' un vettore nello spazio delle feature.

### 6.1 Prodotto scalare (dot product)

Il **prodotto scalare** tra due vettori e' la somma dei prodotti elemento per elemento.
Si usa per calcolare ricavi totali, similarita' tra vettori, proiezioni.

In [None]:
# Quantita' vendute e prezzi unitari
quantita = np.array([50, 30, 20, 80])
prezzi = np.array([10, 25, 100, 5])

# Ricavo totale = somma(q_i * p_i) = prodotto scalare
ricavo_totale = np.dot(quantita, prezzi)
ricavo_totale

In [None]:
# Equivalente con l'operatore @
quantita @ prezzi

### 6.2 Norma di un vettore

La **norma** misura la "lunghezza" di un vettore. La norma L2 (euclidea)
e' la piu' comune e si usa per calcolare distanze tra punti.

In [None]:
# Feature di un cliente: [eta, reddito_normalizzato, spesa_normalizzata]
cliente_a = np.array([0.35, 0.60, 0.80])
cliente_b = np.array([0.55, 0.40, 0.30])

# Norma L2 di un vettore
np.linalg.norm(cliente_a)

### 6.3 Distanza euclidea

La **distanza euclidea** tra due vettori e' la norma della loro differenza.
E' alla base di algoritmi come K-Nearest Neighbors e K-Means.

In [None]:
distanza = np.linalg.norm(cliente_a - cliente_b)
distanza

### 6.4 Similarita' coseno

La **similarita' coseno** misura l'angolo tra due vettori, indipendentemente dalla loro magnitudine.
Vale 1 se i vettori puntano nella stessa direzione, 0 se sono ortogonali, -1 se opposti.
Si usa molto nel text mining e nei sistemi di raccomandazione.

In [None]:
def cosine_similarity(a, b):
    """Calcola la similarita' coseno tra due vettori."""
    return np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b))

cosine_similarity(cliente_a, cliente_b)

In [None]:
# Due clienti con profili simili
cliente_c = np.array([0.40, 0.65, 0.75])
cosine_similarity(cliente_a, cliente_c)

### Esercizi su vettori

**Esercizio 6.1** - Un portafoglio contiene 4 asset con pesi `w = [0.25, 0.35, 0.15, 0.25]`
e rendimenti `r = [0.08, 0.12, 0.03, 0.06]`. Calcola il rendimento del portafoglio
come prodotto scalare w . r.

**Esercizio 6.2** - Dati tre clienti rappresentati come vettori di feature normalizzate,
calcola la distanza euclidea tra ogni coppia e identifica i due clienti piu' simili.

**Esercizio 6.3** - Calcola la similarita' coseno tra i vettori `[1, 0, 1]` e `[0, 1, 0]`.
Sono simili? Perche'?

In [None]:
# Scrivi qui la tua soluzione


---
## 7. Algebra lineare: operazioni con matrici

Le matrici sono centrali nella data analysis: un dataset e' una matrice
dove le righe sono osservazioni e le colonne feature.

### 7.1 Prodotto matrice-vettore

Il prodotto matrice-vettore trasforma un vettore applicando una trasformazione lineare.
In pratica: applicare dei pesi a delle feature.

In [None]:
# Matrice dei dati: 4 clienti, 3 feature
# Colonne: [eta_norm, reddito_norm, spesa_norm]
X = np.array([
    [0.35, 0.60, 0.80],
    [0.55, 0.40, 0.30],
    [0.70, 0.85, 0.90],
    [0.25, 0.30, 0.20],
])

# Vettore dei pesi (es. coefficienti di un modello lineare)
w = np.array([0.3, 0.5, 0.2])

# Score per ogni cliente
score = X @ w
score

### 7.2 Prodotto matrice-matrice

Il prodotto tra matrici combina due trasformazioni lineari.
Per A (m x n) e B (n x p), il risultato C = A @ B ha forma (m x p).

In [None]:
# Vendite per negozio (righe) e prodotto (colonne)
vendite = np.array([
    [10, 25, 8],
    [15, 30, 12],
    [7,  20, 15],
])

# Margine per prodotto (righe) e per tipo: [costo_mat, costo_lavoro]
costi_unitari = np.array([
    [5, 3],   # prodotto 1
    [2, 1],   # prodotto 2
    [10, 8],  # prodotto 3
])

# Costi totali per negozio e per tipo di costo
costi_per_negozio = vendite @ costi_unitari
costi_per_negozio

In [None]:
costi_per_negozio.shape  # 3 negozi x 2 tipi di costo

### 7.3 Matrice trasposta e prodotto X^T X

Il prodotto **X^T X** e' fondamentale in statistica e machine learning:
e' la base della regressione lineare (minimi quadrati) e della matrice di covarianza.

In [None]:
# X^T X: matrice 3x3 (feature x feature)
XtX = X.T @ X
XtX

In [None]:
XtX.shape  # (n_feature x n_feature)

### 7.4 Determinante

Il **determinante** di una matrice quadrata indica se la matrice e' invertibile
(determinante diverso da zero) e misura quanto una trasformazione "dilata" lo spazio.

In [None]:
A = np.array([
    [4, 2],
    [1, 3]
])

np.linalg.det(A)

### 7.5 Matrice inversa

La **matrice inversa** A^-1 soddisfa: A @ A^-1 = I (matrice identita').
Nella regressione lineare, i coefficienti si calcolano con: beta = (X^T X)^-1 X^T y.

In [None]:
A_inv = np.linalg.inv(A)
A_inv

In [None]:
# Verifica: A @ A_inv dovrebbe essere la matrice identita'
np.round(A @ A_inv, 10)

### 7.6 Risolvere un sistema lineare

Un sistema di equazioni lineari Ax = b si risolve con `np.linalg.solve`,
che e' piu' efficiente e numericamente stabile del calcolo esplicito dell'inversa.

Esempio: un'azienda ha 2 canali pubblicitari. Il sistema descrive la relazione
tra budget e vendite stimate.

In [None]:
# 3x + 2y = 18   (canale A ha peso 3, canale B peso 2, vendite = 18)
# 1x + 4y = 16   (canale A ha peso 1, canale B peso 4, vendite = 16)

A = np.array([[3, 2],
              [1, 4]])
b = np.array([18, 16])

x = np.linalg.solve(A, b)
x  # budget ottimale per canale A e canale B

In [None]:
# Verifica: A @ x deve dare b
A @ x

### Esercizi su matrici

**Esercizio 7.1** - Crea una matrice 5x3 (5 osservazioni, 3 feature) e un vettore
di pesi con 3 elementi. Calcola lo score per ogni osservazione con il prodotto matrice-vettore.

**Esercizio 7.2** - Data una matrice A 2x2, calcolane il determinante e l'inversa.
Verifica che `A @ A_inv` sia (approssimativamente) la matrice identita'.

**Esercizio 7.3** - Risolvi il sistema:
```
2x + 5y = 20
4x + 3y = 22
```

In [None]:
# Scrivi qui la tua soluzione


---
## 8. Autovalori, autovettori e applicazioni

Gli **autovalori** e gli **autovettori** sono alla base di tecniche fondamentali
in data analysis, come la PCA (Principal Component Analysis).

### 8.1 Autovalori e autovettori

Data una matrice quadrata A, un autovettore v e' un vettore tale che:

A v = lambda v

dove lambda e' l'autovalore corrispondente. In pratica, la matrice
agisce su v solo "scalandolo", senza cambiarne la direzione.

In [None]:
# Matrice di covarianza (esempio semplificato)
cov_matrix = np.array([
    [5.0, 2.5],
    [2.5, 3.0]
])

autovalori, autovettori = np.linalg.eig(cov_matrix)
autovalori

In [None]:
# Gli autovettori sono le colonne della matrice restituita
autovettori

In [None]:
# Verifica: A @ v = lambda * v (per il primo autovalore)
v1 = autovettori[:, 0]
lambda1 = autovalori[0]

# Questi due vettori devono essere uguali
cov_matrix @ v1, lambda1 * v1

### 8.2 Varianza spiegata (cenno alla PCA)

Nella PCA, gli autovalori della matrice di covarianza indicano quanta varianza
e' catturata da ogni componente principale. Questo ci permette di decidere
quante dimensioni mantenere.

In [None]:
# Percentuale di varianza spiegata da ogni componente
varianza_totale = np.sum(autovalori)
varianza_spiegata = autovalori / varianza_totale * 100
varianza_spiegata

In [None]:
f"La prima componente spiega il {varianza_spiegata[0]:.1f}% della varianza totale."

### 8.3 Matrice di covarianza da dati

La matrice di covarianza misura come le variabili variano insieme.
Valori positivi indicano che crescono insieme, negativi che si muovono in direzioni opposte.

In [None]:
# Simuliamo dati di 100 clienti: eta e reddito (correlati positivamente)
rng = np.random.default_rng(42)
n = 100
eta = rng.normal(40, 10, n)
reddito = eta * 800 + rng.normal(0, 5000, n)  # correlazione positiva con rumore

# Mettiamo i dati in una matrice (100 x 2)
dati = np.column_stack([eta, reddito])
dati.shape

In [None]:
# Matrice di covarianza
np.cov(dati, rowvar=False)

In [None]:
# Matrice di correlazione (covarianza normalizzata, valori tra -1 e 1)
np.corrcoef(dati, rowvar=False)

### Esercizi su autovalori e covarianza

**Esercizio 8.1** - Calcola autovalori e autovettori della matrice identita' 3x3.
Cosa osservi? Ha senso?

**Esercizio 8.2** - Genera 200 osservazioni con 3 variabili correlate
(suggerimento: crea la seconda come funzione della prima piu' rumore, come nell'esempio sopra).
Calcola la matrice di correlazione e commentala.

**Esercizio 8.3** - Data la matrice di covarianza dell'esercizio precedente,
calcola la varianza spiegata percentuale da ogni autovalore.

In [None]:
# Scrivi qui la tua soluzione


---
## 9. Mini-progetto: regressione lineare con NumPy

Mettiamo insieme tutto quello che abbiamo visto per implementare
una **regressione lineare** usando solo NumPy.

La formula dei minimi quadrati ordinari (OLS) e':

**beta = (X^T X)^-1 X^T y**

dove X e' la matrice delle feature (con una colonna di 1 per l'intercetta)
e y e' il vettore target.

### 9.1 Creare i dati

In [None]:
rng = np.random.default_rng(123)
n = 50  # numero di osservazioni

# Feature: budget pubblicitario (in migliaia)
budget = rng.uniform(5, 50, n)

# Target: vendite (relazione lineare con rumore)
# vendite = 10 + 3.5 * budget + rumore
vendite = 10 + 3.5 * budget + rng.normal(0, 15, n)

### 9.2 Costruire la matrice X

In [None]:
# Aggiungiamo la colonna di 1 per l'intercetta
ones = np.ones((n, 1))
X = np.column_stack([ones, budget])

# Primi 5 record
X[:5]

In [None]:
y = vendite
X.shape, y.shape

### 9.3 Calcolare i coefficienti

In [None]:
# beta = (X^T X)^-1 X^T y
XtX = X.T @ X
XtX_inv = np.linalg.inv(XtX)
Xty = X.T @ y

beta = XtX_inv @ Xty
beta  # [intercetta, coefficiente del budget]

In [None]:
f"Vendite stimate = {beta[0]:.2f} + {beta[1]:.2f} * budget"

### 9.4 Fare previsioni e valutare

In [None]:
# Previsioni
y_pred = X @ beta

# Residui
residui = y - y_pred

# Errore quadratico medio (MSE)
mse = np.mean(residui ** 2)
f"MSE: {mse:.2f}"

In [None]:
# R-quadro: proporzione di varianza spiegata
ss_res = np.sum(residui ** 2)
ss_tot = np.sum((y - np.mean(y)) ** 2)
r_squared = 1 - ss_res / ss_tot
f"R-quadro: {r_squared:.4f}"

### 9.5 Alternativa: np.linalg.lstsq

NumPy offre anche `lstsq` (least squares) che risolve il problema
in modo numericamente piu' stabile, senza calcolare esplicitamente l'inversa.

In [None]:
beta_lstsq, residuals, rank, sv = np.linalg.lstsq(X, y, rcond=None)
beta_lstsq

### Esercizio finale

**Esercizio 9.1** - Estendi la regressione aggiungendo una seconda feature.
Genera `budget_social = rng.uniform(2, 30, n)` e crea un target
`vendite = 5 + 2.5 * budget + 1.8 * budget_social + rumore`.
Costruisci la matrice X con 3 colonne (1, budget, budget_social),
calcola i coefficienti e l'R-quadro.

**Esercizio 9.2** - Scrivi una funzione `regressione_ols(X, y)` che riceve
la matrice X (gia' con la colonna di 1) e il vettore y, e restituisce
un dizionario con: `"coefficienti"`, `"mse"`, `"r_squared"`.

In [None]:
# Scrivi qui la tua soluzione


---
## Riepilogo

| Concetto | Funzione NumPy | Uso in Data Analysis |
|----------|---------------|----------------------|
| Creazione array | `np.array`, `np.zeros`, `np.eye` | Strutturare dati numerici |
| Reshape / Trasposta | `.reshape()`, `.T` | Riorganizzare dataset |
| Filtri booleani | `arr[arr > x]` | Filtraggio dati (come pandas) |
| Operazioni vettoriali | `+`, `-`, `*`, `/` | Calcoli colonna per colonna |
| Statistiche | `np.mean`, `np.std`, `np.percentile` | Analisi descrittiva |
| Prodotto scalare | `np.dot`, `@` | Scoring, similarita' |
| Norma e distanza | `np.linalg.norm` | Clustering, KNN |
| Prodotto matriciale | `A @ B` | Trasformazioni lineari |
| Inversa | `np.linalg.inv` | Regressione lineare |
| Sistemi lineari | `np.linalg.solve` | Ottimizzazione |
| Autovalori | `np.linalg.eig` | PCA, riduzione dimensionale |
| Covarianza | `np.cov`, `np.corrcoef` | Analisi delle correlazioni |

Queste operazioni sono il fondamento computazionale su cui si basano
pandas, scikit-learn e gran parte dell'ecosistema Python per la data science.