ESTUDOS DE REGRESSÃO

In [2]:
import numpy as np

## Função de Custo MSE

A função de custo do Erro Quadrático Médio (MSE) é dada por:

$$
J(\theta) = \frac{1}{2m} \sum_{i=1}^{m} (h_\theta(x^{(i)}) - y^{(i)})^2
$$


Onde:
- $ h_\theta(x^{(i)}) = \theta^T x^{(i)} $ é a hipótese (predição do modelo).
- $ y^{(i)} $ é o valor real.
- $ m $ é o número de exemplos de treinamento.


## Equação Normal

A equação normal que minimiza $ J(\theta) $ é:

$$
\theta = (X^T X)^{-1} X^T y
$$

Onde:
- $ X $ é a matriz de características (com uma coluna de 1s para o termo de viés).
- $ y $ é o vetor de valores reais.

## Derivação da Equação Normal

### 1. Função de Custo MSE

A função de custo MSE é dada por:

$$
J(\theta) = \frac{1}{2m} (X\theta - y)^T (X\theta - y)
$$

### 2. Derivada da Função de Custo

Para minimizar $ J(\theta) $, derivamos em relação a $ \theta $ e igualamos a zero:

$$
\nabla_\theta J(\theta) = \frac{1}{m} X^T (X\theta - y) = 0
$$

### 3. Igualando a Derivada a Zero

Rearranjando a equação, obtemos:

$$
X^T (X\theta - y) = 0
$$

### 4. Resolvendo para $ \theta $

Isso nos leva a:

$$
X^T X\theta = X^T y
$$

### 5. Equação Normal

Finalmente, a solução para $ \theta $ é:

$$
\theta = (X^T X)^{-1} X^T y
$$

In [29]:
# Dados de exemplo
X = np.array([[1, 1], [1, 2], [1, 3]])  # Matriz de características (com coluna de 1s para o viés)
y = np.array([1, 2, 3])  # Vetor de valores reais

# Passo 1: Calcular X^T X
X_T_X = X.T @ X
print("X^T X:\n", X_T_X)

# Passo 2: Calcular a inversa de X^T X
X_T_X_inv = np.linalg.inv(X_T_X)
print("\n(X^T X)^(-1):\n", X_T_X_inv)

# Passo 3: Calcular X^T y
X_T_y = X.T @ y
print("\nX^T y:\n", X_T_y)

# Passo 4: Calcular theta
theta = X_T_X_inv @ X_T_y
print("\nCoeficientes theta (equação normal):\n", theta)

X^T X:
 [[ 3  6]
 [ 6 14]]

(X^T X)^(-1):
 [[ 2.33333333 -1.        ]
 [-1.          0.5       ]]

X^T y:
 [ 6 14]

Coeficientes theta (equação normal):
 [-1.77635684e-15  1.00000000e+00]
