# **Resumo Machine Learning - PI**

## **1. Álgebra Linear**

### **1.1 Produto Escalar de Tuplas**

O **produto escalar** entre dois vetores (tuplas) é uma operação que multiplica elementos correspondentes e soma os resultados. É fundamental em projeções e cálculos de similaridade.

**Fórmula:**

$$
\text{produto escalar} = \sum_{i=1}^{n} a_i \cdot b_i
$$

**Exemplo:**

In [None]:
a = (1, 2, 3)
b = (4, 5, 6)
produto = sum(x*y for x, y in zip(a, b))
print(f"Produto escalar: {produto}")

**Interpretação:**

- O produto escalar pode indicar a similaridade entre vetores.
- Se o produto escalar for zero, os vetores são ortogonais (perpendiculares).

### **1.2 Multiplicação de Matrizes**

A multiplicação de matrizes combina linhas de uma matriz com colunas de outra. É usada para transformar espaços, aplicar modelos lineares, entre outros.

**Regra:**

- O número de colunas da primeira matriz deve ser igual ao número de linhas da segunda.

**Exemplo:**

In [None]:
import numpy as np

A = np.array([[1, 2],
              [3, 4]])
B = np.array([[5, 6],
              [7, 8]])
C = np.dot(A, B)
print(f"Matriz resultante:\n{C}")

**Interpretação:**

- Cada elemento da matriz resultante é o produto escalar de uma linha de A com uma coluna de B.

### **1.3 Combinação Linear**

Uma **combinação linear** é a soma de vetores multiplicados por escalares. É a base para conceitos como espaço vetorial e independência linear.

**Fórmula:**

$$
\mathbf{v} = c_1\mathbf{v}_1 + c_2\mathbf{v}_2 + \dots + c_n\mathbf{v}_n
$$

**Exemplo:**

In [None]:
import numpy as np

v1 = np.array([1, 0])
v2 = np.array([0, 1])
coeficientes = [3, 4]
resultado = coeficientes[0]*v1 + coeficientes[1]*v2
print(f"Combinação linear: {resultado}")

**Interpretação:**

- A combinação linear pode gerar qualquer vetor em um espaço se os vetores originais forem linearmente independentes.

---

## **2. Matrizes**

### **2.1 Representação de Dados em Matrizes**

Em Machine Learning, dados são frequentemente representados como matrizes, onde linhas representam observações e colunas representam features (atributos).

**Exemplo:**

In [None]:
import numpy as np

# Cada linha é um exemplo, cada coluna é uma feature
dados = np.array([
    [1.2, 3.5, 5.1],
    [2.3, 3.1, 4.8],
    [0.8, 2.9, 5.6]
])
print("Dados:\n", dados)

### **2.2 Organização de Problemas como Operações Matriciais**

Problemas podem ser formulados em termos de operações matriciais para simplificar cálculos e aproveitar otimizações.

**Exemplo:**

- Equação normal da regressão linear:

$$
\mathbf{\hat{\beta}} = (\mathbf{X}^\top \mathbf{X})^{-1} \mathbf{X}^\top \mathbf{y}
$$

---

## **3. Singular Value Decomposition (SVD)**

### **Conceito:**

SVD é uma fatoração de matrizes que expressa uma matriz **A** como o produto de três matrizes:

$$
\mathbf{A} = \mathbf{U} \mathbf{\Sigma} \mathbf{V}^\top
$$

- **U** e **V** são matrizes ortogonais.
- **Σ** é uma matriz diagonal com os **valores singulares**.

### **Interpretação dos Resultados:**

- **Redução de Dimensionalidade:** Podemos aproximar a matriz original usando apenas os maiores valores singulares.
- **Identificação de Outliers:** Pontos que não são bem representados pelos componentes principais podem ser outliers.

**Exemplo: Identificação de Outliers**

In [None]:
from sklearn.decomposition import TruncatedSVD
import numpy as np

X = np.array([
    [1, 2],
    [2, 4],
    [3, 6],
    [4, 8],
    [100, 200]  # Possível outlier
])

svd = TruncatedSVD(n_components=1)
X_reduzido = svd.fit_transform(X)

# Reconstrução
X_reconstruido = svd.inverse_transform(X_reduzido)
# Erro de reconstrução
erro = np.sum((X - X_reconstruido)**2, axis=1)
outlier = np.argmax(erro)
print(f"Possível outlier na posição: {outlier}")

**Similaridade por Distância Cosseno**

- **Distância Cosseno:** Mede o ângulo entre dois vetores.

$$
\text{similaridade} = \frac{\mathbf{a} \cdot \mathbf{b}}{\|\mathbf{a}\| \|\mathbf{b}\|}
$$

**Exemplo:**

In [None]:
from sklearn.metrics.pairwise import cosine_similarity

vetor1 = X_reduzido[0]
vetor2 = X_reduzido[1]
similaridade = cosine_similarity([vetor1], [vetor2])
print(f"Similaridade cosseno: {similaridade[0][0]}")

---

## **4. Clustering**

### **4.1 K-means**

**Conceito:**

- Agrupa dados em **k** clusters baseados na distância euclidiana.
- Iterativamente ajusta os centróides para minimizar a inércia intra-cluster.

**Exemplo:**


In [None]:
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt

X = np.array([
    [1, 2], [1, 4], [1, 0],
    [10, 2], [10, 4], [10, 0]
])

kmeans = KMeans(n_clusters=2, random_state=0)
kmeans.fit(X)
labels = kmeans.labels_

plt.scatter(X[:, 0], X[:, 1], c=labels)
plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1],
            s=200, c='red', marker='X')
plt.title('K-means Clustering')
plt.show()

### **4.2 Silhouette Score**

**Conceito:**

- Mede quão similar um ponto é ao seu próprio cluster comparado aos outros clusters.
- Varia de -1 a 1; valores próximos a 1 indicam bom ajuste.

**Cálculo:**

In [None]:
from sklearn.metrics import silhouette_score

score = silhouette_score(X, labels)
print(f"Silhouette Score: {score}")

**Interpretação:**

- **Alto (>0.5):** Estrutura de cluster definida.
- **Médio (0.2 - 0.5):** Estrutura menos clara.
- **Baixo (<0.2):** Pode não ser adequado o número de clusters.

---

## **5. Otimização**

### **5.1 Mínimo Global vs. Mínimos Locais**

- **Mínimo Global:** O ponto mais baixo em toda a função.
- **Mínimo Local:** O ponto mais baixo em uma região específica.

**Importância:**

- Algoritmos podem ficar presos em mínimos locais.
- Métodos como inicialização aleatória e otimização estocástica podem ajudar a evitar isso.

### **5.2 Gradient Descent**

**Conceito:**

- Algoritmo para encontrar o mínimo de uma função usando o gradiente (derivada).
- Atualiza os parâmetros na direção negativa do gradiente.

**Fórmula de Atualização:**

$$
\theta_{\text{novo}} = \theta_{\text{atual}} - \alpha \nabla J(\theta)
$$

Onde:
- $\theta$: Parâmetros
- $\alpha$: Taxa de aprendizado
- $\nabla J(\theta)$: Gradiente da função de custo

**Implementação Guiada:**

In [None]:
def gradient_descent(derivada, inicial, learning_rate, iteracoes):
    x = inicial
    for i in range(iteracoes):
        grad = derivada(x)
        x = x - learning_rate * grad
    return x

**Análise de Comportamento:**

- **Mínimos Locais:** Visualize a função para entender onde podem ocorrer.
- **Taxa de Aprendizado:** Um valor muito grande pode fazer o algoritmo "pular" o mínimo, enquanto um valor muito pequeno torna a convergência lenta.

---

## **6. Regressão Linear**

### **Interpretação do Modelo**

- **Equação do Modelo:**

$$
\hat{y} = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \dots + \beta_n x_n
$$

- **Coeficientes ($\beta$):** Representam o impacto de cada feature na variável target.

**Equação Normal:**

$$
\mathbf{\hat{\beta}} = (\mathbf{X}^\top \mathbf{X})^{-1} \mathbf{X}^\top \mathbf{y}
$$

**Interpretação:**

- Fornece os coeficientes que minimizam o erro quadrático médio.
- **Feature-Peso-Target:** Entender como cada feature influencia o resultado.

**Exemplo:**

In [None]:
import numpy as np

X = np.array([
    [1, 2100, 3],
    [1, 1600, 2],
    [1, 2400, 4],
    [1, 1416, 2],
    [1, 3000, 4]
])
y = np.array([399900, 329900, 369000, 232000, 539900])

# Cálculo dos coeficientes
beta = np.linalg.inv(X.T.dot(X)).dot(X.T).dot(y)
print(f"Coeficientes: {beta}")

---

## **7. Feature Engineering**

### **7.1 Polinômios**

- **Transformação Polinomial:** Cria novas features elevando as existentes a potências.

**Exemplo:**

In [None]:
from sklearn.preprocessing import PolynomialFeatures

X = np.array([[2], [3], [4]])
poly = PolynomialFeatures(degree=3)
X_poly = poly.fit_transform(X)
print("Features polinomiais:\n", X_poly)

**Aplicação:**

- Permite que modelos lineares capturem relacionamentos não lineares.

### **7.2 Outras Transformações**

- **Logarítmica:** $\log(x)$
- **Raiz Quadrada:** $\sqrt{x}$
- **One-Hot Encoding:** Para variáveis categóricas.

---

## **8. Aplicação**

### **8.1 Análise Exploratória**

- **Objetivo:** Entender a distribuição dos dados, detectar outliers e identificar relações.

**Passos:**

1. **Visualizações:** Histogramas, scatter plots.
2. **Estatísticas Descritivas:** Média, mediana, desvio padrão.
3. **Correlação:** Matriz de correlação para identificar relações lineares.

### **8.2 Construção de Modelo**

- **Separação Treino-Teste:**

In [None]:
from sklearn.model_selection import train_test_split

X = dados[:, :-1]
y = dados[:, -1]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

- **Modelo Linear com Feature Engineering:**

In [None]:
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures

poly = PolynomialFeatures(degree=2)
X_train_poly = poly.fit_transform(X_train)

model = LinearRegression()
model.fit(X_train_poly, y_train)

### **8.3 Avaliação de Modelo**

- **Medida de Desempenho:** Erro Quadrático Médio (MSE), Coeficiente de Determinação (R²).


In [None]:
from sklearn.metrics import mean_squared_error, r2_score

X_test_poly = poly.transform(X_test)
y_pred = model.predict(X_test_poly)

mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print(f"MSE: {mse}")
print(f"R²: {r2}")

**Interpretação:**

- **MSE Baixo:** Melhor ajuste.
- **R² Próximo de 1:** Modelo explica bem a variabilidade dos dados.

---

## **Dicas Adicionais para a Prova**

- **Entenda Conceitos Básicos:** Certifique-se de compreender os fundamentos antes de aprofundar nos detalhes.
- **Interpretação é Chave:** Como o professor mencionou, a prova focará na interpretação dos resultados e modelos.
- **Pratique Sem Código:** Tente explicar conceitos e resolver problemas sem depender do código para reforçar seu entendimento.
- **Relembre Fórmulas Importantes:** Mesmo que o professor forneça as fórmulas, saber como e quando aplicá-las é essencial.
- **Foque em Aplicações Práticas:** Pense em como cada técnica é aplicada em problemas reais.

---