 ## **Regressão Linear do Zero**
 Aluno: Lucca de Sena Barbosa

 Curso: Ciência da Computação - 2025.2

 - **Estudo de caso**: Prever o salário de um funcionário com base na sua idade;
 - **Objetivo**: Compreender como funcionam os modelos de regressão linear do zero;

 ### **1. Importando as bibliotecas necessárias;**

In [None]:
import pandas as pd
import numpy as np
import plotly.graph_objects as go

 ### **2. Criando um conjunto de dados simples;**

In [None]:
quantidade = 1000

idades = np.random.randint(18, 81, quantidade)

salarios_base = 800 + (idades - 18) * (20000 - 800) / (80 - 18)  
ruido = np.random.normal(0, 1500, quantidade)  
salarios = np.clip(salarios_base + ruido, 800, 20000) 

# Criar DataFrame
dados = pd.DataFrame({
    "Idade": idades,
    "Salario": salarios.astype(int)
})

In [None]:
dados

Unnamed: 0,Idade,Salario
0,71,19137
1,53,11234
2,71,16117
3,18,1356
4,35,8941
...,...,...
995,52,9376
996,34,2680
997,32,6778
998,44,9333


 ### **3. Criando o modelo:**

 #### **3.1 Regressão Linear Simples (y):**

 $$
 y = m \cdot x + b
 $$

 - Precisamos definir os valores de **inclinação (m)** e **intercepto (b)** para construir a função que representa o modelo.

 ---

 #### **3.2 Inclinação (m):**

 $$
 m = \frac{\operatorname{Cov}(X,Y)}{\operatorname{Var}(x)}
 $$

 **3.2.1 Covariância (Cov):**

 $$
 \operatorname{Cov}(X,Y) = \frac{\sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y})}{n-1}
 $$


 **3.2.2 Variância (Var):**

 $$
 \operatorname{Var}(x) = \frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n-1}
 $$

 ---

 #### **3.3 Intercepto (b):**

 $$
 b = \bar{y} - m \cdot \bar{x}
 $$

 ---

In [None]:
def media(valores):
    """
    Calcula a média de uma lista ou array.
    """
    n = len(valores)
    soma = 0
    for i in range(n):
        soma += valores[i]

    return soma / n

class RegressaoLinearSimples:
    def __init__(self):
        # Inicializando os parâmetros do modelo
        self.m = None  # Inclinação (m)
        self.b = None  # Intercepto (b)

    def inclinacao(self, x, y):
        """
        Calcula a inclinação da reta de regressão:
                        m = Cov(X,Y) / Var(X)
        """
        x_media = media(x)
        y_media = media(y)
        n = len(x)

        soma_quadrados_x = 0
        soma_covariancia = 0

        for i in range(n):
            soma_quadrados_x += (x[i] - x_media) ** 2
            soma_covariancia += (x[i] - x_media) * (y[i] - y_media)

        variancia_x = soma_quadrados_x / (n - 1)
        covariancia_xy = soma_covariancia / (n - 1)

        return covariancia_xy / variancia_x

    def intercepto(self, media_x, media_y, m):
        return media_y - (m * media_x)

    def treinar(self, x, y):
        self.m = self.inclinacao(x, y)
        self.b = self.intercepto(media(x), media(y), self.m)

    def prever(self, valores):
        return (self.m * valores) + self.b


x = dados["Idade"].values
y = dados["Salario"].values

modelo = RegressaoLinearSimples()
modelo.treinar(x, y)
y_previsto = modelo.prever(x)

 ### **4. Visualização do modelo com gráficos:**

In [None]:
fig = go.Figure()

# Gráfico dos registros reais
fig.add_trace(go.Scatter(
    x=x, 
    y=y, 
    mode='markers', 
    name='Dados reais',
    marker=dict(color='blue')
))

# Gráfico dos registros previstos
fig.add_trace(go.Scatter(
    x=x, 
    y=y_previsto, 
    mode='lines',  
    name='Modelo',
    line=dict(color='red', width=3)
))

# Layout
fig.update_layout(
    title='Regressão Linear Simples',
    xaxis_title='Idade',
    yaxis_title='Salário',
    showlegend=True,
    template='plotly_dark' 
)

fig.show()

 ### **5. Avaliando a performance do modelo:**

In [None]:
def r_quadrado(y_real, y_previsto):
    soma_residuos = 0
    y_media = media(y_real)
    soma_total = 0

    for i in range(len(y_real)):
        soma_residuos += (y_real[i] - y_previsto[i]) ** 2
        soma_total += (y_real[i] - y_media) ** 2
    
    return 1 - (soma_residuos / soma_total)

def rmse(y_real, y_previsto):
    soma = 0
    n = len(y_real)

    for i in range(n):
        soma += (y_real[i] - y_previsto[i]) ** 2
    
    return (soma / n) ** 0.5

print(f"R²: {r_quadrado(y, y_previsto)}")
print(f"RMSE: {rmse(y, y_previsto)}")

R²: 0.9311834718081685
RMSE: 1440.364050923862
