# CAP 4 - REGRESSÃO

#### Exercício: 

Parte 1: Desenvolva o código necessário para a fórmula básica da regressão linear simples, calculando os coeficientes. 

Parte 2: Use o modelo para fazer previsões.

O dataset abaixo contém dados sobre medidas da cabeça de seres humanos e o peso do cérebro. Seu trabalho é criar um modelo de regressão linear simples que receba uma medida como entrada e faça a previsão do peso do cérebro!

# Outra forma de resolver

In [2]:
# Imports
import numpy as np
import pandas as pd

In [3]:
#Carregando a biblioteca de Regressão
from sklearn.linear_model import LinearRegression

In [5]:
# Carregando os dados
data = pd.read_csv('arquivos/pesos2.csv')
data.head()

Unnamed: 0,Sexo,Grupo,Head Size,Brain Weight
0,1,1,4512,1530
1,1,1,3738,1297
2,1,1,4261,1335
3,1,1,3777,1282
4,1,1,4177,1590


In [6]:
# Definição de Variáveis Independente e Dependente: 'Head Size' é usada como variável independente (X), e 'Brain Weight' como variável dependente (Y). Ambas são extraídas do DataFrame.
X = data['Head Size'].values
Y = data['Brain Weight'].values

In [7]:
# A variável independente X é transformada em um array bidimensional para atender à exigência da API do scikit-learn, que espera que os dados de entrada estejam nesse formato.
X = X.reshape(-1, 1)


In [8]:
# Uma instância de LinearRegression é criada e ajustada aos dados com model.fit(X, Y). Isso faz com que o modelo aprenda a relação entre X e Y.

model = LinearRegression()
model.fit(X, Y)

In [9]:
# model.predict(X) é usado para gerar previsões do modelo para as observações de entrada X.

Y_pred = model.predict(X)


In [10]:
# O coeficiente de determinação (R²) é calculado usando r2_score(Y, Y_pred), o qual fornece uma medida de quão bem as previsões do modelo se ajustam aos dados reais. 
#Quanto mais próximo de 1, melhor o modelo explica a variabilidade dos dados.
# Nesse exemplo R2 de 0.639 indica que há uma correlação moderada a forte entre o tamanho da cabeça e o peso do cérebro nos seus dados, mas há espaço para melhorias no modelo

from sklearn.metrics import r2_score
r2_score(Y, Y_pred)


0.639311719957

In [12]:
# Novo valor de Head Size para previsão
new_head_size = np.array([[4450]])  # Necessário estar em formato 2D

# Fazendo a previsão usando o modelo
predicted_brain_weight = model.predict(new_head_size)

print("Previsão do peso do cérebro para Head Size de 4000 cm³:", predicted_brain_weight[0])


Previsão do peso do cérebro para Head Size de 4000 cm³: 1497.8339817772699


## RESUMO AULA 04



**Introdução & Como Organizamos Nosso Trabalho:** Inicia com uma visão geral sobre a importância da regressão na análise de dados e discute a organização eficaz do trabalho de modelagem estatística, desde a preparação dos dados até a escolha da metodologia correta.

**O Que é Regressão?:** Regressão é uma técnica estatística empregada para explorar e modelar a relação entre uma variável dependente (objetivo) e uma ou mais variáveis independentes (preditoras), com o propósito de fazer previsões ou entender essas relações.

**Variáveis Dependente e Independente:** Define a variável dependente como aquela cujas variações se deseja prever ou explicar, enquanto as variáveis independentes são consideradas como influenciadoras da variável dependente.

**O Que Representa a Correlação?:** Discute como a correlação quantifica a força e a direção da relação linear entre duas variáveis quantitativas, indicando como as variáveis se relacionam entre si.

**Correlação Não Implica Causalidade:** Enfatiza que, embora duas variáveis possam estar correlacionadas, isso não necessariamente indica que uma causa alterações na outra, ressaltando a necessidade de cautela na interpretação de correlações.

**Tipos de Modelos de Regressão:** Apresenta diversos tipos de modelos de regressão, incluindo regressão linear simples e múltipla, regressão logística e outros, cada um adequado para diferentes tipos de dados e análises.

**Formalizando a Regressão Linear Simples:** Introduz a formulação matemática da regressão linear simples, explicando como modelar a relação entre duas variáveis através de uma linha reta e a equação Y = a + bX.

**Solução de uma Regressão Linear Simples & Método dos Mínimos Quadrados:** Descreve como o método dos mínimos quadrados é utilizado para encontrar os coeficientes da regressão que minimizam a diferença entre os valores observados e os valores previstos pela linha de regressão.

**Minimizando a Soma Geral do Erro ao Quadrado & Erro Padrão da Estimativa:** Aborda a minimização do erro quadrático como uma medida da qualidade do ajuste do modelo e discute o erro padrão da estimativa como um indicador da precisão das previsões do modelo.

**Coeficiente de Determinação:** Explica o coeficiente de determinação (R²) como uma medida que indica qual proporção da variação na variável dependente pode ser explicada pelas variáveis independentes no modelo.

**Interpretando Um Modelo de Regressão com StatsModels:** Mostra como utilizar o módulo Python StatsModels para construir e interpretar modelos de regressão, incluindo a análise dos coeficientes e a avaliação da qualidade do ajuste do modelo.

**Exercício - Criando um Modelo de Regressão Para Prever o Peso do Cérebro:** Propõe um exercício prático para aplicar os conceitos de regressão, construindo um modelo que preveja o peso do cérebro com base em variáveis independentes.
