# Notebook: Regressão Linear Passo a Passo

## Introdução à Regressão Linear

A regressão linear é uma técnica estatística usada para modelar a relação entre uma variável dependente (também chamada de variável resposta) e uma ou mais variáveis independentes (também chamadas de preditoras). No caso da regressão linear simples, consideramos apenas uma variável dependente e uma variável independente, e o objetivo é ajustar uma linha reta que melhor explique a relação entre essas duas variáveis.

Neste notebook, vamos aprender a realizar uma regressão linear simples passo a passo, usando Python e a biblioteca `scikit-learn`. Vamos explicar cada etapa de forma detalhada, para que qualquer pessoa possa entender como a regressão linear funciona.

## Importando as Bibliotecas Necessárias

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression

## Definindo os Dados

Vamos começar definindo um conjunto de dados fictício. Suponha que temos um conjunto de dados que relaciona o número de horas estudadas por um aluno e a sua pontuação em um teste.

### Importante:
- **Alterar os Dados**: Caso você deseje usar outros dados, você pode modificar os arrays `X` e `y` no código abaixo.

In [None]:
# Definindo os dados de entrada (horas estudadas) e os dados de saída (pontuação no teste)
X = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10]).reshape(-1, 1)  # Horas estudadas
y = np.array([15, 18, 21, 24, 30, 35, 40, 50, 55, 60])  # Pontuação no teste

# Visualizando os dados
plt.scatter(X, y, color='blue')
plt.xlabel('Horas Estudadas')
plt.ylabel('Pontuação no Teste')
plt.title('Relação entre Horas Estudadas e Pontuação no Teste')
plt.grid(True)
plt.show()

## Treinando o Modelo de Regressão Linear

Vamos usar o `scikit-learn` para treinar um modelo de regressão linear simples. Primeiro, precisamos criar um objeto `LinearRegression()` e, em seguida, ajustar (treinar) o modelo usando nossos dados.

### Passos:
1. Crie um objeto do tipo `LinearRegression`.
2. Use o método `.fit(X, y)` para ajustar o modelo aos dados.

In [None]:
# Criando o modelo de regressão linear
modelo = LinearRegression()

# Treinando o modelo com os dados de entrada (X) e saída (y)
modelo.fit(X, y)

### Coeficientes da Regressão Linear

Após treinar o modelo, podemos acessar os coeficientes da linha de regressão.

- **Coeficiente Angular (Slope)**: Indica a inclinação da linha de regressão. Pode ser acessado através do atributo `.coef_`.
- **Intercepto (Intercept)**: Indica o ponto onde a linha de regressão cruza o eixo y. Pode ser acessado através do atributo `.intercept_`.

In [None]:
# Acessando o coeficiente angular e o intercepto da linha de regressão
coeficiente_angular = modelo.coef_[0]
intercepto = modelo.intercept_

print(f"Coeficiente Angular (Slope): {coeficiente_angular}")
print(f"Intercepto (Intercept): {intercepto}")

## Fazendo Previsões

Agora que o modelo foi treinado, podemos usá-lo para fazer previsões. Vamos prever a pontuação de um aluno que estudou por 7,5 horas.

### Importante:
- **Alterar o Valor**: Caso você queira prever para um valor diferente de horas estudadas, altere a variável `horas_estudadas` no código abaixo.

In [None]:
# Definindo as horas estudadas para fazer a previsão
horas_estudadas = np.array([[7.5]])

# Fazendo a previsão
pontuacao_prevista = modelo.predict(horas_estudadas)

print(f"Pontuação prevista para um aluno que estudou por 7,5 horas: {pontuacao_prevista[0]:.2f}")

## Visualizando a Linha de Regressão

Vamos agora visualizar a linha de regressão ajustada aos nossos dados. A linha de regressão é a linha que melhor se ajusta aos pontos dos nossos dados.

In [None]:
# Visualizando a linha de regressão
plt.scatter(X, y, color='blue', label='Dados Reais')
plt.plot(X, modelo.predict(X), color='red', label='Linha de Regressão')
plt.xlabel('Horas Estudadas')
plt.ylabel('Pontuação no Teste')
plt.title('Regressão Linear - Horas Estudadas vs Pontuação no Teste')
plt.legend()
plt.grid(True)
plt.show()

## Exercícios Adicionais

### Exercício 1: Treinando um Modelo com Novos Dados

Vamos considerar um novo conjunto de dados que relaciona a quantidade de anúncios veiculados em uma campanha publicitária e o número de produtos vendidos. Treine um modelo de regressão linear e faça previsões com base nesses novos dados.

In [None]:
# Novos dados: Anúncios veiculados (X) e Produtos vendidos (y)
X_ex1 = np.array([5, 10, 15, 20, 25, 30, 35, 40, 45, 50]).reshape(-1, 1)  # Anúncios veiculados
y_ex1 = np.array([7, 15, 20, 27, 33, 40, 45, 55, 60, 70])  # Produtos vendidos

# Visualizando os novos dados
plt.scatter(X_ex1, y_ex1, color='green')
plt.xlabel('Anúncios Veiculados')
plt.ylabel('Produtos Vendidos')
plt.title('Relação entre Anúncios Veiculados e Produtos Vendidos')
plt.grid(True)
plt.show()

# Treinando o modelo com os novos dados
modelo_ex1 = LinearRegression()
modelo_ex1.fit(X_ex1, y_ex1)

# Coeficiente Angular e Intercepto
coef_ex1 = modelo_ex1.coef_[0]
intercepto_ex1 = modelo_ex1.intercept_

print(f"Coeficiente Angular (Exercício 1): {coef_ex1}")
print(f"Intercepto (Exercício 1): {intercepto_ex1}")

# Fazendo uma previsão para 37 anúncios veiculados
anuncios_veiculados = np.array([[37]])
vendas_previstas = modelo_ex1.predict(anuncios_veiculados)

print(f"Produtos vendidos previstos para 37 anúncios veiculados: {vendas_previstas[0]:.2f}")

### Exercício 2: Relação entre Idade e Altura

Considere um conjunto de dados que relaciona a idade de crianças (em anos) e sua altura (em centímetros). Treine um modelo de regressão linear e faça previsões para novas idades.

In [None]:
# Dados: Idade (X) e Altura (y)
X_ex2 = np.array([2, 3, 4, 5, 6, 7, 8, 9, 10, 11]).reshape(-1, 1)  # Idade (em anos)
y_ex2 = np.array([85, 90, 95, 100, 105, 112, 118, 125, 130, 135])  # Altura (em cm)

# Visualizando os dados
plt.scatter(X_ex2, y_ex2, color='purple')
plt.xlabel('Idade (anos)')
plt.ylabel('Altura (cm)')
plt.title('Relação entre Idade e Altura')
plt.grid(True)
plt.show()

# Treinando o modelo com os novos dados
modelo_ex2 = LinearRegression()
modelo_ex2.fit(X_ex2, y_ex2)

# Coeficiente Angular e Intercepto
coef_ex2 = modelo_ex2.coef_[0]
intercepto_ex2 = modelo_ex2.intercept_

print(f"Coeficiente Angular (Exercício 2): {coef_ex2}")
print(f"Intercepto (Exercício 2): {intercepto_ex2}")

# Fazendo uma previsão para 7,5 anos de idade
idade_nova = np.array([[7.5]])
altura_prevista = modelo_ex2.predict(idade_nova)

print(f"Altura prevista para uma criança de 7,5 anos: {altura_prevista[0]:.2f} cm")

## Conclusão

Neste notebook, aprendemos como:
1. Definir um conjunto de dados e visualizar a relação entre as variáveis.
2. Treinar um modelo de regressão linear usando `scikit-learn`.
3. Obter os coeficientes da linha de regressão (coeficiente angular e intercepto).
4. Fazer previsões usando o modelo treinado.
5. Visualizar a linha de regressão ajustada aos dados.

### Onde Alterar para Outros Exemplos
- **Dados**: Para treinar um modelo com dados diferentes, basta alterar os arrays `X` e `y`.
- **Fazer Previsões**: Para prever novos valores, altere a variável usada no método `.predict()`.

Espero que este notebook tenha sido útil para você entender como funciona a regressão linear! Se precisar de mais exemplos ou alguma explicação adicional, é só pedir.