# Diferença entre Regressão Linear e Regressão Logística

## Regressão Linear

### O que é?
A regressão linear é uma técnica estatística utilizada para modelar a relação entre uma variável dependente contínua e uma ou mais variáveis independentes. O objetivo é encontrar uma linha que melhor se ajusta aos dados.

### Por que é diferente?
- **Tipo de Saída**: A saída é um valor contínuo (ex: preço, altura).
- **Modelo**: A relação entre as variáveis é expressa por uma equação linear.

### Exemplo Simples
Imagine que queremos prever o preço de uma casa com base em sua área (em metros quadrados). A equação da regressão linear poderia ser:

\[
\text{Preço} = 50000 + 300 \times \text{Área}
\]

Aqui, \(50000\) representa o preço base da casa, e \(300\) indica que, para cada metro quadrado adicional, o preço aumenta em \(300\) reais.

---

## Regressão Logística

### O que é?
A regressão logística é utilizada para modelar a probabilidade de uma variável dependente categórica (geralmente binária) com base em uma ou mais variáveis independentes. Ela usa a função logística para restringir a saída entre 0 e 1.

### Por que é diferente?
- **Tipo de Saída**: A saída é uma probabilidade que pode ser convertida em uma classe (ex: sim/não, compra/não compra).
- **Modelo**: A relação é expressa através da função logística.

### Exemplo Simples
Suponha que queremos prever se um cliente fará uma compra com base em sua renda. A equação da regressão logística pode ser:

\[
P(\text{Compra}) = \frac{1}{1 + e^{-(0.2 + 0.01 \times \text{Renda})}}
\]

Neste caso, \(P(\text{Compra})\) representa a probabilidade de o cliente fazer a compra, e a função logística transforma a combinação linear de variáveis em uma probabilidade entre 0 e 1.

---

## Resumo das Diferenças

| Aspecto                     | Regressão Linear          | Regressão Logística      |
|-----------------------------|---------------------------|---------------------------|
| **Saída**                   | Valor contínuo            | Probabilidade de uma classe |
| **Modelo**                  | Linear                    | Não-linear (logística)    |
| **Exemplo**                 | Preço de uma casa em função da área | Probabilidade de um cliente fazer uma compra com base na renda |

---

## Conclusão
A escolha entre regressão linear e logística depende do tipo de variável que você está tentando prever. Use a regressão linear para variáveis contínuas e a regressão logística para variáveis categóricas.



![image.png](attachment:image.png)

# Quantitativa Continua X Quantitativa Categórica

| Aspecto                     | Quantitativa Contínua         | Quantitativa Categórica       |
|-----------------------------|--------------------------------|--------------------------------|
| **Tipo de Dados**           | Números que podem variar continuamente | Categorias distintas         |
| **Exemplos**                | Altura, Peso, Temperatura      | Gênero, Classificação de Produto |
| **Análise**                 | Média, Mediana, Desvio Padrão  | Frequência, Proporção        |


# Distribuição Binomial X Distribução Multinomial

| Aspecto                     | Distribuição Binomial          | Distribuição Multinomial       |
|-----------------------------|--------------------------------|--------------------------------|
| **Número de Resultados**    | Dois resultados (sucesso/fracasso) | Múltiplos resultados (k categorias) |
| **Exemplo**                 | Lançar uma moeda               | Lançar um dado                 |
| **Probabilidades**          | \( p \) para sucesso           | \( p_1, p_2, \ldots, p_k \) para cada categoria |
| **Contagem**                | Número de sucessos em \( n \) tentativas | Contagem de cada categoria em \( n \) tentativas |


# Exemplo de Uso da Regressão Linear em um Projeto de IA

## Contexto
Você está desenvolvendo um modelo para prever o preço de casas em uma determinada região, usando a área da casa como variável independente.

## Dados
Suponha que você tenha coletado os seguintes dados sobre casas na região:

| Área (m²) | Preço (R$) |
|-----------|------------|
| 50        | 150000     |
| 70        | 210000     |
| 100       | 300000     |
| 120       | 360000     |
| 150       | 450000     |


In [11]:
#pip install scikit-learn

import numpy as np
import pandas as pd
from sklearn.linear_model import LinearRegression

# Criando o dataset
dados = {
    'Área (m²)': [50, 70, 100, 120, 150],
    'Preço (R$)': [150000, 210000, 300000, 360000, 450000]
}
dataset = pd.DataFrame(dados)

# Preparar os dados
area = dataset['Área (m²)'].values.reshape(-1, 1)  # Reshape para uma matriz coluna
preco = dataset['Preço (R$)'].values

# Criar o modelo
modelo = LinearRegression()
modelo.fit(area, preco)

# Fazer previsões
nova_area = np.array([[80]])
preco_previsto = modelo.predict(nova_area)

print(f"O preço previsto para uma casa de 80 m² é: R$ {preco_previsto[0]:.2f}")


O preço previsto para uma casa de 80 m² é: R$ 240000.00
