# <span style="color: green; font-size: 40px; font-weight: bold;"> Projeto 1 (Regressão) </span>

<br><br>

# Prevendo o Valor de Propriedades Imobiliárias

<br><br>

### Contexto

- Uma empresa de corretagem imobiliária está procurando melhorar suas estimativas de preços de venda para propriedades residenciais. Eles querem usar um modelo de regressão para prever o valor de uma casa com base em várias características.
- O **objetivo** é ajudar os corretores a fornecer estimativas de preço mais precisas para seus clientes e, assim, fechar negócios mais rapidamente.

<br>

### Problema de Negócio
- Como podemos prever o valor de venda de uma propriedade residencial com base em suas características?

<br>

### Sobre o Conjunto de Dados

O conjunto de dados simulado terá 10.000 linhas e incluirá as seguintes colunas:

- **area (float)**: Área da propriedade em metros quadrados.
- **bedrooms (int)**: Número de quartos.
- **bathrooms (int)**: Número de banheiros.
- **floors (int)**: Número de andares.
- **year_built (int)**: Ano de construção.
- **location (str)**: Localização da propriedade (bairro ou cidade).
- **garage (int)**: Número de vagas na garagem.
- **value (float)**: Valor de venda da propriedade (variável alvo).


<br><br>

## Importando Pacotes

In [1]:
### Manipulação de Dados ###

# NumPy: Biblioteca para operações matemáticas e manipulação de arrays.
import numpy as np
# Pandas: Biblioteca para manipulação e análise de dados estruturados.
import pandas as pd


### Exibição de Gráficos ###

# Matplotlib: Biblioteca para criação de gráficos e visualizações.
import matplotlib.pyplot as plt
# Seaborn: Biblioteca para criação de gráficos estatísticos e visualizações.
import seaborn as sns


### Machine Learning ###

# Scikit-learn: Biblioteca para ML, incluindo ferramentas para pré-processamento, modelagem, e avaliação.
import sklearn
# Train Test Split: Função para dividir os dados em conjuntos de treino e teste.
from sklearn.model_selection import train_test_split
# StandardScaler: Ferramenta para padronização de recursos, ajustando a média e a variância.
from sklearn.preprocessing import StandardScaler
# LinearRegression, Ridge, Lasso: Algoritmos de regressão linear, incluindo regularização L2 (Ridge) e L1 (Lasso).
from sklearn.linear_model import LinearRegression, Ridge, Lasso


### Avaliação de Modelos ### 

# Métricas para avaliar o desempenho
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score, explained_variance_score


### Configurações Adicionais ###

# Configuração de estilo para visualizações Seaborn.
sns.set_style('whitegrid')
# Inline: Para exibir gráficos diretamente no Jupyter Notebook.
%matplotlib inline
# Warnings: Biblioteca para gerenciar mensagens de aviso, aqui usada para ignorar avisos futuros.
import warnings
warnings.filterwarnings("ignore", category=FutureWarning)
# Ignorando avisos de depreciação
warnings.filterwarnings("ignore", category=DeprecationWarning)

<br><br><br>

## Carregando Conjunto de Dados

In [5]:
# Carrega o dataset
dados = pd.read_csv('dados/imoveis.csv')

In [6]:
# Visualiza
dados.head()

Unnamed: 0,area,bedrooms,bathrooms,floors,year_built,location,garage,value
0,174.835708,2.0,2.0,2.0,1919.0,Zona Norte,3.0,664379.908882
1,143.086785,1.0,1.0,2.0,1959.0,Zona Norte,0.0,501897.679702
2,182.384427,5.0,2.0,1.0,1939.0,Centro,1.0,803255.932459
3,226.151493,2.0,3.0,1.0,1982.0,Zona Oeste,2.0,922852.429946
4,138.292331,1.0,2.0,1.0,2001.0,Centro,1.0,433672.784015


In [8]:
# Info
dados.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 10100 entries, 0 to 10099
Data columns (total 8 columns):
 #   Column      Non-Null Count  Dtype  
---  ------      --------------  -----  
 0   area        10000 non-null  float64
 1   bedrooms    9998 non-null   float64
 2   bathrooms   9997 non-null   float64
 3   floors      10100 non-null  float64
 4   year_built  9999 non-null   float64
 5   location    10100 non-null  object 
 6   garage      9999 non-null   float64
 7   value       10100 non-null  float64
dtypes: float64(7), object(1)
memory usage: 631.4+ KB
