# Note

In [1]:
# Importando as bibliotecas essenciais
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

# Configura√ß√£o para melhor visualiza√ß√£o
plt.style.use('seaborn-v0_8')
sns.set_palette("husl")
print("Bibliotecas importadas com sucesso!")

Bibliotecas importadas com sucesso!


## 2. Cria√ß√£o de Dados de Exemplo

Vamos criar um dataset simples para trabalharmos:

In [None]:
# Criando dados de exemplo
np.random.seed(42)

# Simulando dados de vendas de casas
n_amostras = 100
area_casa = np.random.normal(150, 50, n_amostras)  # √°rea em m¬≤
preco_casa = area_casa * 2000 + np.random.normal(0, 20000, n_amostras)  # pre√ßo em R$

# Criando um DataFrame
dados = pd.DataFrame({
    'area_m2': area_casa,
    'preco_reais': preco_casa
})

print("Dataset criado!")
print(f"Formato dos dados: {dados.shape}")
print("\nPrimeiras 5 linhas:")
dados.head()

## 3. An√°lise Explorat√≥ria dos Dados

Vamos explorar nossos dados:

In [None]:
# Estat√≠sticas descritivas
print("Estat√≠sticas descritivas:")
print(dados.describe())

print("\nInforma√ß√µes sobre o dataset:")
print(dados.info())

print("\nCorrela√ß√£o entre vari√°veis:")
print(dados.corr())

## 4. Visualiza√ß√£o dos Dados

Vamos criar alguns gr√°ficos para entender melhor nossos dados:

In [None]:
# Criando visualiza√ß√µes
fig, axes = plt.subplots(2, 2, figsize=(12, 10))

# Gr√°fico de dispers√£o
axes[0, 0].scatter(dados['area_m2'], dados['preco_reais'], alpha=0.6)
axes[0, 0].set_xlabel('√Årea (m¬≤)')
axes[0, 0].set_ylabel('Pre√ßo (R$)')
axes[0, 0].set_title('Rela√ß√£o entre √Årea e Pre√ßo')

# Histograma da √°rea
axes[0, 1].hist(dados['area_m2'], bins=15, alpha=0.7, color='skyblue')
axes[0, 1].set_xlabel('√Årea (m¬≤)')
axes[0, 1].set_ylabel('Frequ√™ncia')
axes[0, 1].set_title('Distribui√ß√£o da √Årea')

# Histograma do pre√ßo
axes[1, 0].hist(dados['preco_reais'], bins=15, alpha=0.7, color='lightcoral')
axes[1, 0].set_xlabel('Pre√ßo (R$)')
axes[1, 0].set_ylabel('Frequ√™ncia')
axes[1, 0].set_title('Distribui√ß√£o do Pre√ßo')

# Boxplot
axes[1, 1].boxplot([dados['area_m2'], dados['preco_reais']])
axes[1, 1].set_xticklabels(['√Årea (m¬≤)', 'Pre√ßo (R$)'])
axes[1, 1].set_title('Boxplot das Vari√°veis')

plt.tight_layout()
plt.show()

## 5. Modelo de Machine Learning Simples

Agora vamos criar um modelo de regress√£o linear para prever o pre√ßo das casas baseado na √°rea:

In [None]:
# Preparando os dados
X = dados[['area_m2']]  # Features (vari√°vel independente)
y = dados['preco_reais']  # Target (vari√°vel dependente)

# Dividindo os dados em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

print(f"Dados de treino: {X_train.shape[0]} amostras")
print(f"Dados de teste: {X_test.shape[0]} amostras")

# Criando e treinando o modelo
modelo = LinearRegression()
modelo.fit(X_train, y_train)

print("Modelo treinado com sucesso!")
print(f"Coeficiente: {modelo.coef_[0]:.2f}")
print(f"Intercepto: {modelo.intercept_:.2f}")

## 6. Avalia√ß√£o do Modelo

Vamos avaliar como nosso modelo est√° performando:

In [None]:
# Fazendo previs√µes
y_pred = modelo.predict(X_test)

# Calculando m√©tricas
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print("M√©tricas de Avalia√ß√£o:")
print(f"Erro Quadr√°tico M√©dio (MSE): {mse:.2f}")
print(f"Coeficiente de Determina√ß√£o (R¬≤): {r2:.3f}")

# Visualizando as previs√µes
plt.figure(figsize=(10, 6))
plt.scatter(X_test, y_test, alpha=0.6, label='Valores Reais')
plt.scatter(X_test, y_pred, alpha=0.6, color='red', label='Previs√µes')
plt.plot(X_test, y_pred, color='red', linewidth=2, alpha=0.8)
plt.xlabel('√Årea (m¬≤)')
plt.ylabel('Pre√ßo (R$)')
plt.title('Valores Reais vs Previs√µes')
plt.legend()
plt.show()

# Exemplo de previs√£o
area_exemplo = 120
preco_previsto = modelo.predict([[area_exemplo]])[0]
print(f"\nExemplo: Uma casa de {area_exemplo}m¬≤ teria pre√ßo previsto de R$ {preco_previsto:.2f}")

## 7. Conclus√£o

Neste notebook simples, aprendemos:

1. **Importa√ß√£o de bibliotecas** essenciais para ML
2. **Cria√ß√£o e manipula√ß√£o** de dados com Pandas
3. **An√°lise explorat√≥ria** dos dados
4. **Visualiza√ß√£o** com Matplotlib
5. **Cria√ß√£o de um modelo** de regress√£o linear
6. **Avalia√ß√£o** do modelo com m√©tricas

### Pr√≥ximos Passos:
- Explorar diferentes algoritmos de ML
- Trabalhar com datasets reais
- Aprender t√©cnicas de feature engineering
- Implementar valida√ß√£o cruzada
- Otimizar hiperpar√¢metros

**Parab√©ns!** Voc√™ completou seu primeiro notebook de Machine Learning! üéâ