In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import geopandas as gpd
import folium
from folium.plugins import MarkerCluster

# Configurações gerais
dataset_path = "data/train.csv"

# Carregar os dados
df = pd.read_csv(dataset_path)

# Ajustar nomes de colunas
df.columns = df.columns.str.strip().str.lower().str.replace(" ", "_").str.replace("-", "_")

# Exibir primeiras linhas
display(df.head())

# Informações gerais do dataset
df.info()

# Estatísticas descritivas
display(df.describe())

# Distribuição de preços
plt.figure(figsize=(10, 5))
sns.histplot(df['preco'], bins=50, kde=True)
plt.xlabel('Preço dos Imóveis')
plt.ylabel('Frequência')
plt.title('Distribuição de Preços dos Imóveis')
plt.show()

# Correlação entre variáveis numéricas
plt.figure(figsize=(10, 6))
sns.heatmap(df.corr(), annot=True, cmap='coolwarm', fmt='.2f')
plt.title("Matriz de Correlação")
plt.show()

# Mapa Geoespacial com Folium
if 'latitude' in df.columns and 'longitude' in df.columns:
    mapa = folium.Map(location=[df['latitude'].mean(), df['longitude'].mean()], zoom_start=10)
    marker_cluster = MarkerCluster().add_to(mapa)
    
    for _, row in df.iterrows():
        folium.Marker(
            location=[row['latitude'], row['longitude']],
            popup=f"Preço: R${row['preco']:.2f}"
        ).add_to(marker_cluster)
    
    mapa.save("mapa_imoveis.html")
    print("Mapa salvo como mapa_imoveis.html")

# Boxplot de preços por estado
if 'estado' in df.columns:
    plt.figure(figsize=(12, 6))
    sns.boxplot(x='estado', y='preco', data=df)
    plt.xticks(rotation=45)
    plt.title("Distribuição de Preços por Estado")
    plt.show()


ModuleNotFoundError: No module named 'geopandas'