# 1. Inspeção Inicial dos Dados - Ames Housing Dataset

Este notebook realiza a inspeção inicial do conjunto de dados Ames Housing, focando em:
1. Carregamento dos dados
2. Visão geral da estrutura do dataset
3. Análise inicial dos tipos de dados
4. Verificação de valores ausentes
5. Estatísticas básicas

In [None]:
# Importando as bibliotecas necessárias
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import missingno as msno

# Configurações de visualização
plt.style.use('seaborn')
pd.set_option('display.max_columns', None)
%matplotlib inline

In [None]:
# Carregando os dados
df = pd.read_csv('../data/ames_housing.csv')

# Exibindo as primeiras linhas do dataset
print("Primeiras 5 linhas do dataset:")
df.head()

In [None]:
# Informações gerais sobre o dataset
print("\nInformações gerais sobre o dataset:")
df.info()

In [None]:
# Estatísticas descritivas básicas
print("\nEstatísticas descritivas das variáveis numéricas:")
df.describe()

In [None]:
# Análise de valores ausentes
missing_values = df.isnull().sum()
missing_percentages = (missing_values / len(df)) * 100

missing_df = pd.DataFrame({
    'Valores Ausentes': missing_values,
    'Porcentagem (%)': missing_percentages
})

print("\nAnálise de valores ausentes:")
print(missing_df[missing_df['Valores Ausentes'] > 0].sort_values('Valores Ausentes', ascending=False))

In [None]:
# Visualização de valores ausentes
plt.figure(figsize=(12, 6))
msno.matrix(df)
plt.title('Matriz de Valores Ausentes')
plt.show()

In [None]:
# Tipos de dados por coluna
print("\nTipos de dados por coluna:")
df.dtypes.value_counts().to_frame('Contagem')