# Módulo Visualização de Dados:

Leia o arquivo ecommerce_preparados.csv’ dentro de um dataframe  

Faça uma análise detalhada dos dados, descubra quais dados gostaria de destacar e crie os seguintes gráficos:


*   1 Gráfico de dispersão
*   1 Mapa de calor
*   1 Gráfico de barra
*   1 Gráfico de pizza
*   1 Gráfico de densidade

Adicione títulos nos gráficos e nos eixos para ficar claro os objetivos dos gráficos.

Fiquem a vontade para escolher a biblioteca que quiserem, não esqueçam de comentar os códigos.

Essa atividade é um pouco diferente, vocês terão que construir os códigos nesse arquivo e enviar ou o arquivo ou o link do github com o arquivo publicado para os tutores.

In [None]:
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns

sns.set_theme(style="whitegrid")

# Leitura do arquivo (ajuste o caminho se precisar)
df = pd.read_csv('ecommerce_estatistica.csv')

df.head()

In [None]:
df.info()
display(df.describe(include='all').T)

# Separar colunas numéricas e categóricas
num_cols = df.select_dtypes(include='number').columns.tolist()
cat_cols = df.select_dtypes(exclude='number').columns.tolist()

print("Colunas numéricas:", num_cols)
print("Colunas categóricas:", cat_cols)

# Escolhas automáticas (pra não quebrar se o dataset mudar)
x_num = num_cols[0] if len(num_cols) > 0 else None
y_num = num_cols[1] if len(num_cols) > 1 else None
cat = cat_cols[0] if len(cat_cols) > 0 else None


In [None]:
plt.figure(figsize=(10,5))
sns.histplot(df[x_num].dropna(), bins=30, kde=True)
plt.title(f'Histograma de {x_num}')
plt.xlabel(x_num)
plt.ylabel('Frequência')
plt.show()


In [None]:
plt.figure(figsize=(10,5))
sns.scatterplot(data=df, x=x_num, y=y_num, alpha=0.6)
plt.title(f'Dispersão: {x_num} vs {y_num}')
plt.xlabel(x_num)
plt.ylabel(y_num)
plt.show()


In [None]:
plt.figure(figsize=(12,8))
corr = df[num_cols].corr()
sns.heatmap(corr, annot=True, fmt=".2f", cmap="coolwarm", linewidths=0.5)
plt.title('Mapa de calor - Correlação entre variáveis numéricas')
plt.show()


In [None]:
# escolhe uma coluna categórica, ou tenta uma alternativa comum
if cat is None:
    raise ValueError("Não encontrei coluna categórica no dataset para gráfico de barra.")

top = df[cat].value_counts().head(10)

plt.figure(figsize=(10,5))
sns.barplot(x=top.values, y=top.index)
plt.title(f'Top 10 categorias em {cat}')
plt.xlabel('Quantidade')
plt.ylabel(cat)
plt.show()


In [None]:
top = df[cat].value_counts().head(6)
outros = df[cat].value_counts().iloc[6:].sum()
top['Outros'] = outros

plt.figure(figsize=(8,8))
plt.pie(top.values, labels=top.index, autopct='%1.1f%%', startangle=90)
plt.title(f'Distribuição de {cat} (Top 6 + Outros)')
plt.show()


In [None]:
plt.figure(figsize=(10,5))
sns.kdeplot(df[x_num].dropna(), fill=True)
plt.title(f'Densidade (KDE) de {x_num}')
plt.xlabel(x_num)
plt.ylabel('Densidade')
plt.show()


In [None]:
plt.figure(figsize=(10,5))
sns.regplot(data=df, x=x_num, y=y_num, scatter_kws={'alpha':0.5})
plt.title(f'Regressão: {x_num} vs {y_num}')
plt.xlabel(x_num)
plt.ylabel(y_num)
plt.show()
