# Análise Exploratória de Dados com Pandas e Matplotlib


In [None]:
import pandas as pd
import matplotlib.pyplot as plt


## Carregando os dados

In [None]:
# Carregar dados do CSV
df = pd.read_csv("vendas.csv", parse_dates=["Data"])
df["Receita Total"] = df["Quantidade"] * df["Preço Unitário"]
df.head()

## Análise inicial

In [None]:
print(df.dtypes)
print(df.isnull().sum())

## Receita total por categoria

In [None]:
df.groupby("Categoria")["Receita Total"].sum()

## Quantidade média por categoria

In [None]:
df.groupby("Categoria")["Quantidade"].mean()

## Gráfico de barras - Receita por categoria

In [None]:
df.groupby("Categoria")["Receita Total"].sum().plot(kind="bar")
plt.title("Receita Total por Categoria")
plt.ylabel("R$")
plt.show()

## Gráfico de linha - Receita por mês

In [None]:
df.set_index("Data").resample("M")["Receita Total"].sum().plot()
plt.title("Receita Mensal")
plt.ylabel("R$")
plt.show()

## Top 5 produtos mais vendidos

In [None]:
mais_vendidos = df.groupby("Produto")["Quantidade"].sum().sort_values(ascending=False).head(5)
print(mais_vendidos)

## Categoria com maior ticket médio

In [None]:
agrupado = df.groupby("Categoria").agg({
    "Receita Total": "sum",
    "Quantidade": "sum"
})
agrupado["Ticket Médio"] = agrupado["Receita Total"] / agrupado["Quantidade"]
categoria_top = agrupado["Ticket Médio"].idxmax()
valor_top = agrupado["Ticket Médio"].max()
print(f"Categoria com maior ticket médio: {categoria_top} (R$ {valor_top:.2f})")