# M√≥dulo 3: Gerando Insights com An√°lise e Visualiza√ß√£o üìä

## Cen√°rio

No M√≥dulo 2, fizemos o trabalho pesado de limpar e organizar nossos dados de vendas. Agora, com um conjunto de dados limpo e confi√°vel, podemos come√ßar a parte mais divertida: **responder perguntas de neg√≥cio**.

O gerente da lanchonete quer saber:
1.  Qual produto gera mais receita?
2.  Em qual dia da semana vendemos mais?

Nossa miss√£o √© usar o poder do Pandas e das bibliotecas de visualiza√ß√£o para transformar nossos dados em respostas claras e visuais.

### Passo 0: Configura√ß√£o do Ambiente

Al√©m do `pandas`, agora vamos importar duas novas bibliotecas essenciais:
- **`matplotlib.pyplot` (apelido `plt`):** A biblioteca fundamental para criar gr√°ficos em Python. Ela nos d√° controle total sobre a apar√™ncia das nossas visualiza√ß√µes.
- **`seaborn` (apelido `sns`):** Constru√≠da sobre o Matplotlib, ela nos permite criar gr√°ficos estat√≠sticos mais bonitos e complexos com menos c√≥digo.

Vamos tamb√©m definir um "tema" para o Seaborn, para que nossos gr√°ficos j√° comecem com um visual mais profissional.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Define o estilo visual dos gr√°ficos
sns.set_theme(style="whitegrid")

### Passo 1: Preparando os Dados (Recapitulando o M√≥dulo 2)

Para garantir que este notebook funcione de forma independente, vamos executar rapidamente todos os passos de limpeza que aprendemos no M√≥dulo 2. Isso garante que estamos partindo de uma base de dados limpa e pronta para a an√°lise.

In [None]:
# 1. Carregar os dados
url = 'https://raw.githubusercontent.com/Miriam1s/mini_curso_inobar/main/vendas_lanchonete.csv'
df = pd.read_csv(url)

# 2. Limpar e transformar os dados
df['Preco'] = df['Preco'].str.replace(',', '.').astype(float)
df['ID_Cliente'].fillna(0, inplace=True)
df['ID_Cliente'] = df['ID_Cliente'].astype(int)
df['Data'] = pd.to_datetime(df['Data'])

# 3. Criar a coluna 'Total_Venda'
df['Total_Venda'] = df['Preco'] * df['Quantidade']

# 4. Verificar o resultado
print("Dados limpos e prontos para an√°lise:")
df.info()
print("\nPrimeiras linhas do DataFrame final:")
df.head()

### Passo 2: O Poder do Agrupamento com `.groupby()`

Para responder nossas perguntas, precisamos agregar nossos dados. Por exemplo, para saber o total de vendas por produto, precisamos somar todas as vendas de "Coxinha", todas as de "Pastel", e assim por diante.

√â aqui que entra o m√©todo `.groupby()`, uma das ferramentas mais poderosas do Pandas.

> **Analogia:** Pense no `.groupby()` como separar uma pilha de roupas para lavar. Voc√™ tem uma pilha de roupas misturadas (seu DataFrame). `df.groupby('Produto')` √© o ato de criar montes separados: um para coxinhas, um para past√©is, etc. Depois de separar, voc√™ pode aplicar uma opera√ß√£o a cada monte, como somar (`.sum()`), contar (`.count()`) ou calcular a m√©dia (`.mean()`).

#### Pergunta 1: Qual produto gera mais receita?

**L√≥gica:**
1.  **Agrupar** os dados por `Produto`.
2.  Selecionar a coluna que queremos agregar: `Total_Venda`.
3.  Aplicar a opera√ß√£o de **soma** (`.sum()`).
4.  Ordenar os resultados para ver os melhores primeiro (`.sort_values()`).

In [None]:
faturamento_por_produto = df.groupby('Produto')['Total_Venda'].sum().sort_values(ascending=False)

print("Faturamento total por produto:")
print(faturamento_por_produto)

#### Visualizando a Resposta

Uma tabela de n√∫meros √© boa, mas um gr√°fico √© muito mais eficaz para comunicar esse resultado em uma apresenta√ß√£o.

Como estamos comparando categorias (produtos), um **gr√°fico de barras** √© a escolha ideal.

In [None]:
# Define o tamanho da figura (largura, altura)
plt.figure(figsize=(10, 6))

# Cria o gr√°fico de barras
sns.barplot(x=faturamento_por_produto.index, y=faturamento_por_produto.values, palette='viridis')

# Adiciona T√≠tulo e R√≥tulos
plt.title('Faturamento Total por Produto', fontsize=16)
plt.xlabel('Produto', fontsize=12)
plt.ylabel('Faturamento Total (R$)', fontsize=12)

# Rotaciona os r√≥tulos do eixo x para melhor leitura, se necess√°rio
plt.xticks(rotation=45)

# Mostra o gr√°fico
plt.show()

> üí° **Dica de Storytelling com Dados:**
> * **Sempre d√™ um t√≠tulo claro ao seu gr√°fico.** A audi√™ncia deve entender o que est√° vendo sem precisar de explica√ß√µes.
> * **Rotule seus eixos.** O que significa o eixo X? E o Y? Inclua a unidade de medida (R$, %, etc.).
> * **Ordene suas barras.** Barras ordenadas (do maior para o menor, por exemplo) s√£o muito mais f√°ceis de ler do que barras desordenadas.

**Insight:** A Coxinha √© claramente nosso carro-chefe em faturamento!

#### Pergunta 2: Em qual dia da semana vendemos mais?

**L√≥gica:**
1.  Primeiro, precisamos criar uma coluna com o dia da semana. O Pandas torna isso f√°cil com o acessor `.dt` em colunas de data.
2.  Depois, agrupamos por essa nova coluna (`Dia_Semana`) e somamos o `Total_Venda`.
3.  **Pulo do Gato:** Os dias da semana vir√£o em ordem alfab√©tica. Precisamos reorden√°-los para a ordem correta (Segunda, Ter√ßa, etc.) para que o gr√°fico fa√ßa sentido.

In [None]:
# 1. Criar a coluna com o nome do dia da semana
# Usamos .dt.day_name() para obter o nome do dia em ingl√™s
df['Dia_Semana'] = df['Data'].dt.day_name()

# 2. Agrupar e somar
vendas_por_dia = df.groupby('Dia_Semana')['Total_Venda'].sum()

# 3. Corrigir a ordem dos dias
dias_ordem = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday']
vendas_por_dia = vendas_por_dia.reindex(dias_ordem).dropna()

print("Faturamento por dia da semana:")
print(vendas_por_dia)

#### Visualizando a Resposta

Novamente, um gr√°fico de barras √© perfeito para comparar o desempenho de cada dia.

In [None]:
plt.figure(figsize=(12, 6))

sns.barplot(x=vendas_por_dia.index, y=vendas_por_dia.values, palette='plasma')

plt.title('Faturamento por Dia da Semana', fontsize=16)
plt.xlabel('Dia da Semana', fontsize=12)
plt.ylabel('Faturamento Total (R$)', fontsize=12)

plt.show()

**Insight:** Nossas vendas se concentram no in√≠cio da semana, com um pico na Ter√ßa-feira. Isso pode indicar uma oportunidade para promo√ß√µes no final de semana para atrair mais clientes.

### Desafio Final! üèÜ

Agora √© sua vez de ser o analista!

**Sua miss√£o:** O gerente quer saber qual produto vende mais em **quantidade**, n√£o em faturamento. 

1.  Calcule a **quantidade total de itens vendidos por produto**.
2.  Crie um gr√°fico de barras para visualizar o resultado. N√£o se esque√ßa de dar um bom t√≠tulo e rotular os eixos!

In [None]:
# Escreva seu c√≥digo aqui!
# Dica: A l√≥gica √© muito parecida com a da Pergunta 1, mas voc√™ vai somar a coluna 'Quantidade'.


#### Solu√ß√£o do Desafio

In [None]:
# 1. Agrupar por 'Produto' e somar a 'Quantidade'
quantidade_por_produto = df.groupby('Produto')['Quantidade'].sum().sort_values(ascending=False)

# 2. Criar o gr√°fico
plt.figure(figsize=(10, 6))
sns.barplot(x=quantidade_por_produto.index, y=quantidade_por_produto.values, palette='cividis')
plt.title('Quantidade de Itens Vendidos por Produto', fontsize=16)
plt.xlabel('Produto', fontsize=12)
plt.ylabel('Quantidade Total Vendida', fontsize=12)
plt.show()

## Conclus√£o do Minicurso

**Parab√©ns!** üéâ

Voc√™ completou a jornada completa de um analista de dados:
1.  Recebeu dados brutos e bagun√ßados (`.csv`).
2.  Explorou, limpou e preparou os dados para an√°lise (M√≥dulo 2).
3.  Transformou os dados limpos em respostas para perguntas de neg√≥cio usando agrega√ß√µes (`.groupby()`).
4.  Comunicou suas descobertas de forma clara e visual com gr√°ficos (`matplotlib` e `seaborn`).

Este √© o ciclo fundamental da an√°lise de dados. As ferramentas e t√©cnicas que voc√™ aprendeu aqui s√£o a base para resolver problemas muito mais complexos no mundo real.

Lembre-se que este √© apenas o come√ßo. Continue praticando, seja curioso e explore a se√ß√£o **"Como Continuar sua Jornada em Dados"** no `README.md` do nosso reposit√≥rio para encontrar livros, plataformas e dicas para construir seu portf√≥lio.

**Obrigado por participar e boa sorte na sua jornada de dados!**