### 📦 Briefing do Projeto – Vendas XPTO

#### 🧩 Cenário
A empresa XPTO está em expansão e deseja modernizar suas decisões comerciais com base em dados.

O departamento de vendas forneceu dois arquivos para a equipe de dados:
- `base_vendas.csv`: com as vendas realizadas.
- `aumento.csv`: com os percentuais de aumento dos produtos por categoria.

#### 🎯 Objetivos do Projeto
1. Aplicar os percentuais de acréscimo às vendas e criar uma nova coluna com o valor ajustado.
2. Realizar um comparativo por categoria (antes e depois do acréscimo).
3. Calcular a comissão de cada vendedor (2,5% sobre o total vendido).
4. Gerar gráficos para apoiar a análise (barras comparativas e comissão).
5. Organizar os dados e simular o envio dos resultados por e-mail.

#### 🔍 Situação Problema

A empresa XPTO forneceu dois arquivos CSV:

- `base_vendas.csv`: registros das vendas realizadas.
- `aumento.csv`: percentuais de aumento por categoria de produto.

Sua missão:
1. Aplicar os percentuais de aumento aos dados de venda.
2. Calcular a comissão dos vendedores (2,5%).
3. Realizar análises agregadas por categoria e por vendedor.
4. Gerar gráficos comparativos.
5. Responder o Desafio.


#### 💡 O que se espera de você?
- Que organize os dados de forma clara e limpa;
- Aplique os cálculos e gere as visualizações corretamente;
- Responda aos desafios e complete os blocos de código propostos.


#### Esse projeto é um ótimo exemplo de como Python pode ser usado para automatizar análises comerciais reais. 😉
---

### Etapa 1: Instalação de bibliotecas

Execute o código abaixo para instalar a biblioteca `chardet` se necessário ou repita o processo para as demais bibliotecas.

In [None]:
# !pip install chardet

### Etapa 2: Importação de bibliotecas

**Exercício:** Execute o código abaixo para importar as bibliotecas que serão usadas neste notebook.

In [22]:
import pandas as pd
import numpy as np
import chardet
import matplotlib.pyplot as plt
import seaborn as sns


### Etapa 3: Como descobrir encoding do arquivo CSV

🚨 **Exercício:** Use a biblioteca `chardet` para descobrir o encoding do arquivo `base_vendas.csv` e `categorias_valores.csv`.

In [2]:
rawdata = open('base_vendas.csv', 'rb').read()
encoding = chardet.detect(rawdata)['encoding']
print('Encoding detectado:', encoding)

Encoding detectado: ISO-8859-1


In [3]:
rawdata = open('categorias_valores.csv', 'rb').read()
encoding2 = chardet.detect(rawdata)['encoding']
print('Encoding detectado:', encoding2)

Encoding detectado: utf-8


### ℹ️ Entendendo o que é *Encoding*

Quando lemos arquivos `.csv`, precisamos informar ao Python **como os caracteres estão codificados** no arquivo. Essa codificação é chamada de **encoding**.

📌 **Encoding** é o formato que traduz os textos em bytes para que possam ser armazenados em arquivos.

Os encodings mais comuns são:

- **UTF-8**: É o mais utilizado atualmente. Compatível com acentos, símbolos e idiomas diversos. É a codificação padrão na internet.
- **ISO-8859-1** (ou Latin-1): Era muito usada em arquivos de sistemas antigos ou exportações do Excel em português. Também suporta acentos, mas com codificação diferente da UTF-8.

⚠️ Se o encoding for informado errado, os dados podem aparecer com caracteres quebrados, como `Ã©` em vez de `é`.

✅ Por isso usamos a biblioteca `chardet` para detectar automaticamente o encoding antes de carregar os dados com `pd.read_csv(...)`.

Exemplo prático:
```python
df = pd.read_csv("base_vendas.csv", encoding="ISO-8859-1", sep=";")


### Etapa 3.1: Crie o dataframe com os arquivos csv.


In [4]:
df_vendas = pd.read_csv('base_vendas.csv', encoding="ISO-8859-1", sep=';')
df_categorias = pd.read_csv('categorias_valores.csv', encoding='utf-8', sep=',')

### Etapa 4: Estrutura e Diagnóstico Inicial dos Dados (EDA)

Antes de partirmos para a exploração gráfica, vamos entender a estrutura da base:

In [1]:
# Veja as primeiras linhas do dataframe de vendas


In [2]:
# Veja as primeiras linhas do dataframe de categorias


In [3]:
# Verifique os tipos de dados e colunas do dataframs de vendas


In [4]:
# Verifique os tipos de dados e colunas do dataframe de categorias


In [5]:
# Verifique os valores nulos do dataframe de vendas.


In [6]:
# Verifique os valores nulos do dataframe de categorias


In [7]:
# Verifique a estatistica das colunas textuais do dataframe de categorias.


In [8]:
# Verifique a estatistica das colunas textuais do dataframe de vendas.


In [9]:
# Verifique a estatistica das colunas numéricas do dataframe de vendas.


In [10]:
# Verifique a estatistica das colunas numéricas do dataframe de categorias.


In [11]:
# Verifique os valores únicos da coluna 'Categoria' do dataframe de categorias.
 

In [12]:
# Verifique os valores únicos da coluna 'categoria_produto' do dataframe de vendas.


In [13]:
# Verifique os valores únicos da coluna 'nome_vendedor' do dataframe de vendas.


In [14]:
# Verifique os valores únicos da coluna 'categoria_produto' do dataframe de vendas.


In [15]:
# Verifique a estatística da categoria do produto por valor de venda.


### Etapa 5: Análise Gráfica

Agora sim, vamos explorar graficamente os dados!

##### Plot um Histograma de Distribuição dos Valores de Venda

##### Plot um Gráfico de barras por marca de produto


##### Plot um Boxplot por categoria (para visualizar dispersão dos valores.

### Etapa 6: Questões **DESAFIO**
🚨 **Desafio 1:** Renomeie a coluna `valor` para `percentual_aumento` e una os dois DataFrames.

🚨 **Desafio 2:** Crie uma nova coluna no resultado do ultimo dataframe criado chamada `venda_final` aplicando o percentual de aumento.

🚨 **Desafio 3:** Faça uma visualização agrupado por `categoria` e gerado um gráfico comparando os valores originais e com aumento.

🚨 **Desafio 4:** Faça uma análise Calculando a comissão de 2,5% para cada vendedor.

🚨 **Desafio 5** Gere um gráfico com a comissão dos vendedores, calculados no desafio anterior.

🚨 **Desafio 6:** Transforme a coluna `data_venda` em formato de data e crie uma nova coluna `ano` com o ano da venda.

🚨 **Desafio 7:** Calcule o total de vendas por ano.

🚨 **Desafio 8:** Crie um gráfico de pizza com a distribuição percentual de vendas por categorias.

🚨 **Desafio 9:** Escreva abaixo ao menos 2 insights baseados nas análises anteriores.

---Exemplo:
- Qual categoria mais fatura?
- Qual vendedor teve a maior comissão?
- Houve crescimento ano a ano?

In [None]:
# Escreva seus insights aqui:
# 1.
# 2.

🚨 **Desafio 10:** Exporte os dados finais de categoria e comissão para arquivos CSV.

---

### 🛒 Desafio Extra — Projeto de Vendas com PostgreSQL usando psycopg2 e ipython-sql.

Agora que você finalizou a análise dos dados de vendas, chegou o momento de estruturar tudo como um banco de dados relacional real!

Neste desafio, você irá:

✅ Conectar ao PostgreSQL  
✅ Criar as tabelas via SQL  
✅ Inserir os dados linha a linha a partir do DataFrame (o dataframe gerado da Venda o qual calculamos a venda com aumento) .
✅ Realizar algumas consultas de negócio com SQL puro  

---

#### 🎯 Objetivo

Transformar os dados do seu projeto de vendas em um banco PostgreSQL, criando uma tabela chamada `vendas_final`, contendo as informações abaixo:

##### 🧱 Estrutura esperada da tabela `vendas_final`

| Campo           | Tipo     | Descrição                            |
|-----------------|----------|--------------------------------------|
| cod_produto     | texto    | Código identificador do produto      |
| nome_produto    | texto    | Nome do produto                      |
| categoria       | texto    | Categoria do produto                 |
| valor_venda     | numérico | Valor original da venda              |
| venda_final     | numérico | Valor com aumento aplicado           |
| nome_vendedor   | texto    | Nome do vendedor responsável         |
| data_venda      | data     | Data em que ocorreu a venda          |

---

#### 🔌 Etapa 1 — Conectando ao banco PostgreSQL (Dica)

```python
import psycopg2

try:
    conn = psycopg2.connect(
        host="localhost",
        database="aula01",
        user="postgres",
        password="1234"
    )
    print("Conexão bem sucedida!")
except Exception as e:
    print("Erro ao conectar ao banco de dados:", e)

# Criar o cursor
crsr = conn.cursor()

```
#### 🔑 Etapa 2 — Crie as tabelas com SQL com Python;
#### 🔎 Etapa 3 - Inserir os dados na tabela apartir do dataframe.
#### 📥 Etapa 4 - Realizar algumas consultas de negócio com SQL puro.

- Qual foi o total de vendas por categoria?
- Quem foram os 3 vendedores que mais venderam?
- Qual a média de valor final de venda?


#### 📦 Entregáveis do Desafio:

✅ Notebook .ipynb com:

- Conexão via psycopg2;
- Criação da tabela vendas_final;
- Inserção linha a linha dos dados;
- Banco PostgreSQL populado com os dados corretos;
- Execução de 3 consultas SQL obrigatórias;

✅ Entrega do Projeto:

- Subir o projeto no GITHUB, documentado e me enviar o link do repositório por email.
- Ou enviar o projeto por e-mail: nayara.valevskii@gmail.com

#### DICA:

Aproveite o projeto para o portfólio, documente e post no Linkedin.

Boa sorte, galerinhaaa! 🔥

