### üì¶ Briefing do Projeto ‚Äì Vendas XPTO

#### üß© Cen√°rio
A empresa XPTO est√° em expans√£o e deseja modernizar suas decis√µes comerciais com base em dados.

O departamento de vendas forneceu dois arquivos para a equipe de dados:
- `base_vendas.csv`: com as vendas realizadas.
- `aumento.csv`: com os percentuais de aumento dos produtos por categoria.

#### üéØ Objetivos do Projeto
1. Aplicar os percentuais de acr√©scimo √†s vendas e criar uma nova coluna com o valor ajustado.
2. Realizar um comparativo por categoria (antes e depois do acr√©scimo).
3. Calcular a comiss√£o de cada vendedor (2,5% sobre o total vendido).
4. Gerar gr√°ficos para apoiar a an√°lise (barras comparativas e comiss√£o).
5. Organizar os dados e simular o envio dos resultados por e-mail.

#### üîç Situa√ß√£o Problema

A empresa XPTO forneceu dois arquivos CSV:

- `base_vendas.csv`: registros das vendas realizadas.
- `aumento.csv`: percentuais de aumento por categoria de produto.

Sua miss√£o:
1. Aplicar os percentuais de aumento aos dados de venda.
2. Calcular a comiss√£o dos vendedores (2,5%).
3. Realizar an√°lises agregadas por categoria e por vendedor.
4. Gerar gr√°ficos comparativos.
5. Responder o Desafio.


#### üí° O que se espera de voc√™?
- Que organize os dados de forma clara e limpa;
- Aplique os c√°lculos e gere as visualiza√ß√µes corretamente;
- Responda aos desafios e complete os blocos de c√≥digo propostos.


#### Esse projeto √© um √≥timo exemplo de como Python pode ser usado para automatizar an√°lises comerciais reais. üòâ
---

### Etapa 1: Instala√ß√£o de bibliotecas

Execute o c√≥digo abaixo para instalar a biblioteca `chardet` se necess√°rio ou repita o processo para as demais bibliotecas.

In [None]:
# !pip install chardet

### Etapa 2: Importa√ß√£o de bibliotecas

**Exerc√≠cio:** Execute o c√≥digo abaixo para importar as bibliotecas que ser√£o usadas neste notebook.

In [22]:
import pandas as pd
import numpy as np
import chardet
import matplotlib.pyplot as plt
import seaborn as sns


### Etapa 3: Como descobrir encoding do arquivo CSV

üö® **Exerc√≠cio:** Use a biblioteca `chardet` para descobrir o encoding do arquivo `base_vendas.csv` e `categorias_valores.csv`.

In [2]:
rawdata = open('base_vendas.csv', 'rb').read()
encoding = chardet.detect(rawdata)['encoding']
print('Encoding detectado:', encoding)

Encoding detectado: ISO-8859-1


In [3]:
rawdata = open('categorias_valores.csv', 'rb').read()
encoding2 = chardet.detect(rawdata)['encoding']
print('Encoding detectado:', encoding2)

Encoding detectado: utf-8


### ‚ÑπÔ∏è Entendendo o que √© *Encoding*

Quando lemos arquivos `.csv`, precisamos informar ao Python **como os caracteres est√£o codificados** no arquivo. Essa codifica√ß√£o √© chamada de **encoding**.

üìå **Encoding** √© o formato que traduz os textos em bytes para que possam ser armazenados em arquivos.

Os encodings mais comuns s√£o:

- **UTF-8**: √â o mais utilizado atualmente. Compat√≠vel com acentos, s√≠mbolos e idiomas diversos. √â a codifica√ß√£o padr√£o na internet.
- **ISO-8859-1** (ou Latin-1): Era muito usada em arquivos de sistemas antigos ou exporta√ß√µes do Excel em portugu√™s. Tamb√©m suporta acentos, mas com codifica√ß√£o diferente da UTF-8.

‚ö†Ô∏è Se o encoding for informado errado, os dados podem aparecer com caracteres quebrados, como `√É¬©` em vez de `√©`.

‚úÖ Por isso usamos a biblioteca `chardet` para detectar automaticamente o encoding antes de carregar os dados com `pd.read_csv(...)`.

Exemplo pr√°tico:
```python
df = pd.read_csv("base_vendas.csv", encoding="ISO-8859-1", sep=";")


### Etapa 3.1: Crie o dataframe com os arquivos csv.


In [4]:
df_vendas = pd.read_csv('base_vendas.csv', encoding="ISO-8859-1", sep=';')
df_categorias = pd.read_csv('categorias_valores.csv', encoding='utf-8', sep=',')

### Etapa 4: Estrutura e Diagn√≥stico Inicial dos Dados (EDA)

Antes de partirmos para a explora√ß√£o gr√°fica, vamos entender a estrutura da base:

In [1]:
# Veja as primeiras linhas do dataframe de vendas


In [2]:
# Veja as primeiras linhas do dataframe de categorias


In [3]:
# Verifique os tipos de dados e colunas do dataframs de vendas


In [4]:
# Verifique os tipos de dados e colunas do dataframe de categorias


In [5]:
# Verifique os valores nulos do dataframe de vendas.


In [6]:
# Verifique os valores nulos do dataframe de categorias


In [7]:
# Verifique a estatistica das colunas textuais do dataframe de categorias.


In [8]:
# Verifique a estatistica das colunas textuais do dataframe de vendas.


In [9]:
# Verifique a estatistica das colunas num√©ricas do dataframe de vendas.


In [10]:
# Verifique a estatistica das colunas num√©ricas do dataframe de categorias.


In [11]:
# Verifique os valores √∫nicos da coluna 'Categoria' do dataframe de categorias.
 

In [12]:
# Verifique os valores √∫nicos da coluna 'categoria_produto' do dataframe de vendas.


In [13]:
# Verifique os valores √∫nicos da coluna 'nome_vendedor' do dataframe de vendas.


In [14]:
# Verifique os valores √∫nicos da coluna 'categoria_produto' do dataframe de vendas.


In [15]:
# Verifique a estat√≠stica da categoria do produto por valor de venda.


### Etapa 5: An√°lise Gr√°fica

Agora sim, vamos explorar graficamente os dados!

##### Plot um Histograma de Distribui√ß√£o dos Valores de Venda

##### Plot um Gr√°fico de barras por marca de produto


##### Plot um Boxplot por categoria (para visualizar dispers√£o dos valores.

### Etapa 6: Quest√µes **DESAFIO**
üö® **Desafio 1:** Renomeie a coluna `valor` para `percentual_aumento` e una os dois DataFrames.

üö® **Desafio 2:** Crie uma nova coluna no resultado do ultimo dataframe criado chamada `venda_final` aplicando o percentual de aumento.

üö® **Desafio 3:** Fa√ßa uma visualiza√ß√£o agrupado por `categoria` e gerado um gr√°fico comparando os valores originais e com aumento.

üö® **Desafio 4:** Fa√ßa uma an√°lise Calculando a comiss√£o de 2,5% para cada vendedor.

üö® **Desafio 5** Gere um gr√°fico com a comiss√£o dos vendedores, calculados no desafio anterior.

üö® **Desafio 6:** Transforme a coluna `data_venda` em formato de data e crie uma nova coluna `ano` com o ano da venda.

üö® **Desafio 7:** Calcule o total de vendas por ano.

üö® **Desafio 8:** Crie um gr√°fico de pizza com a distribui√ß√£o percentual de vendas por categorias.

üö® **Desafio 9:** Escreva abaixo ao menos 2 insights baseados nas an√°lises anteriores.

---Exemplo:
- Qual categoria mais fatura?
- Qual vendedor teve a maior comiss√£o?
- Houve crescimento ano a ano?

In [None]:
# Escreva seus insights aqui:
# 1.
# 2.

üö® **Desafio 10:** Exporte os dados finais de categoria e comiss√£o para arquivos CSV.

---

### üõí Desafio Extra ‚Äî Projeto de Vendas com PostgreSQL usando psycopg2 e ipython-sql.

Agora que voc√™ finalizou a an√°lise dos dados de vendas, chegou o momento de estruturar tudo como um banco de dados relacional real!

Neste desafio, voc√™ ir√°:

‚úÖ Conectar ao PostgreSQL  
‚úÖ Criar as tabelas via SQL  
‚úÖ Inserir os dados linha a linha a partir do DataFrame (o dataframe gerado da Venda o qual calculamos a venda com aumento) .
‚úÖ Realizar algumas consultas de neg√≥cio com SQL puro  

---

#### üéØ Objetivo

Transformar os dados do seu projeto de vendas em um banco PostgreSQL, criando uma tabela chamada `vendas_final`, contendo as informa√ß√µes abaixo:

##### üß± Estrutura esperada da tabela `vendas_final`

| Campo           | Tipo     | Descri√ß√£o                            |
|-----------------|----------|--------------------------------------|
| cod_produto     | texto    | C√≥digo identificador do produto      |
| nome_produto    | texto    | Nome do produto                      |
| categoria       | texto    | Categoria do produto                 |
| valor_venda     | num√©rico | Valor original da venda              |
| venda_final     | num√©rico | Valor com aumento aplicado           |
| nome_vendedor   | texto    | Nome do vendedor respons√°vel         |
| data_venda      | data     | Data em que ocorreu a venda          |

---

#### üîå Etapa 1 ‚Äî Conectando ao banco PostgreSQL (Dica)

```python
import psycopg2

try:
    conn = psycopg2.connect(
        host="localhost",
        database="aula01",
        user="postgres",
        password="1234"
    )
    print("Conex√£o bem sucedida!")
except Exception as e:
    print("Erro ao conectar ao banco de dados:", e)

# Criar o cursor
crsr = conn.cursor()

```
#### üîë Etapa 2 ‚Äî Crie as tabelas com SQL com Python;
#### üîé Etapa 3 - Inserir os dados na tabela apartir do dataframe.
#### üì• Etapa 4 - Realizar algumas consultas de neg√≥cio com SQL puro.

- Qual foi o total de vendas por categoria?
- Quem foram os 3 vendedores que mais venderam?
- Qual a m√©dia de valor final de venda?


#### üì¶ Entreg√°veis do Desafio:

‚úÖ Notebook .ipynb com:

- Conex√£o via psycopg2;
- Cria√ß√£o da tabela vendas_final;
- Inser√ß√£o linha a linha dos dados;
- Banco PostgreSQL populado com os dados corretos;
- Execu√ß√£o de 3 consultas SQL obrigat√≥rias;

‚úÖ Entrega do Projeto:

- Subir o projeto no GITHUB, documentado e me enviar o link do reposit√≥rio por email.
- Ou enviar o projeto por e-mail: nayara.valevskii@gmail.com

#### DICA:

Aproveite o projeto para o portf√≥lio, documente e post no Linkedin.

Boa sorte, galerinhaaa! üî•

