# **MÓDULO 26 - Projeto Final do Aprofundamento de Analytics**

Bem-vindos ao Projeto de Dashboard de E-commerce! Este projeto é uma oportunidade para vocês aplicarem habilidades essenciais de análise de dados em um cenário prático e realista. Vocês irão trabalhar com um conjunto de dados de transações de clientes de uma loja virtual, distribuídos em duas tabelas distintas. O objetivo final é construir um dashboard interativo que facilite a visualização e análise das informações relevantes do e-commerce, utilizando ferramentas como Looker Studio ou Power BI.

**Objetivo do Projeto:**

Tratamento de Dados: Realizar a junção (JOIN) de duas tabelas utilizando SQL para consolidar as informações.
Análise de Dados: Exportar os dados resultantes para um arquivo CSV.
Visualização de Dados: Desenvolver um dashboard interativo e informativo para visualização das principais métricas e insights do e-commerce.

**Tabelas Disponibilizadas:**

**Tabela de Transações:** Contém os registros de transações realizadas pelos clientes, incluindo detalhes como ID da transação, valor e outros.


**Tabela de Dados Pessoais:** Contém as informações pessoais dos clientes, como ID do cliente, nome, genero, cidade, etc.

**Chave de Ligação:** As tabelas se relacionam através da coluna ID_CLIENT, que é a chave identificadora dos clientes.

# Etapas do Projeto:

1. Realizar um JOIN SQL nas duas tabelas, unificando as informações através da coluna ID_CLIENT. Você deve justificar a escolha do JOIN (Inner/ Left/ Right ou Full).

2. Exportar os dados consolidados resultantes do JOIN para um arquivo CSV.

3. Utilizar Looker Studio ou Power BI para importar o arquivo CSV.

4. Criar visualizações interativas que apresentem métricas importantes, como total de vendas, número de transações, distribuição geográfica dos clientes, perfil demográfico dos clientes, entre outros.

Abaixo temos a configuração do ambiente SQL:

In [11]:
import sqlite3
import pandas as pd

In [13]:
df_transacoes = pd.read_csv("TB_TRANSACOES_PROJETO_ECOMM.csv", delimiter=';')
df_clientes = pd.read_csv("TB_CLIENTES_PROJETO_ECOMM.csv", delimiter=';')

In [15]:
conn = sqlite3.connect('projeto.db')
# Carregar o DataFrame no banco de dados SQLite - criando tb_transacoes e tb_clientes
df_transacoes.to_sql('tb_transacoes', conn, index=False, if_exists='replace')
df_clientes.to_sql('tb_clientes', conn, index=False, if_exists='replace')

175

In [17]:
# Função para executar consultas SQL e retornar o resultado como um DataFrame
def run_query(query):
    return pd.read_sql_query(query, conn)

In [30]:
query = """
SELECT
*
FROM tb_transacoes AS A
LEFT JOIN tb_clientes AS B
ON A.id_client = B.Id_client
"""
df = pd.read_sql(query, conn)
df

Unnamed: 0,id_client,Category,Price,Card Type,state_name,First_name,Gender,Job_Title,Id_client
0,37,Electronics,7293,mastercard,ND,Cornie,Genderqueer,Editor,37.0
1,38,Jewelry,12189,mastercard,PA,Rab,Male,Assistant Manager,38.0
2,39,Baby,643,mastercard,MA,Codie,Female,Financial Analyst,39.0
3,40,Outdoors,948,mastercard,OR,Scott,Female,Civil Engineer,40.0
4,5,Outdoors,6195,mastercard,MN,Tanney,Female,VP Marketing,5.0
...,...,...,...,...,...,...,...,...,...
362,363,Jewelry,4432,mastercard,,,,,
363,364,Kids,12042,mastercard,,,,,
364,365,Grocery,2431,mastercard,,,,,
365,366,Tools,11153,mastercard,,,,,


Justifique a escolha do JOIN:

Escolhi o LEFT JOIN pelo fato de poder unir os dados da tabela da esquerda e criar insights a partir deles, sem precisar dos dados da tabela da direita, que são mais limitados, e também, não interfere em nada trazer a tabela da esquerda toda, só tem a ajudar.

Exportando o arquivo como CSV:

In [35]:
df.to_csv('dados_ecommerce_final.csv', index=False)

**Dicas para o projeto:**
- Se atente que, como o mesmo cliente realiza mais de 1 transação quando você for trazer alguma métrica relacionada a dados do cliente terá que utilizar o distinct para criar essas métricas no dashboard, se não acabará tendo os dados repetidos.

- Análise sua tabela, entenda a dimensão dos dados, no excel, antes de enviar para o Powerbi ou Looker Studio.

- Tente montar preveamente um roteiro de quais métricas e visualizações irá colocar no dashboard, isso tornará seu processo mais rápido.

- Qualquer dificuldade para subir sua base para as ferramentas de visualização envie a base e o erro encontrado para que os tutores possam te ajudar.