# Resumo Executivo 

Este projeto apresenta uma análise aprofundada do conjunto de dados de comércio eletrônico realizado pela plataforma Olist, cobrindo o período de 2016 a 2018.

O Olist é uma empresa que se entitula um ecossistema líder em soluções para vendas online. Seus produtos digitais são destinados a varejistas e marcas de todos os segmentos, com tecnologia integrada para auxiliar no crescimento e aumentar o faturamento de pequenas, médias e grandes empresas. 

O estudo, usando SQL e Python, explora várias dimensões do comércio eletrônico, incluindo padrões de pedidos, preferências de pagamento, entrega logística, categorização de produtos e desempenho do vendedor.

As principais conclusões destacam tendências notáveis no comportamento do consumidor e na eficiência operacional da empresa. Os insights obtidos com esta análise não apenas esclarecem o estado atual do comércio eletrônico do olist, mas também preparam o terreno para pesquisas futuras. A próxima fase visa aprofundar o comportamento do vendedor, com foco na segmentação e estratégia, enriquecendo assim nossa compreensão da dinâmica do comércio eletrônico da plataforma.

## Conteúdo

- [Descrição dos dados](#descrição-dos-dados)
- [Objetivos do projeto](#objetivos-do-projeto)



## Descrição dos dados

O conjunto de dados públicos de comércio eletrônico da Olist é um conjunto de dados abrangente que contém dados de 100.000 pedidos entre os anos de 2016 à 2018. Esse rico conjunto de dados fornece uma visão multidimensional de cada pedido, abrangendo aspectos como status do pedido, preços, pagamento e desempenho do frete. Também inclui detalhes sobre a localização dos clientes, atributos do produto e avaliações dos clientes. O conjunto de dados compreende 9 bancos de dados relacionais, incluindo informações sobre clientes, pedidos, itens de pedidos, pagamentos, avaliações, vendedores, produtos, categorias de produtos e geolocalização. A estrutura desses bancos de dados é ilustrada no esquema de banco de dados a seguir.

XXXXXX inculir imagem XXXXXXX


## Objetivos do projeto

1. O objetivo principal desta análise é obter insights sobre as diversas facetas do comércio eletrônico realizado dentro da plataforma Olist, com foco em pedidos, pagamentos, entregas e produtos.
2. Transformar dados complexos de comércio eletrônico em um formato de fácil compreensão, proporcionando aos leitores uma visão clara e concisa do cenário do comércio eletrônico da plataforma Olist.

## Analise Exploratória dos Dados (EDA)

### Configuração do Projeto

Para preparar o projeto, execute o scripit `startup.sh`. Ele irá realizar as seguintes tarefas:

1. Inicializará uma imagem Docker do Postgres
2. Executará o arquivo main.py

**main.py**: Utiliza duas classes: `OlistDataExtractor`, que extrai os datasets csv do arquivo `olist_data.zip` para um diretório `/data/raw`. E `OlistDataLoader` que carrega e cria as tabelas no banco de dados Postgres. (Veja o README do projeto para mais detalhes.) 

## Conexão como o Postgres

**Importações básicas**

In [None]:
import os

import pandas as pd
import psycopg2
from dotenv import load_dotenv
from sqlalchemy import create_engine

load_dotenv()

**Carregameno do módulo sql**

In [None]:
%load_ext sql

**Conexão com o banco de dados**

In [None]:
conn = os.environ.get("CONNECTION_STRING")

In [None]:
%sql {conn}

**Confere o schema do banco**

In [None]:
%%sql
SELECT *
FROM pg_catalog.pg_tables
WHERE schemaname != 'pg_catalog' AND 
    schemaname != 'information_schema';