# **Brazilian E-Commerce Public Dataset by Olist**

O conjunto de dados "Brazilian E-Commerce Public Dataset by Olist" é composto por várias tabelas que fornecem informações abrangentes sobre transações de comércio eletrônico. Vou explicar detalhadamente algumas das tabelas principais e seus campos:

![Visualização da distribuição](https://github.com/Wellitiz/Projeto_BigData/blob/main/Files/Arquivos%20Projeto/Base.png?raw=true)

## **Tabela "olist_orders_dataset":**
Informações sobre pedidos, incluindo identificadores, status, datas de compra, aprovação, envio e entrega.

* **order_id:** Identificador único para cada pedido (tipo de dado: string).
* **customer_id:** Identificador único do cliente associado ao pedido (tipo de dado: string).
* **order_status:** Estado do pedido (tipo de dado: string).
* **order_purchase_timestamp:** Data e hora da compra (tipo de dado: timestamp).
* **order_approved_at:** Data e hora da aprovação do pedido (tipo de dado: timestamp).
* **order_delivered_carrier_date:** Data de envio do pedido pelo transportador (tipo de dado: timestamp).
* **order_delivered_customer_date:** Data de entrega do pedido ao cliente (tipo de dado: timestamp).
* **order_estimated_delivery_date:** Data estimada de entrega do pedido (tipo de dado: timestamp).

## **Tabela "olist_order_items_dataset":**
Detalhes sobre os itens de cada pedido, como identificadores, produtos, vendedores, preços e valores de frete.

* **order_id:** Identificador único para cada pedido (tipo de dado: string).
* **order_item_id:** Identificador único para cada item no pedido (tipo de dado: int).
* **product_id:** Identificador único para cada produto (tipo de dado: string).
* **seller_id:** Identificador único para cada vendedor (tipo de dado: string).
* **shipping_limit_date:** Data limite para envio do item (tipo de dado: timestamp).
* **price:** Preço do item (tipo de dado: float).
* **freight_value:** Valor do frete para o item (tipo de dado: float).

## **Tabela "olist_products_dataset":**
Fornece dados detalhados sobre os produtos, incluindo categorias, comprimento, peso e dimensões, possibilitando análises de qualidade do produto e características de produtos mais propensos à insatisfação.

* **product_id:** Identificador único para cada produto (tipo de dado: string).
* **product_category_name:** Nome da categoria do produto (tipo de dado: string).
* **product_name_length:** Comprimento do nome do produto (tipo de dado: int).
* **product_description_length:** Comprimento da descrição do produto (tipo de dado: int).
* **product_photos_qty:** Quantidade de fotos do produto (tipo de dado: int).
* **product_weight_g:** Peso do produto em gramas (tipo de dado: float).
* **product_length_cm:** Comprimento do produto em centímetros (tipo de dado: float).
* **product_height_cm:** Altura do produto em centímetros (tipo de dado: float).
* **product_width_cm:** Largura do produto em centímetros (tipo de dado: float).

## **Tabela "olist_customers_dataset":**
Contém informações sobre os clientes, como identificadores, códigos postais e localizações geográficas, permitindo análises de comportamento do cliente e distribuição geográfica.


* **customer_id:** Identificador único do cliente (tipo de dado: string).
* **customer_unique_id:** Identificador único e anônimo do cliente (tipo de dado: string).
* **customer_zip_code_prefix:** Código postal do cliente (tipo de dado: int).
* **customer_city:** Cidade do cliente (tipo de dado: string).
* **customer_state:** Estado do cliente (tipo de dado: string).

## **Tabela "olist_sellers_dataset":**
Inclui dados sobre os vendedores, como identificadores, códigos postais e localizações geográficas, possibilitando análises sobre a distribuição geográfica dos vendedores.

* **seller_id:** Identificador único do vendedor (tipo de dado: string).
* **seller_zip_code_prefix:** Código postal do vendedor (tipo de dado: int).
* **seller_city:** Cidade do vendedor (tipo de dado: string).
* **seller_state:** Estado do vendedor (tipo de dado: string).

## **Tabela "olist_order_reviews_dataset":**
Contém avaliações dos clientes, incluindo pontuações, títulos e mensagens de comentários, proporcionando insights sobre a satisfação do cliente e feedbacks específicos.

* **review_id:** Identificador único para cada avaliação (tipo de dado: string).
* **order_id:** Identificador único para cada pedido associado à avaliação (tipo de dado: string).
* **review_score:** Pontuação atribuída pelo cliente à avaliação (tipo de dado: int).
* **review_comment_title:** Título do comentário da avaliação (tipo de dado: string).
* **review_comment_message:** Mensagem do comentário da avaliação (tipo de dado: string).
* **review_creation_date:** Data de criação da avaliação (tipo de dado: timestamp).
* **review_answer_timestamp:** Data de resposta à avaliação (tipo de dado: timestamp).

## **Tabela "olist_order_payments_dataset":**
Detalhes sobre pagamentos, incluindo métodos de pagamento, número de parcelas e valores pagos.

* **order_id:** Identificador único para cada pedido (tipo de dado: string).
* **payment_sequential:** Número sequencial para indicar a ordem dos pagamentos para o mesmo pedido (tipo de dado: int).
* **payment_type:** Método de pagamento utilizado (tipo de dado: string).
* **payment_installments:** Número de parcelas do pagamento (tipo de dado: int).
* **payment_value:** Valor do pagamento (tipo de dado: float).

## **Tabela "olist_geolocation_dataset":**
Oferece dados geográficos relacionados a códigos postais, latitude, longitude e localização, permitindo análises espaciais e geográficas.

* **geolocation_zip_code_prefix:** Código postal da localização (tipo de dado: int).
* **geolocation_lat:** Latitude da localização (tipo de dado: float).
* **geolocation_lng:** Longitude da localização (tipo de dado: float).
* **geolocation_city:** Cidade da localização (tipo de dado: string).
* **geolocation_state:** Estado da localização (tipo de dado: string).

## **Tabela "product_category_name_translation":**
Traduções dos nomes das categorias de produtos presentes na tabela "olist_products_dataset", incluindo os nomes originais em português e suas traduções para o inglês.


* **product_category_name:** Nome original da categoria de produto em português (tipo de dado: string).
* **product_category_name_english:** Tradução do nome da categoria para o inglês (tipo de dado: string).