# <center> Mini Projeto - Walmart </center>

---

## O que será feito?
Em um cenário onde a empresa Walmart precisa fazer um levantamento do faturamento das lojas nos USA e apontar qual loja seria melhor para **expandir seu tamanho** será montado um Notebook bem redigido mostrando o passo a passo das etapas de análise do case, fazendo uma introdução e dados atuais sobre o problema. Também será ressaltado/explicado passagens complexas ou insights que você tiver durante a resolução desse projeto.

## Descrição do Projeto
O Projeto de deverá ser desenvolvido em 3 etapas do CRISP-DM, que são o Business Understanding, Data Understanding e Data Preparation

**Business Understanding:** Nessa etapa o principal objetivo será compreender os requisitos do projeto. Para isso precisamos responder 3 tasks principais:
- Determinar os objetivos de negócio
- Fazer a avaliação da situação
- Determinar os objetivos e metas para a mineração de dados

**Data Understanding:** Nessa etapa o principal objetivo será compreender os dados que o projeto possui. Para isso precisamos responder 3 tasks principais:
- Coleta Inicial dos dados
- Descrição dos dados
- Exploração dos dados

**Data Preparation**
- Seleção dos dados
- Limpeza dos dados
- Responder às questões de output de projeto

## Output do Projeto

Ao final da análise, serão respondidas as 5 seguintes questões:

1. Qual o preço médio de vendas semanal por loja?
2. Qual o atributo que tem maior correlação (positiva ou negativa) com o número de vendas?
3. Da loja com maior venda acumulada (soma de vendas de todo o período), quantas semanas do 
ano ele ultrapassou a média do período?
4. Faça um gráfico com as vendas máximas, mínimas e médias de todas as lojas ao longo do 
tempo. Ressalte de alguma forma, o período de feriados mencionados acima
5. Pensando na expansão de uma das lojas, que loja você escolheria e o porque

---

# 1.**Business Understanding**

## Walmart Inc.
Walmart, Inc., é uma multinacional estadunidense de lojas de departamento. A companhia foi fundada por Sam Walton em 1962, incorporada em 31 de outubro de 1969 e feita capital aberto na New York Stock Exchange, em 1972. No ano de 2021, obteve um um lucro de $13.51 Bilhões. Sendo uma das principais lojas de varejo do mundo, os dados contemplam as vendas semanais de 45 lojas espalhadas pelos Estados Unidos. O Walmart realiza vários eventos promocionais de descontos ao longo do ano. Essas remarcações precedem feriados importantes, os quatro maiores de todos, que são o Super Bowl, o Dia do Trabalho, o Dia de Ação de Graças e o Natal. As semanas que incluem esses feriados têm um peso maior.

### Determinando os objetivos de negócio
A empresa precisa fazer um levantamento do faturamento das lojas nos USA e apontar qual loja seria melhor para 
**expandir seu tamanho,** dado que as vendas de uma determinada loja são afetadas por algumas variáveis em cada loja como temperatura, preço do combustível na região, CPI, desemprego.

### Avaliação da Situação
Dataset: https://www.kaggle.com/yasserh/walmart-dataset

Os dados apresentam as vendas semanais de 05/02/10 até 01/11/12 em 45 lojas varejistas da rede Walmart e também algumas métricas econômicas e meteorológicas por semana. A descrição destas características estão abaixo:

- Lista dos 4 maiores feriados americanos

   | Holiday Events | Semanas |
   | --- | --- |
   | Super Bowl | 12-Feb-10, 11-Feb-11, 10-Feb-12 |
   | Labour Day | 10-Sep-10, 09-Sep-11, 07-Sep-12 |
   | Thanksgiving | 26-Nov-10, 25-Nov-11, 23-Nov-12 |
   | Christmas | 31-Dec-10, 30-Dec-11, 28-Dec-12 |
<br></br>
- Descrição de cada coluna das tabelas da base

   | Variável | Descrição |
   | --- | --- |
   | Store | Número de Lojas |
   | Date | Semana de Venda |
   | Weekly_Sales | Venda naquela semana |
   | Holiday_Flag | Flag se é ou não semana com feriado (1 - Holiday Week 0 - Non-Holiday Week) |
   | Temperature | Temperatura do dia em ºF |
   | Fuel_Price | Preço do combustível na região da Loja |
   | CPI | Índice de preços ao consumidor |
   | Unemployment | Taxa de desemprego |
<br></br>
Para que sejam feitos todos os tratamentos e limpezas necessárias será utilizada a linguagem Python e os recursos disponíveis nas bibliotecas Pandas e Numpy, podendo ser feito uso de outras bibliotecas de dados conforme a necessidade. Além disso, para fins mais ilustrativos poderá ser usado o software Power BI para a confecção de um painel ilustrativo com todos os insights criados.

### Objetivos e Metas para a Mineração de Dados


# 2.**Data Understanding**

### Coleta Inicial dos dados

A coleta da base de dados será feita a partir do arquivo do tipo CSV disponibilizado, utilizando a biblioteca Pandas do Python. Abaixo segue um o código utilizado para carregar a base de dados através da função read_csv, assim como um print da base para visualização e confirmação do seu formato inicial.

In [7]:
import pandas as pd

base = pd.read_csv('Walmart.csv')

print(base)

      Store        Date  Weekly_Sales  Holiday_Flag  Temperature  Fuel_Price  \
0         1  05-02-2010    1643690.90             0        42.31       2.572   
1         1  12-02-2010    1641957.44             1        38.51       2.548   
2         1  19-02-2010    1611968.17             0        39.93       2.514   
3         1  26-02-2010    1409727.59             0        46.63       2.561   
4         1  05-03-2010    1554806.68             0        46.50       2.625   
...     ...         ...           ...           ...          ...         ...   
6430     45  28-09-2012     713173.95             0        64.88       3.997   
6431     45  05-10-2012     733455.07             0        64.89       3.985   
6432     45  12-10-2012     734464.36             0        54.47       4.000   
6433     45  19-10-2012     718125.53             0        56.47       3.969   
6434     45  26-10-2012     760281.43             0        58.85       3.882   

             CPI  Unemployment  
0     

### Descrição dos dados

### Exploração dos dados