# Contexto:
    Este projeto tem como objetivo analisar os dados de vendas de uma loja fictícia
    para identificar faturamento, produtos mais lucrativos e a evolução das vendas ao longo do tempo.

# Etapas (Google data analytics)
    1- Perguntar: desafio, objetivo ou questão comercial. Fazer as perguntas certas para entender o objetivo da análise.

    2 - Preparar: geração de dados, coleta, armazenamento e Gerenciamento de dados

    3 - Processar: Limpeza de dados e Integridade dos dados

    4 - Analisar: exploração, Visualização de dados e análise

    5 - Compartilhar: comunicar e interpretar resultados
    
    6 - Agir: colocar os insights em prática para resolver o problema
            


# Criação do projeto

    1 - Criar a venv
        entrar na venv

    2 - Criar pastas:
        data (para dados)
        notebook (para análise)
        src (main.py)

    3 - Criar arquivos:
        .gitignore
        README.md

    4 - Instalar bibliotecas
        pandas / plotly

# Etapa 1 - Perguntar

   # Objetivo da análise:

        Identificar o faturamento total
        Identificar os produtos mais lucrativos
        Analisar a evolução das vendas ao longo do tempo

# 2 - Preparar

In [1]:
#2.1 - importar bibliotecas
import pandas as pd
import plotly.express as px

#2.2 - carregar os dados

    #(..) pra voltar pastas e procurar na pasta correta
tabela = pd.read_csv("../data/vendas.csv")

    #head() - mostras as primeiras 5 linhas do data set 
tabela.head() 

    #se algo estiver errado aqui, a análise não começa
tabela.info()

    #estatistica
tabela.describe()



<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7 entries, 0 to 6
Data columns (total 5 columns):
 #   Column      Non-Null Count  Dtype 
---  ------      --------------  ----- 
 0   data        7 non-null      object
 1   produto     7 non-null      object
 2   categoria   7 non-null      object
 3   preco       7 non-null      int64 
 4   quantidade  7 non-null      int64 
dtypes: int64(2), object(3)
memory usage: 412.0+ bytes


Unnamed: 0,preco,quantidade
count,7.0,7.0
mean,805.714286,2.142857
std,1248.971005,1.46385
min,50.0,1.0
25%,85.0,1.0
50%,120.0,2.0
75%,900.0,2.5
max,3500.0,5.0


# 3 - Processar 

In [2]:
#3.1 - Tratamento

    #Verifica quantos valores faltando tem em cada coluna
tabela.isna().sum()

    #Convertendo dados de data em formato de texto para formato de data(datetime)
tabela["data"] = pd.to_datetime(tabela["data"])

    #Criando o dado que responde à pergunta do objetivo
        #Criando a coluna "faturamento" e atribuindo o valor dela
tabela["faturamento"] = tabela["quantidade"] * tabela["preco"]

display(tabela)

Unnamed: 0,data,produto,categoria,preco,quantidade,faturamento
0,2024-01-05,Mouse,Periféricos,50,3,150
1,2024-01-10,Teclado,Periféricos,120,2,240
2,2024-02-02,Monitor,Monitores,900,1,900
3,2024-02-15,Mouse,Periféricos,50,5,250
4,2024-03-01,Notebook,Computadores,3500,1,3500
5,2024-03-12,Teclado,Periféricos,120,1,120
6,2024-03-20,Monitor,Monitores,900,2,1800


# 4 - Analisar

In [5]:
#Faturamento total

faturamento_total = tabela["faturamento"].sum()
print("Faturamento total:", faturamento_total)


#Produto mais lucrativo

faturamento_por_produto = (
    tabela.groupby("produto")["faturamento"].sum()
    .reset_index() #precisa
    .sort_values(by="faturamento", ascending=False) #maior para o menor
)

print("Produto mais luvrativo / Faturamento por produto:")
display(faturamento_por_produto)


#Evolução ao longo do tempo

faturamento_por_data = (
    tabela.groupby("data")["faturamento"].sum()
    .reset_index()
)

print("Evolução das vendas ao longo do tempo:")
display(faturamento_por_data)

Faturamento total: 6960
Produto mais luvrativo / Faturamento por produto:


Unnamed: 0,produto,faturamento
2,Notebook,3500
0,Monitor,2700
1,Mouse,400
3,Teclado,360


Evolução das vendas ao longo do tempo:


Unnamed: 0,data,faturamento
0,2024-01-05,150
1,2024-01-10,240
2,2024-02-02,900
3,2024-02-15,250
4,2024-03-01,3500
5,2024-03-12,120
6,2024-03-20,1800


In [None]:
# Visualisação (plotly)

#Faturamento por produto
fig = px.bar(
    faturamento_por_produto,
    x = "produto",
    y = "faturamento",
    title = "Faturamento por produto"
)

fig.show()

In [9]:
#Evolução ao longo do tempo

fig = px.line(
    faturamento_por_data,
    x = "data",
    y = "faturamento",
    title = "Evolução do faturamento"
)

fig.show()

# 5 - Compartilhar

### Etapa 5 – Insights da Análise

A análise dos dados mostra que o faturamento total no período foi de **R$ 6.960,00**.

O produto mais lucrativo foi o **Notebook**, responsável por um faturamento de **R$ 3.500,00**, representando uma parcela significativa do faturamento total, o que indica alta relevância desse produto para o negócio.

Observa-se que as vendas entre **janeiro de 2024 e março de 2024** apresentaram um comportamento **oscilante**, com uma **alta expressiva no mês de março**, sugerindo um possível aumento da demanda ou a ocorrência de ações comerciais nesse período.

    