In [19]:
import pandas as pd

# Cria um novo DataFrame para receber os dados sumarizados
tabela = pd.DataFrame()

# Lê os dados em blocos, convertendo a coluna "Order Date" para datas
for chunk in pd.read_csv("vendas.csv", chunksize=10000, parse_dates=["Order Date"]):
    colunas = ["Region", "Country", "Item Type", "Sales Channel", "Order Date", "Units Sold", "Total Revenue"]
    
    # Filtra as colunas necessárias
    chunk_filtrado = chunk[colunas]
    
    # Concatena os dados filtrados ao DataFrame principal
    tabela = pd.concat([tabela, chunk_filtrado], ignore_index=True)


In [20]:
# 1. Identifica o produto mais vendido em termos de quantidade e canal
produto_mais_vendido = tabela.groupby(["Item Type", "Sales Channel"])["Units Sold"].sum().reset_index()
produto_mais_vendido = produto_mais_vendido.loc[produto_mais_vendido["Units Sold"].idxmax()]



In [21]:
# 2. Determina o país e região com o maior volume de vendas (em valor)
vendas_por_pais_regiao = tabela.groupby(["Country", "Region"])["Total Revenue"].sum().reset_index()
maior_vendas = vendas_por_pais_regiao.loc[vendas_por_pais_regiao["Total Revenue"].idxmax()]


In [22]:
# 3. Calcula a média de vendas mensais por produto
tabela['Month'] = tabela['Order Date'].dt.to_period('M')
media_vendas_mensais = tabela.groupby(["Month", "Item Type"])["Units Sold"].sum().reset_index()
media_mensal = media_vendas_mensais.groupby("Item Type")["Units Sold"].mean().reset_index()


In [23]:
# Cria um arquivo Excel para salvar os resultados
with pd.ExcelWriter("relatorio_vendas.xlsx") as writer:
    # Salva cada DataFrame em uma aba separada
    produto_mais_vendido.to_frame().T.to_excel(writer, sheet_name='Produto Mais Vendido', index=False)
    maior_vendas.to_frame().T.to_excel(writer, sheet_name='Maior Vendas', index=False)
    media_mensal.to_excel(writer, sheet_name='Media Vendas Mensais', index=False)

print("Relatório gerado com sucesso em 'relatorio_vendas.xlsx'")

Relatório gerado com sucesso em 'relatorio_vendas.xlsx'


# Documentação do Código de Análise de Vendas

## Visão Geral

Este código é uma solução para a análise de vendas a partir de um arquivo CSV chamado `vendas.csv`. O objetivo principal é processar grandes volumes de dados para extrair informações valiosas sobre vendas, como:

1. Identificar o produto mais vendido em termos de quantidade e canal de vendas.
2. Determinar qual país e região tiveram o maior volume de vendas (em valor).
3. Calcular a média de vendas mensais por produto.
4. Gerar um relatório em formato Excel que contenha os resultados das análises.

## Dependências

Para executar este código, é necessário ter a biblioteca `pandas` instalada. Esta biblioteca é amplamente utilizada para manipulação e análise de dados em Python.

### Instalação

Você pode instalar a biblioteca `pandas` utilizando o seguinte comando:

```bash
pip install pandas
