In [2]:
from google.colab import files
import os

uploaded = files.upload()

for filename in uploaded.keys():
  print(f'Uploaded file: {filename}')
  # Optionally, move the file to a specific directory if needed
  # For this specific case, we can assume it's uploaded to the current working directory

# Verify if 'vendas.csv' was uploaded
if 'vendas.csv' in uploaded:
  print("‚úÖ 'vendas.csv' uploaded successfully. You can now run the previous cells.")
else:
  print("‚ùå 'vendas.csv' was not found among the uploaded files. Please ensure you select the correct file.")

Saving vendas.csv to vendas.csv
Uploaded file: vendas.csv
‚úÖ 'vendas.csv' uploaded successfully. You can now run the previous cells.


In [3]:
# ==========================================
# EDA TECH STORE - AN√ÅLISE DE VENDAS
# ==========================================

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')

# Configura√ß√µes de visualiza√ß√£o
plt.style.use('seaborn-v0_8-darkgrid')
sns.set_palette("husl")
pd.set_option('display.max_columns', None)
pd.set_option('display.float_format', '{:.2f}'.format)

print("="*60)
print("AN√ÅLISE EXPLORAT√ìRIA DE DADOS - TECHSTORE")
print("="*60)

# ==========================================
# 1. CARREGAMENTO DOS DADOS
# ==========================================
print("\nüìÇ Carregando dados...")

df = pd.read_csv('vendas.csv')

print(f"‚úÖ Dados carregados com sucesso!")
print(f"Total de registros: {len(df)}")

# ==========================================
# 2. INFORMA√á√ïES B√ÅSICAS
# ==========================================
print("\n" + "="*60)
print("üìã INFORMA√á√ïES B√ÅSICAS DO DATASET")
print("="*60)

print("\nüîç Primeiras 5 linhas:")
print(df.head())

print(f"\nüìä N√∫mero total de registros: {len(df)}")

print("\nüìë Informa√ß√µes das colunas:")
print(df.info())

# ==========================================
# 3. C√ÅLCULO DA RECEITA TOTAL
# ==========================================
print("\n" + "="*60)
print("üí∞ C√ÅLCULO DA RECEITA TOTAL")
print("="*60)

df['receita'] = df['quantidade'] * df['preco_unitario']
receita_total = df['receita'].sum()

print(f"\nüíµ Receita Total: R$ {receita_total:,.2f}")

# ==========================================
# 4. CONSULTAS ESPEC√çFICAS
# ==========================================
print("\n" + "="*60)
print("üîé CONSULTAS ESPEC√çFICAS")
print("="*60)

# 4.1 Vendas de Eletr√¥nicos
print("\nüì± Vendas da categoria 'Eletr√¥nicos':")
eletronicos = df[df['categoria'] == 'Eletr√¥nicos']
print(eletronicos[['data', 'produto', 'quantidade', 'preco_unitario', 'receita']])

# 4.2 Produto mais vendido
print("\nüèÜ Produto mais vendido (em quantidade):")
produto_mais_vendido = df.groupby('produto')['quantidade'].sum().sort_values(ascending=False)
print(f"\nProduto: {produto_mais_vendido.index[0]}")
print(f"Quantidade total vendida: {produto_mais_vendido.values[0]}")

# 4.3 Regi√£o com maior valor de compras
print("\nüåç Regi√£o com maior valor de compras:")
receita_por_regiao = df.groupby('regiao')['receita'].sum().sort_values(ascending=False)
print(f"\nRegi√£o: {receita_por_regiao.index[0]}")
print(f"Receita total: R$ {receita_por_regiao.values[0]:,.2f}")

# ==========================================
# 5. VISUALIZA√á√ïES (DESAFIO EXTRA)
# ==========================================
print("\n" + "="*60)
print("üìà GERANDO VISUALIZA√á√ïES")
print("="*60)

# Preparar dados
df['data'] = pd.to_datetime(df['data'])
df['mes_ano'] = df['data'].dt.strftime('%Y-%m')

# 5.1 Receita por Categoria
receita_categoria = df.groupby('categoria')['receita'].sum().sort_values(ascending=False)

plt.figure(figsize=(10, 6))
receita_categoria.plot(kind='bar', color='steelblue')
plt.title('Receita por Categoria', fontsize=16, fontweight='bold')
plt.xlabel('Categoria', fontsize=12)
plt.ylabel('Receita (R$)', fontsize=12)
plt.xticks(rotation=45)
plt.tight_layout()
plt.savefig('receita_categoria.png', dpi=300, bbox_inches='tight')
print("‚úÖ Gr√°fico salvo: receita_categoria.png")
plt.close()

# 5.2 Evolu√ß√£o das Vendas por M√™s
vendas_mensais = df.groupby('mes_ano')['receita'].sum().sort_index()

plt.figure(figsize=(12, 6))
vendas_mensais.plot(kind='line', marker='o', color='green', linewidth=2)
plt.title('Evolu√ß√£o das Vendas por M√™s', fontsize=16, fontweight='bold')
plt.xlabel('M√™s', fontsize=12)
plt.ylabel('Receita (R$)', fontsize=12)
plt.xticks(rotation=45)
plt.grid(True, alpha=0.3)
plt.tight_layout()
plt.savefig('evolucao_vendas_mes.png', dpi=300, bbox_inches='tight')
print("‚úÖ Gr√°fico salvo: evolucao_vendas_mes.png")
plt.close()

# ==========================================
# 6. RELAT√ìRIO EXCEL (DESAFIO EXTRA)
# ==========================================
print("\n" + "="*60)
print("üìÑ GERANDO RELAT√ìRIO EXCEL")
print("="*60)

with pd.ExcelWriter('relatorio_vendas.xlsx', engine='openpyxl') as writer:
    # Dados completos
    df.to_excel(writer, sheet_name='Dados Completos', index=False)

    # Receita por categoria
    receita_categoria.to_excel(writer, sheet_name='Receita por Categoria')

    # Receita por regi√£o
    receita_por_regiao.to_excel(writer, sheet_name='Receita por Regi√£o')

    # Vendas mensais
    vendas_mensais.to_excel(writer, sheet_name='Vendas Mensais')

    # Tabela din√¢mica: Regi√£o √ó Categoria
    pivot = df.pivot_table(
        values='receita',
        index='regiao',
        columns='categoria',
        aggfunc='sum',
        fill_value=0
    )
    pivot.to_excel(writer, sheet_name='Regi√£o x Categoria')

print("‚úÖ Relat√≥rio Excel salvo: relatorio_vendas.xlsx")

print("\n" + "="*60)
print("üéâ AN√ÅLISE CONCLU√çDA COM SUCESSO!")
print("="*60)

AN√ÅLISE EXPLORAT√ìRIA DE DADOS - TECHSTORE

üìÇ Carregando dados...
‚úÖ Dados carregados com sucesso!
Total de registros: 100

üìã INFORMA√á√ïES B√ÅSICAS DO DATASET

üîç Primeiras 5 linhas:
         data            produto    categoria  quantidade  preco_unitario  \
0  2025-12-09          Headset G  Perif√©ricos           1            2759   
1  2025-03-12          Arm√°rio P       M√≥veis           2            4516   
2  2025-11-24  Mesa Escrit√≥rio N       M√≥veis           1            4347   
3  2025-09-14            T√™nis T    Vestu√°rio           3            3046   
4  2025-08-03             Bon√© V    Vestu√°rio           2            4453   

    cliente        regiao  
0  Fernanda       Sudeste  
1    Rafael         Norte  
2    Rafael       Sudeste  
3       Ana         Norte  
4     Bruno  Centro-Oeste  

üìä N√∫mero total de registros: 100

üìë Informa√ß√µes das colunas:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 100 entries, 0 to 99
Data columns (total 7 co