# 📊 Desafio Obrigatório — Análise de Dados de Vendas

Este notebook resolve o desafio obrigatório da disciplina de Data Science, conforme a apostila. O objetivo é realizar uma análise de vendas e despesas, tratando dados ausentes e aplicando funções estatísticas básicas.


In [None]:
import pandas as pd
import numpy as np


dados = {
    'Região': ['Norte', 'Norte', 'Sul', 'Sul', 'Norte'],
    'Mês': ['Jan', 'Fev', 'Jan', 'Fev', 'Mar'],
    'Vendas': [1500, np.nan, 2200, 1800, 2000],
    'Despesas': [300, 250, np.nan, 400, 350]
}


df = pd.DataFrame(dados)
df.to_excel("vendas.xlsx", index=False)
print("Arquivo 'vendas.xlsx' criado com sucesso!")

## 2. Carregando e inspecionando os dados

In [None]:

df = pd.read_excel("vendas.xlsx")
print("📋 Dados carregados:")
print(df)

## 3. Tratamento de valores ausentes

In [None]:

df['Vendas'] = df['Vendas'].fillna(df['Vendas'].median())


df['Despesas'] = df['Despesas'].fillna(df['Despesas'].mean())

print("📌 Dados após preenchimento dos valores ausentes:")
print(df)

## 4. Agrupamento por Região e Mês

In [None]:

agrupado = df.groupby(['Região', 'Mês']).agg({
    'Vendas': 'sum',
    'Despesas': 'mean'
}).reset_index()

print("📊 Dados agrupados:")
print(agrupado)

## 5. Combinação horizontal das colunas 'Vendas' e 'Despesas'

In [None]:

vendas_despesas = np.hstack([df[['Vendas']], df[['Despesas']]])
print("📎 Colunas combinadas (Vendas e Despesas):")
print(vendas_despesas)

## 6. Sumário estatístico dos dados numéricos

In [None]:

estatisticas = df.describe()
print("📈 Estatísticas descritivas:")
print(estatisticas)

# Mediana manual
medianas = df.median(numeric_only=True)
print("\n🔢 Medianas:")
print(medianas)