# Análise Exploratória – Loja de Departamentos

In [1]:
# 📚 Importar biblioteca necessária
import pandas as pd

In [3]:
# Carregar os dados do Excel
dados = pd.read_excel("LojaDepto_aquecimento.xlsx")

In [9]:
# Ver estrutura dos dados
dados.info()
dados

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 100 entries, 0 to 99
Data columns (total 7 columns):
 #   Column       Non-Null Count  Dtype
---  ------       --------------  -----
 0   Obs          100 non-null    int64
 1   Sexo         100 non-null    int64
 2   Idade        100 non-null    int64
 3   Renda        100 non-null    int64
 4   Eletrônicos  100 non-null    int64
 5   Vestuário    100 non-null    int64
 6   Satisfação   100 non-null    int64
dtypes: int64(7)
memory usage: 5.6 KB


Unnamed: 0,Obs,Sexo,Idade,Renda,Eletrônicos,Vestuário,Satisfação
0,1,1,64,1600,152,1258,1
1,2,1,68,1670,999,1306,4
2,3,1,65,1722,0,1324,1
3,4,0,2,1867,3368,150,3
4,5,1,66,1961,999,1408,2
...,...,...,...,...,...,...,...
95,96,0,26,4114,4674,742,5
96,97,0,23,4191,3989,872,2
97,98,0,46,4281,3628,958,5
98,99,0,40,7250,3126,2075,4


In [11]:
# Proporção de homens e mulheres
prop_mulher = dados["Sexo"].mean()
prop_homem = 1 - prop_mulher

round(prop_homem, 2), round(prop_mulher, 2)

(0.3, 0.7)

In [13]:
# Criar colunas com rótulos de sexo
dados["Sexo2"] = dados["Sexo"].map({0: "homem", 1: "mulher"})
dados["Sexo3"] = dados["Sexo"].map({0: "homem", 1: "mulher"})

In [15]:
# Tabela de frequência e proporção
frequencia = dados["Sexo2"].value_counts()
proporcao = dados["Sexo2"].value_counts(normalize=True).round(2)

tabela_sexo = pd.DataFrame({
    "Contagem": frequencia,
    "Proporção": proporcao
}).T

tabela_sexo

Sexo2,mulher,homem
Contagem,70.0,30.0
Proporção,0.7,0.3


In [17]:
# Estatísticas descritivas da variável Idade
media_idade = dados["Idade"].mean()
dp_idade = dados["Idade"].std()

print(f"Média de idade: {media_idade:.1f}")
print(f"Desvio-padrão da idade: {dp_idade:.1f}")

Média de idade: 42.5
Desvio-padrão da idade: 15.7


In [19]:
# Mediana da variável Renda
mediana_renda = dados["Renda"].median()
print(f"Mediana da renda: {mediana_renda:.2f}")

Mediana da renda: 3284.00


In [21]:
# Clientes que gastam acima da média em Eletrônicos
media_eletronicos = dados["Eletrônicos"].mean()
clientes_acima_media_eletro = dados[dados["Eletrônicos"] > media_eletronicos]

print(f"Número de clientes com gasto acima da média em Eletrônicos: {len(clientes_acima_media_eletro)}")
clientes_acima_media_eletro.head()

Número de clientes com gasto acima da média em Eletrônicos: 51


Unnamed: 0,Obs,Sexo,Idade,Renda,Eletrônicos,Vestuário,Satisfação,Sexo2,Sexo3
3,4,0,2,1867,3368,150,3,homem,homem
13,14,1,63,2541,4850,884,3,mulher,mulher
21,22,0,57,2771,3636,427,2,homem,homem
26,27,1,51,2921,2980,1298,2,mulher,mulher
27,28,0,19,2960,3270,548,4,homem,homem


In [23]:
# Clientes que gastam acima da média em Eletrônicos E Vestuário
media_vestuario = dados["Vestuário"].mean()
clientes_acima_media_ambos = dados[
    (dados["Eletrônicos"] > media_eletronicos) & 
    (dados["Vestuário"] > media_vestuario)
]

print(f"Número de clientes com gasto acima da média em Eletrônicos e Vestuário: {len(clientes_acima_media_ambos)}")
clientes_acima_media_ambos.head()

Número de clientes com gasto acima da média em Eletrônicos e Vestuário: 14


Unnamed: 0,Obs,Sexo,Idade,Renda,Eletrônicos,Vestuário,Satisfação,Sexo2,Sexo3
42,43,1,46,3130,3119,1350,3,mulher,mulher
43,44,1,36,3156,2613,1435,3,mulher,mulher
44,45,1,38,3182,2577,1450,1,mulher,mulher
49,50,1,47,3274,3149,1396,3,mulher,mulher
60,61,1,47,3387,2974,1462,5,mulher,mulher
