<a href="https://colab.research.google.com/github/vlademirribeiro/estat-stica/blob/main/faixas_personalidas.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Distribuindo os salários dos colaboradores por faixas personalizadas

Estamos trabalhando com o dataset colaboradores da empresa varejista que está sob nossa consultoria. O objetivo é construir uma tabela de frequência com base em classes salariais personalizadas, considerando o salário mínimo (SM) de R$ 1.412,00, e visualizar os dados em um gráfico de barras para identificar as faixas salariais mais representativas.

As classes são definidas como:

*  A: Acima de 12 SM → Acima de R$16.944

*  B: De 8 a 12 SM → Entre R$ 11.296 e R$ 16.944

*  C: De 4 a 8 SM → Entre R$ 5.648 e R$ 11.296 Item da lista

*  D: De 2 a 4 SM → Entre R$ 2.824 e R$ 5.648

*  E: Até 2 SM → Até R$ 2.824

Vamos começar lendo os dados e criando as classes de acordo com o salário mínimo na época da pesquisa. Vamos passar também para as classes os valores mínimos e máximos de remuneração que serão importantes para dividir as classes utilizando a função cut.

In [None]:
# Carregando bibliotecas
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

# Carregar os dados
url = "https://raw.githubusercontent.com/alura-cursos/estatistica-r-frequencias-medidas/refs/heads/main/dados/colaboradores.csv"
colaboradores = pd.read_csv(url)

# Definindo o salário mínimo e classes
sm = 1412

# Definindo as classes salariais com base no salário mínimo
classes = [colaboradores['remuneracao'].min(), sm * 2, sm * 4, sm * 8, sm * 12, colaboradores['remuneracao'].max()]

classes

Agora, que definimos as classes em um vetor, vamos criar uma coluna que salva as faixas para cada remuneração dentro da base de dados. Para isso, utilizaremos a mesma função cut que utilizamos no vídeo anterior, mas dessa vez vamos passar o nome da classe (A até E) ao invés do intervalo da faixa para o valor da coluna.

In [None]:
# Definindo as classes salariais com base nas faixas
labels = ['E', 'D', 'C', 'B', 'A']
colaboradores['faixa_salarial'] = pd.cut(colaboradores['remuneracao'], bins=classes, labels=labels, right=True, include_lowest=True)

colaboradores

Agora, vamos agrupar os dados por classe e criar a distribuição de frequência absoluta e relativa, atualizando a variável classes_salariais.

In [None]:
# Tabela de frequência das faixas salariais
frequencias = colaboradores['faixa_salarial'].value_counts().sort_index()

frequencias

# Agrupar por faixa salarial e calcular a frequência e porcentagem
classes_salariais = colaboradores.groupby('faixa_salarial', observed=False ).size().reset_index(name='frequencia')

# Calcular a porcentagem
classes_salariais['porcentagem'] = (classes_salariais['frequencia'] / len(colaboradores)) * 100

# Ordenar pelas classes salariais
classes_salariais = classes_salariais.sort_values(by='faixa_salarial')

classes_salariais

Agora que já conseguimos construir a tabela de frequências, vamos visualizar a distribuição em um gráfico de barras:

In [None]:
# Ajustando o tamanho do gráfico
plt.figure(figsize=(10, 8))

# Criando o gráfico de barras
sns.barplot(x='faixa_salarial', y='frequencia', data=classes_salariais, color='steelblue', alpha=0.6)

# Adicionando título e rótulos aos eixos
plt.title('Distribuição de Frequência das Faixas Salariais', fontsize=22, ha='center')
plt.xlabel('Faixas', fontsize=16)
plt.ylabel('nº de colaboradores', fontsize=16)

# Adicionando rótulos de frequência e porcentagem acima das barras
for i, row in classes_salariais.iterrows():
    plt.text(i, row['frequencia'] + 2, f"{row['frequencia']} ({round(row['porcentagem'], 1)}%)",
             ha='center', fontsize=14)

# Exibindo o gráfico
plt.show()

Após a criação do gráfico e da tabela de frequências, podemos tirar algumas conclusões:

A maior parte dos colaboradores está concentrada na classe D , representando remunerações na faixa de 2 até 4 salários mínimos.
As classes A e B representam aproximadamente 1.1% de todos os colaboradores, ou seja, apenas 128 colaboradores dos 11.090 recebem 8 salários mínimos ou mais.
Este comportamento é comum em empresas varejistas, onde grande parte dos colaboradores trabalha em funções operacionais, como atendimento e logística.
