# Identificando Dados Qualitativos Nominais e Ordinais em Números

Em análise de dados, é comum encontrar variáveis numéricas que, na verdade, representam categorias. Por exemplo, códigos de identificação, classificações ou respostas de pesquisas codificadas numericamente. Essas variáveis são qualitativas e podem ser de dois tipos principais:

- **Nominais:** Categorias sem uma ordem lógica, como gêneros (1 = Masculino, 2 = Feminino) ou departamentos (1 = TI, 2 = RH, 3 = Marketing).
- **Ordinais:** Categorias com uma ordem natural, como níveis de satisfação (1 = Insatisfeito, 2 = Neutro, 3 = Satisfeito).

Tratar adequadamente essas variáveis é essencial para evitar erros, como realizar operações matemáticas em dados que representam categorias. Em Python, podemos usar a biblioteca **pandas** para tratar essas variáveis corretamente, especialmente com o tipo `Categorical` para variáveis ordinais.

## O que é um Categorical?

Em Python, o `Categorical` do pandas é usado para representar variáveis categóricas. Ele permite armazenar as categorias de forma eficiente e, no caso de variáveis ordinais, definir uma ordem específica para elas. Isso facilita a manipulação e análise dos dados.

## Exemplo

Uma empresa realiza uma pesquisa de satisfação com clientes e coleta os seguintes dados:

- `cliente_id`: Número de identificação do cliente (nominal).
- `nivel_satisfacao`: Respostas codificadas como 1 (Insatisfeito), 2 (Neutro), 3 (Satisfeito) (ordinal).

O objetivo é transformar essas variáveis corretamente utilizando `Categorical` e visualizar a alteração. Podemos fazer isso da seguinte forma:

In [2]:
# Importando o pacote
import pandas as pd

In [3]:
# DataFrame de exemplo
dados = pd.DataFrame({
    'cliente_id': [101, 102, 103, 104, 105],
    'nivel_satisfacao': [3, 2, 1, 3, 2]
})

In [None]:
# Convertendo nivel_satisfacao em uma categoria ordinal
dados['nivel_satisfacao'] = pd.Categorical(
    dados['nivel_satisfacao'],
    categories=[1, 2, 3],
    ordered=True
)

avaliacao_labels = {1: 'Insatisfeito', 2: 'Neutro', 3: 'Satisfeito'}
dados['nivel_satisfacao'] = dados['nivel_satisfacao'].map(avaliacao_labels)

In [8]:
# Ordenando os dados pela coluna 'nivel_satisfacao'
dados_sorted = dados.sort_values('nivel_satisfacao', ascending=False)

dados_sorted

Unnamed: 0,cliente_id,nivel_satisfacao
0,101,Satisfeito
3,104,Satisfeito
1,102,Neutro
4,105,Neutro
2,103,Insatisfeito


Note que ordenamos os dados de forma decrescente pelo `nivel_satisfacao`, e o `Categorical` reconheceu a ordem definida nas categorias (de Satisfeito a Insatisfeito) com base no parâmetro `ordered=True`.

## Aplicações do Categorical

O Categorical pode auxiliar em diversas situações na ciência de dados e análise com Python, como:

- **Análise Estatística:** Para definir variáveis categóricas e quais estatísticas descritivas aplicar nesses casos.
- **Visualização de Dados:** Facilita a criação de gráficos categóricos, como gráficos de barras, usando bibliotecas como Matplotlib e Seaborn.
- **Machine Learning:** Prepara variáveis categóricas para algoritmos que não aceitam dados numéricos diretamente.
- **Manipulação de Dados:** Permite ordenações e agrupamentos em tabelas e relatórios.

Logo, transformar variáveis numéricas que expressam variáveis categóricas em `Categorical` garante maior precisão e facilita a interpretação em análises qualitativas.