# Variáveis Qualitativas (Nominal)

In [40]:
import pandas as pd
import numpy as np

# Para os gráficos
import matplotlib.pyplot as plt
import plotly.express as px

In [4]:
sexo = ['M', 'F']
cor = ['Preto', 'Catanho', 'Azul', 'Verde']
cigarro = ['Fumante', 'Não Fumante']
doente = ['Doente', 'Sadio']
estado_civil = ['Solteiro(a)', 'Casado(a)']

In [5]:
a_sexo = np.random.choice(sexo, size = 100, replace = True)
a_cor_olhos = np.random.choice(cor, size = 100, replace = True)
a_fumante = np.random.choice(cigarro, size = 100, replace = True)
a_doente = np.random.choice(doente, size = 100, replace = True)
a_dummy_estado_civil = np.random.choice(estado_civil, size = 100, replace = True)

In [18]:
variaveis_categoricas_nominais = pd.DataFrame({
                                        'sexo' : a_sexo,
                                        'cor_olhos' : a_cor_olhos,
                                        'cigarro' : a_fumante,
                                        'doente' : a_doente,
                                        'estado_civil' : a_dummy_estado_civil        
                                })

In [19]:
variaveis_categoricas_nominais

Unnamed: 0,sexo,cor_olhos,cigarro,doente,estado_civil
0,F,Preto,Não Fumante,Sadio,Casado(a)
1,F,Preto,Fumante,Doente,Casado(a)
2,M,Preto,Não Fumante,Sadio,Solteiro(a)
3,M,Preto,Não Fumante,Sadio,Solteiro(a)
4,M,Azul,Fumante,Doente,Solteiro(a)
...,...,...,...,...,...
95,M,Preto,Fumante,Sadio,Solteiro(a)
96,M,Catanho,Não Fumante,Sadio,Casado(a)
97,M,Azul,Fumante,Doente,Casado(a)
98,M,Verde,Fumante,Doente,Solteiro(a)


In [36]:
freq = variaveis_categoricas_nominais['cor_olhos'].value_counts().reset_index()
freq


Unnamed: 0,cor_olhos,count
0,Preto,34
1,Catanho,24
2,Azul,23
3,Verde,19


In [80]:
grafico = px.bar(freq, x = 'cor_olhos', y = 'count',
                title = 'Distribuição da Cor dos Olhos',
                labels = {'cor_olhos': 'Cor dos Olhos', 'count': 'Frequência'},
                color = 'cor_olhos',
                color_discrete_map = {'Preto' : 'black', 'Castanho' : 'brown', 'Azul' : 'blue', 'verde' : 'green'}
                )

# Centraliza o título
grafico.update_layout(title_x = 0.5)

grafico.show()

### Distribuição da Cor dos Olhos por Sexo

1. Gráfico de Barras Agrupados

In [79]:
# Distribuição da cor dos olhos separados por sexo
frequencia = variaveis_categoricas_nominais.groupby(['cor_olhos', 'sexo']).size().reset_index(name = 'frequencia')

# Plotando nossos resultados
grafico2 = px.bar(frequencia, x = 'cor_olhos', y = 'frequencia', color = 'sexo',
                  title = 'Distribuição da Cor dos Olhos por Sexo',
                  labels = {'cor_olhos' : 'Cor dos Olhos', 'count' : 'Frequencia'},
                  barmode = 'group',         # Agrupa as barras
                  color_discrete_map = {'F' : 'pink', 'M' : 'blue'} 
                  )


# Centraliza o título
grafico2.update_layout(title_x = 0.5)

grafico2.show()

In [69]:
frequencia

Unnamed: 0,cor_olhos,sexo,frequencia
0,Azul,F,15
1,Azul,M,8
2,Catanho,F,12
3,Catanho,M,12
4,Preto,F,18
5,Preto,M,16
6,Verde,F,12
7,Verde,M,7


1. Resultado em Percentual (%)

In [98]:
# 1. Calculando o percentual de cada distribuição
total_observacoes = len(variaveis_categoricas_nominais)         # 100, já que criamos uma amostra de 100 valores.

# Ajusta o eixo y para ir de 0 a 100
frequencia['percentual'] = frequencia.groupby('cor_olhos')['frequencia'].transform(
    lambda x: (x / x.sum()) * 100
)

In [99]:
# Plotando nosso gráfico
grafico2_perc = px.bar(frequencia, x = 'cor_olhos', y = 'percentual', color = 'sexo',
                    title = 'Distribuição (%) da Cor dos Olhos por Sexo',
                    labels = {'cor_olhos' : 'Cor dos Olhos', 'percentual' : 'Percentual (%)'},
                    barmode = 'group',
                    color_discrete_map = {'F': 'pink', 'M' : 'blue'}
                    )

# Centraliza o título
grafico2_perc.update_layout(title_x = 0.5)


grafico2_perc.show()

2. Gráfico de Barras Sobreposto


In [None]:
grafico_3_stack = px.bar(frequencia, x = 'cor_olhos', y = 'frequencia', color = 'sexo',
                title = 'Distribuição da Cor dos olhos por Sexo',
                labels = {'cor_olhos' : 'Cor dos Olhos', 'percentual' : 'Percentual'},                                                        
                barmode = 'stack',          # Barras sobrepostas
                color_discrete_map = {'F' : 'pink', 'M' : 'blue'}
        )


# Centraliza o título
grafico_3_stack.update_layout(title_x = 0.5)

grafico_3_stack.show()

In [95]:
grafico_3_stack_perc = px.bar(frequencia, x = 'cor_olhos', y = 'percentual', color = 'sexo',
              title = 'Distribuição da Cor dos olhos por Sexo (%)',
              labels = {'cor_olhos' : 'Cor dos Olhos', 'percentual' : 'Percentual (%)'},                                                        
              barmode = 'stack',          # Barras sobrepostas
              color_discrete_map = {'F' : 'pink', 'M' : 'blue'}
       )


# Centraliza o título
grafico_3_stack_perc.update_layout(title_x = 0.5)

grafico_3_stack_perc.show()