In [None]:
import warnings
warnings.filterwarnings("ignore")

import pandas as pd
import copy
import matplotlib.pyplot as plt
import plotly.express as px
import numpy as np
import seaborn as sns

data = pd.read_csv("/kaggle/input/young-people-survey/responses.csv")

Nessa análise, tentaremos encontrar algum padrão entre a felicidade de um indivíduo e o gênero com o qual ele se identifica. Essa base consiste em questionário realizado com jovens universitários da Eslováquia, e as respostas que anaisaremos têm caráter escalar ( Por exemplo, a felicidade é avaliada de 1 a 5 - de menos feliz a mais feliz) avaliado pelo próprio usuário.

In [None]:
# Renomeei as colunas para português
data = data.rename(columns = {"Happiness in life": "Felicidade",
                      "Gender": "Gênero",
                      "Left - right handed":"Destro - canhoto",
                      "Village - town":"Vila - cidade",
                      "House - block of flats":"Casa - apartamento"})

# Renomeei as variáveis para português
data = data.replace("male", "Masculino")
data = data.replace("female", "Feminino")

data = data.replace("left handed", "Canhoto")
data = data.replace("right handed", "Destro")

data = data.replace("village", "Vila")
data = data.replace("city", "Cidade")

data = data.replace("block of flats", "Apartamento")
data = data.replace("house/bungalow", "Casa")

In [None]:
# criei uma figura de 5 subplots
fig, ax = plt.subplots(nrows=5, ncols=1, figsize=(5, 15))

# plotei as respostas da felicidade, para usar como base
sns.countplot(y='Felicidade', data=data, ax=ax[0])

#plotei algumas variáveis booleanas em relação a felicidade
sns.countplot(y='Felicidade', hue = 'Gênero', data=data, ax=ax[1])
sns.countplot(y='Felicidade', hue = 'Destro - canhoto', data=data, ax=ax[2])
sns.countplot(y='Felicidade', hue = 'Vila - cidade', data=data, ax=ax[3])
sns.countplot(y='Felicidade', hue = 'Casa - apartamento', data=data, ax=ax[4])

# coloquei título no gráfico
fig.suptitle('Análise da felicidade em aspectos antônimos', fontsize=16)

Dos gráficos mostrados, percebemos uma alteração de padrão apenas no Felicidade/Gênero, onde a quantidade de homens é inferior a quantidade de mulheres em todos as respostas, menos na felicidade 5, indicando que homens são mais propensos a serem 100% felizes, mas menos propensos a serem 80% felizes. Estranho, não?

Podemos averiguar a veracidade dessa conclusão analisando nossa base a partir de outra variáveis bem correlacionadas com a felicidade, como crença em Deus, gosto por pets e ânimo na vida. Os gráficos abaixo comprovam essa relação:

In [None]:
# renomeei mais algumas variáveis para aprofundar nossa análise
data = data.rename(columns = {"God": "Deus",
                  "Pets": "Pets",
                  "Energy levels": "Ânimo"})

# criei uma figura com 3 subplots
fig, ax = plt.subplots(nrows=3, ncols=1, figsize=(5, 10))

# subplots
sns.countplot(y='Felicidade', hue = 'Deus', data=data, ax=ax[0])
sns.countplot(y='Felicidade', hue = 'Pets', data=data, ax=ax[1])
sns.countplot(y='Felicidade', hue = 'Ânimo', data=data)

#coloquei um título
fig.suptitle('Relação entre felicidade e fatores chave', fontsize=16)

Como percebemos, os gráficos têm uma tendência para números maiores de felicidade corresponderem com números maiores da variável analisada. Sendo assim, é esperado que percebamos uma quantidade maior de homens acreditando em Deus, gostando de pets e tendo maior ânimo, já que essa é a *Persona* das pessoas mais felizes.

Vejamos se isso se confirma:

In [None]:
# criei uma outra figura com 3 subplots
fig, ax = plt.subplots(nrows=1, ncols=3, figsize=(15, 5))

# subplots
sns.countplot(y='Deus', hue = 'Gênero', data=data, ax=ax[0])
sns.countplot(y='Pets', hue = 'Gênero', data=data, ax=ax[1])
sns.countplot(y='Ânimo', hue = 'Gênero', data=data)

# Adicionei títulos aos gráficos
fig.suptitle('Gênero em relação às variáveis chave', fontsize=16)
ax[0].set_title('Fé em Deus', fontsize = 20)
ax[1].set_title('Gosto por Pets', fontsize = 20)
ax[2].set_title('Ânimo na vida', fontsize = 20)

Percemos, portanto, que as mulheres têm muito mais afeto por Pets, fé em Deus e um pouco mais de ânimo que os homens. Assim, a *persona* de indíviduos felizes coincide mais com a *persona* feminina. Dessa forma, tudo indica que o fato de o número de homens 100% felizes ser superior ao número de mulheres 100% felizes foi apenas um evento isolado, e não um padrão a ser esperado em pesquisas de maior escala.