# Análises Questionário PRIP 2023 - Sociodemográficas

**Importante!** Este notebook foi desenvolvido como parte de um projeto de iniciação científica em 2024. Devido à natureza sensível dos dados contidos nos dataframes utilizados para as análises, optamos por omiti-los. Assim, o notebook não é executável e tem como finalidade exclusivamente a apresentação dos resultados.

Notebook feito em conjunto com Pedro Augusto Martins Gagini.

---

 ## Preparando o notebook
- Importar bibliotecas
- Configurar exibição
- Montar carregamento de arquivos
- Carregar arquivos

In [None]:
# Importação de bibliotecas

"""
Este código Python importa várias bibliotecas essenciais para análise e visualização de dados.

Bibliotecas Importadas:
- `matplotlib.pyplot` (plt): Biblioteca de visualização que permite criar gráficos e gráficos.
- `seaborn` (sns): Biblioteca de visualização estatística que aprimora a aparência dos gráficos do Matplotlib.
- `numpy` (np): Biblioteca para cálculos numéricos, usada frequentemente em manipulação de dados.
- `pandas` (pd): Biblioteca para manipulação e análise de dados tabulares (DataFrames).

"""

import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import pandas as pd

In [None]:
# Configurações para as figuras

"""
Configura o tema padrão do Seaborn para 'whitegrid', que define o estilo de fundo dos gráficos.

- 'whitegrid': Um fundo branco com linhas de grade.

Configura as configurações padrão de DPI (dots per inch) para figuras e figuras salvas.

- `plt.rcParams['figure.dpi']`: Define a resolução (DPI) das figuras exibidas na tela.
- `plt.rcParams['savefig.dpi']`: Define a resolução (DPI) das figuras salvas em arquivos.

"""

sns.set_theme(style="whitegrid")
plt.rcParams['figure.dpi'] = 200
plt.rcParams['savefig.dpi'] = 200

In [None]:
# Montando o Google Drive

"""
Este trecho de código monta o Google Drive no ambiente do Colab, permitindo o acesso aos arquivos armazenados no Google Drive.

- `from google.colab import drive`: Importa a biblioteca necessária para montar o Google Drive.
- `drive.mount('/content/drive')`: Monta o Google Drive na pasta '/content/drive' do ambiente.

"""

from google.colab import drive

drive.mount('/content/drive')

"""
Este trecho de código define o caminho para um arquivo CSV que será carregado posteriormente.

- `caminho`: Uma string que contém o caminho para o arquivo CSV no Google Drive.

"""

caminho = "/content/drive/My Drive/PUB/1. Setembro/Semana 18 a 25/1. Arquivos base/amostra_geral.csv"

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [None]:
"""
Esta linha de código lê o arquivo CSV especificado e carrega seus dados em um DataFrame do Pandas.

- 'pd.read_csv()': Função do Pandas para ler um arquivo CSV.
- 'caminho': O caminho do arquivo CSV a ser lido.
- 'sep=',': O delimitador usado no arquivo CSV (vírgula neste caso).
- 'low_memory=False': Desativa a verificação de baixa memória para arquivos grandes.

"""

dados = pd.read_csv(caminho, sep=',', low_memory=False)

 ## Analisando os arquivos
- Renomear colunas
- Imprimir colunas
- Verificar shape
- Imprimir parte do dataframe

In [None]:
# Dando nomes mais amigáveis para algumas colunas

dados.rename(columns={"Unnamed: 0": "Índice",
                      "Qual o seu ano de ingresso como aluno(a) de graduação na USP?": "Ano de ingresso - gradução",
                      "Qual o seu ano de ingresso como aluno(a) de pós-graduação na USP?": "Ano de ingresso - pós-grad",
                      "Qual o seu ano de ingresso como servidor(a) técnico-administrativo(a) na USP?": "Ano de ingresso - servidor",
                      "Qual o seu ano de ingresso como docente na USP?": "Ano de ingresso - docente",
                      "Qual o seu ano de ingresso como pós-doutorando(a) na USP?": "Ano de ingresso - pós-doc",
                      "Qual a sua jornada de trabalho semanal?": "Jornada de trabalho",
                      "Qual o seu regime de dedicação?": "Regime de dedicação",
                      "As perguntas a seguir se referem à sua experiência acadêmica (aproveitamento acadêmico, oportunidades para estágio, qualificação adequada, etc) na USP": "Experiência acadêmica",
                      "Qual é o nível educacional mais alto alcançado pela sua mãe ou responsável 1? Assinale aquela que mais se adequa.": "Nível educacional da mãe ou responsável 1",
                      "Qual é o nível educacional mais alto alcançado pelo seu pai ou responsável 2? Assinale aquela que mais se adequa.": "Nível educacional da mãe ou responsável 2",
                      "Qual é o seu nível mais alto de educação concluído?": "Nível educacional do respondente",
                      "Você é atualmente dependente financeiramente (família/responsável está ajudando com suas despesas) ou independente (você é o único provedor para as suas despesas)?": "Dependente ou independente financeiramente",
                      "Unnamed: 85": "Desrespeitoso (1) a Respeitoso (5)",
                      "Unnamed: 86": "Não Acolhedor (1) a Acolhedor (5)",
                      "Unnamed: 87": "Não-colaborativo (1) a Colaborativo (5)",
                      "Unnamed: 88": "Regredindo (1) a Melhorando (5)",
                      "Unnamed: 89": "Para pessoas com deficiência, Excludente/seletivo (1) a Inclusivo (5)",
                      "Unnamed: 90": "Para LGBTQIA+, Excludente/seletivo (1) a Inclusivo (5)",
                      "Unnamed: 91": "Para PPI, Excludente/seletivo (1) a Inclusivo (5)",
                      "Unnamed: 92": "Para mulheres, Excludente/seletivo (1) a Inclusivo (5)",
                      "Unnamed: 93": "Para baixo nível socioeconômico, Excludente/seletivo (1) a Inclusivo (5)",
                      "Em relação à orientação sexual, como você se identifica": "Orientação sexual",
                      "Qual é sua identidade de gênero?": "Identidade de gênero",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Biblioteca":"Confortável em Salas de aula",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Salas de aula":"Confortável em Salas de aula",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Laboratórios":"Confortável em Laboratórios",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Biblioteca":"Confortável em Biblioteca",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Restaurante universitário":"Confortável em Restaurante universitário",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Moradia":"Confortável em Moradia",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Centro de esportes do campus":"Confortável em Centro de esportes do campus",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Eventos culturais no campus":"Confortável em Eventos culturais no campus",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Transporte ou estacionamentos no campus":"Confortável em Transporte ou estacionamentos no campus",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Calçadas e ruas do campus":"Confortável em Calçadas e ruas do campus",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Outros edifícios do campus":"Confortável em Outros edifícios do campus",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Setor ou local de trabalho":"Confortável em Setor ou local de trabalho",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Espaços de convivência na sua unidade":"Confortável em Espaços de convivência na sua unidade",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Reuniões de colegiados":"Confortável em Reuniões de colegiados",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Restaurantes ou cafés no campus":"Confortável em Restaurantes ou cafés no campus",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Biblioteca.1":"Confortável em Biblioteca.1",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Centro de esportes":"Confortável em Centro de esportes",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Eventos culturais no campus.1":"Confortável em Eventos culturais no campus.1",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Transporte ou estacionamentos no campus.1":"Confortável em Transporte ou estacionamentos no campus.1",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Calçadas e ruas do campus.1":"Confortável em Calçadas e ruas do campus.1",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Outros edifícios do campus.1":"Confortável em Outros edifícios do campus.1",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Salas de aula.1":"Confortável em Salas de aula.1",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Laboratórios.1":"Confortável em Laboratórios.1",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Biblioteca.2":"Confortável em Biblioteca.2",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Departamento ou unidade":"Confortável em Departamento ou unidade",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Reuniões de colegiados.1":"Confortável em Reuniões de colegiados.1",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Restaurantes ou cafés no campus.1":"Confortável em Restaurantes ou cafés no campus.1",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Centro de esportes.1":"Confortável em Centro de esportes.1",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Eventos culturais no campus.2":"Confortável em Eventos culturais no campus.2",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Transporte ou estacionamentos no campus.2":"Confortável em Transporte ou estacionamentos no campus.2",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Calçadas e ruas do campus.2":"Confortável em Calçadas e ruas do campus.2",
                      "Quão confortável você se sente em cada um dos ambientes abaixo?:Outros edifícios do campus.2":"Confortável em Outros edifícios do campus.2",
                      "Como você avalia a acessibilidade para pessoas com deficiência na USP?:Salas de aula, laboratórios": "Acessibilidade em salas de aula",
                      "Como você avalia a acessibilidade para pessoas com deficiência na USP?:Residência universitária": "Acessibilidade em residência universitária",
                      "Como você avalia a acessibilidade para pessoas com deficiência na USP?:Biblioteca": "Acessibilidade em biblioteca",
                      "Como você avalia a acessibilidade para pessoas com deficiência na USP?:Transporte/ estacionamento no campus": "Acessibilidade em transporte/estacionamento no campus",
                      "Como você avalia a acessibilidade para pessoas com deficiência na USP?:Outros edifícios do campus": "Acessibilidade em outros edifícios do campus",
                      "Como você avalia a acessibilidade para pessoas com deficiência na USP?:Banheiros": "Acessibilidade em banheiros",
                      "Como você avalia a acessibilidade para pessoas com deficiência na USP?:Calçadas": "Acessibilidade em calçadas",
                      "Como você avalia a acessibilidade para pessoas com deficiência na USP?:Materiais instrucionais": "Acessibilidade em materiais instrucionais",
                      "Como você avalia a acessibilidade para pessoas com deficiência na USP?:Sites": "Acessibilidade em sites",
                      "As perguntas a seguir se referem à sua experiência acadêmica (aproveitamento acadêmico, oportunidades para estágio, qualificação adequada, etc) na USP:Eu sinto que meu potencial acadêmico é aproveitado ao máximo.":"Experiência acadêmica: eu sinto que meu potencial acadêmico é aproveitado ao máximo.",
                      "As perguntas a seguir se referem à sua experiência acadêmica (aproveitamento acadêmico, oportunidades para estágio, qualificação adequada, etc) na USP:Estou satisfeito(a) com minha experiência acadêmica na USP.":"Experiência acadêmica: estou satisfeito(a) com minha experiência acadêmica na USP.",
                      "As perguntas a seguir se referem à sua experiência acadêmica (aproveitamento acadêmico, oportunidades para estágio, qualificação adequada, etc) na USP:Estou satisfeito(a) com meu desenvolvimento intelectual desde que vim para a USP.":"Experiência acadêmica: estou satisfeito(a) com meu desenvolvimento intelectual desde que vim para a USP.",
                      "As perguntas a seguir se referem à sua experiência acadêmica (aproveitamento acadêmico, oportunidades para estágio, qualificação adequada, etc) na USP:Minha performance acadêmica está de acordo com o que eu esperava.":"Experiência acadêmica: minha performance acadêmica está de acordo com o que eu esperava.",
                      "As perguntas a seguir se referem à sua experiência acadêmica (aproveitamento acadêmico, oportunidades para estágio, qualificação adequada, etc) na USP:Meu interesse por novas ideias e assuntos aumentou desde que vim para a USP.":"Experiência acadêmica: meu interesse por novas ideias e assuntos aumentou desde que vim para a USP.",
                      "As perguntas a seguir se referem à sua experiência acadêmica (aproveitamento acadêmico, oportunidades para estágio, qualificação adequada, etc) na USP:Eu me sinto confiante de que vou concluir o meu curso/formação atual na USP.":"Experiência acadêmica: eu me sinto confiante de que vou concluir o meu curso/formação atual na USP.",
                      "Como docente, assinale a alternativa que melhor representa a sua opinião sobre as afirmações a seguir:Estou satisfeito(a) com a minha carreira na USP.":"Como docente, estou satisfeito(a) com a minha carreira na USP.",
                      "Como docente, assinale a alternativa que melhor representa a sua opinião sobre as afirmações a seguir:Acredito que os processos avaliativos são transparentes.":"Como docente, acredito que os processos avaliativos são transparentes.",
                      "Como docente, assinale a alternativa que melhor representa a sua opinião sobre as afirmações a seguir:Acredito que a docência é devidamente reconhecida na minha carreira.":"Como docente, acredito que a docência é devidamente reconhecida na minha carreira.",
                      "Como docente, assinale a alternativa que melhor representa a sua opinião sobre as afirmações a seguir:Acredito que a pesquisa é devidamente reconhecida na minha carreira.":"Como docente, acredito que a pesquisa é devidamente reconhecida na minha carreira.",
                      "Como docente, assinale a alternativa que melhor representa a sua opinião sobre as afirmações a seguir:Acredito que as atividades de extensão são devidamente reconhecidas na minha carreira.":"Como docente, acredito que as atividades de extensão são devidamente reconhecidas na minha carreira.",
                      "Como docente, assinale a alternativa que melhor representa a sua opinião sobre as afirmações a seguir:Acredito que as atividades de gestão são devidamente reconhecidas na minha carreira.":"Como docente, acredito que as atividades de gestão são devidamente reconhecidas na minha carreira.",
                      "Como docente, assinale a alternativa que melhor representa a sua opinião sobre as afirmações a seguir:Tenho apoio administrativo adequado para exercer minhas atividades de pesquisa e docência.":"Como docente, tenho apoio administrativo adequado para exercer minhas atividades de pesquisa e docência.",
                      "Como docente, assinale a alternativa que melhor representa a sua opinião sobre as afirmações a seguir:Tenho estrutura de trabalho que considero adequada.":"Como docente, tenho estrutura de trabalho que considero adequada.",
                      "Como docente, assinale a alternativa que melhor representa a sua opinião sobre as afirmações a seguir:Acredito que as questões pessoais (parentalidade, cuidados com idosos, questões de saúde mental, entre outros) são levadas em consideração pela USP nos processos avaliativos e de progressão na carreira.":"Como docente, acredito que as questões pessoais são levadas em consideração pela USP nos processos avaliativos e de progressão na carreira.",
                      "Como docente, assinale a alternativa que melhor representa a sua opinião sobre as afirmações a seguir:Acredito que a instituição forneça condições de equidade para que docentes de diferentes grupos (étnico-raciais, de gênero, sexualidade) acessem a progressão na carreira":"Como docente, acredito que a instituição forneça condições de equidade para que docentes de diferentes grupos ( acessem a progressão na carreira",
                      "Como funcionário(a), assinale a alternativa que melhor representa a sua opinião sobre as afirmações a seguir:Estou satisfeito(a) com a minha carreira na USP.":"Como funcionário(a), estou satisfeito(a) com a minha carreira na USP.",
                      "Como funcionário(a), assinale a alternativa que melhor representa a sua opinião sobre as afirmações a seguir:Minhas atividades são compatíveis com a minha função atual.":"Como funcionário(a), minhas atividades são compatíveis com a minha função atual.",
                      "Como funcionário(a), assinale a alternativa que melhor representa a sua opinião sobre as afirmações a seguir:Acredito que o meu trabalho é devidamente reconhecido pela universidade.":"Como funcionário(a), acredito que o meu trabalho é devidamente reconhecido pela universidade.",
                      "Como funcionário(a), assinale a alternativa que melhor representa a sua opinião sobre as afirmações a seguir:Acredito que a minha formação acadêmica e profissional é devidamente reconhecida pela universidade.":"Como funcionário(a), acredito que a minha formação acadêmica e profissional é devidamente reconhecida pela universidade.",
                      "Como funcionário(a), assinale a alternativa que melhor representa a sua opinião sobre as afirmações a seguir:Acredito que as questões pessoais (parentalidade, cuidados com idosos, questões de saúde mental, entre outros) são levadas em consideração pela USP nos processos avaliativos, de progressão na carreira e gestão cotidiana das minhas atividades":"Como funcionário(a), acredito que as questões pessoais são levadas em consideração pela USP nos processos avaliativos, de progressão na carreira e gestão cotidiana das minhas atividades",
                      "Como funcionário(a), assinale a alternativa que melhor representa a sua opinião sobre as afirmações a seguir:Acredito que a instituição forneça condições de equidade para servidores de diferentes grupos (étnico-raciais, de gênero, sexualidade, religiosos etc.) realizarem a progressão na carreira.":"Como funcionário(a), acredito que a instituição forneça condições de equidade para servidores de diferentes grupos realizarem a progressão na carreira.",
                      "Como funcionário(a), assinale a alternativa que melhor representa a sua opinião sobre as afirmações a seguir:Considero que há uma distribuição justa de tarefas no meu setor.":"Como funcionário(a), considero que há uma distribuição justa de tarefas no meu setor.",
                      "Como funcionário(a), assinale a alternativa que melhor representa a sua opinião sobre as afirmações a seguir:Meu supervisor/ superior fornece feedback (retorno sobre o meu trabalho) adequado para melhorar meu desempenho.":"Como funcionário(a), meu supervisor/ superior fornece feedback adequado para melhorar meu desempenho.",
                      "Como funcionário(a), assinale a alternativa que melhor representa a sua opinião sobre as afirmações a seguir:Tenho estrutura de trabalho (salas de aula, equipamentos, conexão) que considero adequada.":"Como funcionário(a), tenho estrutura de trabalho que considero adequada.",
                      "Como funcionário(a), assinale a alternativa que melhor representa a sua opinião sobre as afirmações a seguir:Acredito que os processos avaliativos da carreira são transparentes.":"Como funcionário(a), acredito que os processos avaliativos da carreira são transparentes.",
                      }, inplace=True)

In [None]:
# Imprimir todas as colunas do dataframe; uma coluna é impressa por linha por causa do '\n'
print(*dados.columns, sep = '\n')

Índice
Qual a sua posição principal na USP hoje?
Curso de pós-graduação
Enquadramento
Enquadramento.1
Ano de ingresso - gradução
Ano de ingresso - pós-grad
Ano de ingresso - servidor
Ano de ingresso - docente
Ano de ingresso - pós-doc
Unidade
Qual a sua jornada de trabalho semanal? 
Regime de dedicação
Período em que está matriculado
Período(s) em que efetivamente frequenta o campus
Experiência acadêmica
Recebeu ou recebe bolsa de pesquisa?
Qual a bolsa? (considerar a última solicitação)
Qual? (considerar a última solicitação)
Recebeu ou recebe bolsa de pesquisa (Pós-graduação/Pós-doutorado)  (considerar a última solicitação)
Qual bolsa? (Pós-graduação)  (considerar a última solicitação)
Qual bolsa? (Pós-doutorado)  (considerar a última solicitação)
Como docente, assinale a alternativa que melhor representa a sua opinião sobre as afirmações a seguir
Se você quiser comentar alguma(s) de suas respostas às declarações anteriores, faça-o aqui.
Como funcionário(a), assinale a alternativa qu

##Restringindo a uma categoria (graduação)
- Imprimir shape
- Tabela Cruzada de Posi
-
-

In [None]:
"""
Esta linha de código filtra os dados originais para incluir apenas as entradas em que a 'Posição institucional' é igual a 'Aluno(a) de graduação'.
Os dados filtrados são armazenados na variável 'grad'.
"""
grad = dados.loc[dados['Posição institucional']=='Aluno(a) de graduação']

In [None]:
"""
Esta linha de código filtra os dados originais para incluir apenas as entradas em que a 'Posição institucional' é igual a 'Aluno(a) de graduação'.
Os dados filtrados são armazenados na variável 'grad'.
"""
crosstab = pd.crosstab(dados['Posição institucional'], columns='Total', colnames=[''])
crosstab.loc['Total'] = crosstab.sum()
crosstab

Unnamed: 0_level_0,Total
Posição institucional,Unnamed: 1_level_1
Aluno(a) de graduação,3001
Aluno(a) de pós-graduação,1288
Pós-doutorando(a),312
Servidor(a) docente,1000
Servidor(a) técnico(a)-administrativo(a),969
Total,6570


In [None]:
"""
Esta linha de código cria uma tabela cruzada que conta o número de ocorrências de diferentes categorias na coluna 'Orientação sexual' para os dados filtrados dos alunos de graduação.
A tabela é normalizada por colunas, ou seja, os valores são expressos como uma porcentagem da coluna total.
"""
crosstab = pd.crosstab(grad['Orientação sexual'],columns='Total', normalize='columns',colnames=[''])
crosstab.loc['Total'] = crosstab.sum()
crosstab.round(2)*100

Unnamed: 0_level_0,Total
Orientação sexual,Unnamed: 1_level_1
Bissexual,24.0
Heterossexual,54.0
Homossexual,11.0
Não sei,3.0
Outro/Prefiro não responder,4.0
Pansexual,4.0
Total,100.0


In [None]:
"""
Esta linha de código cria uma tabela cruzada que conta o número de ocorrências de diferentes categorias na coluna 'Identidade de gênero' para os dados filtrados dos alunos de graduação.
A tabela é normalizada por colunas, expressando os valores como uma porcentagem da coluna total.
"""
crosstab = pd.crosstab(grad['Identidade de gênero'], columns='Total', normalize='columns', colnames=[''])
crosstab.loc['Total'] = crosstab.sum()
crosstab.round(2)*100

Unnamed: 0_level_0,Total
Identidade de gênero,Unnamed: 1_level_1
Homem cis,42.0
Homem trans,0.0
Mulher cis,53.0
Mulher trans,0.0
Outro/Prefiro não responder,2.0
Pessoa não binária,3.0
Total,100.0


In [None]:
"""
Esta linha de código cria uma tabela cruzada que conta o número de ocorrências das diferentes combinações de 'Identidade de gênero' e 'Campus' para os dados filtrados dos alunos de graduação.
A tabela é normalizada por colunas, expressando os valores como uma porcentagem da coluna total.
"""
crostab = pd.crosstab(grad['Identidade de gênero'], grad['Campus'], normalize='columns')
crosstab['Total'] = crosstab.sum(axis=1)
crosstab.round(2)*100

Unnamed: 0_level_0,Total
Identidade de gênero,Unnamed: 1_level_1
Homem cis,42.0
Homem trans,0.0
Mulher cis,53.0
Mulher trans,0.0
Outro/Prefiro não responder,2.0
Pessoa não binária,3.0
Total,100.0


In [None]:
"""
Esta linha de código cria uma tabela cruzada que conta o número de ocorrências das diferentes combinações de 'Campus' e 'Identidade de gênero' para os dados filtrados dos alunos de graduação.
A tabela é normalizada por linhas, expressando os valores como uma porcentagem da linha total.
"""
crostab = pd.crosstab(grad['Campus'], grad['Identidade de gênero'], normalize='index')
crosstab['Total'] = crosstab.sum(axis=1)
crosstab.round(2)*100

Unnamed: 0_level_0,Total
Identidade de gênero,Unnamed: 1_level_1
Homem cis,42.0
Homem trans,0.0
Mulher cis,53.0
Mulher trans,0.0
Outro/Prefiro não responder,2.0
Pessoa não binária,3.0
Total,100.0


In [None]:
"""
Esta linha de código cria uma tabela cruzada que conta o número de ocorrências das diferentes combinações de 'Campus', 'Posição institucional' e 'Identidade de gênero' para os dados originais.
A tabela é normalizada por linhas, expressando os valores como uma porcentagem da linha total e multiplicando por 100 para obter uma representação em porcentagem.
"""
crosstab = pd.crosstab([dados['Campus'],dados['Posição institucional']], dados['Identidade de gênero'], normalize='index')
crosstab['Total'] = crosstab.sum(axis=1)
crosstab.round(2)*100

Unnamed: 0_level_0,Identidade de gênero,Homem cis,Homem trans,Mulher cis,Mulher trans,Outro/Prefiro não responder,Pessoa não binária,Total
Campus,Posição institucional,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
Bauru,Aluno(a) de graduação,9.0,0.0,86.0,0.0,3.0,3.0,100.0
Bauru,Aluno(a) de pós-graduação,32.0,0.0,68.0,0.0,0.0,0.0,100.0
Bauru,Pós-doutorando(a),0.0,0.0,100.0,0.0,0.0,0.0,100.0
Bauru,Servidor(a) docente,28.0,0.0,72.0,0.0,0.0,0.0,100.0
Bauru,Servidor(a) técnico(a)-administrativo(a),26.0,0.0,72.0,0.0,2.0,0.0,100.0
Lorena,Aluno(a) de graduação,47.0,0.0,51.0,0.0,2.0,0.0,100.0
Lorena,Aluno(a) de pós-graduação,62.0,0.0,38.0,0.0,0.0,0.0,100.0
Lorena,Pós-doutorando(a),50.0,0.0,50.0,0.0,0.0,0.0,100.0
Lorena,Servidor(a) docente,56.0,0.0,40.0,0.0,4.0,0.0,100.0
Lorena,Servidor(a) técnico(a)-administrativo(a),33.0,0.0,56.0,0.0,11.0,0.0,100.0


In [None]:
"""

"""
tab = pd.crosstab([dados['Campus'],dados['Posição institucional']], dados['Identidade de gênero'],  normalize='index')
tab.reset_index(inplace=True)
np.round(tab,3)

Identidade de gênero,Campus,Posição institucional,Homem cis,Homem trans,Mulher cis,Mulher trans,Outro/Prefiro não responder,Pessoa não binária
0,Bauru,Aluno(a) de graduação,0.086,0.0,0.857,0.0,0.029,0.029
1,Bauru,Aluno(a) de pós-graduação,0.318,0.0,0.682,0.0,0.0,0.0
2,Bauru,Pós-doutorando(a),0.0,0.0,1.0,0.0,0.0,0.0
3,Bauru,Servidor(a) docente,0.28,0.0,0.72,0.0,0.0,0.0
4,Bauru,Servidor(a) técnico(a)-administrativo(a),0.262,0.0,0.721,0.0,0.016,0.0
5,Lorena,Aluno(a) de graduação,0.472,0.0,0.509,0.0,0.019,0.0
6,Lorena,Aluno(a) de pós-graduação,0.615,0.0,0.385,0.0,0.0,0.0
7,Lorena,Pós-doutorando(a),0.5,0.0,0.5,0.0,0.0,0.0
8,Lorena,Servidor(a) docente,0.56,0.0,0.4,0.0,0.04,0.0
9,Lorena,Servidor(a) técnico(a)-administrativo(a),0.333,0.0,0.556,0.0,0.111,0.0


In [None]:
# Uso da função melt
tab = pd.melt(tab, id_vars=['Posição institucional'], value_vars=['Mulher cis', 'Homem cis', 'Mulher trans', 'Homem trans', 'Pessoa não binária', 'Outro/Prefiro não responder'])
tab

Unnamed: 0,Posição institucional,Identidade de gênero,value
0,Aluno(a) de graduação,Mulher cis,0.857143
1,Aluno(a) de pós-graduação,Mulher cis,0.681818
2,Pós-doutorando(a),Mulher cis,1.000000
3,Servidor(a) docente,Mulher cis,0.720000
4,Servidor(a) técnico(a)-administrativo(a),Mulher cis,0.721311
...,...,...,...
265,Aluno(a) de graduação,Outro/Prefiro não responder,0.025751
266,Aluno(a) de pós-graduação,Outro/Prefiro não responder,0.000000
267,Pós-doutorando(a),Outro/Prefiro não responder,0.000000
268,Servidor(a) docente,Outro/Prefiro não responder,0.040816


In [None]:
pd.crosstab(grad['Identidade de gênero'], grad['Campus'], normalize='columns')

In [None]:
pd.crosstab(grad['Campus'], grad['Identidade de gênero'], normalize='index')

In [None]:
pd.crosstab([dados['Campus'],dados['Posição institucional']], dados['Orientação sexual'], normalize='index')

In [None]:
tab = pd.crosstab([dados['Campus'],dados['Posição institucional']], dados['Orientação sexual'],  normalize='index')
tab.reset_index(inplace=True)
np.round(tab,3)

In [None]:
# Uso da função melt
tab = pd.melt(tab, id_vars=['Posição institucional'], value_vars=['Mulher cis', 'Homem cis', 'Mulher trans', 'Homem trans', 'Pessoa não binária', 'Outro/Prefiro não responder'])
tab

In [None]:
dados.loc[(dados['Qual é a sua idade?']<100) & (dados['Qual é a sua idade?']>15) ].groupby(by=['Campus','Posição institucional'])['Qual é a sua idade?'].describe()

In [None]:
pd.crosstab([grad['Campus'],grad['Posição institucional']], grad['Qual das faixas representa melhor a sua renda mensal familiar?'], normalize='index')

In [None]:
pd.crosstab([grad['Campus'],grad['Posição institucional']], grad['Qual das faixas representa melhor a sua renda mensal familiar?'], normalize='index')

In [None]:
grad['Renda familiar'] = 0
grad.loc[grad['Qual das faixas representa melhor a sua renda mensal familiar?']=='Até 2,9 mil', 'Renda familiar estimada'] = 1450
grad.loc[grad['Qual das faixas representa melhor a sua renda mensal familiar?']=='Entre R$ 3 mil e R$ 7,1 mil	', 'Renda familiar estimada'] = 5050
grad.loc[grad['Qual das faixas representa melhor a sua renda mensal familiar?']=='Entre R$ 7,2 mil e R$ 22 mil', 'Renda familiar estimada'] = 14600
grad.loc[grad['Qual das faixas representa melhor a sua renda mensal familiar?']=='Superior a R$ 22 mil', 'Renda familiar estimada'] = 22000


In [None]:
grad.loc[grad['Quantas pessoas vivem dessa renda mensal?']=='5 ou mais', 'Quantas pessoas vivem dessa renda mensal?']=5
grad.loc[grad['Quantas pessoas vivem dessa renda mensal?']=='Prefiro não responder', 'Quantas pessoas vivem dessa renda mensal?']='NaN'


In [None]:
grad['Renda per capita estimada'] =0

for i in range(0,len(grad)):
  if(grad['Quantas pessoas vivem dessa renda mensal?'].iloc[i,]):
    grad['Renda per capita estimada'].iloc[i,] = grad['Renda familiar estimada'].iloc[i,]/float(grad['Quantas pessoas vivem dessa renda mensal?'].iloc[i,])

In [None]:
grad.groupby(by=['Campus','Posição institucional'])['Renda per capita estimada'].describe()

In [None]:
grad['Renda per capita estimada']

In [None]:
plt.figure(figsize = (10,8))
plt.rc('xtick', labelsize=7)

ax = sns.barplot(tab, y='Identidade de gênero', x='value', hue='Posição institucional')

for i in range(0,5):
  ax.bar_label(ax.containers[i], fmt='%.1f%%');


In [None]:
plt.figure(figsize = (10,8))
plt.rc('xtick', labelsize=7)

ax = sns.barplot(tab, y='Posição institucional', x='value', hue='Identidade de gênero')

for i in range(0,6):
  ax.bar_label(ax.containers[i], fmt='%.1f%%');

ax.legend(loc='lower right',ncol=3)


In [None]:
aux = dados.loc[:, ['Posição institucional', 'Orientação sexual']]
aux[aux.isnull()] = 'Em branco'

orientacao = aux.value_counts().reset_index().sort_values('Posição institucional')
orientacao = orientacao.rename({0: 'Respostas'}, axis = 1)

for i in orientacao.iloc[:,0].drop_duplicates():
  orientacao.loc[orientacao['Posição institucional'] == i, 'Respostas'] /= \
  orientacao.loc[orientacao['Posição institucional'] == i, 'Respostas'].sum()
orientacao

orientacao['Respostas'] *= 100
orientacao.reset_index(inplace = True)
orientacao = orientacao.sort_values(by = 'Respostas', ascending = False)
orientacao = orientacao.sort_values(by = 'Posição institucional')

orientacao.style.format({"Respostas": "{:,.2f}%"})


In [None]:
plt.figure(figsize = (13,8))
plt.rc('xtick', labelsize=12)

ax = sns.barplot(data = orientacao, y= 'Em relação à orientação sexual, como você se identifica',\
                 x = 'Respostas', hue = 'Posição institucional', order = ['Heterossexual', 'Homossexual', 'Bissexual', 'Pansexual', 'Assexual',
                                                                     'Prefiro não responder', 'Não sei', 'Outro'])

#total = len(dados['Em relação à orientação sexual, como você se identifica'])
for p in ax.patches:
        porcentagem = '{:.1f}%'.format(p.get_width())
        x = p.get_x() + p.get_width()
        y = p.get_y() + p.get_height()/2 + 0.075
        ax.annotate(porcentagem, (x, y))

plt.xlabel("")
plt.ylabel("")
plt.title("Em relação à orientação sexual, como você se identifica?",size = 13)
plt.tight_layout()

In [None]:
aux = dados.loc[:, ['Posição institucional', 'Você tem alguma religião?']]
aux[aux.isnull()] = 'Em branco'

religiao = aux.value_counts().reset_index().sort_values('Posição institucional')
religiao = religiao.rename({0: 'Respostas'}, axis = 1)

for i in religiao.iloc[:,0].drop_duplicates():
  religiao.loc[religiao['Posição institucional'] == i, 'Respostas'] /= \
  religiao.loc[religiao['Posição institucional'] == i, 'Respostas'].sum()
religiao

religiao['Respostas'] *= 100
religiao.reset_index(inplace = True)
religiao = religiao.sort_values(by = 'Respostas', ascending = False)
religiao = religiao.sort_values(by = 'Posição institucional')

religiao.style.format({"Respostas": "{:,.2f}%"})

In [None]:
plt.figure(figsize = (12,6))
plt.rc('xtick', labelsize=12)


ax = sns.barplot(data = religiao, y= 'Você tem alguma religião?',\
                 x = 'Respostas', hue = 'Posição institucional')
for p in ax.patches:
        porcentagem = '{:.1f}%'.format(p.get_width())
        x = p.get_x() + p.get_width()
        y = p.get_y() + p.get_height()/2 + 0.03
        ax.annotate(porcentagem, (x, y))

plt.xlabel("")
plt.ylabel("")
plt.title("Você tem alguma religião?",size = 12)
plt.tight_layout()

plt.show()

In [None]:
dados.loc[~dados['Qual é o seu estado conjugal atual (situação de fato)?'].isin(['Solteiro(a)', 'Em um relacionamento ou união estável', 'Casado(a)',
                                                                                 'Separado(a)/Divorciado(a)' , 'Viúvo(a)',
                                                                                 'Prefiro não responder']), 'Qual é o seu estado conjugal atual (situação de fato)?'] = 'Outro'

aux = dados.loc[:, ['Posição institucional', 'Qual é o seu estado conjugal atual (situação de fato)?']]
aux[aux.isnull()] = 'Em branco'

estado_conj = aux.value_counts().reset_index().sort_values('Posição institucional')
estado_conj = estado_conj.rename({0: 'Respostas'}, axis = 1)

for i in estado_conj.iloc[:,0].drop_duplicates():
  estado_conj.loc[estado_conj['Posição institucional'] == i, 'Respostas'] /= \
  estado_conj.loc[estado_conj['Posição institucional'] == i, 'Respostas'].sum()
estado_conj

estado_conj['Respostas'] *= 100
estado_conj.reset_index(inplace = True)
estado_conj = estado_conj.sort_values(by = 'Respostas', ascending = False)
estado_conj = estado_conj.sort_values(by = 'Posição institucional')

estado_conj.style.format({"Respostas": "{:,.2f}%"})

In [None]:

plt.figure(figsize = (12,6))
plt.rc('xtick', labelsize=12)

ax = sns.barplot(data = estado_conj, y= 'Qual é o seu estado conjugal atual (situação de fato)?',\
                 x = 'Respostas', hue = 'Posição institucional', order = ['Solteiro(a)', 'Em um relacionamento ou união estável', 'Casado(a)',
                                                                      'Separado(a)/Divorciado(a)' , 'Viúvo(a)',
                                                                      'Prefiro não responder','Outro'])

for p in ax.patches:
        porcentagem = '{:.1f}%'.format(p.get_width())
        x = p.get_x() + p.get_width() + 0.1
        y = p.get_y() + p.get_height()/2 + 0.1
        ax.annotate(porcentagem, (x, y))

plt.xlabel("")
plt.ylabel("")
plt.title("Estado Conjugal",size = 12)
plt.tight_layout()
plt.legend(loc = 'lower right')
plt.show()

In [None]:
dicionario = {"Moro com minha família nuclear (pais, irmãos, filhos, cônjuge, companheiro(a))" :
              "Moro com minha família nuclear\n (pais, irmãos, filhos, cônjuge,\n companheiro(a))"}

dados.replace(dicionario, inplace = True)

dados.loc[~dados['Onde e/ou com quem você mora?'].isin(['Moro com minha família nuclear\n (pais, irmãos, filhos, cônjuge,\n companheiro(a))',
'Moro com outros membros da família (família extensa)',
'Independentemente, em um apartamento/casa',
'Moro com amigos',
'Moradia no campus (CRUSP ou alojamento)',
'República',
'Prefiro não responder']), 'Onde e/ou com quem você mora?'] = 'Outro'

aux = dados.loc[:, ['Posição institucional', 'Onde e/ou com quem você mora?']]
aux[aux.isnull()] = 'Em branco'

moradia = aux.value_counts().reset_index().sort_values('Posição institucional')
moradia = moradia.rename({0: 'Respostas'}, axis = 1)

for i in moradia.iloc[:,0].drop_duplicates():
  moradia.loc[moradia['Posição institucional'] == i, 'Respostas'] /= \
  moradia.loc[moradia['Posição institucional'] == i, 'Respostas'].sum()
moradia

moradia['Respostas'] *= 100
moradia.reset_index(inplace = True)
moradia = moradia.sort_values(by = 'Respostas', ascending = False)
moradia = moradia.sort_values(by = 'Posição institucional')

moradia.style.format({"Respostas": "{:,.2f}%"})

In [None]:

plt.figure(figsize = (12,6))
plt.rc('xtick', labelsize=12)

ax = sns.barplot(data = moradia, y= 'Onde e/ou com quem você mora?',\
                 x = 'Respostas', hue = 'Qual a sua posição principal na USP hoje?', order = ['Moro com minha família nuclear\n (pais, irmãos, filhos, cônjuge,\n companheiro(a))',
                                                                 'Moro com outros membros da família (família extensa)',
                                                                 'Independentemente, em um apartamento/casa',
                                                                 'Moro com amigos',
                                                                 'Moradia no campus (CRUSP ou alojamento)',
                                                                 'República',
                                                                 'Prefiro não responder', 'Outro'])


for p in ax.patches:
        porcentagem = '{:.1f}%'.format(p.get_width())
        x = p.get_x() + p.get_width() + 0.3
        y = p.get_y() + p.get_height()/2 + 0.12
        ax.annotate(porcentagem, (x, y))


plt.xlabel("")
plt.ylabel('')
plt.title("Moradia",size = 12)
plt.tight_layout()

plt.show()

In [None]:
dicionario = {'Tenho filho(as), concorri em um processo seletivo para uma vaga na creche da USP, mas não fui contemplada(o)' :
              "Tenho filho(as), \nconcorri em um processo seletivo \npara uma vaga na creche da USP, \nmas não fui contemplada(o)"}

dados.replace(dicionario, inplace = True)

aux = dados.loc[:, ['Posição institucional', 'Considerando a parentalidade e as creches da USP, qual a afirmação mais adequada para você?']]
aux[aux.isnull()] = 'Em branco'

parentalidade = aux.value_counts().reset_index().sort_values('Posição institucional')
parentalidade = parentalidade.rename({0: 'Respostas'}, axis = 1)

for i in parentalidade.iloc[:,0].drop_duplicates():
  parentalidade.loc[parentalidade['Posição institucional'] == i, 'Respostas'] /= \
  parentalidade.loc[parentalidade['Posição institucional'] == i, 'Respostas'].sum()
parentalidade

parentalidade['Respostas'] *= 100
parentalidade.reset_index(inplace = True)
parentalidade = parentalidade.sort_values(by = 'Respostas', ascending = False)
parentalidade = parentalidade.sort_values(by = 'Posição institucional')

parentalidade.style.format({"Respostas": "{:,.2f}%"})

In [None]:
plt.figure(figsize = (12,6))
plt.rc('xtick', labelsize=12)

ax = sns.barplot(data = parentalidade, y= 'Considerando a parentalidade e as creches da USP, qual a afirmação mais adequada para você?',\
                 x = 'Respostas', hue = 'Posição institucional', order = ['Não tenho filho(as)',
                                                                              'Tenho filho(as), nunca utilizei e não utilizo a creche da USP',
                                                                              'Tenho filho(as), utilizo ou já utilizei a creche da USP',
                                                                              'Tenho filho(as), \nconcorri em um processo seletivo \npara uma vaga na creche da USP, \nmas não fui contemplada(o)',
                                                                              'Pretendo concorrer a uma vaga na creche da USP no futuro',
                                                                              'Prefiro não responder',
                                                                              ])

for p in ax.patches:
        porcentagem = '{:.1f}%'.format(p.get_width())
        x = p.get_x() + p.get_width()
        y = p.get_y() + p.get_height()/2 + 0.075
        ax.annotate(porcentagem, (x, y))

plt.xlabel("")
plt.ylabel("")
plt.title("Parentalidade",size = 12)
plt.tight_layout()

plt.show()


In [None]:
dicionario = {'branca' : 'Branca', 'parda' : 'Parda', 'preta' : 'Preta', 'amarela': 'Amarela', 'indígena' : 'Indígena',
              'prefiro não responder' : 'Prefiro não responder'}

dados.replace(dicionario, inplace = True)

dados.loc[~dados['Qual sua cor/raça (critério IBGE)'].isin(['Branca', 'Parda', 'Preta', 'Amarela', 'Indígena', 'Prefiro não responder']),
          'Qual sua cor/raça (critério IBGE)'] = 'Outro'

aux = dados.loc[:, ['Posição institucional', 'Qual sua cor/raça (critério IBGE)']]
aux[aux.isnull()] = 'Em branco'

cor = aux.value_counts().reset_index().sort_values('Posição institucional')
cor = cor.rename({0: 'Respostas'}, axis = 1)

for i in cor.iloc[:,0].drop_duplicates():
  cor.loc[cor['Posição institucional'] == i, 'Respostas'] /= \
  cor.loc[cor['Posição institucional'] == i, 'Respostas'].sum()
cor

cor['Respostas'] *= 100
cor.reset_index(inplace = True)
cor = cor.sort_values(by = 'Respostas', ascending = False)
cor = cor.sort_values(by = 'Posição institucional')

cor.style.format({"Respostas": "{:,.2f}%"})

In [None]:

plt.figure(figsize = (13,8))
plt.rc('xtick', labelsize=12)

ax = sns.barplot(data = cor, y= 'Qual sua cor/raça (critério IBGE)',\
                 x = 'Respostas', hue = 'Posição institucional', order = ['Branca' , 'Parda', 'Preta', 'Amarela', 'Indígena', 'Outro','Prefiro não responder'])

for p in ax.patches:
        porcentagem = '{:.1f}%'.format(p.get_width())
        x = p.get_x() + p.get_width()
        y = p.get_y() + p.get_height()/2 + 0.075
        ax.annotate(porcentagem, (x, y))

plt.xlabel("")
plt.ylabel("")
plt.title("Qual sua cor/raça (critério IBGE)?",size = 12)
plt.tight_layout()


plt.show()

In [None]:
dicionario = {'Mulher cis (pessoa que nasceu com sexo feminino e se identifica com o gênero feminino)' : 'Mulher cis (pessoa que nasceu com \n sexo feminino e se identifica com \n o gênero feminino)',
              'Homem cis (pessoa que nasceu com sexo masculino e se identifica com o gênero masculino)' : 'Homem cis (pessoa que nasceu com \n sexo masculino e se identifica com \n o gênero masculino)',
              'Mulher trans (pessoa que nasceu com características sexuais masculinas e se identifica com o gênero feminino)' : 'Mulher trans (pessoa que nasceu com \n características sexuais masculinas e se identifica com \n o gênero feminino)',
              'Homem trans (pessoa que nasceu com características sexuais femininas e se identifica com o gênero masculino)' : 'Homem trans (pessoa que nasceu com \n características sexuais femininas e se identifica com \n o gênero masculino)',
              'Pessoa não binária (pessoa que não se identifica estritamente com o gênero masculino ou feminino)' : 'Pessoa não binária (pessoa que não \n se identifica estritamente com \n o gênero masculino ou feminino)'}

dados.replace(dicionario, inplace = True)

dados.loc[~dados['Qual é sua identidade de gênero?'].isin(['Mulher cis (pessoa que nasceu com \n sexo feminino e se identifica com \n o gênero feminino)',
                                                           'Homem cis (pessoa que nasceu com \n sexo masculino e se identifica com \n o gênero masculino)',
                                                           'Mulher trans (pessoa que nasceu com \n características sexuais masculinas e se identifica com \n o gênero feminino)',
                                                           'Homem trans (pessoa que nasceu com \n características sexuais femininas e se identifica com \n o gênero masculino)',
                                                           'Pessoa não binária (pessoa que não \n se identifica estritamente com \n o gênero masculino ou feminino)',
                                                           'Prefiro não responder']),
          'Qual é sua identidade de gênero?'] = 'Outro'

aux = dados.loc[:, ['Posição institucional', 'Qual é sua identidade de gênero?']]
aux[aux.isnull()] = 'Em branco'

genero = aux.value_counts().reset_index().sort_values('Posição institucional')
genero = genero.rename({0: 'Respostas'}, axis = 1)

for i in genero.iloc[:,0].drop_duplicates():
  genero.loc[genero['Posição institucional'] == i, 'Respostas'] /= \
  genero.loc[genero['Posição institucional'] == i, 'Respostas'].sum()
genero

genero['Respostas'] *= 100
genero.reset_index(inplace = True)
genero = genero.sort_values(by = 'Respostas', ascending = False)
genero = genero.sort_values(by = 'Posição institucional')

genero.style.format({"Respostas": "{:,.2f}%"})

In [None]:

plt.figure(figsize = (15,10))
plt.rc('xtick', labelsize=12)

ax = sns.barplot(data = genero, y= 'Qual é sua identidade de gênero?',\
                 x = 'Respostas', hue = 'Posição institucional', order = ['Mulher cis (pessoa que nasceu com \n sexo feminino e se identifica com \n o gênero feminino)',
                                                           'Homem cis (pessoa que nasceu com \n sexo masculino e se identifica com \n o gênero masculino)',
                                                           'Mulher trans (pessoa que nasceu com \n características sexuais masculinas e se identifica com \n o gênero feminino)',
                                                           'Homem trans (pessoa que nasceu com \n características sexuais femininas e se identifica com \n o gênero masculino)',
                                                           'Pessoa não binária (pessoa que não \n se identifica estritamente com \n o gênero masculino ou feminino)',
                                                           'Prefiro não responder', 'Outro'])

for p in ax.patches:
        porcentagem = '{:.1f}%'.format(p.get_width())
        x = p.get_x() + p.get_width()
        y = p.get_y() + p.get_height()/2 + 0.075
        ax.annotate(porcentagem, (x, y))

plt.xlabel("")
plt.ylabel("")
plt.title("'Qual é sua identidade de gênero?'",size = 12)
plt.tight_layout()

plt.show()


In [None]:
dados = dados.fillna('Sem Religião')

dados.loc[~dados['Especifique a sua religião'].isin(['Católica', 'Evangélica', 'Espírita', 'Outras religiosidades cristãs',
                                                     'Religiões afro/afro-brasileiras', 'Judaica', 'Islâmica',
                                                     'Não determinada ou múltiplo pertencimento', 'Prefiro não informar', 'Sem Religião']), 'Especifique a sua religião'] = 'Outro'


aux = dados.loc[:, ['Posição institucional', 'Especifique a sua religião']]
aux[aux.isnull()] = 'Em branco'

religiaoq = aux.value_counts().reset_index().sort_values('Posição institucional')
religiaoq = religiaoq.rename({0: 'Respostas'}, axis = 1)

for i in religiaoq.iloc[:,0].drop_duplicates():
  religiaoq.loc[religiaoq['Posição institucional'] == i, 'Respostas'] /= \
  religiaoq.loc[religiaoq['Posição institucional'] == i, 'Respostas'].sum()
religiaoq

religiaoq['Respostas'] *= 100
religiaoq.reset_index(inplace = True)
religiaoq = religiaoq.sort_values(by = 'Respostas', ascending = False)
religiaoq = religiaoq.sort_values(by = 'Posição institucional')

religiaoq.style.format({"Respostas": "{:,.2f}%"})

In [None]:
plt.figure(figsize = (15,12))
plt.rc('xtick', labelsize=12)

ax = sns.barplot(data = religiaoq, y= 'Especifique a sua religião',\
                 x = 'Respostas', hue = 'Posição institucional', order = ['Católica', 'Evangélica', 'Espírita', 'Outras religiosidades cristãs',
                                                     'Religiões afro/afro-brasileiras', 'Judaica', 'Islâmica',
                                                     'Não determinada ou múltiplo pertencimento', 'Prefiro não informar','Sem Religião', 'Outro'])

for p in ax.patches:
        porcentagem = '{:.1f}%'.format(p.get_width())
        x = p.get_x() + p.get_width()
        y = p.get_y() + p.get_height()/2 + 0.05
        ax.annotate(porcentagem, (x, y))

plt.xlabel("")
plt.ylabel("")
plt.title("Religião",size = 12)
plt.tight_layout()
plt.legend(loc = 'center right')
plt.show()

In [None]:
func = dados.loc[dados['Posição institucional']=='Servidor(a) técnico(a)-administrativo(a)']

In [None]:
for i in range(len(func)):
    if('Mulher cis' in func['Qual é sua identidade de gênero?'].iloc[i]):
        func['Qual é sua identidade de gênero?'].iloc[i] = 'Mulher cis'
    if('Mulher trans' in func['Qual é sua identidade de gênero?'].iloc[i]):
        func['Qual é sua identidade de gênero?'].iloc[i]= 'Mulher trans'
    if('Homem cis' in func['Qual é sua identidade de gênero?'].iloc[i]):
        func['Qual é sua identidade de gênero?'].iloc[i] = 'Homem cis'
    if('Homem trans' in func['Qual é sua identidade de gênero?'].iloc[i]):
        func['Qual é sua identidade de gênero?'].iloc[i] = 'Homem trans'
    if('Pessoa não binária' in func['Qual é sua identidade de gênero?'].iloc[i]):
        func['Qual é sua identidade de gênero?'].iloc[i] = 'Pessoa não binária'
    if('Prefiro não responder' in func['Qual é sua identidade de gênero?'].iloc[i]):
        func['Qual é sua identidade de gênero?'].iloc[i] = 'Outro/Prefiro não responder'

func.loc[~func['Qual é sua identidade de gênero?'].isin(['Mulher cis', 'Mulher trans', 'Homem cis','Homem trans', 'Pessoa não binária']),'Qual é sua identidade de gênero?'] = 'Outro/Prefiro não responder'


In [None]:
func = func.loc[func['Enquadramento']=='Superior']

In [None]:
round(round(pd.crosstab([func['Qual sua cor/raça (critério IBGE)']], [func['Qual é sua identidade de gênero?']], normalize='all').reindex(['branca', 'amarela', 'parda', 'preta', 'prefiro não responder']),3)*100)

In [None]:
dados.head()

In [None]:
for i in range(len(dados)):
    if('Mulher cis' in dados['Qual é sua identidade de gênero?'].iloc[i]):
        dados['Qual é sua identidade de gênero?'].iloc[i] = 'Mulher cis'
    if('Mulher trans' in dados['Qual é sua identidade de gênero?'].iloc[i]):
        dados['Qual é sua identidade de gênero?'].iloc[i]= 'Mulher trans'
    if('Homem cis' in dados['Qual é sua identidade de gênero?'].iloc[i]):
        dados['Qual é sua identidade de gênero?'].iloc[i] = 'Homem cis'
    if('Homem trans' in dados['Qual é sua identidade de gênero?'].iloc[i]):
        dados['Qual é sua identidade de gênero?'].iloc[i] = 'Homem trans'
    if('Pessoa não binária' in dados['Qual é sua identidade de gênero?'].iloc[i]):
        dados['Qual é sua identidade de gênero?'].iloc[i] = 'Pessoa não binária'
    if('Prefiro não responder' in dados['Qual é sua identidade de gênero?'].iloc[i]):
        dados['Qual é sua identidade de gênero?'].iloc[i] = 'Outro/Prefiro não responder'

dados.loc[~dados['Qual é sua identidade de gênero?'].isin(['Mulher cis', 'Mulher trans', 'Homem cis','Homem trans', 'Pessoa não binária']),'Qual é sua identidade de gênero?'] = 'Outro/Prefiro não responder'


In [None]:
round(round(pd.crosstab([dados['Qual sua cor/raça (critério IBGE)']], [dados['Posição institucional']], normalize='all').reindex(['branca', 'amarela', 'parda', 'preta', 'prefiro não responder']),3)*100)