## Importação das Bibliotecas

In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import re
import seaborn as sns

## Leitura e Visualização da Base

In [2]:
# Caminho do arquivo Excel
excel_file = "arw.xlsx"

# Leitura do arquivo Excel
df = pd.read_excel(excel_file, sheet_name='Respondentes')

# Exibir as primeiras linhas do DataFrame
print("DataFrame original:")
print(df.head())
print("------------")

DataFrame original:
   numero_respondente        data_resposta concorda_termo_consentimento  \
0                 NaN                  NaN                          NaN   
1                 NaN                  NaN                          NaN   
2                 1.0  2024-07-02 11:02:13                          Sim   
3                 2.0  2024-07-02 11:46:29                          Sim   
4                 3.0  2024-07-02 11:02:21                          Sim   

  faixa_etaria  cor_raca                               identificacao_genero  \
0           NaN      NaN                                                NaN   
1           NaN      NaN                                                NaN   
2  45 a 54 anos   Branca  Homem cisgênero (que se identifica com o gêner...   
3  35 a 44 anos   Branca  Mulher cisgênero (que se identifica com o gêne...   
4  35 a 44 anos   Branca  Homem cisgênero (que se identifica com o gêner...   

  pessoa_com_deficiencia estado_graduacao estado_maior

In [3]:
# Exibir os tipos de dados originais
print("\nTipos de dados originais:")
print(df.dtypes)


Tipos de dados originais:
numero_respondente                            float64
data_resposta                                  object
concorda_termo_consentimento                   object
faixa_etaria                                   object
cor_raca                                       object
identificacao_genero                           object
pessoa_com_deficiencia                         object
estado_graduacao                               object
estado_maior_titulacao                         object
nivel_escolaridade                             object
ano_conclusao_graduacao                       float64
ano_conclusao_mestrado                        float64
ano_conclusao_doutorado                       float64
faixa_renda_domiciliar                         object
renda_principal_onde_vive                      object
responsavel_cuidado_familiar                   object
quantidade_filhos                              object
idade_filhos                                   object
a

In [4]:
# Drop das colunas desnecessárias
columns_to_drop = ['endereco_ip', 'coletor', 'tempo_gasto', 'data_resposta', 'concorda_termo_consentimento']
columns_to_drop = [col for col in columns_to_drop if col in df.columns]
df.drop(columns=columns_to_drop, inplace=True)

# Função para converter floats em inteiros
def converter_float_para_int(df):
    for coluna in df.columns:
        if df[coluna].dtype == 'float64':
            # Verifica se há valores NaN na coluna e os preenche com 0 (ou outro valor apropriado) antes da conversão
            df[coluna].fillna(0, inplace=True)
            df[coluna] = df[coluna].astype(int)
    return df

# Aplicar a função para converter floats em inteiros
df = converter_float_para_int(df)

# Exibir os tipos de dados após a conversão
print("\nTipos de dados após a conversão:")
print(df.dtypes)


Tipos de dados após a conversão:
numero_respondente                             int64
faixa_etaria                                  object
cor_raca                                      object
identificacao_genero                          object
pessoa_com_deficiencia                        object
estado_graduacao                              object
estado_maior_titulacao                        object
nivel_escolaridade                            object
ano_conclusao_graduacao                        int64
ano_conclusao_mestrado                         int64
ano_conclusao_doutorado                        int64
faixa_renda_domiciliar                        object
renda_principal_onde_vive                     object
responsavel_cuidado_familiar                  object
quantidade_filhos                             object
idade_filhos                                  object
area_concentracao                             object
instituicao_nivel_mais_alto                   object
ocupacao_pro

## Perfil socioeconômico

#### Qual é a sua faixa etária?

In [5]:
faixa_etaria = df['faixa_etaria'].value_counts()
print(faixa_etaria)

KeyError: 'faixa_etaria'

#### Qual a sua cor ou raça?

In [None]:
cor_raca = df['cor_raca'].value_counts()
print(cor_raca)

#### Como você se identifica em termos de gênero?

In [None]:
identificacao_genero = df['identificacao_genero'].value_counts()
print(identificacao_genero)

In [None]:
# Função para remover o texto após o parêntese, incluindo o próprio parêntese
def remover_apos_parentese(texto):
    if isinstance(texto, str):
        return re.sub(r'\s*\(.*\)', '', texto).strip()
    return texto

# Aplicar a função à coluna 'identificacao_genero'
df['identificacao_genero'] = df['identificacao_genero'].apply(remover_apos_parentese)

# Contar as ocorrências de cada valor único na coluna 'identificacao_genero'
identificacao_genero_counts = df['identificacao_genero'].value_counts()

# Exibir o resultado
print("Contagem de cada valor:")
print(identificacao_genero_counts)

#### Você é uma pessoa com deficiência?

In [None]:
pessoa_com_deficiencia = df['pessoa_com_deficiencia'].value_counts()
print(pessoa_com_deficiencia)

#### Em qual estado brasileiro você fez a sua graduação em ciências sociais?

In [None]:
estado_graduacao = df['estado_graduacao'].value_counts()
print(estado_graduacao)

#### Em qual estado brasileiro você obteve sua maior titulação acadêmica?

In [None]:
estado_maior_titulacao = df['estado_maior_titulacao'].value_counts()
print(estado_maior_titulacao)

#### Qual o nível de escolaridade mais elevado alcançado por você? Por favor, selecione a opção mais apropriada:

In [None]:
nivel_escolaridade = df['nivel_escolaridade'].value_counts()
print(nivel_escolaridade)

#### Por favor, indique o ano em que concluiu sua graduação:

Muitos erros no preenchimento do ano de conclusão da graduação.

In [None]:
ano_conclusao_graduacao = df['ano_conclusao_graduacao'].value_counts()
print(ano_conclusao_graduacao)

In [None]:
# Anos de Graduação > 1900
graduacao_abaixo_1900 = df.query('ano_conclusao_graduacao <= 1900')[['ano_conclusao_graduacao', 'numero_respondente']]
print(graduacao_abaixo_1900)

# Contar a quantidade de registros por ano para anos > 1900
contagem_por_ano_acima_1900 = df.query('ano_conclusao_graduacao <= 1900')['ano_conclusao_graduacao'].value_counts().sort_index()

# Exibir a contagem por ano
print("\nContagem por Ano de Graduação <= 1900:")
print(contagem_por_ano_acima_1900)

In [None]:
# Substituir anos de conclusão da graduação abaixo de 1901 por 0
df['ano_conclusao_graduacao'] = df['ano_conclusao_graduacao'].apply(lambda x: x if x >= 1901 else 0)

# Anos de Graduação > 1900
graduacao_abaixo_1900 = df.query('ano_conclusao_graduacao <= 1900')[['ano_conclusao_graduacao', 'numero_respondente']]
print(graduacao_abaixo_1900)

# Contar a quantidade de registros por ano para anos > 1900
contagem_por_ano_acima_1900 = df.query('ano_conclusao_graduacao <= 1900')['ano_conclusao_graduacao'].value_counts().sort_index()

# Exibir a contagem por ano
print("\nContagem por Ano de Graduação <= 1900:")
print(contagem_por_ano_acima_1900)

In [None]:
df.query("ano_conclusao_graduacao == 0")['ano_conclusao_graduacao']

In [None]:
df.query("ano_conclusao_graduacao != 0")['ano_conclusao_graduacao']

In [None]:
# Contar valores nulos na coluna 'ano_conclusao_graduacao'
nulos_ano_conclusao = df['ano_conclusao_graduacao'].isnull().sum()

# Exibir o resultado
print(nulos_ano_conclusao)

In [None]:
ano_conclusao_graduacao

#### Por favor, indique o ano em concluiu o seu mestrado:

In [None]:
ano_conclusao_mestrado = df['ano_conclusao_mestrado'].value_counts()
print(ano_conclusao_mestrado)

In [None]:
# Anos de Graduação > 1900
mestrado_abaixo_1900 = df.query('ano_conclusao_mestrado <= 1900')[['ano_conclusao_mestrado', 'numero_respondente']]
print(mestrado_abaixo_1900)

# Contar a quantidade de registros por ano para anos > 1900
contagem_por_ano_acima_1900 = df.query('ano_conclusao_mestrado <= 1900')['ano_conclusao_mestrado'].value_counts().sort_index()

# Exibir a contagem por ano
print("\nContagem por Ano de Graduação <= 1900:")
print(contagem_por_ano_acima_1900)

In [None]:
# Substituir anos de conclusão da graduação abaixo de 1901 por 0
df['ano_conclusao_mestrado'] = df['ano_conclusao_mestrado'].apply(lambda x: x if x >= 1901 else 0)

# Anos de Graduação > 1900
graduacao_abaixo_1900 = df.query('ano_conclusao_mestrado <= 1900')[['ano_conclusao_mestrado', 'numero_respondente']]
print(graduacao_abaixo_1900)

# Contar a quantidade de registros por ano para anos > 1900
contagem_por_ano_acima_1900 = df.query('ano_conclusao_mestrado <= 1900')['ano_conclusao_mestrado'].value_counts().sort_index()

# Exibir a contagem por ano
print("\nContagem por Ano de Graduação <= 1900:")
print(contagem_por_ano_acima_1900)

#### Por favor, indique o ano em que concluiu seu doutorado:

In [None]:
ano_conclusao_doutorado = df['ano_conclusao_doutorado'].value_counts()
print(ano_conclusao_doutorado)                      

In [None]:
# Anos de Graduação > 1900
doutorado_abaixo_1900 = df.query('ano_conclusao_doutorado <= 1900')[['ano_conclusao_doutorado', 'numero_respondente']]
print(mestrado_abaixo_1900)

# Contar a quantidade de registros por ano para anos > 1900
contagem_por_ano_acima_1900 = df.query('ano_conclusao_doutorado <= 1900')['ano_conclusao_doutorado'].value_counts().sort_index()

# Exibir a contagem por ano
print("\nContagem por Ano de Graduação <= 1900:")
print(contagem_por_ano_acima_1900)

In [None]:
# Substituir anos de conclusão da graduação abaixo de 1901 por 0
df['ano_conclusao_doutorado'] = df['ano_conclusao_doutorado'].apply(lambda x: x if x >= 1901 else 0)

# Anos de Graduação > 1900
doutorado_abaixo_1900 = df.query('ano_conclusao_doutorado <= 1900')[['ano_conclusao_doutorado', 'numero_respondente']]
print(graduacao_abaixo_1900)

# Contar a quantidade de registros por ano para anos > 1900
contagem_por_ano_acima_1900 = df.query('ano_conclusao_doutorado <= 1900')['ano_conclusao_doutorado'].value_counts().sort_index()

# Exibir a contagem por ano
print("\nContagem por Ano de Graduação <= 1900:")
print(contagem_por_ano_acima_1900)

#### Por favor, indique a sua faixa de renda domiciliar mensal

In [None]:
# Função para remover o texto 'salários-mínimos' ou 'salário-mínimo'
def limpar_texto(texto):
    if isinstance(texto, str):  # Verifica se o valor é uma string
        return texto.replace('salários-mínimos', '').replace('salário-mínimo', '').strip()
    return texto  # Retorna o valor original se não for uma string

# Aplicar a função à coluna 'faixa_renda_domiciliar'
df['faixa_renda_domiciliar'] = df['faixa_renda_domiciliar'].apply(limpar_texto)

# Verificar o resultado
faixa_renda_domiciliar = df['faixa_renda_domiciliar'].value_counts()
print(faixa_renda_domiciliar)

#### A sua renda é a principal do domicílio onde você vive?

In [None]:
renda_principal_onde_vive = df['renda_principal_onde_vive'].value_counts()
print(renda_principal_onde_vive)

#### Você é responsável pelo cuidado de algum familiar?

In [None]:
responsavel_cuidado_familiar = df['responsavel_cuidado_familiar'].value_counts()
print(responsavel_cuidado_familiar)

In [None]:
# Dicionário de mapeamento para simplificar os textos
mapear_textos = {
    'Sim, filho/a (s)': 'Filho(s)',
    'Sim, familiar(es) que é (são) idosos (as)': 'Familiares Idosos',
    'Sim, familiar (es) que é (são) crianças': 'Familiares Crianças',
    'Sim, familiar (es) que é (são) pessoa com deficiência': 'Familiares com Deficiência',
    'Sim, enteados(a)': 'Enteados',
    'Prefiro não responder': 'Prefiro não responder',
    'Não': 'Não'
}

# Aplicar o mapeamento à coluna 'responsavel_cuidado_familiar'
df['responsavel_cuidado_familiar'] = df['responsavel_cuidado_familiar'].replace(mapear_textos)

# Verificar o resultado
responsavel_cuidado_familiar = df['responsavel_cuidado_familiar'].value_counts()
print(responsavel_cuidado_familiar)

#### Quantos filhos(as) você tem?

In [None]:
quantidade_filhos = df['quantidade_filhos'].value_counts()
print(quantidade_filhos)

In [None]:
# Dicionário de mapeamento para simplificar os textos
mapear_textos = {
    '1 filha (o)': '1 filha(o)',
    '2 filhas (os)': '2 filhas(os)',
    '3 filhas (os)': '3 filhas(os)',
    '4 filhas (os)': '4 filhas(os)',
    '5 filhas (os) ou mais': '5 ou mais filhas(os)',
    'Não tenho filhos': 'Sem filhos',
    'Prefiro não responder': 'Prefiro não responder'
}

# Aplicar o mapeamento à coluna 'quantidade_filhos'
df['quantidade_filhos'] = df['quantidade_filhos'].replace(mapear_textos)

# Verificar o resultado
quantidade_filhos = df['quantidade_filhos'].value_counts()
print(quantidade_filhos)

#### Caso tenha filhos (as), por favor, assinale as alternativas que correspondam à idade dos (as) mesmos (as).OBS: Em caso de mais de um (a) filho (a), é possível selecionar mais de uma opção.

In [None]:
idade_filhos = df['idade_filhos'].value_counts()
print(idade_filhos)

## Perfil acadêmico e profissional

#### Qual é a sua principal área de concentração nas Ciências Sociais?

In [None]:
area_concentracao = df['area_concentracao'].value_counts()
print(area_concentracao)

## Instituição de Nível Mais Alto

In [None]:
# Limpar o texto entre parênteses e ajustar a coluna
df['instituicao_nivel_mais_alto'] = df['instituicao_nivel_mais_alto'].str.replace(r'\s*\(.*\)', '', regex=True).str.strip()

instituicao_nivel_mais_alto = df['instituicao_nivel_mais_alto'].value_counts()
print(instituicao_nivel_mais_alto)

In [None]:
# Dicionário de mapeamento para simplificar os textos
mapear_textos = {
    'Pública': 'Pública',
    'Privada com fins lucrativos': 'Privada com fins lucrativos',
    'Privada sem fins lucrativos (confessionais, comunitárias e fundações)': 'Privada sem fins lucrativos',
}

# Aplicar o mapeamento à coluna 'quantidade_filhos'
df['instituicao_nivel_mais_alto'] = df['instituicao_nivel_mais_alto'].replace(mapear_textos)

# Verificar o resultado
instituicao_nivel_mais_alto = df['instituicao_nivel_mais_alto'].value_counts()
print(instituicao_nivel_mais_alto)

## Ocupação Profissional Atual

In [None]:
ocupacao_profissional_atual = df['ocupacao_profissional_atual'].value_counts()
print(ocupacao_profissional_atual)

## Desempregados

In [None]:
desempregado_opcao = df['desempregado_opcao'].value_counts()
print(desempregado_opcao)

## Expectativa para Encontrar Emprego Compatível com a Formação

In [None]:
expectativa_emprego_compativel_formacao = df['expectativa_emprego_compativel_formacao'].value_counts()
print(expectativa_emprego_compativel_formacao)

In [None]:
# Filtrar para desconsiderar NaN e 0
filtro = df['expectativa_emprego_compativel_formacao'].notna() & (df['expectativa_emprego_compativel_formacao'] != 0)

# Aplicar o filtro e contar os valores
expectativa_emprego_compativel_formacao = df[filtro]['expectativa_emprego_compativel_formacao'].value_counts()

# Exibir o resultado
print(expectativa_emprego_compativel_formacao)

## Tipo de Vínculo Atual

In [None]:
tipo_vinculo_ocupacao_atual = df['tipo_vinculo_ocupacao atual'].value_counts()
print(tipo_vinculo_ocupacao_atual)

In [None]:
# Criar um dicionário de mapeamento para os valores de 'tipo_vinculo_ocupacao_atual'
mapeamento_ocupacao = {
    "Empregado(a) formal no setor privado": "Empregado(a) Formal no Setor Privado",
    "Bolsista": "Bolsista",
    "Autônomo(a)/prestador(a) de serviço": "Autônomo(a)/Prestador(a) de Serviço",
    "Servidor(a) estatutário federal": "Servidor(a) Estatutário Federal",
    "Servidor(a) estatutário estadual": "Servidor(a) Estatutário Estadual",
    "Empregado(a) formal no terceiro setor": "Empregado(a) Formal no Terceiro Setor",
    "Servidor(a) estatutário municipal": "Servidor(a) Estatutário Municipal",
    "Servidor (a) temporário no âmbito estadual": "Servidor(a) Temporário no Âmbito Estadual",
    "Servidor(a) público celetista estadual": "Servidor(a) Público Celetista Estadual",
    "Servidor(a) público celetista federal": "Servidor(a) Público Celetista Federal",
    "Empresário(a)": "Empresário(a)",
    "Servidor (a) comissionado (a) no âmbito estadual": "Servidor(a) Comissionado (a) no Âmbito Estadual",
    "Servidor (a) temporário no âmbito federal": "Servidor(a) Temporário no Âmbito Federal",
    "Servidor (a) temporário no âmbito municipal": "Servidor(a) Temporário no Âmbito Municipal",
    "Servidor(a) público celetista municipal": "Servidor(a) Público Celetista Municipal",
    "Servidor (a) comissionado (a) no âmbito municipal": "Servidor(a) Comissionado(a) no Âmbito Municipal",
    "Servidor (a) comissionado (a) no âmbito federal": "Servidor(a) Comissionado(a) no Âmbito Federal",
}

# Aplicar o mapeamento à coluna 'tipo_vinculo_ocupacao_atual'
df['tipo_vinculo_ocupacao atual'] = df['tipo_vinculo_ocupacao atual'].map(mapeamento_ocupacao)

# Contar os valores após o mapeamento
tipo_vinculo_ocupacao_atual = df['tipo_vinculo_ocupacao atual'].value_counts()

# Exibir o resultado
print(tipo_vinculo_ocupacao_atual)

## Caracterização da Organização

In [None]:
# Criar um dicionário de mapeamento para os valores de 'caracterizacao_organizacao'
mapeamento_ocupacao = {
    "Instituição de ensino superior pública": "Instituição de Ensino Superior Pública",
    "Instituição de ensino superior privada com fins lucrativos": "Instituição de Ensino Superior Privada com Fins Lucrativos",
    "Instituição de ensino superior privada sem fins lucrativos (confessionais, comunitárias e fundações)": "Instituição de Ensino Superior Privada sem Fins Lucrativos",
    "Instituição de ensino da rede básica pública": "Instituição de Ensino da Rede Básica Pública",
    "Instituição de ensino da rede básica privada": "Instituição de Ensino da Rede Básica Privada",
    "Instituição de ensino da rede básica privada sem fins lucrativos": "Instituição de Ensino da Rede Básica Privada sem Fins Lucrativos",
    "Empresa pública/autarquia": "Empresa Pública/Autarquia",
    "Congresso Nacional": "Congresso Nacional",
    "Assembleia legislativa estadual": "Assembleia Legislativa Estadual",
    "Assembleia legislativa municipal": "Assembleia Legislativa Municipal",
    "Órgãos públicos de controle (Tribunais de contas, Ministério Público etc.)": "Órgãos Públicos de Controle",
    "Empresa privada": "Empresa Privada",
    "Organização do terceiro setor (ONGs, OSCIPs, OSs, cooperativas, associações, fundações etc.)": "Organização do Terceiro Setor",
    "Empresa própria ou da qual você é sócio(a)": "Empresa Própria ou Sócio(a)"
}

# Remover espaços em branco nas bordas dos valores na coluna
df['caracterizacao_organizacao'] = df['caracterizacao_organizacao'].str.strip()

# Aplicar o mapeamento à coluna 'caracterizacao_organizacao'
df['caracterizacao_organizacao_atual'] = df['caracterizacao_organizacao'].map(mapeamento_ocupacao)

# Contar os valores após o mapeamento
caracterizacao_organizacao_atual = df['caracterizacao_organizacao_atual'].value_counts()

# Exibir o resultado
print("\nContagem por caracterização da organização atual:")
print(caracterizacao_organizacao_atual)

## Tamanho da Instituição no Setor Privado

In [None]:
# Contar os valores
tamanho_instituicao = df['tamanho_instituicao'].value_counts()

# Exibir o resultado
print(tamanho_instituicao)

## Perfil da Empresa no Setor Privado

In [None]:
# Criar um dicionário de mapeamento para os valores de 'perfil_empresa_privada'
mapeamento_ocupacao = {
    "Consultoria/assessoria econômica ou financeira": "Consultoria/Assessoria Econômica ou Financeira",
    "Consultoria/assessoria econômica em relações institucionais e governamentais": "Consultoria/Assessoria Econômica em Relações Institucionais e Governamentais",
    "Consultoria/assessoria em pesquisa": "Consultoria/Assessoria em Pesquisa",
    "Consultoria/assessoria em ensino e educação": "Consultoria/Assessoria em Ensino e Educação",
    "Consultoria/assessoria em meio ambiente e sustentabilidade": "Consultoria/Assessoria em Meio Ambiente e Sustentabilidade",
    "Consultoria/assessoria em governança social e diversidade": "Consultoria/Assessoria em Governança Social e Diversidade",
    "Consultoria/assessoria em cultura/projetos culturais": "Consultoria/Assessoria em Cultura/Projetos Culturais",
    "Empresa do setor industrial": "Empresa do Setor Industrial",
    "Empresa do setor de serviços": "Empresa do Setor de Serviços",
    "Empresa do setor financeiro": "Empresa do Setor Financeiro"
}

# Aplicar o mapeamento à coluna 'perfil_empresa_privada'
df['perfil_empresa_privada'] = df['perfil_empresa_privada'].map(mapeamento_ocupacao)

# Contar os valores após o mapeamento
perfil_empresa_privada = df['perfil_empresa_privada'].value_counts()

# Exibir o resultado
print(perfil_empresa_privada)

## Ramo de Atuação no Setor Público

In [None]:
# Contar os valores
perfil_ramo_atuacao_publico = df['perfil_ramo_atuacao_publico'].value_counts()

# Exibir o resultado
print(perfil_ramo_atuacao_publico)

## Expectativas Iniciais com a Profissão

In [None]:
# Remover o ponto final das frases na coluna 'expectativas_iniciais_profissao' e capitalizar as palavras
df['expectativas_iniciais_profissao'] = df['expectativas_iniciais_profissao'].str.rstrip('.').str.title()

# Contar os valores
expectativas_iniciais_profissao = df['expectativas_iniciais_profissao'].value_counts()

# Exibir o resultado
print(expectativas_iniciais_profissao)

## Expectativas Alcançadas na Profissão

In [None]:
# Capitalizar os valores na coluna 'expectativas_alcancadas'
df['expectativas_alcancadas'] = df['expectativas_alcancadas'].str.title()

# Contar os valores
expectativas_alcancadas = df['expectativas_alcancadas'].value_counts()

# Exibir o resultado
print(expectativas_alcancadas)

## Sentimento em Relação à Carreira Atualmente

In [None]:
# Capitalizar os valores na coluna 'satisfacao_carreira'
df['satisfacao_carreira'] = df['satisfacao_carreira'].str.title()

# Contar os valores
satisfacao_carreira = df['satisfacao_carreira'].value_counts()

# Exibir o resultado
print(satisfacao_carreira)

## Fatores para o Sucesso Profissional

In [None]:
# Capitalizar os valores na coluna 'fatores_sucesso_profissional'
df['fatores_sucesso_profissional'] = df['fatores_sucesso_profissional'].str.title()

# Contar os valores
fatores_sucesso_profissional = df['fatores_sucesso_profissional'].value_counts()

# Exibir o resultado
print(fatores_sucesso_profissional)

## Desafios para a Realização Profissional

In [None]:
# Capitalizar os valores na coluna 'desafios_realizacao_profissional'
df['desafios_realizacao_profissional'] = df['desafios_realizacao_profissional'].str.title()

# Contar os valores
desafios_realizacao_profissional = df['desafios_realizacao_profissional'].value_counts()

# Exibir o resultado
print(desafios_realizacao_profissional)

## Compatibilidade do Emprego com a Formação

In [None]:
# Contar os valores
compatibilidade_emprego_formacao = df['compatibilidade_emprego_formacao'].value_counts()

# Exibir o resultado
print(compatibilidade_emprego_formacao)

## O Currículo do Curso Atende às Necessidades Profissionais

In [None]:
# Capitalizar os valores na coluna 'curriculo_atende_necessidades'
df['curriculo_atende_necessidades'] = df['curriculo_atende_necessidades'].str.title()

# Contar os valores
curriculo_atende_necessidades = df['curriculo_atende_necessidades'].value_counts()

# Exibir o resultado
print(curriculo_atende_necessidades)               

## Conhecimento Aplicável

In [None]:
# Capitalizar os valores na coluna 'conhecimento_aplicavel'
df['conhecimento_aplicavel'] = df['conhecimento_aplicavel'].str.title()

# Contar os valores
conhecimento_aplicavel = df['conhecimento_aplicavel'].value_counts()

# Exibir o resultado
print(conhecimento_aplicavel)          

## Como Adquiriu os Conhecimentos Aplicáveis Necessários

In [None]:
# Criar um dicionário de mapeamento para os valores de 'como_adquiriu_conhecimento'
mapeamento_ocupacao = {
    "Adquiri esses conhecimentos por conta própria": "Por Conta Própria",
    "Adquiri esses conhecimentos através de cursos complementares ou de curta duração": "Cursos Complementares Ou De Curta Duração",
    "Adquiri esses conhecimentos através de treinamentos no local de trabalho": "Treinamentos No Local De Trabalho"
}

# Aplicar o mapeamento à coluna 'como_adquiriu_conhecimento'
df['como_adquiriu_conhecimento'] = df['como_adquiriu_conhecimento'].map(mapeamento_ocupacao)

# Contar os valores
como_adquiriu_conhecimento = df['como_adquiriu_conhecimento'].value_counts()

# Exibir o resultado
print(como_adquiriu_conhecimento) 

## Conhecimento Necessário nos Cursos de Ciência Política

In [None]:
# Capitalizar os valores na coluna 'desafios_realizacao_profissional'
df['conhecimento_necessario'] = df['conhecimento_necessario'].str.title()

# Contar os valores
conhecimento_necessario = df['conhecimento_necessario'].value_counts()

# Exibir o resultado
print(conhecimento_necessario)

#### A formação em Ciências Sociais ajuda a desenvolver habilidades como leitura e escrita. Em que medida essas habilidades têm sido úteis na sua atividade profissional?

In [None]:
# Capitalizar os valores na coluna 'habilidades_utilidade_leitura_escrita'
df['habilidades_utilidade_leitura_escrita'] = df['habilidades_utilidade_leitura_escrita'].str.title()

# Contar os valores
habilidades_utilidade_leitura_escrita = df['habilidades_utilidade_leitura_escrita'].value_counts()

# Exibir o resultado
print(habilidades_utilidade_leitura_escrita)

#### A formação em Ciências Sociais ajuda a desenvolver habilidades como pensamento sistemático e capacidade analítica. Em que medida essas habilidades têm sido úteis na sua atividade profissional?

In [None]:
# Capitalizar os valores na coluna 'habilidades_utilidade_pensamento_analitico'
df['habilidades_utilidade_pensamento_analitico'] = df['habilidades_utilidade_pensamento_analitico'].str.title()

# Contar os valores
habilidades_utilidade_pensamento_analitico = df['habilidades_utilidade_pensamento_analitico'].value_counts()

# Exibir o resultado
print(habilidades_utilidade_pensamento_analitico)

#### A formação em Ciências Sociais ajuda a desenvolver habilidades como coleta, tratamento e análise de dados. Em que medida essas habilidades têm sido úteis na sua atividade profissional?

In [None]:
# Capitalizar os valores na coluna 'habilidades_utilidade_analise_dados'
df['habilidades_utilidade_analise_dados'] = df['habilidades_utilidade_analise_dados'].str.title()

# Contar os valores
habilidades_utilidade_analise_dados = df['habilidades_utilidade_analise_dados'].value_counts()

# Exibir o resultado
print(habilidades_utilidade_analise_dados)