# Leitura e Join dos Arquivos JSON


# Prospects

In [24]:
# Configurar pandas para exibir todas as colunas

import json
import pandas as pd
#pd.set_option('display.max_colwidth', None)
#pd.set_option('display.max_columns', None)

In [25]:


# Carregar o arquivo JSON
with open("C:/Users/win/Desktop/Projetos/Datathon/llm/data/external/prospects.json", encoding="utf-8") as f:
    data = json.load(f)

# Transformar em lista de registros
records = []
for id_, info in data.items():
    base = {"id": id_, "titulo": info.get("titulo", ""), "modalidade": info.get("modalidade", "")}
    prospects = info.get("prospects", [])
    if prospects:
        for prospect in prospects:
            rec = {**base, **prospect}
            records.append(rec)
    else:
        records.append(base)

df_prospects = pd.DataFrame(records)
print(f"Total de colunas em df_prospects: {df_prospects.shape[1]}")
# Exibir o número de linhas do DataFrame df_prospects
print(f"Número de linhas em df_prospects: {df_prospects.shape[0]}")
df_prospects.head()

Total de colunas em df_prospects: 10
Número de linhas em df_prospects: 56702


Unnamed: 0,id,titulo,modalidade,nome,codigo,situacao_candidado,data_candidatura,ultima_atualizacao,comentario,recrutador
0,4530,CONSULTOR CONTROL M,,José Vieira,25632.0,Encaminhado ao Requisitante,25-03-2021,25-03-2021,"Encaminhado para - PJ R$ 72,00/hora",Ana Lívia Moreira
1,4530,CONSULTOR CONTROL M,,Srta. Isabela Cavalcante,25529.0,Encaminhado ao Requisitante,22-03-2021,23-03-2021,"encaminhado para - R$ 6.000,00 – CLT Full , não tem empresa aberta",Ana Lívia Moreira
2,4531,2021-2607395-PeopleSoft Application Engine-Domain Consultant,,Sra. Yasmin Fernandes,25364.0,Contratado pela Decision,17-03-2021,12-04-2021,Data de Inicio: 12/04/2021,Juliana Cassiano
3,4531,2021-2607395-PeopleSoft Application Engine-Domain Consultant,,Alexia Barbosa,25360.0,Encaminhado ao Requisitante,17-03-2021,17-03-2021,,Juliana Cassiano
4,4532,,,,,,,,,


In [26]:
# Ajustar tipagens das colunas do df_prospects
import numpy as np
from pandas.api.types import is_numeric_dtype

# Exemplo de análise e transformação de tipos
df_prospects['id'] = df_prospects['id'].astype(str)
if 'codigo' in df_prospects.columns:
    df_prospects['codigo'] = pd.to_numeric(df_prospects['codigo'], errors='coerce')
for col in ['data_candidatura', 'ultima_atualizacao']:
    if col in df_prospects.columns:
        df_prospects[col] = pd.to_datetime(df_prospects[col], format='%d-%m-%Y', errors='coerce')
if 'comentario' in df_prospects.columns:
    df_prospects['comentario'] = df_prospects['comentario'].astype(str)
if 'recrutador' in df_prospects.columns:
    df_prospects['recrutador'] = df_prospects['recrutador'].astype('category')
if 'situacao_candidado' in df_prospects.columns:
    df_prospects['situacao_candidado'] = df_prospects['situacao_candidado'].astype('category')
if 'titulo' in df_prospects.columns:
    df_prospects['titulo'] = df_prospects['titulo'].astype(str)
if 'modalidade' in df_prospects.columns:
    df_prospects['modalidade'] = df_prospects['modalidade'].astype(str)

# Exibir tipos finais das colunas
print(df_prospects.dtypes)
df_prospects.head()

id                            object
titulo                        object
modalidade                    object
nome                          object
codigo                       float64
situacao_candidado          category
data_candidatura      datetime64[ns]
ultima_atualizacao    datetime64[ns]
comentario                    object
recrutador                  category
dtype: object


Unnamed: 0,id,titulo,modalidade,nome,codigo,situacao_candidado,data_candidatura,ultima_atualizacao,comentario,recrutador
0,4530,CONSULTOR CONTROL M,,José Vieira,25632.0,Encaminhado ao Requisitante,2021-03-25,2021-03-25,"Encaminhado para - PJ R$ 72,00/hora",Ana Lívia Moreira
1,4530,CONSULTOR CONTROL M,,Srta. Isabela Cavalcante,25529.0,Encaminhado ao Requisitante,2021-03-22,2021-03-23,"encaminhado para - R$ 6.000,00 – CLT Full , não tem empresa aberta",Ana Lívia Moreira
2,4531,2021-2607395-PeopleSoft Application Engine-Domain Consultant,,Sra. Yasmin Fernandes,25364.0,Contratado pela Decision,2021-03-17,2021-04-12,Data de Inicio: 12/04/2021,Juliana Cassiano
3,4531,2021-2607395-PeopleSoft Application Engine-Domain Consultant,,Alexia Barbosa,25360.0,Encaminhado ao Requisitante,2021-03-17,2021-03-17,,Juliana Cassiano
4,4532,,,,,,NaT,NaT,,


In [27]:
# EDA (Análise Exploratória de Dados) para df_prospects
print('Formato do DataFrame:', df_prospects.shape)
print('\nTipos de dados:')
print(df_prospects.dtypes)

print('\nColunas com valores nulos:')
print(df_prospects.isnull().sum())

print('\nExemplo de linhas duplicadas:')
print(df_prospects[df_prospects.duplicated()])

print('\nResumo estatístico das colunas numéricas:')
print(df_prospects.describe(include=["number"]))

print('\nResumo estatístico das colunas categóricas:')
print(df_prospects.describe(include=["object"]))

print('\nValores únicos por coluna:')
for col in df_prospects.columns:
    print(f'{col}: {df_prospects[col].nunique()}')

print('\nExemplo de valores únicos para a coluna "situacao_candidado":')
if 'situacao_candidado' in df_prospects.columns:
    print(df_prospects['situacao_candidado'].unique())

print('\nExemplo de valores únicos para a coluna "recrutador":')
if 'recrutador' in df_prospects.columns:
    print(df_prospects['recrutador'].unique())

Formato do DataFrame: (56702, 10)

Tipos de dados:
id                            object
titulo                        object
modalidade                    object
nome                          object
codigo                       float64
situacao_candidado          category
data_candidatura      datetime64[ns]
ultima_atualizacao    datetime64[ns]
comentario                    object
recrutador                  category
dtype: object

Colunas com valores nulos:
id                       0
titulo                   0
modalidade               0
nome                  2943
codigo                2943
situacao_candidado    2943
data_candidatura      2943
ultima_atualizacao    6856
comentario               0
recrutador            2943
dtype: int64

Exemplo de linhas duplicadas:
Empty DataFrame
Columns: [id, titulo, modalidade, nome, codigo, situacao_candidado, data_candidatura, ultima_atualizacao, comentario, recrutador]
Index: []

Resumo estatístico das colunas numéricas:
              codigo
cou

# Applicants

In [28]:
import json
import pandas as pd
pd.set_option('display.max_colwidth', None)
# Carregar o arquivo JSON
with open("C:/Users/win/Desktop/Projetos/Datathon/llm/data/external/applicants.json", encoding="utf-8") as f:
    data = json.load(f)

# Transformar em lista de registros, incluindo o id como campo
records = []
for id_, info in data.items():
    rec = {"id": id_, **info}
    records.append(rec)

# Normalizar os dados aninhados em colunas
df_applicants = pd.json_normalize(records)

print(f"Total de colunas em df_applicants: {df_applicants.shape[1]}")
df_applicants.head(1)



Total de colunas em df_applicants: 58


Unnamed: 0,id,cv_pt,cv_en,infos_basicas.telefone_recado,infos_basicas.telefone,infos_basicas.objetivo_profissional,infos_basicas.data_criacao,infos_basicas.inserido_por,infos_basicas.email,infos_basicas.local,infos_basicas.sabendo_de_nos_por,infos_basicas.data_atualizacao,infos_basicas.codigo_profissional,infos_basicas.nome,informacoes_pessoais.data_aceite,informacoes_pessoais.nome,informacoes_pessoais.cpf,informacoes_pessoais.fonte_indicacao,informacoes_pessoais.email,informacoes_pessoais.email_secundario,informacoes_pessoais.data_nascimento,informacoes_pessoais.telefone_celular,informacoes_pessoais.telefone_recado,informacoes_pessoais.sexo,informacoes_pessoais.estado_civil,informacoes_pessoais.pcd,informacoes_pessoais.endereco,informacoes_pessoais.skype,informacoes_pessoais.url_linkedin,informacoes_pessoais.facebook,informacoes_profissionais.titulo_profissional,informacoes_profissionais.area_atuacao,informacoes_profissionais.conhecimentos_tecnicos,informacoes_profissionais.certificacoes,informacoes_profissionais.outras_certificacoes,informacoes_profissionais.remuneracao,informacoes_profissionais.nivel_profissional,formacao_e_idiomas.nivel_academico,formacao_e_idiomas.nivel_ingles,formacao_e_idiomas.nivel_espanhol,formacao_e_idiomas.outro_idioma,formacao_e_idiomas.instituicao_ensino_superior,formacao_e_idiomas.cursos,formacao_e_idiomas.ano_conclusao,informacoes_pessoais.download_cv,informacoes_profissionais.qualificacoes,informacoes_profissionais.experiencias,formacao_e_idiomas.outro_curso,cargo_atual.id_ibrati,cargo_atual.email_corporativo,cargo_atual.cargo_atual,cargo_atual.projeto_atual,cargo_atual.cliente,cargo_atual.unidade,cargo_atual.data_admissao,cargo_atual.data_ultima_promocao,cargo_atual.nome_superior_imediato,cargo_atual.email_superior_imediato
0,31000,"assistente administrativo\n\n\nsantosbatista\nitapecerica da serra/sp\n29 anos ▪ brasileiro ▪ casado\nformação acadêmica\n bacharel - ciências contábeis\ncentro universitário ítalo brasileiro\njul/2015 - dez/2018\n graduação - gestão financeira\ncentro universitário anhanguera\njan/2013 - dez/2014\nhabilidades\n contas a pagar e receber\n excel avançado\n indicadores kpi’s\n notas fiscais, cfop’s\n fechamento contábil\n emissão de boletos\n guias\n impostos\n budget\n controladoria\n sistemas integrados:\ntotvs;\nfolha matic;\nnavision\nresumo profissional\nprofissional com experiência nos departamentos financeiro,\ncontábil, fiscal e controladoria jurídica. elaboração e análise de\nindicadores kpi’s de resultado, relatórios, guias, gestão de\npagamentos, notas fiscais, boletos, fechamento financeiro e\ncontábil fiscal.\nsoftwares erp protheus, folha matic, navision, elaw e sapiens,\nexcel avançado, (kpi's, painéis de dashboard e automatização).\nhistórico profissional\n 01/2021 – 07/2021 fcn contabilidade freight forwarder\n\nassistente contábil\nconciliações contábeis, financeira, folha de pagamento,\nfiscal, lançamentos contábeis, exportações txt, análise e\nelaboração de relatórios, fechamento contábil, análise\nfiscal e contabilização de folha de pagamento, sistema\nfolha matic.\n 10/2020 – 01/2021 almeida advogados\nassistente financeiro\ngestão de pagamentos, baixa de boletos, relatórios gerenciais.\n 04/2019 – 06/2019 fedex brasil logistica e transporte ltda\nassistente juridico\nresponsável pelo fechamento mensal através das\napurações de provisões e reclassificações contábeis,\nelaboração de indicadores financeiros e desempenho,\nautomatização de planilhas, análise de budget e real vs\norçado.\n 07/2017 – 11/2018 atonanni construções e serviços ltda\nassistente contábil / fiscal\nlançamento de notas fiscais, apurações dos impostos (iss,\npis, cofins, cprb, ir, csll).\nguias de pagamentos, sped fiscais, relatórios, xml, cfop,\nncm.\n 06/2014 – 07/2017 iss servisytem do brasil ltda\nassistente de controladoria\ncontas a pagar e a receber, análises contábeis e\nfinanceiras, reembolsos, p.o’s.\ngestão de custos, budget, real vs orçado, indicadores, kpi’s\ne mapeamento de melhorias.\n 04/2013 – 06/2014 n & n comércio de alimentos ltda\nassistente financeiro\ncontas a pagar e a receber, boletos, relatórios gerenciais.\nbaixa de notas fiscais, concilação financeira, negociações\nde pagamentos\n",,,(11) 97048-2708,,10-11-2021 07:29:49,Luna Correia,carolina_aparecida@gmail.com,,,10-11-2021 07:29:49,31000,Carolina Aparecida,Cadastro anterior ao registro de aceite,Carolina Aparecida,,:,carolina_aparecida@gmail.com,,0000-00-00,(11) 97048-2708,,,,,,,,,,,,,,,,,,,-,,,,,,,,,,,,,,,,,


In [29]:
df_applicants.columns.to_list()

['id',
 'cv_pt',
 'cv_en',
 'infos_basicas.telefone_recado',
 'infos_basicas.telefone',
 'infos_basicas.objetivo_profissional',
 'infos_basicas.data_criacao',
 'infos_basicas.inserido_por',
 'infos_basicas.email',
 'infos_basicas.local',
 'infos_basicas.sabendo_de_nos_por',
 'infos_basicas.data_atualizacao',
 'infos_basicas.codigo_profissional',
 'infos_basicas.nome',
 'informacoes_pessoais.data_aceite',
 'informacoes_pessoais.nome',
 'informacoes_pessoais.cpf',
 'informacoes_pessoais.fonte_indicacao',
 'informacoes_pessoais.email',
 'informacoes_pessoais.email_secundario',
 'informacoes_pessoais.data_nascimento',
 'informacoes_pessoais.telefone_celular',
 'informacoes_pessoais.telefone_recado',
 'informacoes_pessoais.sexo',
 'informacoes_pessoais.estado_civil',
 'informacoes_pessoais.pcd',
 'informacoes_pessoais.endereco',
 'informacoes_pessoais.skype',
 'informacoes_pessoais.url_linkedin',
 'informacoes_pessoais.facebook',
 'informacoes_profissionais.titulo_profissional',
 'informaco

In [30]:
# Ajustar tipagens das colunas do df_applicants considerando as colunas fornecidas
date_cols = [
    'infos_basicas.data_criacao', 'infos_basicas.data_atualizacao',
    'informacoes_pessoais.data_aceite', 'informacoes_pessoais.data_nascimento',
    'cargo_atual.data_admissao', 'cargo_atual.data_ultima_promocao'
 ]
num_cols = [
    'infos_basicas.codigo_profissional', 'formacao_e_idiomas.ano_conclusao', 'cargo_atual.id_ibrati'
 ]
cat_cols = [
    'informacoes_pessoais.sexo', 'informacoes_pessoais.estado_civil', 'informacoes_pessoais.pcd',
    'formacao_e_idiomas.nivel_academico', 'formacao_e_idiomas.nivel_ingles', 'formacao_e_idiomas.nivel_espanhol',
    'formacao_e_idiomas.outro_idioma', 'cargo_atual.unidade'
 ]

# IDs e textos longos
df_applicants['id'] = df_applicants['id'].astype(str)
df_applicants['cv_pt'] = df_applicants['cv_pt'].astype(str)
df_applicants['cv_en'] = df_applicants['cv_en'].astype(str)

# Datas
for col in date_cols:
    if col in df_applicants.columns:
        df_applicants[col] = pd.to_datetime(df_applicants[col], errors='coerce', dayfirst=True)

# Números
for col in num_cols:
    if col in df_applicants.columns:
        df_applicants[col] = pd.to_numeric(df_applicants[col], errors='coerce')

# Categóricos
for col in cat_cols:
    if col in df_applicants.columns:
        df_applicants[col] = df_applicants[col].astype('category')

# Demais campos como texto
for col in df_applicants.columns:
    if col not in date_cols + num_cols + cat_cols + ['id', 'cv_pt', 'cv_en'] and df_applicants[col].dtype == object:
        df_applicants[col] = df_applicants[col].astype(str)

print(df_applicants.dtypes)
print(f"Número de linhas em df_applicants: {df_applicants.shape[0]}")

  df_applicants[col] = pd.to_datetime(df_applicants[col], errors='coerce', dayfirst=True)


id                                                          object
cv_pt                                                       object
cv_en                                                       object
infos_basicas.telefone_recado                               object
infos_basicas.telefone                                      object
infos_basicas.objetivo_profissional                         object
infos_basicas.data_criacao                          datetime64[ns]
infos_basicas.inserido_por                                  object
infos_basicas.email                                         object
infos_basicas.local                                         object
infos_basicas.sabendo_de_nos_por                            object
infos_basicas.data_atualizacao                      datetime64[ns]
infos_basicas.codigo_profissional                            int64
infos_basicas.nome                                          object
informacoes_pessoais.data_aceite                    datetime64

  df_applicants[col] = pd.to_datetime(df_applicants[col], errors='coerce', dayfirst=True)


In [31]:
# EDA (Análise Exploratória de Dados) para df_applicants
print('Formato do DataFrame:', df_applicants.shape)
print('\nTipos de dados:')
print(df_applicants.dtypes)

print('\nColunas com valores nulos:')
print(df_applicants.isnull().sum())

print('\nExemplo de linhas duplicadas:')
print(df_applicants[df_applicants.duplicated()])

print('\nResumo estatístico das colunas numéricas:')
print(df_applicants.describe(include=["number"]))

print('\nResumo estatístico das colunas categóricas:')
print(df_applicants.describe(include=["object"]))

print('\nValores únicos por coluna:')
for col in df_applicants.columns:
    print(f'{col}: {df_applicants[col].nunique()}')

# Exemplo de valores únicos para algumas colunas relevantes
for col in ['informacoes_pessoais.sexo', 'informacoes_pessoais.estado_civil', 'formacao_e_idiomas.nivel_academico', 'formacao_e_idiomas.nivel_ingles', 'formacao_e_idiomas.nivel_espanhol']:
    if col in df_applicants.columns:
        print(f'\nValores únicos para a coluna {col}:')
        print(df_applicants[col].unique())

Formato do DataFrame: (42482, 58)

Tipos de dados:
id                                                          object
cv_pt                                                       object
cv_en                                                       object
infos_basicas.telefone_recado                               object
infos_basicas.telefone                                      object
infos_basicas.objetivo_profissional                         object
infos_basicas.data_criacao                          datetime64[ns]
infos_basicas.inserido_por                                  object
infos_basicas.email                                         object
infos_basicas.local                                         object
infos_basicas.sabendo_de_nos_por                            object
infos_basicas.data_atualizacao                      datetime64[ns]
infos_basicas.codigo_profissional                            int64
infos_basicas.nome                                          object
informacoes

In [32]:
# Ajustar tipagens das colunas do df_applicants
import numpy as np
from pandas.api.types import is_numeric_dtype

# Exemplo de análise e transformação de tipos
df_applicants['id'] = df_applicants['id'].astype(str)
if 'codigo' in df_applicants.columns:
    df_applicants['codigo'] = pd.to_numeric(df_applicants['codigo'], errors='coerce')
for col in ['data_candidatura', 'ultima_atualizacao']:
    if col in df_applicants.columns:
        df_applicants[col] = pd.to_datetime(df_applicants[col], format='%d-%m-%Y', errors='coerce')
if 'comentario' in df_applicants.columns:
    df_applicants['comentario'] = df_applicants['comentario'].astype(str)
if 'recrutador' in df_applicants.columns:
    df_applicants['recrutador'] = df_applicants['recrutador'].astype('category')
if 'situacao_candidado' in df_applicants.columns:
    df_applicants['situacao_candidado'] = df_applicants['situacao_candidado'].astype('category')
if 'titulo' in df_applicants.columns:
    df_applicants['titulo'] = df_applicants['titulo'].astype(str)
if 'modalidade' in df_applicants.columns:
    df_applicants['modalidade'] = df_applicants['modalidade'].astype(str)

# Exibir tipos finais das colunas
print(df_applicants.dtypes)
print(f"Número de linhas em df_applicants: {df_applicants.shape[0]}")
df_applicants.head()

id                                                          object
cv_pt                                                       object
cv_en                                                       object
infos_basicas.telefone_recado                               object
infos_basicas.telefone                                      object
infos_basicas.objetivo_profissional                         object
infos_basicas.data_criacao                          datetime64[ns]
infos_basicas.inserido_por                                  object
infos_basicas.email                                         object
infos_basicas.local                                         object
infos_basicas.sabendo_de_nos_por                            object
infos_basicas.data_atualizacao                      datetime64[ns]
infos_basicas.codigo_profissional                            int64
infos_basicas.nome                                          object
informacoes_pessoais.data_aceite                    datetime64

Unnamed: 0,id,cv_pt,cv_en,infos_basicas.telefone_recado,infos_basicas.telefone,infos_basicas.objetivo_profissional,infos_basicas.data_criacao,infos_basicas.inserido_por,infos_basicas.email,infos_basicas.local,infos_basicas.sabendo_de_nos_por,infos_basicas.data_atualizacao,infos_basicas.codigo_profissional,infos_basicas.nome,informacoes_pessoais.data_aceite,informacoes_pessoais.nome,informacoes_pessoais.cpf,informacoes_pessoais.fonte_indicacao,informacoes_pessoais.email,informacoes_pessoais.email_secundario,informacoes_pessoais.data_nascimento,informacoes_pessoais.telefone_celular,informacoes_pessoais.telefone_recado,informacoes_pessoais.sexo,informacoes_pessoais.estado_civil,informacoes_pessoais.pcd,informacoes_pessoais.endereco,informacoes_pessoais.skype,informacoes_pessoais.url_linkedin,informacoes_pessoais.facebook,informacoes_profissionais.titulo_profissional,informacoes_profissionais.area_atuacao,informacoes_profissionais.conhecimentos_tecnicos,informacoes_profissionais.certificacoes,informacoes_profissionais.outras_certificacoes,informacoes_profissionais.remuneracao,informacoes_profissionais.nivel_profissional,formacao_e_idiomas.nivel_academico,formacao_e_idiomas.nivel_ingles,formacao_e_idiomas.nivel_espanhol,formacao_e_idiomas.outro_idioma,formacao_e_idiomas.instituicao_ensino_superior,formacao_e_idiomas.cursos,formacao_e_idiomas.ano_conclusao,informacoes_pessoais.download_cv,informacoes_profissionais.qualificacoes,informacoes_profissionais.experiencias,formacao_e_idiomas.outro_curso,cargo_atual.id_ibrati,cargo_atual.email_corporativo,cargo_atual.cargo_atual,cargo_atual.projeto_atual,cargo_atual.cliente,cargo_atual.unidade,cargo_atual.data_admissao,cargo_atual.data_ultima_promocao,cargo_atual.nome_superior_imediato,cargo_atual.email_superior_imediato
0,31000,"assistente administrativo\n\n\nsantosbatista\nitapecerica da serra/sp\n29 anos ▪ brasileiro ▪ casado\nformação acadêmica\n bacharel - ciências contábeis\ncentro universitário ítalo brasileiro\njul/2015 - dez/2018\n graduação - gestão financeira\ncentro universitário anhanguera\njan/2013 - dez/2014\nhabilidades\n contas a pagar e receber\n excel avançado\n indicadores kpi’s\n notas fiscais, cfop’s\n fechamento contábil\n emissão de boletos\n guias\n impostos\n budget\n controladoria\n sistemas integrados:\ntotvs;\nfolha matic;\nnavision\nresumo profissional\nprofissional com experiência nos departamentos financeiro,\ncontábil, fiscal e controladoria jurídica. elaboração e análise de\nindicadores kpi’s de resultado, relatórios, guias, gestão de\npagamentos, notas fiscais, boletos, fechamento financeiro e\ncontábil fiscal.\nsoftwares erp protheus, folha matic, navision, elaw e sapiens,\nexcel avançado, (kpi's, painéis de dashboard e automatização).\nhistórico profissional\n 01/2021 – 07/2021 fcn contabilidade freight forwarder\n\nassistente contábil\nconciliações contábeis, financeira, folha de pagamento,\nfiscal, lançamentos contábeis, exportações txt, análise e\nelaboração de relatórios, fechamento contábil, análise\nfiscal e contabilização de folha de pagamento, sistema\nfolha matic.\n 10/2020 – 01/2021 almeida advogados\nassistente financeiro\ngestão de pagamentos, baixa de boletos, relatórios gerenciais.\n 04/2019 – 06/2019 fedex brasil logistica e transporte ltda\nassistente juridico\nresponsável pelo fechamento mensal através das\napurações de provisões e reclassificações contábeis,\nelaboração de indicadores financeiros e desempenho,\nautomatização de planilhas, análise de budget e real vs\norçado.\n 07/2017 – 11/2018 atonanni construções e serviços ltda\nassistente contábil / fiscal\nlançamento de notas fiscais, apurações dos impostos (iss,\npis, cofins, cprb, ir, csll).\nguias de pagamentos, sped fiscais, relatórios, xml, cfop,\nncm.\n 06/2014 – 07/2017 iss servisytem do brasil ltda\nassistente de controladoria\ncontas a pagar e a receber, análises contábeis e\nfinanceiras, reembolsos, p.o’s.\ngestão de custos, budget, real vs orçado, indicadores, kpi’s\ne mapeamento de melhorias.\n 04/2013 – 06/2014 n & n comércio de alimentos ltda\nassistente financeiro\ncontas a pagar e a receber, boletos, relatórios gerenciais.\nbaixa de notas fiscais, concilação financeira, negociações\nde pagamentos\n",,,(11) 97048-2708,,2021-11-10 07:29:49,Luna Correia,carolina_aparecida@gmail.com,,,2021-11-10 07:29:49,31000,Carolina Aparecida,NaT,Carolina Aparecida,,:,carolina_aparecida@gmail.com,,NaT,(11) 97048-2708,,,,,,,,,,,,,,,,,,,-,,,,,,,,,,,,,,NaT,NaT,,
1,31001,"formação acadêmica\nensino médio (2º grau) em ensino médio (2º grau), beatriz lopes em sp\njan. 2010 até dez. 2012\nensino superior em administração de empresas, unip em sp\njun. 2016 - trancado\nexperiência profissional\nanalista administrativo de operações, liq em são paulo - sp\nmai. 2018 até o momento\n\nadministração - administração geral (analista)\n\nauxiliar na área de bi (business intelligence). extração de informação e análise de relatórios gerenciais, acompanhamento dos processos para as áreas financeiras,rh,operacional. suporte a toda área de backoffice, suporte a todos os supervisores. criação de indicadores (dashboard) pelo excel. analista de operações em trade com todo suporte a equipe de supervisores e gerentes.\n\nestagiaria, ballmash modas e confecções ltda eireli epp em sp\njan. 2017 até nov. 2017\n\nadministração - administração geral (estagiário)\n\natividades: administração geral. auxilio na conferencia do caixa e controle de vendas no cartão, lançamentos de dados em planilha, contas a pagar, emissão e lançamento de notas fiscal. auxiliar no arquivo de documentos, atendimento telefônico e anotações, atendimento ao público.\n\noperador de caixa, parque da mônica em sp\nout. 2015 até jul. 2016\n\ncomercial, vendas - atendimento (operacional)\n\noperação de pdv atendimento ao publico .\n\noperadora de teleatendimento, rede bem estar em sp\nfev. 2015 até jul. 2015\n\ntelemarketing - telemarketing / call center ativo (operacional)\n\nagendamentos e vendas .\n\nvendas atendente, cinemark brasil em sp\njan. 2012 até fev. 2014\n\ncultura, lazer, entretenimento - entretenimento (operacional)\n\natendimento e recepção ao cliente em todos os setores .matemática comercial transição de cartão seja ele de débito ou crédito até mesmo título de crédito dentre outras atribuições. promover vendas de produtos e serviços em comunicação direta ao cliente.\n\ninformática:\nbanco de dados: caché\nprogramação: html\naplicações de escritório: microsoft access, microsoft excel, microsoft outlook, microsoft powerpoint, microsoft word, open office\nsistemas operacionais: windows, linux\noutros programas: edição de som, edição de video\n",,,(11) 93723-4396,Analista Administrativo,2021-11-10 08:56:16,Laura Pacheco,eduardo_rios@hotmail.com,"São Paulo, São Paulo",Outros,2021-11-11 11:10:31,31001,Eduardo Rios,NaT,Eduardo Rios,,Outros: Contato do RH,eduardo_rios@hotmail.com,,1994-12-28,(11) 93723-4396,,Feminino,Solteiro,Não,são paulo,,,,Analista Administrativo,Administrativa,,,,1900,,Ensino Superior Incompleto,Nenhum,Nenhum,-,,,,,,,,,,,,,,NaT,NaT,,
2,31002,"objetivo: área administrativa | financeira\n\nresumo profissional\ngraduada em administração de empresas e cursando tecnologia em gestão da cadeia de\nsuprimentos e logística.\n\nprofissional com mais de 11 anos de experiência nas áreas administrativa e financeira. atuei em\nempresas de diversos tamanhos e seguimentos, inclusive multinacionais no ramo de cosméticos,\nalimentício, e-commerce e operações/facilities.\npossuo experiência em análise, lançamento e controle de despesas de cartão corporativo;\nemissão de nota fiscal de serviço e confecção de boleto bancário; lançamento de fatura e\ncontabilização de nfe pelo software gerencial sap (módulo financeiro mm/fi); conciliação\nbancária, fluxo de caixa; follow-up de contas a pagar e a receber, formulação de planilhas\ngerenciais diversas; negociação e cobrança de clientes inadimplentes; controle de processo de\nrequisição de compra de equipamentos de segurança.\nconhecimento de danfe, arquivo xml, cfop, emissão e apuração de guia de imposto federal,\nmunicipal e estadual.\ncapacitada a utilizar os sistemas de gestão sap, gosoft, legal manager, foconet e\nconhecimentos em sistemas bancários. inglês intermediário (interrompido).\n\nformação acadêmica\ntecnologia em gestão da cadeia de suprimentos e logística - cursando\nfaculdade de tecnologia do estado de são paulo - fatec\ngraduação em administração de empresas - concluído\nuniversidade paulista - unip\n\nidioma\ninglês intermediário - interrompido\ncna - cultural norte americano\n\nexperiência profissional\n07/2020 a 08/2021 cushman & wakefield consultoria imobiliária\nanalista administrativo de operações\n- responsável pelo controle e gestão de contas a receber;\n- cálculo de rateio de despesa e elaboração de comunicados;\n- cobrança de inadimplentes;\n- input de certidão correlacionada a fornecedor (crf, cnd e tributos mobiliários);\n- elaboração de carta de depósito e planilhas gerenciais;\n- lançamento de nota fiscal de serviço e de consumo;\n- análise e acompanhamento de documentação (devec, iptu e outros);\n- suporte ao gerente, dirigente e equipe de operações.\n\n12/2017 a 06/2020 higitec desentupimento e dedetização\nfinanceiro\n- emissão de nota fiscal de serviço;\n- emissão de boleto bancário pelos sistemas ecobrança caixa, itaú banking e yespay;\n- geração de relatórios para o gerenciamento de contas a receber;\n- negociação e cobrança de cliente, referente cheque devolvido e boleto em aberto;\n- controle de processos jurídicos relacionados a fornecedores;\n- suporte ao diretor, gerente, departamento financeiro e áreas correlatas.\n\n06/2014 a 05/2015 yoki alimentos\nanalista administrativo de vendas\n- recebimento, análise, lançamento e controle das despesas de cartão corporativo empresarial;\n- formulação de planilhas gerenciais e controle dos gastos gerais da matriz e regionais do brasil;\n- suporte ao diretor e a equipe de vendas;\n- input no sistema smk de notas fiscais de serviços e de consumo (danfe), faturas e reembolsos;\n- responsável pelo processo de requisição de compra de equipamentos de segurança, suprindo\nas necessidades do key account, regionais de todo brasil e do evento foco da companhia;\n- levantamento e análise dos gastos com hotéis e passagens aéreas dos colaboradores;\n- criação e manutenção de manuais, tendo como intuito facilitar a compreensão dos processos;\n- responsável por dar treinamento aos novos funcionários da companhia.\n\n08/2013 a 06/2014 meta bpo (cliente: nivea)\nassistente contábil\nassistente administrativo\n- lançamento de processo de folha de pagamento no sistema sap (rescisão, férias, empréstimo\npara funcionário, salário e pensão alimentícia);\n- lançamento do formulário de reembolso de despesa de vendas, nota de débito, fatura, boleto,\nnota de honorário e invoice;\n- contabilização de notas fiscais no sistema sap (módulo financeiro mm/fi);\n- recebimento, análise, verificação e input no sistema de nota fiscal de serviço e consumo;\n- análise de imposto federal, estadual e municipal (pis / cofins / csll / inss / iss / icms);\n- lançamento de danfe, conferência de arquivo xml e cfop;\n- formulação de planilha de controle gerencial referente as despesas com convenção\ninternacional e despesas mensais do cartão corporativo.\n\n03/2008 a 10/2012 condomínio residencial ouro preto\nassistente administrativo\nestagiário administrativo\n- controle de contas a pagar e a receber;\n- conciliação bancária, follow-up e gestão do fluxo de caixa;\n- elaboração de balancete e boleto bancário;\n- cobrança e negociação com condôminos;\nformação complementar\ntécnico em gestão administrativo empresarial - concluído\nescola profissional nossa senhora de fátima\ninformática\npacote office (sos computadores) - concluído\nsistemas de gestão sap, gosolft, legal manager, foconet e conhecimentos em sistemas bancários.\n",,,(11) 92399-9824,Administrativo | Financeiro,2021-11-10 09:01:00,Laura Pacheco,pedro_henrique_carvalho@gmail.com,"São Paulo, São Paulo",Anúncio,2021-11-10 11:42:36,31002,Pedro Henrique Carvalho,NaT,Pedro Henrique Carvalho,,Anúncio:,pedro_henrique_carvalho@gmail.com,,1988-12-12,(11) 92399-9824,,Feminino,Solteiro,Não,são paulo,,,,Administrativo | Financeiro,Administrativa,,"MS [77-418] MOS: Microsoft Office Word 2013, MS [77-420] MOS: Microsoft Office Excel 2013, MS [77-423] MOS: Microsoft Office Outlook 2013, MS [77-422] MOS: Microsoft Office PowerPoint 2013, SAP FI",,"2.500,00",,Ensino Superior Completo,Intermediário,Básico,Português - Fluente,,Administração de Empresas,2012.0,,,,,,,,,,,NaT,NaT,,
3,31003,"formação\nensino médio completo\ninformática intermediaria (excel, word, internet, outlook)\nadministração financeira – senac\nexperiência\n07/02/2021 á atual – teleperformance crm s/a.\nprincipais atividades: ativo em vendas para a philip morris cigarros marlboro.\n09/01/2020 á 10/02/2021 – foxtime recursos humanos\nprincipais atividades: prestação de serviços para o banco aymoré financiamentos de veículos.\n21/12/2015 á 05/07/2019 – kpmg assurance services ltda.\nprincipais atividades: análise de processos judiciais pessoa física e jurídica, a fim de evitar riscos para\nempresa com a contratação de novos clientes. consiste em uma pesquisa a respeito da reputação e\nintegridade da entidade e proprietários/administradores. gerenciamento das solicitações recebidas pelo\ncliente.\n01/09/2015 á 19/12/2015 – royal academia ltda\nprincipais atividades: recepção de alunos e funcionários, funções administrativas.\n01/02/2013 á14/01/2015 – malta assessoria de cobranças ltda\nprincipais atividades: realizar análise nos documentos pessoais e jurídicos, contato com cliente verificando se\na indícios de fraude (utilizando os sistemas crivo/receita federal/mdb/aciona registro das analise dos\nclientes/sistemas tim).\n03/10/2011 à 18/05/2012- vetdantas produtos para animais ltda- me\nbancário, emissão e liberação de pedidos, contas a pagar e receber.\nqualificações\nprofissional com excelente comunicação e experiência em atendimento, pleno domínio da rotina administrativa,\nboa digitação, bom raciocínio lógico, dedicada, adaptável a mudanças e de fácil relacionamento\n",,,(11) 98100-1727,Área administrativa,2021-11-10 09:08:13,Laura Pacheco,thiago_barbosa@hotmail.com,"São Paulo, São Paulo",Site de Empregos,2021-11-10 16:04:51,31003,Thiago Barbosa,NaT,Thiago Barbosa,,Site de Empregos: Infojobs,thiago_barbosa@hotmail.com,,1992-05-08,(11) 98100-1727,,Feminino,Casado,Não,são paulo,,,,Área administrativa,Administrativa,,,,110000,,Ensino Superior Incompleto,Nenhum,Nenhum,-,,,,,,,,,,,,,,NaT,NaT,,
4,31004,"última atualização em 09/11/2021\n­ sp\n\nensino superior em administração de empresas, anhanguera educacional em sp\nde 01/2016 até 06/2020\n\nobjetivos profissionais\nadministração ­ administração geral\nlogística ­ transporte\ncontábil, finanças, economia ­ contas a pagar e receber\nr$ 4000,00 ­ 5000,00 (bruto mensal)\nperíodo integral\nefetivo – clt\nassistente ­ analista\n\nexperiência profissional\nanalista administrativo pleno, yamaha motor do brasil corretora de seguros ltda em guarulhos ­ sp\nago. 2013 até o momento\nadministração ­ administração geral (analista)\nfaturamento de seguro proteção financeira do banco yamaha, acompanhamento e suporte para sinistros de seguro\nproteção financeira, abertura e acompanhamento de sinistros de vida para funcionários da empresa. receber e enviar\ncorrespondências e documentos.controlar contas a pagar e receitas.elaborar relatório financeiro. realizar faturamentos e\núltima atualização em 09/11/2021\n­ sp\nanalista administrativo pleno, yamaha motor do brasil corretora de seguros ltda em\nsp\nde 08/2013 até o momento\nadministração ­ administração geral (analista)\nfaturamento de seguro proteção financeira do banco yamaha, acompanhamento e suporte\npara sinistros de seguro proteção financeira, abertura e acompanhamento de sinistros de\nvida para funcionários da e... +info\nensino superior em administração de empresas, anhanguera educacional em sp\nde 01/2016 até 06/2020\nredes sociais\naverbações do departamento logistico. manter arquivos e cadastros de informações atualizados. assessorar gerentes e\nlíderes com questões práticas da rotina de trabalho, como preparar documentos, prestar informações ao público,\nresponder e­mails.funcionalidades de monitoramento em averbações no sistema at&m. funcionalidades sistema oracle,\noperações varejo autbank, teleport e dados para power bi.\n\naverbações do departamento logistico. manter arquivos e cadastros de informações atualizados. assessorar gerentes e\nlíderes com questões práticas da rotina de trabalho, como preparar documentos, prestar informações ao público,\nresponder e­mails.funcionalidades de monitoramento em averbações no sistema at&m. funcionalidades sistema oracle,\noperações varejo autbank, teleport e dados para power bi.\nauxiliar coordenação, escola superior paulista de administração em sp\nset. 2011 até ago. 2013\neducação, ensino, idiomas ­ ensino superior (assistente)\natendimento ao professor, funções sistêmicas, conhecimento em totvs, agendamento de reuniões, elaboração de\ndocumentos (atas, pautas, certificados, declarações, planilhas no excel), atendimento ao aluno, elaboração de horário\nsemestral por curso, elaboração de ponto e envio de e­mails.\nauxiliar administrativo, vanderlei navilli peças me em sp\nfev. 2006 até ago. 2010\nadministração ­ administração geral (auxiliar)\nconhecimento prático em world, excel e corel draw. serviços de escritório, controle financeiro, atendimento ao cliente e\natendimento pabx, agendamento de reuniões e serviços gerais.prospecção, venda, abertura, fechamento e resoluções de\ncaixa, controle de emissões de notas fiscais de entrada e saídas.\ninformática:\nbanco de dados: oracle\ngráficos/web: coreldraw\naplicações de escritório: microsoft access, microsoft excel, microsoft word, microsoft outlook, microsoft powerpoint\nsistemas operacionais: windows, unix\noutros programas: erp, crm\nidiomas\nportuguês, nativo\njaponês, intermediário\ndados complementares\ndisponibilidade para viajar\ndisponibilidade para mudar de residência\ncarteira de habilitação\ndados pessoais\nsim\nsim\na, b\nnasceu em 8 de fevereiro de 1992, 29 anos.\nfeminino, casado\n",,,(11) 92517-2678,,2021-11-10 09:18:46,Maria Clara Pires,diogo_das_neves@hotmail.com,,,2021-11-10 09:22:03,31004,Diogo das Neves,NaT,Diogo das Neves,,:,diogo_das_neves@hotmail.com,,1969-12-31,(11) 92517-2678,,,,,,,,,,,,,,,,,,,-,,,,,,,,,,,,,,NaT,NaT,,


# Vagas

In [33]:

# Supondo que o arquivo já foi lido como dicionário:
with open("C:/Users/win/Desktop/Projetos/Datathon/llm/data/external/vagas.json", encoding="utf-8") as f:
    data = json.load(f)

# Transforma o dicionário em lista de registros, incluindo o id como campo
records = []
for id_, info in data.items():
    rec = {"id": id_, **info}
    records.append(rec)

# Normaliza os dados aninhados em colunas
df_vagas = pd.json_normalize(records)

# Visualiza as primeiras linhas
print(f"Total de colunas em df_vagas: {df_vagas.shape[1]}")
df_vagas.head()


Total de colunas em df_vagas: 45


Unnamed: 0,id,informacoes_basicas.data_requicisao,informacoes_basicas.limite_esperado_para_contratacao,informacoes_basicas.titulo_vaga,informacoes_basicas.vaga_sap,informacoes_basicas.cliente,informacoes_basicas.solicitante_cliente,informacoes_basicas.empresa_divisao,informacoes_basicas.requisitante,informacoes_basicas.analista_responsavel,informacoes_basicas.tipo_contratacao,informacoes_basicas.prazo_contratacao,informacoes_basicas.objetivo_vaga,informacoes_basicas.prioridade_vaga,informacoes_basicas.origem_vaga,informacoes_basicas.superior_imediato,informacoes_basicas.nome,informacoes_basicas.telefone,perfil_vaga.pais,perfil_vaga.estado,perfil_vaga.cidade,perfil_vaga.bairro,perfil_vaga.regiao,perfil_vaga.local_trabalho,perfil_vaga.vaga_especifica_para_pcd,perfil_vaga.faixa_etaria,perfil_vaga.horario_trabalho,perfil_vaga.nivel profissional,perfil_vaga.nivel_academico,perfil_vaga.nivel_ingles,perfil_vaga.nivel_espanhol,perfil_vaga.outro_idioma,perfil_vaga.areas_atuacao,perfil_vaga.principais_atividades,perfil_vaga.competencia_tecnicas_e_comportamentais,perfil_vaga.demais_observacoes,perfil_vaga.viagens_requeridas,perfil_vaga.equipamentos_necessarios,beneficios.valor_venda,beneficios.valor_compra_1,beneficios.valor_compra_2,informacoes_basicas.data_inicial,informacoes_basicas.data_final,perfil_vaga.habilidades_comportamentais_necessarias,informacoes_basicas.nome_substituto
0,5185,04-05-2021,00-00-0000,Operation Lead -,Não,"Morris, Moran and Dodson",Dra. Catarina Marques,Decision São Paulo,Maria Laura Nogueira,Srta. Bella Ferreira,CLT Full,,,,,Superior Imediato:,,,Brasil,São Paulo,São Paulo,,,2000,Não,De: Até:,,Sênior,Ensino Superior Completo,Avançado,Fluente,,TI - Sistemas e Ferramentas-,"Operations Lead\n\nRoles & Responsibilities:\n• The Operations Manager is accountable for delivering the run services towards a client or a specific set of clients.\n• The Operations Manager has a firm working relation with the SDM who is accountable for the overall contractual compliance of all services and projects.\n• Responsible for the delivery of the services from multiple Service Lines.\n• Operations Manager ensures that the services are deliver according to the SLA, as well as managing the delivery of non-standard / client specific services.\n• Delivery:\no Deliver services according to SLA.\no Day-to-day management of all service delivery activities.\no Ensure consistency of delivery approach; consistent with strategy - Manage Major Incidents / client alerts.\no Drive the identification of operational cost & efficiency savings.\n• Supplier & third party management SLA services:\no Manage and coordinate with Vendor and maintain SLAs towards customer.\n• Financial:\no Achieve productivity & cost efficiency savings.\no Maintain unit costing volume, accurate forecasting and charging data (#work units/service requests/changes).\no Identify SLA up sell opportunities.\n• Client Reporting:\no Maintain SLA R&I log and follow-up actions aimed at reducing risks to service and service credits.\no Resolution of operational issues arising from client disputes - SLA Reporting to the client.\n\n.","Required Skills:\n• Prior experience in Cloud Infrastructure Management technologies AWS , SAP BASIS, SQL, Oracle etc\n• Experience in the delivery of customer services to expected SLAs.\n• Be able to understand complex cross platform technical issues, contractual requirements and able to identify areas for improvement.\n• Good delegation skills, negotiation skills and people management.\n• Good customer relations skills to understand client/client representatives concerns and requirements.\n• Leadership abilities - mainly during crisis and major incidents.",100% Remoto Período – entre 5 – 6 meses,,Nenhum -,-,R$,,,,,
1,5184,04-05-2021,00-00-0000,Consultor PP/QM Sênior,Não,"Morris, Moran and Dodson",Dra. Catarina Marques,Decision São Paulo,Maria Laura Nogueira,Yasmin da Rosa,CLT Full,,Contratação,,,Superior Imediato:,,,Brasil,São Paulo,São Paulo,,,2000,Não,De: Até:,,Sênior,Ensino Superior Completo,Fluente,Nenhum,,TI - Desenvolvimento/Programação-,Consultor PP/QM Sr.\n\n• Consultor PP/QM Sênior com experiencia em projetos de Rollout e implementação SAP ECC\n• Inglês mandatório\n• Remoto (Em alguns momentos / fases do projeto deverá estar presente na planta do cliente em Campinas/SP),• Consultor PP/QM Sênior com experiencia em projetos de Rollout e implementação SAP ECC\n• Inglês mandatório\n• Remoto (Em alguns momentos / fases do projeto deverá estar presente na planta do cliente em Campinas/SP),• Início: Imediato • Fim: Jan/22,,Nenhum -,-,R$,,,,,
2,5183,04-05-2021,00-00-0000,ANALISTA PL/JR C/ SQL,Não,"Morris, Moran and Dodson",Dra. Catarina Marques,Decision São Paulo,Maria Laura Nogueira,Ana Albuquerque,CLT Full,,RFP,,,Superior Imediato:,,,Brasil,São Paulo,São Paulo,,,2000,Não,De: Até:,,Analista,Ensino Superior Completo,Nenhum,Intermediário,,TI - Sistemas e Ferramentas-,"Descrição – Atividades:\n\no Monitoramento das interfaces KDP\no Monitoramento sistema B2B durante o dia\no Monitoramento do Whatsapp durante o dia\no Monitoramento da subida de pedidos (KDP, WAE e B2B)\no Suporte para equipe comercial quando tem problemas em algum cliente no WAE\no Suporte Aplicativo Pitcher (Projeto Promotores).\no Suporte no grupo whatsapp KDP, para vendedores e executivos\no Atendimento da fila de chamados SM9 do grupo KDP\no Validação das listas de visitas de C4C toda quinta e sexta\no Garantir que as necessidades dos clientes sejam atendidas à medida que o projeto evolui","Requisitos mandatórios:\n\no Conhecimentos Técnicos: Conhecimento SQL, e algum conhecimento de SAP SD\no Competências Interpessoais: Relacionamento interpessoal, foco no cliente, trabalho em equipe, excelente\ncomunicação, e adaptabilidade.\n\nRequisitos desejáveis:\no Idiomas: Espanhol nível intermediário.",Localização: Remoto Perfil: Analista Pleno ou Jr Período: de 17 maio até 30 de junho,,Nenhum -,-,R$,,,,,
3,5182,04-05-2021,18-05-2021,Technical Architect - 11894809,Não,Nelson-Page,Dr. Raul Monteiro,Decision São Paulo,Cecília Freitas,Clara Rios,"PJ/Autônomo, CLT Full",Determinado,Contratação,Alta: Alta complexidade 3 a 5 dias,,Superior Imediato:,,,Brasil,São Paulo,São Paulo,,,2000,Não,De: Até:,,Analista,Ensino Superior Completo,Básico,Básico,,TI - Projetos-,"Descrição/Comentário: Architecture Frameworks - Review and integrate all application requirements, including functional, security, integration, performance, quality and operations requirements. Review and integrate the technical architecture requirements. Provide input into final decisions regarding hardware, network products, system software and security.- Experiência em configurações FICA\n- Experiência em FI\n- Experiência em FS-SD\n- Experiência em processo de Cobrança\n- Experiência em processo de Arrecadação\n- Experiência em processo de Contabilização\n- Conhecimento ABAP para realizar debug, análise do código e propor soluções técnicas\n- Conhecimento em processos massivos\n- Conhecimento das integraçãoes do módulo Faturamento\n- Trabalho em liderança da equipe\nOutros detalhes do trabalho: 1 - Application Architectures (P5 - Master) | 2 - Architecture Design (P5 - Master) | 3 - Operations Architectures (P5 - Master) | 4 - SAP FI CO Finance (P5 - Master) | 5 - Technology Architectures (P5 - Master). -Possibilidade de absorção -Trabalho remoto (Presencial somente se tiver alguma necessidade do cliente) -Horário das 9h ás 18h\nPrimary Skill * Others (Please note the Skill at the beginning of Job Description)","Descrição/Comentário: Architecture Frameworks - Review and integrate all application requirements, including functional, security, integration, performance, quality and operations requirements. Review and integrate the technical architecture requirements. Provide input into final decisions regarding hardware, network products, system software and security.- Experiência em configurações FICA\n- Experiência em FI\n- Experiência em FS-SD\n- Experiência em processo de Cobrança\n- Experiência em processo de Arrecadação\n- Experiência em processo de Contabilização\n- Conhecimento ABAP para realizar debug, análise do código e propor soluções técnicas\n- Conhecimento em processos massivos\n- Conhecimento das integraçãoes do módulo Faturamento\n- Trabalho em liderança da equipe\nOutros detalhes do trabalho: 1 - Application Architectures (P5 - Master) | 2 - Architecture Design (P5 - Master) | 3 - Operations Architectures (P5 - Master) | 4 - SAP FI CO Finance (P5 - Master) | 5 - Technology Architectures (P5 - Master). -Possibilidade de absorção -Trabalho remoto (Presencial somente se tiver alguma necessidade do cliente) -Horário das 9h ás 18h\nPrimary Skill * Others (Please note the Skill at the beginning of Job Description)","Budgeted Rate - indicate currency and type (hourly/daily)* R$ 75.000,00",Não,Notebook padrão -,- p/ mês (168h),fechado,,18-05-2021,17-01-2022,,
4,5181,04-05-2021,00-00-0000,Consultor SAP AUTHORIZATION (BCA) -Pleno / Sênior,Não,Mann and Sons,Cauê Fogaça,Decision São Paulo,Maria Laura Nogueira,Srta. Bella Ferreira,CLT Full,,,,,Superior Imediato:,,,Brasil,São Paulo,São Paulo,,,2000,Não,De: Até:,,Sênior,Ensino Superior Completo,Intermediário,Nenhum,,TI - SAP-,Experiência como Consultor SAP AUTHORIZATION (BCA).\nPleno / Sênior,Experiência como Consultor SAP AUTHORIZATION (BCA).\nPleno / Sênior,contratação CLT full pela Decision locação remota na Siemens - projeto e as do AMS Tempo de alocação: 5 meses e depois será absorvido pela TCS - Maio a Setembro full time horário comercial (8h por dia),Sim,Nenhum -,-,R$,,,,,


In [34]:
# Ajuste explícito de tipos das colunas do df_vagas conforme a lista fornecida
vagas_date_cols = [
    'informacoes_basicas.data_requicisao',
    'informacoes_basicas.limite_esperado_para_contratacao',
    'informacoes_basicas.data_inicial',
    'informacoes_basicas.data_final'
 ]
vagas_num_cols = [
    'beneficios.valor_venda', 'beneficios.valor_compra_1', 'beneficios.valor_compra_2'
 ]
vagas_cat_cols = [
    'informacoes_basicas.tipo_contratacao', 'informacoes_basicas.prazo_contratacao',
    'informacoes_basicas.prioridade_vaga', 'informacoes_basicas.origem_vaga',
    'perfil_vaga.pais', 'perfil_vaga.estado', 'perfil_vaga.cidade', 'perfil_vaga.bairro', 'perfil_vaga.regiao',
    'perfil_vaga.vaga_especifica_para_pcd', 'perfil_vaga.faixa_etaria', 'perfil_vaga.horario_trabalho',
    'perfil_vaga.nivel profissional', 'perfil_vaga.nivel_academico', 'perfil_vaga.nivel_ingles', 'perfil_vaga.nivel_espanhol',
    'perfil_vaga.outro_idioma', 'perfil_vaga.viagens_requeridas'
 ]
vagas_text_cols = [
    'id', 'informacoes_basicas.titulo_vaga', 'informacoes_basicas.vaga_sap', 'informacoes_basicas.cliente',
    'informacoes_basicas.solicitante_cliente', 'informacoes_basicas.empresa_divisao', 'informacoes_basicas.requisitante',
    'informacoes_basicas.analista_responsavel', 'informacoes_basicas.objetivo_vaga', 'informacoes_basicas.superior_imediato',
    'informacoes_basicas.nome', 'informacoes_basicas.telefone', 'perfil_vaga.local_trabalho',
    'perfil_vaga.areas_atuacao', 'perfil_vaga.principais_atividades', 'perfil_vaga.competencia_tecnicas_e_comportamentais',
    'perfil_vaga.demais_observacoes', 'perfil_vaga.equipamentos_necessarios',
    'perfil_vaga.habilidades_comportamentais_necessarias', 'informacoes_basicas.nome_substituto'
 ]

# Ajustar datas
for col in vagas_date_cols:
    if col in df_vagas.columns:
        df_vagas[col] = pd.to_datetime(df_vagas[col], errors='coerce', dayfirst=True)

# Ajustar numéricos
for col in vagas_num_cols:
    if col in df_vagas.columns:
        df_vagas[col] = pd.to_numeric(df_vagas[col], errors='coerce')

# Ajustar categóricos
for col in vagas_cat_cols:
    if col in df_vagas.columns:
        df_vagas[col] = df_vagas[col].astype('category')

# Ajustar textos
for col in vagas_text_cols:
    if col in df_vagas.columns:
        df_vagas[col] = df_vagas[col].astype(str)

# Ajustar demais colunas como texto se não estiverem em nenhuma lista
for col in df_vagas.columns:
    if col not in vagas_date_cols + vagas_num_cols + vagas_cat_cols + vagas_text_cols:
        df_vagas[col] = df_vagas[col].astype(str)

print('Tipos finais das colunas do df_vagas:')
print(df_vagas.dtypes)

Tipos finais das colunas do df_vagas:
id                                                              object
informacoes_basicas.data_requicisao                     datetime64[ns]
informacoes_basicas.limite_esperado_para_contratacao    datetime64[ns]
informacoes_basicas.titulo_vaga                                 object
informacoes_basicas.vaga_sap                                    object
informacoes_basicas.cliente                                     object
informacoes_basicas.solicitante_cliente                         object
informacoes_basicas.empresa_divisao                             object
informacoes_basicas.requisitante                                object
informacoes_basicas.analista_responsavel                        object
informacoes_basicas.tipo_contratacao                          category
informacoes_basicas.prazo_contratacao                         category
informacoes_basicas.objetivo_vaga                               object
informacoes_basicas.prioridade_vaga    

  df_vagas[col] = pd.to_datetime(df_vagas[col], errors='coerce', dayfirst=True)


In [35]:
# EDA (Análise Exploratória de Dados) para df_vagas
print('Formato do DataFrame:', df_vagas.shape)
print('\nTipos de dados:')
print(df_vagas.dtypes)

print('\nColunas com valores nulos:')
print(df_vagas.isnull().sum())

print('\nExemplo de linhas duplicadas:')
print(df_vagas[df_vagas.duplicated()])

print('\nResumo estatístico das colunas numéricas:')
print(df_vagas.describe(include=["number"]))

print('\nResumo estatístico das colunas categóricas:')
print(df_vagas.describe(include=["object", "category"]))

print('\nValores únicos por coluna:')
for col in df_vagas.columns:
    print(f'{col}: {df_vagas[col].nunique()}')

# Exemplo de valores únicos para algumas colunas relevantes
for col in ['informacoes_basicas.tipo_contratacao', 'informacoes_basicas.prioridade_vaga', 'perfil_vaga.nivel_academico', 'perfil_vaga.nivel_ingles', 'perfil_vaga.nivel_espanhol']:
    if col in df_vagas.columns:
        print(f'\nValores únicos para a coluna {col}:')
        print(df_vagas[col].unique())

Formato do DataFrame: (14081, 45)

Tipos de dados:
id                                                              object
informacoes_basicas.data_requicisao                     datetime64[ns]
informacoes_basicas.limite_esperado_para_contratacao    datetime64[ns]
informacoes_basicas.titulo_vaga                                 object
informacoes_basicas.vaga_sap                                    object
informacoes_basicas.cliente                                     object
informacoes_basicas.solicitante_cliente                         object
informacoes_basicas.empresa_divisao                             object
informacoes_basicas.requisitante                                object
informacoes_basicas.analista_responsavel                        object
informacoes_basicas.tipo_contratacao                          category
informacoes_basicas.prazo_contratacao                         category
informacoes_basicas.objetivo_vaga                               object
informacoes_basicas.priori

In [36]:
# Realizar join de todos os DataFrames mantendo todas as colunas (outer join)
df_joined = df_prospects.merge(df_applicants, on="id", how="outer", suffixes=("_prospect", "_applicant"))
df_joined = df_joined.merge(df_vagas, on="id", how="outer", suffixes=("", "_vaga"))

print(f"Total de colunas em df_joined: {df_joined.shape[1]}")
df_joined.head()

Total de colunas em df_joined: 111


Unnamed: 0,id,titulo,modalidade,nome,codigo,situacao_candidado,data_candidatura,ultima_atualizacao,comentario,recrutador,cv_pt,cv_en,infos_basicas.telefone_recado,infos_basicas.telefone,infos_basicas.objetivo_profissional,infos_basicas.data_criacao,infos_basicas.inserido_por,infos_basicas.email,infos_basicas.local,infos_basicas.sabendo_de_nos_por,infos_basicas.data_atualizacao,infos_basicas.codigo_profissional,infos_basicas.nome,informacoes_pessoais.data_aceite,informacoes_pessoais.nome,informacoes_pessoais.cpf,informacoes_pessoais.fonte_indicacao,informacoes_pessoais.email,informacoes_pessoais.email_secundario,informacoes_pessoais.data_nascimento,informacoes_pessoais.telefone_celular,informacoes_pessoais.telefone_recado,informacoes_pessoais.sexo,informacoes_pessoais.estado_civil,informacoes_pessoais.pcd,informacoes_pessoais.endereco,informacoes_pessoais.skype,informacoes_pessoais.url_linkedin,informacoes_pessoais.facebook,informacoes_profissionais.titulo_profissional,informacoes_profissionais.area_atuacao,informacoes_profissionais.conhecimentos_tecnicos,informacoes_profissionais.certificacoes,informacoes_profissionais.outras_certificacoes,informacoes_profissionais.remuneracao,informacoes_profissionais.nivel_profissional,formacao_e_idiomas.nivel_academico,formacao_e_idiomas.nivel_ingles,formacao_e_idiomas.nivel_espanhol,formacao_e_idiomas.outro_idioma,formacao_e_idiomas.instituicao_ensino_superior,formacao_e_idiomas.cursos,formacao_e_idiomas.ano_conclusao,informacoes_pessoais.download_cv,informacoes_profissionais.qualificacoes,informacoes_profissionais.experiencias,formacao_e_idiomas.outro_curso,cargo_atual.id_ibrati,cargo_atual.email_corporativo,cargo_atual.cargo_atual,cargo_atual.projeto_atual,cargo_atual.cliente,cargo_atual.unidade,cargo_atual.data_admissao,cargo_atual.data_ultima_promocao,cargo_atual.nome_superior_imediato,cargo_atual.email_superior_imediato,informacoes_basicas.data_requicisao,informacoes_basicas.limite_esperado_para_contratacao,informacoes_basicas.titulo_vaga,informacoes_basicas.vaga_sap,informacoes_basicas.cliente,informacoes_basicas.solicitante_cliente,informacoes_basicas.empresa_divisao,informacoes_basicas.requisitante,informacoes_basicas.analista_responsavel,informacoes_basicas.tipo_contratacao,informacoes_basicas.prazo_contratacao,informacoes_basicas.objetivo_vaga,informacoes_basicas.prioridade_vaga,informacoes_basicas.origem_vaga,informacoes_basicas.superior_imediato,informacoes_basicas.nome,informacoes_basicas.telefone,perfil_vaga.pais,perfil_vaga.estado,perfil_vaga.cidade,perfil_vaga.bairro,perfil_vaga.regiao,perfil_vaga.local_trabalho,perfil_vaga.vaga_especifica_para_pcd,perfil_vaga.faixa_etaria,perfil_vaga.horario_trabalho,perfil_vaga.nivel profissional,perfil_vaga.nivel_academico,perfil_vaga.nivel_ingles,perfil_vaga.nivel_espanhol,perfil_vaga.outro_idioma,perfil_vaga.areas_atuacao,perfil_vaga.principais_atividades,perfil_vaga.competencia_tecnicas_e_comportamentais,perfil_vaga.demais_observacoes,perfil_vaga.viagens_requeridas,perfil_vaga.equipamentos_necessarios,beneficios.valor_venda,beneficios.valor_compra_1,beneficios.valor_compra_2,informacoes_basicas.data_inicial,informacoes_basicas.data_final,perfil_vaga.habilidades_comportamentais_necessarias,informacoes_basicas.nome_substituto
0,0,,,,,,NaT,NaT,,,,,,,,NaT,pelo próprio candidato,heitor_melo@gmail.com,,,NaT,0.0,Heitor Melo,NaT,Heitor Melo,,:,heitor_melo@gmail.com,,NaT,,,,,,,,,,,,,,,,,,,,-,,,,.pdf,,,,,,,,,,NaT,NaT,,,NaT,NaT,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,NaT,NaT,,
1,1,,,,,,NaT,NaT,,,"\nexperiência em análise, desenvolvimento e implantação de soluções e melhorias para os principais módulos do sap, visando atender as mais variadas necessidades das empresas. participação em projetos de implantação e migração de versão, projetos de melhorias e suporte pós-implantação e projetos de adequação de funcionalidades do sap à lei sarbanes-oxley (sox) e projetos de implementação de nf-e. conhecimentos técnicos em reports, batch-input, module-pool, sapscript, smartforms, interface, rfc’s, bapi, exits, querie, report writer, entre outros. conhecimento dos principais processos dos módulos: sd, mm, pp, qm, pm, ps, fi e co.\n",,,(11) 99889-8296,Consultor ABAP,2017-08-21 14:16:35,pelo próprio candidato,nicole_fogaça@gmail.com,"São Paulo, São Paulo",Outros,2017-08-21 14:16:35,1.0,Nicole Fogaça,NaT,Nicole Fogaça,,Outros: Importação,nicole_fogaça@gmail.com,,NaT,(11) 99889-8296,,,Casado,,são paulo,,,,Consultor ABAP,,"Experiência em análise, desenvolvimento e implantação de soluções e melhorias para os principais módulos do SAP, visando atender as mais variadas necessidades das empresas. Participação em projetos de implantação e migração de versão, projetos de melhorias e suporte pós-implantação e projetos de adequação de funcionalidades do SAP à Lei Sarbanes-Oxley (SOX) e projetos de implementação de NF-e. Conhecimentos técnicos em Reports, Batch-input, Module-Pool, SapScript, SmartForms, Interface, RFC’s, Bapi, Exits, Querie, Report Writer, entre outros. Conhecimento dos principais processos dos módulos: SD, MM, PP, QM, PM, PS, FI e CO.",,,0.0,,Ensino Superior Completo,,,-,FASP,Ciência da Computação,0.0,,,,,,,,,,,NaT,NaT,,,NaT,NaT,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,NaT,NaT,,
2,10,Operador de Monitoração de SWC,,Daniela Machado,12622.0,Encaminhado ao Requisitante,2018-12-07,2018-12-07,,Helena Barros,,,,(22) 92154-5781,Consultor SAP BW Senior,2017-08-25 12:57:50,pelo próprio candidato,pietra_da_luz@hotmail.com,"São Paulo, São Paulo",Outros,2017-08-25 12:57:50,10.0,Pietra da Luz,NaT,Pietra da Luz,,Outros: Importação,pietra_da_luz@hotmail.com,,1974-06-27,(22) 92154-5781,,,Casado,,são paulo,,,,Consultor SAP BW Senior,,"Sou Alexandre Lopes, Tenho 10 anos de experiência: ferramentas SAP BW - Hana Studio- BO - SAP FI - Tableau - . Informações Complementares: Trabalhei em empresas como Bco Itau, BNDES, Heineken, L´Oreal, Lojas Leader, CSN, Puratos e Petrobras, Brasil Kirin entre outras",,,0.0,,Ensino Superior Completo,,,-,ESTACIO DE SÁ,Processos Gerenciais,2012.0,,,,,,,,,,,NaT,NaT,,,2018-12-05,2018-12-01,Operador de Monitoração de SWC,Não,Walters Group,Levi da Luz,Decision São Paulo,Cecília Freitas,Helena Barros,CLT Full,Indeterminado,Contratação,Média: Média complexidade 6 a 10 dias,,Superior Imediato:,Felipe,,Brasil,São Paulo,São Paulo,barra funda,Oeste,2000.0,Não,De: 18 Até: 30,9/18 14/22,Analista,Ensino Superior Incompleto,Técnico,Nenhum,,TI - Suporte-,"a. Possuir experiência em monitoração de terminais de autoatendimento (Banking ou Retail)\nOBs. Técnico com boa linguagem, e atendimento ao cliente Forma de contratação vamos de CLT Flex ou cooperado\nValores entre R$ 2.500,00 e 3.000,00","a. Possuir experiência em monitoração de terminais de autoatendimento (Banking ou Retail)\nOBs. Técnico com boa linguagem, e atendimento ao cliente Forma de contratação vamos de CLT Flex ou cooperado\nValores entre R$ 2.500,00 e 3.000,00",,Não,,,,,NaT,NaT,bom relacionamento atendimento a cliente boa fluência verbal fara atendimento telefônico,
3,10,Operador de Monitoração de SWC,,Henry Cassiano,12621.0,Prospect,2018-12-07,2018-12-07,,Helena Barros,,,,(22) 92154-5781,Consultor SAP BW Senior,2017-08-25 12:57:50,pelo próprio candidato,pietra_da_luz@hotmail.com,"São Paulo, São Paulo",Outros,2017-08-25 12:57:50,10.0,Pietra da Luz,NaT,Pietra da Luz,,Outros: Importação,pietra_da_luz@hotmail.com,,1974-06-27,(22) 92154-5781,,,Casado,,são paulo,,,,Consultor SAP BW Senior,,"Sou Alexandre Lopes, Tenho 10 anos de experiência: ferramentas SAP BW - Hana Studio- BO - SAP FI - Tableau - . Informações Complementares: Trabalhei em empresas como Bco Itau, BNDES, Heineken, L´Oreal, Lojas Leader, CSN, Puratos e Petrobras, Brasil Kirin entre outras",,,0.0,,Ensino Superior Completo,,,-,ESTACIO DE SÁ,Processos Gerenciais,2012.0,,,,,,,,,,,NaT,NaT,,,2018-12-05,2018-12-01,Operador de Monitoração de SWC,Não,Walters Group,Levi da Luz,Decision São Paulo,Cecília Freitas,Helena Barros,CLT Full,Indeterminado,Contratação,Média: Média complexidade 6 a 10 dias,,Superior Imediato:,Felipe,,Brasil,São Paulo,São Paulo,barra funda,Oeste,2000.0,Não,De: 18 Até: 30,9/18 14/22,Analista,Ensino Superior Incompleto,Técnico,Nenhum,,TI - Suporte-,"a. Possuir experiência em monitoração de terminais de autoatendimento (Banking ou Retail)\nOBs. Técnico com boa linguagem, e atendimento ao cliente Forma de contratação vamos de CLT Flex ou cooperado\nValores entre R$ 2.500,00 e 3.000,00","a. Possuir experiência em monitoração de terminais de autoatendimento (Banking ou Retail)\nOBs. Técnico com boa linguagem, e atendimento ao cliente Forma de contratação vamos de CLT Flex ou cooperado\nValores entre R$ 2.500,00 e 3.000,00",,Não,,,,,NaT,NaT,bom relacionamento atendimento a cliente boa fluência verbal fara atendimento telefônico,
4,10,Operador de Monitoração de SWC,,Sr. João Lucas Farias,12620.0,Encaminhado ao Requisitante,2018-12-07,2018-12-07,,Helena Barros,,,,(22) 92154-5781,Consultor SAP BW Senior,2017-08-25 12:57:50,pelo próprio candidato,pietra_da_luz@hotmail.com,"São Paulo, São Paulo",Outros,2017-08-25 12:57:50,10.0,Pietra da Luz,NaT,Pietra da Luz,,Outros: Importação,pietra_da_luz@hotmail.com,,1974-06-27,(22) 92154-5781,,,Casado,,são paulo,,,,Consultor SAP BW Senior,,"Sou Alexandre Lopes, Tenho 10 anos de experiência: ferramentas SAP BW - Hana Studio- BO - SAP FI - Tableau - . Informações Complementares: Trabalhei em empresas como Bco Itau, BNDES, Heineken, L´Oreal, Lojas Leader, CSN, Puratos e Petrobras, Brasil Kirin entre outras",,,0.0,,Ensino Superior Completo,,,-,ESTACIO DE SÁ,Processos Gerenciais,2012.0,,,,,,,,,,,NaT,NaT,,,2018-12-05,2018-12-01,Operador de Monitoração de SWC,Não,Walters Group,Levi da Luz,Decision São Paulo,Cecília Freitas,Helena Barros,CLT Full,Indeterminado,Contratação,Média: Média complexidade 6 a 10 dias,,Superior Imediato:,Felipe,,Brasil,São Paulo,São Paulo,barra funda,Oeste,2000.0,Não,De: 18 Até: 30,9/18 14/22,Analista,Ensino Superior Incompleto,Técnico,Nenhum,,TI - Suporte-,"a. Possuir experiência em monitoração de terminais de autoatendimento (Banking ou Retail)\nOBs. Técnico com boa linguagem, e atendimento ao cliente Forma de contratação vamos de CLT Flex ou cooperado\nValores entre R$ 2.500,00 e 3.000,00","a. Possuir experiência em monitoração de terminais de autoatendimento (Banking ou Retail)\nOBs. Técnico com boa linguagem, e atendimento ao cliente Forma de contratação vamos de CLT Flex ou cooperado\nValores entre R$ 2.500,00 e 3.000,00",,Não,,,,,NaT,NaT,bom relacionamento atendimento a cliente boa fluência verbal fara atendimento telefônico,


In [37]:
pd.set_option('display.max_colwidth', None)
pd.set_option('display.max_columns', None)
df_joined[df_joined['nome'] == 'Daniela Machado']

Unnamed: 0,id,titulo,modalidade,nome,codigo,situacao_candidado,data_candidatura,ultima_atualizacao,comentario,recrutador,cv_pt,cv_en,infos_basicas.telefone_recado,infos_basicas.telefone,infos_basicas.objetivo_profissional,infos_basicas.data_criacao,infos_basicas.inserido_por,infos_basicas.email,infos_basicas.local,infos_basicas.sabendo_de_nos_por,infos_basicas.data_atualizacao,infos_basicas.codigo_profissional,infos_basicas.nome,informacoes_pessoais.data_aceite,informacoes_pessoais.nome,informacoes_pessoais.cpf,informacoes_pessoais.fonte_indicacao,informacoes_pessoais.email,informacoes_pessoais.email_secundario,informacoes_pessoais.data_nascimento,informacoes_pessoais.telefone_celular,informacoes_pessoais.telefone_recado,informacoes_pessoais.sexo,informacoes_pessoais.estado_civil,informacoes_pessoais.pcd,informacoes_pessoais.endereco,informacoes_pessoais.skype,informacoes_pessoais.url_linkedin,informacoes_pessoais.facebook,informacoes_profissionais.titulo_profissional,informacoes_profissionais.area_atuacao,informacoes_profissionais.conhecimentos_tecnicos,informacoes_profissionais.certificacoes,informacoes_profissionais.outras_certificacoes,informacoes_profissionais.remuneracao,informacoes_profissionais.nivel_profissional,formacao_e_idiomas.nivel_academico,formacao_e_idiomas.nivel_ingles,formacao_e_idiomas.nivel_espanhol,formacao_e_idiomas.outro_idioma,formacao_e_idiomas.instituicao_ensino_superior,formacao_e_idiomas.cursos,formacao_e_idiomas.ano_conclusao,informacoes_pessoais.download_cv,informacoes_profissionais.qualificacoes,informacoes_profissionais.experiencias,formacao_e_idiomas.outro_curso,cargo_atual.id_ibrati,cargo_atual.email_corporativo,cargo_atual.cargo_atual,cargo_atual.projeto_atual,cargo_atual.cliente,cargo_atual.unidade,cargo_atual.data_admissao,cargo_atual.data_ultima_promocao,cargo_atual.nome_superior_imediato,cargo_atual.email_superior_imediato,informacoes_basicas.data_requicisao,informacoes_basicas.limite_esperado_para_contratacao,informacoes_basicas.titulo_vaga,informacoes_basicas.vaga_sap,informacoes_basicas.cliente,informacoes_basicas.solicitante_cliente,informacoes_basicas.empresa_divisao,informacoes_basicas.requisitante,informacoes_basicas.analista_responsavel,informacoes_basicas.tipo_contratacao,informacoes_basicas.prazo_contratacao,informacoes_basicas.objetivo_vaga,informacoes_basicas.prioridade_vaga,informacoes_basicas.origem_vaga,informacoes_basicas.superior_imediato,informacoes_basicas.nome,informacoes_basicas.telefone,perfil_vaga.pais,perfil_vaga.estado,perfil_vaga.cidade,perfil_vaga.bairro,perfil_vaga.regiao,perfil_vaga.local_trabalho,perfil_vaga.vaga_especifica_para_pcd,perfil_vaga.faixa_etaria,perfil_vaga.horario_trabalho,perfil_vaga.nivel profissional,perfil_vaga.nivel_academico,perfil_vaga.nivel_ingles,perfil_vaga.nivel_espanhol,perfil_vaga.outro_idioma,perfil_vaga.areas_atuacao,perfil_vaga.principais_atividades,perfil_vaga.competencia_tecnicas_e_comportamentais,perfil_vaga.demais_observacoes,perfil_vaga.viagens_requeridas,perfil_vaga.equipamentos_necessarios,beneficios.valor_venda,beneficios.valor_compra_1,beneficios.valor_compra_2,informacoes_basicas.data_inicial,informacoes_basicas.data_final,perfil_vaga.habilidades_comportamentais_necessarias,informacoes_basicas.nome_substituto
2,10,Operador de Monitoração de SWC,,Daniela Machado,12622.0,Encaminhado ao Requisitante,2018-12-07,2018-12-07,,Helena Barros,,,,(22) 92154-5781,Consultor SAP BW Senior,2017-08-25 12:57:50,pelo próprio candidato,pietra_da_luz@hotmail.com,"São Paulo, São Paulo",Outros,2017-08-25 12:57:50,10.0,Pietra da Luz,NaT,Pietra da Luz,,Outros: Importação,pietra_da_luz@hotmail.com,,1974-06-27,(22) 92154-5781,,,Casado,,são paulo,,,,Consultor SAP BW Senior,,"Sou Alexandre Lopes, Tenho 10 anos de experiência: ferramentas SAP BW - Hana Studio- BO - SAP FI - Tableau - . Informações Complementares: Trabalhei em empresas como Bco Itau, BNDES, Heineken, L´Oreal, Lojas Leader, CSN, Puratos e Petrobras, Brasil Kirin entre outras",,,0,,Ensino Superior Completo,,,-,ESTACIO DE SÁ,Processos Gerenciais,2012.0,,,,,,,,,,,NaT,NaT,,,2018-12-05,2018-12-01,Operador de Monitoração de SWC,Não,Walters Group,Levi da Luz,Decision São Paulo,Cecília Freitas,Helena Barros,CLT Full,Indeterminado,Contratação,Média: Média complexidade 6 a 10 dias,,Superior Imediato:,Felipe,,Brasil,São Paulo,São Paulo,barra funda,Oeste,2000,Não,De: 18 Até: 30,9/18 14/22,Analista,Ensino Superior Incompleto,Técnico,Nenhum,,TI - Suporte-,"a. Possuir experiência em monitoração de terminais de autoatendimento (Banking ou Retail)\nOBs. Técnico com boa linguagem, e atendimento ao cliente Forma de contratação vamos de CLT Flex ou cooperado\nValores entre R$ 2.500,00 e 3.000,00","a. Possuir experiência em monitoração de terminais de autoatendimento (Banking ou Retail)\nOBs. Técnico com boa linguagem, e atendimento ao cliente Forma de contratação vamos de CLT Flex ou cooperado\nValores entre R$ 2.500,00 e 3.000,00",,Não,,,,,NaT,NaT,bom relacionamento atendimento a cliente boa fluência verbal fara atendimento telefônico,
75060,7811,ASSISTENTE ADM SENIOR - Google,,Daniela Machado,32358.0,Desistiu,2022-01-03,2022-01-07,,Sra. Manuella Oliveira,,,,(11) 93896-3450,Gestão de TI,2018-03-29 17:04:58,pelo próprio candidato,davi_luiz_ferreira@gmail.com,,Outros,2018-03-29 17:04:58,7811.0,Davi Luiz Ferreira,NaT,Davi Luiz Ferreira,,Outros: Importação,davi_luiz_ferreira@gmail.com,,NaT,(11) 93896-3450,,,,,,,,,Gestão de TI,,,,,0,,,,,-,,,,,,,,,,,,,,NaT,NaT,,,2021-12-15,NaT,ASSISTENTE ADM SENIOR - Google,Não,Miller-Curry,Hellena Gonçalves,Decision Campinas,Ana Ribeiro,Sra. Joana Sousa,CLT Full,Indeterminado,,,,Superior Imediato:,,,Brasil,São Paulo,São Paulo,,,2000,Não,De: Até:,,Assistente,Ensino Superior Cursando,Intermediário,Nenhum,,Administrativa-,"Trabalho no site do cliente em SP - endereço Avenida Brigadeiro Faria lima, 3477.\nIrá interagir com um Team Leader da Polônia\nRecepção de comprovantes de despesas físicos dos funcionários\nConferência/Reconciliação/Armazenamento dos comprovantes de despesas\nEnvio de comprovantes para armazenagem\nAnálise do Pedido de Reembolso em Sistema (CONCUR)\nPreenchimento de planilhas de controle de despesas\nAuxílio em pedidos de auditoria","Skills Interpessoais\nBoa Comunicação\nOrganização\nFoco e assiduidade\nRelacionamento com outros colaboradores (Teamwork é Fundamental)\nPro atividade em resolução de problemas""","Previsão de inicio para o dia 03/01/2021 Horário de trabalho das 08h as 17h Local de trabalho - Cliente da IBM - Site Google Itaim Bibi - endereço Avenida Brigadeiro Faria lima, 3477 Gestor responsável Eder Paulo Assumpcao Artur",,,,,,NaT,NaT,,


In [38]:
# Resetar o índice de todos os DataFrames principais
df_prospects.reset_index(drop=True, inplace=True)
df_applicants.reset_index(drop=True, inplace=True)
df_vagas.reset_index(drop=True, inplace=True)
df_joined.reset_index(drop=True, inplace=True)
print('Índices resetados para todos os DataFrames.')

Índices resetados para todos os DataFrames.


In [42]:
df_joined[['cv_pt', 'perfil_vaga.principais_atividades', 'perfil_vaga.competencia_tecnicas_e_comportamentais']]

Unnamed: 0,cv_pt,perfil_vaga.principais_atividades,perfil_vaga.competencia_tecnicas_e_comportamentais
0,,,
1,"\nexperiência em análise, desenvolvimento e implantação de soluções e melhorias para os principais módulos do sap, visando atender as mais variadas necessidades das empresas. participação em projetos de implantação e migração de versão, projetos de melhorias e suporte pós-implantação e projetos de adequação de funcionalidades do sap à lei sarbanes-oxley (sox) e projetos de implementação de nf-e. conhecimentos técnicos em reports, batch-input, module-pool, sapscript, smartforms, interface, rfc’s, bapi, exits, querie, report writer, entre outros. conhecimento dos principais processos dos módulos: sd, mm, pp, qm, pm, ps, fi e co.\n",,
2,,"a. Possuir experiência em monitoração de terminais de autoatendimento (Banking ou Retail)\nOBs. Técnico com boa linguagem, e atendimento ao cliente Forma de contratação vamos de CLT Flex ou cooperado\nValores entre R$ 2.500,00 e 3.000,00","a. Possuir experiência em monitoração de terminais de autoatendimento (Banking ou Retail)\nOBs. Técnico com boa linguagem, e atendimento ao cliente Forma de contratação vamos de CLT Flex ou cooperado\nValores entre R$ 2.500,00 e 3.000,00"
3,,"a. Possuir experiência em monitoração de terminais de autoatendimento (Banking ou Retail)\nOBs. Técnico com boa linguagem, e atendimento ao cliente Forma de contratação vamos de CLT Flex ou cooperado\nValores entre R$ 2.500,00 e 3.000,00","a. Possuir experiência em monitoração de terminais de autoatendimento (Banking ou Retail)\nOBs. Técnico com boa linguagem, e atendimento ao cliente Forma de contratação vamos de CLT Flex ou cooperado\nValores entre R$ 2.500,00 e 3.000,00"
4,,"a. Possuir experiência em monitoração de terminais de autoatendimento (Banking ou Retail)\nOBs. Técnico com boa linguagem, e atendimento ao cliente Forma de contratação vamos de CLT Flex ou cooperado\nValores entre R$ 2.500,00 e 3.000,00","a. Possuir experiência em monitoração de terminais de autoatendimento (Banking ou Retail)\nOBs. Técnico com boa linguagem, e atendimento ao cliente Forma de contratação vamos de CLT Flex ou cooperado\nValores entre R$ 2.500,00 e 3.000,00"
5,,"a. Possuir experiência em monitoração de terminais de autoatendimento (Banking ou Retail)\nOBs. Técnico com boa linguagem, e atendimento ao cliente Forma de contratação vamos de CLT Flex ou cooperado\nValores entre R$ 2.500,00 e 3.000,00","a. Possuir experiência em monitoração de terminais de autoatendimento (Banking ou Retail)\nOBs. Técnico com boa linguagem, e atendimento ao cliente Forma de contratação vamos de CLT Flex ou cooperado\nValores entre R$ 2.500,00 e 3.000,00"
6,,"a. Possuir experiência em monitoração de terminais de autoatendimento (Banking ou Retail)\nOBs. Técnico com boa linguagem, e atendimento ao cliente Forma de contratação vamos de CLT Flex ou cooperado\nValores entre R$ 2.500,00 e 3.000,00","a. Possuir experiência em monitoração de terminais de autoatendimento (Banking ou Retail)\nOBs. Técnico com boa linguagem, e atendimento ao cliente Forma de contratação vamos de CLT Flex ou cooperado\nValores entre R$ 2.500,00 e 3.000,00"
7,,"a. Possuir experiência em monitoração de terminais de autoatendimento (Banking ou Retail)\nOBs. Técnico com boa linguagem, e atendimento ao cliente Forma de contratação vamos de CLT Flex ou cooperado\nValores entre R$ 2.500,00 e 3.000,00","a. Possuir experiência em monitoração de terminais de autoatendimento (Banking ou Retail)\nOBs. Técnico com boa linguagem, e atendimento ao cliente Forma de contratação vamos de CLT Flex ou cooperado\nValores entre R$ 2.500,00 e 3.000,00"
8,,"a. Possuir experiência em monitoração de terminais de autoatendimento (Banking ou Retail)\nOBs. Técnico com boa linguagem, e atendimento ao cliente Forma de contratação vamos de CLT Flex ou cooperado\nValores entre R$ 2.500,00 e 3.000,00","a. Possuir experiência em monitoração de terminais de autoatendimento (Banking ou Retail)\nOBs. Técnico com boa linguagem, e atendimento ao cliente Forma de contratação vamos de CLT Flex ou cooperado\nValores entre R$ 2.500,00 e 3.000,00"
9,,"a. Possuir experiência em monitoração de terminais de autoatendimento (Banking ou Retail)\nOBs. Técnico com boa linguagem, e atendimento ao cliente Forma de contratação vamos de CLT Flex ou cooperado\nValores entre R$ 2.500,00 e 3.000,00","a. Possuir experiência em monitoração de terminais de autoatendimento (Banking ou Retail)\nOBs. Técnico com boa linguagem, e atendimento ao cliente Forma de contratação vamos de CLT Flex ou cooperado\nValores entre R$ 2.500,00 e 3.000,00"


In [44]:
# Salvar colunas selecionadas de df_joined na pasta processed
import os
output_dir = os.path.join('..', 'data', 'raw')
os.makedirs(output_dir, exist_ok=True)
output_path = os.path.join(output_dir, 'cv_atividades_competencias.csv')
df_joined[['cv_pt', 'perfil_vaga.principais_atividades', 'perfil_vaga.competencia_tecnicas_e_comportamentais']].to_csv(output_path, index=False, encoding='utf-8')
print(f'Arquivo salvo em: {output_path}')

Arquivo salvo em: ..\data\raw\cv_atividades_competencias.csv
