<a href="https://colab.research.google.com/github/LeonardoRoig/Tech_5_Streamlit_Vagas/blob/main/ETL_Modelo_Streamlit_A.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# üìò ETL_Modelo_Streamlit_A
Notebook que treina o modelo, gera ranking e prints do recrutador, e no final exporta os arquivos `.py` e `requirements.txt` para deploy no Streamlit Cloud.

## 1) Imports e Configura√ß√£o

In [1]:

import os, re, json
import pandas as pd, numpy as np
from typing import List, Optional
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import OneHotEncoder
from sklearn.compose import ColumnTransformer
from sklearn.pipeline import Pipeline
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report, roc_auc_score
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity

pd.set_option("display.max_colwidth", 300)

# Colunas padr√£o
ID_VAGA_COL, ID_CAND_COL, TARGET_COL = "id_vaga", "id_candidato", "target"

# Caminhos padr√£o
TRAIN_PATH, PENDING_PATH, EXPORT_DIR = "/content/aprovados_reprovados.csv", "/content/nao_classificados.csv", "/content/artifacts"
os.makedirs(EXPORT_DIR, exist_ok=True)


## 2) Leitura dos Dados

In [2]:

df_train = pd.read_csv(TRAIN_PATH)
df_pending = pd.read_csv(PENDING_PATH)
print("Treino:", df_train.shape, "Pendentes:", df_pending.shape)
df_train.head()


Treino: (10110, 31) Pendentes: (34961, 31)


Unnamed: 0,id_vaga,inf_titulo_vaga,inf_cliente,inf_vaga_sap,perfil_nivel_academico,perfil_nivel profissional,perfil_nivel_ingles,perfil_nivel_espanhol,perfil_competencia_tecnicas_e_comportamentais,perfil_principais_atividades,...,qualificacoes,certificacoes,experiencias,nivel_academico,nivel_ingles,nivel_espanhol,cargo_atual,nivel_profissional,outro_idioma,cursos
0,5184,Consultor PP/QM S√™nior,"Morris, Moran and Dodson",N√£o,Ensino Superior Completo,S√™nior,Fluente,Nenhum,‚Ä¢ Consultor PP/QM S√™nior com experiencia em projetos de Rollout e implementa√ß√£o SAP ECC\n‚Ä¢ Ingl√™s mandat√≥rio\n‚Ä¢ Remoto (Em alguns momentos / fases do projeto dever√° estar presente na planta do cliente em Campinas/SP),Consultor PP/QM Sr.\n\n‚Ä¢ Consultor PP/QM S√™nior com experiencia em projetos de Rollout e implementa√ß√£o SAP ECC\n‚Ä¢ Ingl√™s mandat√≥rio\n‚Ä¢ Remoto (Em alguns momentos / fases do projeto dever√° estar presente na planta do cliente em Campinas/SP),...,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado
1,5184,Consultor PP/QM S√™nior,"Morris, Moran and Dodson",N√£o,Ensino Superior Completo,S√™nior,Fluente,Nenhum,‚Ä¢ Consultor PP/QM S√™nior com experiencia em projetos de Rollout e implementa√ß√£o SAP ECC\n‚Ä¢ Ingl√™s mandat√≥rio\n‚Ä¢ Remoto (Em alguns momentos / fases do projeto dever√° estar presente na planta do cliente em Campinas/SP),Consultor PP/QM Sr.\n\n‚Ä¢ Consultor PP/QM S√™nior com experiencia em projetos de Rollout e implementa√ß√£o SAP ECC\n‚Ä¢ Ingl√™s mandat√≥rio\n‚Ä¢ Remoto (Em alguns momentos / fases do projeto dever√° estar presente na planta do cliente em Campinas/SP),...,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado
2,5184,Consultor PP/QM S√™nior,"Morris, Moran and Dodson",N√£o,Ensino Superior Completo,S√™nior,Fluente,Nenhum,‚Ä¢ Consultor PP/QM S√™nior com experiencia em projetos de Rollout e implementa√ß√£o SAP ECC\n‚Ä¢ Ingl√™s mandat√≥rio\n‚Ä¢ Remoto (Em alguns momentos / fases do projeto dever√° estar presente na planta do cliente em Campinas/SP),Consultor PP/QM Sr.\n\n‚Ä¢ Consultor PP/QM S√™nior com experiencia em projetos de Rollout e implementa√ß√£o SAP ECC\n‚Ä¢ Ingl√™s mandat√≥rio\n‚Ä¢ Remoto (Em alguns momentos / fases do projeto dever√° estar presente na planta do cliente em Campinas/SP),...,N√£o informado,N√£o informado,N√£o informado,Mestrado Completo,Fluente,Fluente,N√£o informado,N√£o informado,N√£o informado,Engenharia da Computa√ß√£o
3,5184,Consultor PP/QM S√™nior,"Morris, Moran and Dodson",N√£o,Ensino Superior Completo,S√™nior,Fluente,Nenhum,‚Ä¢ Consultor PP/QM S√™nior com experiencia em projetos de Rollout e implementa√ß√£o SAP ECC\n‚Ä¢ Ingl√™s mandat√≥rio\n‚Ä¢ Remoto (Em alguns momentos / fases do projeto dever√° estar presente na planta do cliente em Campinas/SP),Consultor PP/QM Sr.\n\n‚Ä¢ Consultor PP/QM S√™nior com experiencia em projetos de Rollout e implementa√ß√£o SAP ECC\n‚Ä¢ Ingl√™s mandat√≥rio\n‚Ä¢ Remoto (Em alguns momentos / fases do projeto dever√° estar presente na planta do cliente em Campinas/SP),...,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado
4,5183,ANALISTA PL/JR C/ SQL,"Morris, Moran and Dodson",N√£o,Ensino Superior Completo,Analista,Nenhum,Intermedi√°rio,"Requisitos mandat√≥rios:\n\no Conhecimentos T√©cnicos: Conhecimento SQL, e algum conhecimento de SAP SD\no Compet√™ncias Interpessoais: Relacionamento interpessoal, foco no cliente, trabalho em equipe, excelente\ncomunica√ß√£o, e adaptabilidade.\n\nRequisitos desej√°veis:\no Idiomas: Espanhol n√≠vel in...","Descri√ß√£o ‚Äì Atividades:\n\no Monitoramento das interfaces KDP\no Monitoramento sistema B2B durante o dia\no Monitoramento do Whatsapp durante o dia\no Monitoramento da subida de pedidos (KDP, WAE e B2B)\no Suporte para equipe comercial quando tem problemas em algum cliente no WAE\no Suporte Apli...",...,N√£o informado,N√£o informado,N√£o informado,P√≥s Gradua√ß√£o Cursando,B√°sico,B√°sico,N√£o informado,N√£o informado,N√£o informado,Direito


## 3) Pr√©-processamento

In [3]:

X, y = df_train.drop(columns=[TARGET_COL]), df_train[TARGET_COL]
cat_cols = X.select_dtypes(include=["object"]).columns.tolist()
for c in [ID_VAGA_COL, ID_CAND_COL]:
    if c in cat_cols: cat_cols.remove(c)
preprocessor = ColumnTransformer([("cat", OneHotEncoder(handle_unknown="ignore"), cat_cols)], remainder="passthrough")


## 4) Treino e Avalia√ß√£o

In [4]:

X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=0.2, stratify=y, random_state=42)
model = Pipeline([("preprocess", preprocessor), ("clf", RandomForestClassifier(n_estimators=300, random_state=42))])
model.fit(X_train, y_train)
y_pred, y_proba = model.predict(X_val), model.predict_proba(X_val)[:,1]
print(classification_report(y_val, y_pred))
print("ROC AUC:", roc_auc_score(y_val, y_proba))


              precision    recall  f1-score   support

         0.0       0.99      1.00      1.00      1534
         1.0       1.00      0.98      0.99       488

    accuracy                           0.99      2022
   macro avg       1.00      0.99      0.99      2022
weighted avg       0.99      0.99      0.99      2022

ROC AUC: 0.9998690875670592


A acur√°cia do modelo navalida√ß√£o √© de 99%.

## 5) Predi√ß√£o e Ranking

In [17]:
df_pred = df_pending.copy()
df_pred["score"] = model.predict_proba(df_pred)[:,1]
df_pred["rank"] = df_pred.groupby(ID_VAGA_COL)["score"].rank(ascending=False, method="first")
ranking = df_pred[df_pred["rank"] <= 10].sort_values([ID_VAGA_COL,"rank"]).reset_index(drop=True)
pd.set_option('display.max_columns', None)
display(ranking.tail(200))
#display(ranking)

Unnamed: 0,id_vaga,inf_titulo_vaga,inf_cliente,inf_vaga_sap,perfil_nivel_academico,perfil_nivel profissional,perfil_nivel_ingles,perfil_nivel_espanhol,perfil_competencia_tecnicas_e_comportamentais,perfil_principais_atividades,titulo,id_candidato,nome,data_candidatura,recrutador,situacao_candidado,target,objetivo_profissional,titulo_profissional,area_atuacao,conhecimentos_tecnicos,qualificacoes,certificacoes,experiencias,nivel_academico,nivel_ingles,nivel_espanhol,cargo_atual,nivel_profissional,outro_idioma,cursos,score,rank
31565,14098,SAP S4HANA _L3 - SAP MM CGEMJP00282607,"Morris, Moran and Dodson",Sim,Ensino Superior Completo,Analista,B√°sico,,"Descri√ß√£o da Vaga:\n\n+ 5 anos de projetos SAP\nExperiencia em projetos de implementa√ß√£o S/4HANA\nConhecimento da metodologia Activate\nConhecimento comprovado de FIORI\nConhecimento comprovado em projeto de Retail S/4HANA\nConhecimento comprovado em: DADOS MESTRES RETAIL (ARTIGO, HIERARQUIA, GRUPO DE MERCADORIA, CENTRO, REFSITE); GEST√ÉO DE SORTIMENTO E CATALOGA√á√ÉO\nCLUSTERIZA√á√ÉO ; COMPRA COLETIVA; CROSS DOCKING ; FLOW THROUGH; ALOCA√á√ÉO DE MERCADORIA; REABASTECIMENTO DE CD E LOJA; RETAIL STORE OPERATION; ACORDOS COMERCIAIS (CONTRATOS) ; INTERA√á√ÉO COM PDV; PRECIFICA√á√ÉO DE VAREJO; NO√á√ïES DE INTEGRA√á√ÉO COM PDV, PROMO√á√ÉO E VENDA CASADA",Vaga: SAP S4HANA _L3 - SAP MM CGEMJP00282607 ‚Äì 4 POSI√á√ïES\nPer√≠odo de Aloca√ß√£o: 03/02/2025 at√© 01/08/2025 - Aloca√ß√£o\nAtua√ß√£o: H√≠brida\n\nDisponibilidade para Viagens: N√£o se aplica\n\nIdiomas: n√£o se aplica,SAP S4HANA _L3 - SAP MM CGEMJP00282607,20896,Maria da Luz,30-01-2025,Elisa Nunes,Encaminhado ao Requisitante,,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,Intermedi√°rio,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,0.126667,4.0
31566,14098,SAP S4HANA _L3 - SAP MM CGEMJP00282607,"Morris, Moran and Dodson",Sim,Ensino Superior Completo,Analista,B√°sico,,"Descri√ß√£o da Vaga:\n\n+ 5 anos de projetos SAP\nExperiencia em projetos de implementa√ß√£o S/4HANA\nConhecimento da metodologia Activate\nConhecimento comprovado de FIORI\nConhecimento comprovado em projeto de Retail S/4HANA\nConhecimento comprovado em: DADOS MESTRES RETAIL (ARTIGO, HIERARQUIA, GRUPO DE MERCADORIA, CENTRO, REFSITE); GEST√ÉO DE SORTIMENTO E CATALOGA√á√ÉO\nCLUSTERIZA√á√ÉO ; COMPRA COLETIVA; CROSS DOCKING ; FLOW THROUGH; ALOCA√á√ÉO DE MERCADORIA; REABASTECIMENTO DE CD E LOJA; RETAIL STORE OPERATION; ACORDOS COMERCIAIS (CONTRATOS) ; INTERA√á√ÉO COM PDV; PRECIFICA√á√ÉO DE VAREJO; NO√á√ïES DE INTEGRA√á√ÉO COM PDV, PROMO√á√ÉO E VENDA CASADA",Vaga: SAP S4HANA _L3 - SAP MM CGEMJP00282607 ‚Äì 4 POSI√á√ïES\nPer√≠odo de Aloca√ß√£o: 03/02/2025 at√© 01/08/2025 - Aloca√ß√£o\nAtua√ß√£o: H√≠brida\n\nDisponibilidade para Viagens: N√£o se aplica\n\nIdiomas: n√£o se aplica,SAP S4HANA _L3 - SAP MM CGEMJP00282607,15,Dr. Erick da Rosa,29-01-2025,Elisa Nunes,Encaminhado ao Requisitante,,Consultor,Consultor,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,P√≥s Gradua√ß√£o Completo,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,MBA,0.120000,5.0
31567,14098,SAP S4HANA _L3 - SAP MM CGEMJP00282607,"Morris, Moran and Dodson",Sim,Ensino Superior Completo,Analista,B√°sico,,"Descri√ß√£o da Vaga:\n\n+ 5 anos de projetos SAP\nExperiencia em projetos de implementa√ß√£o S/4HANA\nConhecimento da metodologia Activate\nConhecimento comprovado de FIORI\nConhecimento comprovado em projeto de Retail S/4HANA\nConhecimento comprovado em: DADOS MESTRES RETAIL (ARTIGO, HIERARQUIA, GRUPO DE MERCADORIA, CENTRO, REFSITE); GEST√ÉO DE SORTIMENTO E CATALOGA√á√ÉO\nCLUSTERIZA√á√ÉO ; COMPRA COLETIVA; CROSS DOCKING ; FLOW THROUGH; ALOCA√á√ÉO DE MERCADORIA; REABASTECIMENTO DE CD E LOJA; RETAIL STORE OPERATION; ACORDOS COMERCIAIS (CONTRATOS) ; INTERA√á√ÉO COM PDV; PRECIFICA√á√ÉO DE VAREJO; NO√á√ïES DE INTEGRA√á√ÉO COM PDV, PROMO√á√ÉO E VENDA CASADA",Vaga: SAP S4HANA _L3 - SAP MM CGEMJP00282607 ‚Äì 4 POSI√á√ïES\nPer√≠odo de Aloca√ß√£o: 03/02/2025 at√© 01/08/2025 - Aloca√ß√£o\nAtua√ß√£o: H√≠brida\n\nDisponibilidade para Viagens: N√£o se aplica\n\nIdiomas: n√£o se aplica,SAP S4HANA _L3 - SAP MM CGEMJP00282607,8320,Augusto Vieira,30-01-2025,Elisa Nunes,Prospect,,Consultor SAP,Consultor SAP,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,0.103333,6.0
31568,14099,SAP S4HANA _L3 - SAP ABAP S√™nior - CGEMJP00282590,"Morris, Moran and Dodson",Sim,Ensino Superior Completo,S√™nior,B√°sico,,"Descri√ß√£o da Vaga:\nApplication Consultant / SAP development / S4HANA / HANA / R4 Application consultants are supervised by a senior technical architect or similar manager and work to improve, create, and manage their online applications and computer software packages\n\nPelo menos cinco projetos comprovados em ECC;\nPelo menos tr√™s projetos comprovados em S/4 HANA;\nPelo menos um com SOLMAN e metodologia SAP Activate\nExperi√™ncia em Abode Forms, Workflow, SOAMANAGER, CDS View e Annotation\nConhecimento em Fiori, SEGW, OData Service, AMDP\n\nDesej√°vel:\nMapeamento de campos SAP para Data warehouse/Data lake\nHANA Calculation View, SQL Script\n\nDiferencial:\nConhecimento Build (Apps, Process Automation)\nConhecimento em BTP\nHANA XSA",Vaga: SAP S4HANA _L3 - SAP ABAP SR CGEMJP00282590 - 10 POSI√á√ïES\nPer√≠odo de Aloca√ß√£o: 03/02/2025 at√© 01/08/2025 - Aloca√ß√£o\nAtua√ß√£o: H√≠brida\n\nDisponibilidade para Viagens: N√£o se aplica\n\nIdiomas: n√£o se aplica,SAP S4HANA _L3 - SAP ABAP S√™nior - CGEMJP00282590,12386,Danilo Nascimento,29-01-2025,Yasmin da Rosa,Encaminhado ao Requisitante,,ABAP,ABAP,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,0.180000,1.0
31569,14099,SAP S4HANA _L3 - SAP ABAP S√™nior - CGEMJP00282590,"Morris, Moran and Dodson",Sim,Ensino Superior Completo,S√™nior,B√°sico,,"Descri√ß√£o da Vaga:\nApplication Consultant / SAP development / S4HANA / HANA / R4 Application consultants are supervised by a senior technical architect or similar manager and work to improve, create, and manage their online applications and computer software packages\n\nPelo menos cinco projetos comprovados em ECC;\nPelo menos tr√™s projetos comprovados em S/4 HANA;\nPelo menos um com SOLMAN e metodologia SAP Activate\nExperi√™ncia em Abode Forms, Workflow, SOAMANAGER, CDS View e Annotation\nConhecimento em Fiori, SEGW, OData Service, AMDP\n\nDesej√°vel:\nMapeamento de campos SAP para Data warehouse/Data lake\nHANA Calculation View, SQL Script\n\nDiferencial:\nConhecimento Build (Apps, Process Automation)\nConhecimento em BTP\nHANA XSA",Vaga: SAP S4HANA _L3 - SAP ABAP SR CGEMJP00282590 - 10 POSI√á√ïES\nPer√≠odo de Aloca√ß√£o: 03/02/2025 at√© 01/08/2025 - Aloca√ß√£o\nAtua√ß√£o: H√≠brida\n\nDisponibilidade para Viagens: N√£o se aplica\n\nIdiomas: n√£o se aplica,SAP S4HANA _L3 - SAP ABAP S√™nior - CGEMJP00282590,15143,Lara Santos,11-02-2025,Yasmin da Rosa,Encaminhado ao Requisitante,,Consultor ABAP SR.,Consultor ABAP SR.,N√£o informado,SAP ABAP,N√£o informado,N√£o informado,N√£o informado,Ensino Superior Completo,Intermedi√°rio,B√°sico,N√£o informado,N√£o informado,N√£o informado,Matem√°tica computacional,0.173333,2.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
31760,14217,SAP SD,Jenkins-Walker,Sim,Ensino Superior Completo,S√™nior,Avan√ßado,Intermedi√°rio,"Experi√™ncia na implementa√ß√£o de projetos de SD, participando desde a an√°lise de requisitos e\nlevantamento de dados at√© o suporte p√≥s implementa√ß√£o;\n‚Ä¢ Atendimento de demandas relacionadas a SD de diversos processos de venda, como\nconsigna√ß√£o, retorno, devolu√ß√£o, third-party, nota de cr√©dito/d√©bito, sucata, demonstra√ß√£o, etc;\n‚Ä¢ Experi√™ncia em localiza√ß√£o Brasil;\n‚Ä¢ Experi√™ncia com Nota Fiscal Eletr√¥nica;\n‚Ä¢ Realiza√ß√£o de configura√ß√µes para atender demandas de diferentes processos de vendas, desde\na cria√ß√£o do documento de venda, da remessa e todo o fluxo at√© a fatura e a nota fiscal;\n‚Ä¢ Cria√ß√£o de solu√ß√µes customizadas junto aos clientes;\n‚Ä¢ Elabora√ß√£o de cen√°rios de testes;\n‚Ä¢ Experi√™ncia na integra√ß√£o de sistemas legados com o SAP SD (ECC/S4Hana);\n‚Ä¢ Experi√™ncia em carga de dados no sistema ‚Äì Master Data e Dados Transacionais","Experi√™ncia na implementa√ß√£o de projetos de SD, participando desde a an√°lise de requisitos e\nlevantamento de dados at√© o suporte p√≥s implementa√ß√£o;\n‚Ä¢ Atendimento de demandas relacionadas a SD de diversos processos de venda, como\nconsigna√ß√£o, retorno, devolu√ß√£o, third-party, nota de cr√©dito/d√©bito, sucata, demonstra√ß√£o, etc;\n‚Ä¢ Experi√™ncia em localiza√ß√£o Brasil;\n‚Ä¢ Experi√™ncia com Nota Fiscal Eletr√¥nica;\n‚Ä¢ Realiza√ß√£o de configura√ß√µes para atender demandas de diferentes processos de vendas, desde\na cria√ß√£o do documento de venda, da remessa e todo o fluxo at√© a fatura e a nota fiscal;\n‚Ä¢ Cria√ß√£o de solu√ß√µes customizadas junto aos clientes;\n‚Ä¢ Elabora√ß√£o de cen√°rios de testes;\n‚Ä¢ Experi√™ncia na integra√ß√£o de sistemas legados com o SAP SD (ECC/S4Hana);\n‚Ä¢ Experi√™ncia em carga de dados no sistema ‚Äì Master Data e Dados Transacionais",SAP SD,10720,Luigi Novaes,26-02-2025,Yasmin da Rosa,Encaminhado ao Requisitante,,CONSULTOR SAP SD LES,CONSULTOR SAP SD LES,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,0.143333,8.0
31761,14217,SAP SD,Jenkins-Walker,Sim,Ensino Superior Completo,S√™nior,Avan√ßado,Intermedi√°rio,"Experi√™ncia na implementa√ß√£o de projetos de SD, participando desde a an√°lise de requisitos e\nlevantamento de dados at√© o suporte p√≥s implementa√ß√£o;\n‚Ä¢ Atendimento de demandas relacionadas a SD de diversos processos de venda, como\nconsigna√ß√£o, retorno, devolu√ß√£o, third-party, nota de cr√©dito/d√©bito, sucata, demonstra√ß√£o, etc;\n‚Ä¢ Experi√™ncia em localiza√ß√£o Brasil;\n‚Ä¢ Experi√™ncia com Nota Fiscal Eletr√¥nica;\n‚Ä¢ Realiza√ß√£o de configura√ß√µes para atender demandas de diferentes processos de vendas, desde\na cria√ß√£o do documento de venda, da remessa e todo o fluxo at√© a fatura e a nota fiscal;\n‚Ä¢ Cria√ß√£o de solu√ß√µes customizadas junto aos clientes;\n‚Ä¢ Elabora√ß√£o de cen√°rios de testes;\n‚Ä¢ Experi√™ncia na integra√ß√£o de sistemas legados com o SAP SD (ECC/S4Hana);\n‚Ä¢ Experi√™ncia em carga de dados no sistema ‚Äì Master Data e Dados Transacionais","Experi√™ncia na implementa√ß√£o de projetos de SD, participando desde a an√°lise de requisitos e\nlevantamento de dados at√© o suporte p√≥s implementa√ß√£o;\n‚Ä¢ Atendimento de demandas relacionadas a SD de diversos processos de venda, como\nconsigna√ß√£o, retorno, devolu√ß√£o, third-party, nota de cr√©dito/d√©bito, sucata, demonstra√ß√£o, etc;\n‚Ä¢ Experi√™ncia em localiza√ß√£o Brasil;\n‚Ä¢ Experi√™ncia com Nota Fiscal Eletr√¥nica;\n‚Ä¢ Realiza√ß√£o de configura√ß√µes para atender demandas de diferentes processos de vendas, desde\na cria√ß√£o do documento de venda, da remessa e todo o fluxo at√© a fatura e a nota fiscal;\n‚Ä¢ Cria√ß√£o de solu√ß√µes customizadas junto aos clientes;\n‚Ä¢ Elabora√ß√£o de cen√°rios de testes;\n‚Ä¢ Experi√™ncia na integra√ß√£o de sistemas legados com o SAP SD (ECC/S4Hana);\n‚Ä¢ Experi√™ncia em carga de dados no sistema ‚Äì Master Data e Dados Transacionais",SAP SD,13635,Kevin Porto,26-02-2025,Yasmin da Rosa,Prospect,,consultor SD,consultor SD,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,0.140000,9.0
31762,14217,SAP SD,Jenkins-Walker,Sim,Ensino Superior Completo,S√™nior,Avan√ßado,Intermedi√°rio,"Experi√™ncia na implementa√ß√£o de projetos de SD, participando desde a an√°lise de requisitos e\nlevantamento de dados at√© o suporte p√≥s implementa√ß√£o;\n‚Ä¢ Atendimento de demandas relacionadas a SD de diversos processos de venda, como\nconsigna√ß√£o, retorno, devolu√ß√£o, third-party, nota de cr√©dito/d√©bito, sucata, demonstra√ß√£o, etc;\n‚Ä¢ Experi√™ncia em localiza√ß√£o Brasil;\n‚Ä¢ Experi√™ncia com Nota Fiscal Eletr√¥nica;\n‚Ä¢ Realiza√ß√£o de configura√ß√µes para atender demandas de diferentes processos de vendas, desde\na cria√ß√£o do documento de venda, da remessa e todo o fluxo at√© a fatura e a nota fiscal;\n‚Ä¢ Cria√ß√£o de solu√ß√µes customizadas junto aos clientes;\n‚Ä¢ Elabora√ß√£o de cen√°rios de testes;\n‚Ä¢ Experi√™ncia na integra√ß√£o de sistemas legados com o SAP SD (ECC/S4Hana);\n‚Ä¢ Experi√™ncia em carga de dados no sistema ‚Äì Master Data e Dados Transacionais","Experi√™ncia na implementa√ß√£o de projetos de SD, participando desde a an√°lise de requisitos e\nlevantamento de dados at√© o suporte p√≥s implementa√ß√£o;\n‚Ä¢ Atendimento de demandas relacionadas a SD de diversos processos de venda, como\nconsigna√ß√£o, retorno, devolu√ß√£o, third-party, nota de cr√©dito/d√©bito, sucata, demonstra√ß√£o, etc;\n‚Ä¢ Experi√™ncia em localiza√ß√£o Brasil;\n‚Ä¢ Experi√™ncia com Nota Fiscal Eletr√¥nica;\n‚Ä¢ Realiza√ß√£o de configura√ß√µes para atender demandas de diferentes processos de vendas, desde\na cria√ß√£o do documento de venda, da remessa e todo o fluxo at√© a fatura e a nota fiscal;\n‚Ä¢ Cria√ß√£o de solu√ß√µes customizadas junto aos clientes;\n‚Ä¢ Elabora√ß√£o de cen√°rios de testes;\n‚Ä¢ Experi√™ncia na integra√ß√£o de sistemas legados com o SAP SD (ECC/S4Hana);\n‚Ä¢ Experi√™ncia em carga de dados no sistema ‚Äì Master Data e Dados Transacionais",SAP SD,47044,Isabelly Vieira,26-02-2025,Emanuelly Vieira,Prospect,,Consultor SAP SD,Consultor SAP SD,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,0.136667,10.0
31763,14218,Java Support Analyst,Mann and Sons,N√£o,Ensino Superior Completo,Analista,Fluente,,‚Ä¢ Hor√°rio de trabalho: Domingo a quinta -feira: 13 √†s 22h.\n‚Ä¢ Candidatos preferencialmente devem estar em Londrina (presencial)/ S√£o Paulo.\n\n‚Ä¢ Ingl√™s avan√ßado/fluente.,"**Job Description: Support Analyst (Unix, SQL, Java L2 Production Support)**\n\n**Role Overview:**\nWe are seeking a skilled and motivated Support Analyst with experience in Unix, SQL, and Java to join our L2 Production Support team. The ideal candidate will provide technical support, troubleshoot complex issues, and ensure the stability and efficiency of production systems. This role involves working closely with development teams, operations, and stakeholders to drive quick resolution of incidents and proactive problem management.\n\n---\n\n**Key Responsibilities:**\n1. **Unix Troubleshooting and Support:**\n- Monitor and troubleshoot applications in Unix environments.\n- Analyze logs to identify and resolve underlying issues.\n- Perform tasks using Unix commands such as `sed`, `awk`, `grep`, `cut`, `tail`, `ps`, `kill`, and others.\n- Manage system performance through capacity management and log segmentation.\n\n2. **Database Management:**\n- Work with RDBMS environments like Sybase ASE/IQ, Oracle, or DB2.\n- Diagnose and resolve database issues, including deadlocks and performance tuning.\n- Write and debug advanced SQL queries, stored procedures, and indexes.\n\n3. **Programming and Scripting:**\n- Utilize structured or object-oriented programming languages (Java, C++, VB, .NET, etc.).\n- Leverage scripting languages like Shell, Perl, Python, or JavaScript for automation and problem-solving.\n- Develop scripts for file parsing, process automation, and log analysis.\n\n4. **Incident and Problem Management:**\n- Handle production incidents, identify patterns, and analyze root causes.\n- Collaborate with App Dev teams to implement effective solutions and process improvements.\n- Manage incidents, problems, and changes within ITIL frameworks.\n\n5. **Team Collaboration and Leadership:**\n- Provide technical guidance to support specialists and junior team members.\n- Facilitate clear communication with stakeholders regarding technical and functional issues.\n- Lead discussions with App Dev and senior stakeholders to drive resolution strategies.\n\n6. **Continuous Improvement:**\n- Observe system performance to suggest and implement proactive optimizations.\n- Stay updated with emerging technologies and best practices in support and development.\n\n---\n\n**Skills and Qualifications:**\n- **Technical Expertise:** Proficiency in Unix environments, advanced SQL queries, and at least one programming language (Java preferred).\n- **Problem-Solving Skills:** Strong analytical skills for identifying root causes and resolving issues in development or production settings.\n- **Communication Skills:** Excellent ability to articulate technical details and coordinate with cross-functional teams.\n- **Experience:** Proven track record in application process management and production support, with hands-on knowledge of incident, problem, and change management processes.\n\n---\n\n**Preferred Qualifications:**\n- Certification in ITIL or relevant frameworks.\n- Exposure to monitoring tools and performance tuning techniques.\n- Experience working in fast-paced, high-pressure production environments.\n\nJoin us to make a meaningful impact on system reliability and performance while growing your career in a dynamic, collaborative environment.",Java Support Analyst,40384,Dr. Vitor Hugo Silva,26-02-2025,Laura Pacheco,Entrevista T√©cnica,,Linux,Linux,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,N√£o informado,0.103333,1.0


## 6) Fun√ß√µes auxiliares para Similaridade e Print do Recrutador

In [6]:

def top_terms_overlap(job_text, cand_text, k=8):
    tok = lambda s: set(re.findall(r"[\w\-\+]+", str(s).lower()))
    jset, cset = tok(job_text), tok(cand_text)
    return {"match_terms": list(jset & cset)[:k], "missing_terms": list(jset - cset)[:k]}

def local_similarity(job_text, cand_text):
    vec = TfidfVectorizer(max_features=2000)
    tfidf = vec.fit_transform([str(job_text), str(cand_text)])
    return float(cosine_similarity(tfidf[0], tfidf[1])[0][0])


## 7) Exportar `train_and_rank.py`

In [7]:

train_code = """
import re, json
import pandas as pd, numpy as np
from sklearn.preprocessing import OneHotEncoder
from sklearn.compose import ColumnTransformer
from sklearn.pipeline import Pipeline
from sklearn.ensemble import RandomForestClassifier
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity

ID_VAGA_COL, ID_CAND_COL, TARGET_COL = "id_vaga", "id_candidato", "target"

def top_terms_overlap(job_text, cand_text, k=8):
    tok = lambda s: set(re.findall(r"[\w\-\+]+", str(s).lower()))
    jset, cset = tok(job_text), tok(cand_text)
    return {"match_terms": list(jset & cset)[:k], "missing_terms": list(jset - cset)[:k]}

def local_similarity(job_text, cand_text):
    vec = TfidfVectorizer(max_features=2000)
    tfidf = vec.fit_transform([str(job_text), str(cand_text)])
    return float(cosine_similarity(tfidf[0], tfidf[1])[0][0])

def run_pipeline(train_path, pending_path, export_dir="/content/artifacts", top_k=10):
    df_train, df_pending = pd.read_csv(train_path), pd.read_csv(pending_path)
    X, y = df_train.drop(columns=[TARGET_COL]), df_train[TARGET_COL]
    cat_cols = X.select_dtypes(include=["object"]).columns.tolist()
    for c in [ID_VAGA_COL, ID_CAND_COL]:
        if c in cat_cols: cat_cols.remove(c)
    preprocessor = ColumnTransformer([("cat", OneHotEncoder(handle_unknown="ignore"), cat_cols)], remainder="passthrough")
    pipe = Pipeline([("preprocess", preprocessor), ("clf", RandomForestClassifier(n_estimators=300, random_state=42))])
    pipe.fit(X, y)
    df_pred = df_pending.copy()
    df_pred["score"] = pipe.predict_proba(df_pred)[:,1]
    df_pred["rank"] = df_pred.groupby(ID_VAGA_COL)["score"].rank(ascending=False, method="first")
    ranking = df_pred[df_pred["rank"] <= top_k].sort_values([ID_VAGA_COL,"rank"]).reset_index(drop=True)
    ranking.to_csv(f"{export_dir}/ranking_por_vaga.csv", index=False)
    cards = ranking[[ID_VAGA_COL, ID_CAND_COL, "score", "rank"]].to_dict(orient="records")
    with open(f"{export_dir}/cards_recrutador.json", "w", encoding="utf-8") as f:
        json.dump(cards, f, ensure_ascii=False, indent=2)
    return ranking
"""

with open(os.path.join(EXPORT_DIR, "train_and_rank.py"), "w", encoding="utf-8") as f:
    f.write(train_code)
print("Arquivo train_and_rank.py exportado!")


Arquivo train_and_rank.py exportado!


  tok = lambda s: set(re.findall(r"[\w\-\+]+", str(s).lower()))


## 8) Exportar `app.py`

In [8]:

app_code = """
import json, pandas as pd, streamlit as st
from train_and_rank import run_pipeline

st.set_page_config(page_title="Netflix das Vagas", layout="wide")
st.title("üé¨ Netflix das Vagas ‚Äî Top 10 Candidatos por Vaga")

train_file = st.file_uploader("CSV de treino (aprovados/reprovados)", type=["csv"])
pending_file = st.file_uploader("CSV de pendentes (n√£o classificados)", type=["csv"])

if train_file and pending_file:
    with open("train.csv","wb") as f: f.write(train_file.getbuffer())
    with open("pending.csv","wb") as f: f.write(pending_file.getbuffer())
    ranking = run_pipeline("train.csv", "pending.csv", export_dir=".")
    st.success("Pipeline executado!")

    vagas = sorted(ranking["id_vaga"].unique().tolist())
    vaga_sel = st.sidebar.selectbox("Selecione a vaga", vagas)
    top = ranking[ranking["id_vaga"]==vaga_sel].sort_values("rank")
    st.subheader(f"Top {len(top)} candidatos para a vaga {vaga_sel}")

    cols = st.columns(5)
    for i, (_, row) in enumerate(top.iterrows()):
        col = cols[i % 5]
        with col:
            st.markdown(f"### üë§ Candidato {row['id_candidato']}")
            st.metric("Score (modelo)", f"{row['score']:.3f}")
            st.caption(f"Rank: {row['rank']}")
    with st.expander("Tabela completa da vaga"):
        st.dataframe(top)
else:
    st.info("Fa√ßa upload dos dois arquivos CSV para rodar o pipeline.")
"""

with open(os.path.join(EXPORT_DIR, "app.py"), "w", encoding="utf-8") as f:
    f.write(app_code)
print("Arquivo app.py exportado!")


Arquivo app.py exportado!


## 9) Exportar `requirements.txt`

In [9]:

reqs = """pandas==2.2.2
numpy==1.26.4
scikit-learn==1.4.2
streamlit==1.32.0
"""

with open(os.path.join(EXPORT_DIR, "requirements.txt"), "w", encoding="utf-8") as f:
    f.write(reqs)
print("Arquivo requirements.txt exportado!")


Arquivo requirements.txt exportado!
