In [1]:
from transformers import pipeline

from langchain_core.prompts import PromptTemplate
from langchain_core.output_parsers import PydanticOutputParser
from langchain_community.llms import HuggingFacePipeline
import torch

from pydantic import BaseModel
from typing import List

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
class Gap(BaseModel):
    title: str
    description: str
    impact: str
    actions: List[str]

class GapAnalysis(BaseModel):
    company_name: str
    job_title: str
    generation_date: str
    gaps: List[Gap]

In [3]:
print(torch.cuda.is_available())
print(torch.cuda.device_count())
print(torch.cuda.get_device_name(0))

True
1
NVIDIA GeForce RTX 3050 Laptop GPU


In [None]:
torch.version.cuda

'12.8'

: 

In [None]:
hf_pipeline = pipeline(
    "text-generation",
    model="Qwen/Qwen2.5-7B-Instruct",
    max_new_tokens=3400,
    device=0,
    torch_dtype=torch.float16
)

llm = HuggingFacePipeline(pipeline=hf_pipeline)

`torch_dtype` is deprecated! Use `dtype` instead!
Loading weights:  86%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñå | 292/339 [00:05<00:00, 52.88it/s, Materializing param=model.layers.24.mlp.down_proj.weight]           

In [None]:
parser = PydanticOutputParser(pydantic_object=GapAnalysis)

In [None]:
prompt = PromptTemplate(
    input_variables=["job_description", "profile"],
    template=
"""
Voc√™ √© um recrutador t√©cnico.

Vaga:
{job_description}

Perfil do candidato:
{profile}

Tarefa:
Analise a vaga e o perfil do candidato e gere uma an√°lise de gaps.
""",
    partial_variables={
        "format_instructions": parser.get_format_instructions()
    }
)

In [None]:
chain = prompt | llm | parser

In [None]:
with open('./01_jobs/job_1.txt', 'r') as f:

    job_description = f.read()

job_description

'Descri√ß√£o da vaga\n\nBuscamos profissional com especialidade em aplicar Intelig√™ncia Artificial Generativa para integrar nossa equipe de projetos voltados ao atendimento ao cliente. Como integrante do time, ser√° respons√°vel por desenvolver e implementar globalmente solu√ß√µes inovadoras utilizando principalmente tecnologias de IA generativa, contribuindo diretamente para otimizar nosso neg√≥cio e transformar a experi√™ncia do cliente atrav√©s de solu√ß√µes tecnol√≥gicas avan√ßadas.\n\nResponsabilidades e atribui√ß√µes\n\nDesenvolver de ponta a ponta solu√ß√µes de neg√≥cio utilizando tecnologias de IA generativa e aprendizado de m√°quina;\nUtilizar ferramentas low/no-code como aceleradores do desenvolvimento e implementa√ß√£o de solu√ß√µes;\nIdentificar e implementar solu√ß√µes t√©cnicas otimizadas para atender requisitos espec√≠ficos de projeto;\nAnalisar sistematicamente oportunidades de melhoria cont√≠nua em sistemas j√° desenvolvidos;\nMaximizar a escalabilidade, desempenho, u

In [None]:
with open('./02_source/source.txt', 'r') as f:

    source = f.read()

source

'Felipe Castro\nData Scientist | Machine Learning | NLP | Applied AI\nS√£o Paulo ‚Äì SP | (11) 93938-8082 | felmateos@alumni.usp.br | linkedin.com/in/felmateos | github.com/felmateos | kaggle.com/felmateos\nEXPERI√äNCIA PROFISSIONAL\nIta√∫ Unibanco 2025 ‚Äì 2026\nAnalista de Dados S√£o Paulo, SP\n‚Ä¢ Desenvolvimento de modelo de Reconhecimento de Entidades Nomeadas (NER) com aprendizado supervisionado e fine-tuning de LLMs.\n‚Ä¢ Aplica√ß√£o em textos corporativos para identifica√ß√£o autom√°tica de produtos e volumes, aumentando a rastreabilidade de ofertas.\n‚Ä¢ Uso de Python, Transformers e PyTorch em ambiente produtivo.\nIta√∫ Unibanco 2024 ‚Äì 2025\nEstagi√°rio de Ci√™ncia de Dados S√£o Paulo, SP\n‚Ä¢ Sistema de OCR com extra√ß√£o autom√°tica de entidades e valores em documentos estruturados e semiestruturados.\n‚Ä¢ Uso de IA Generativa para substituir processos manuais, reduzindo tempo de processamento e aumentando efici√™ncia operacional.\nUSP ‚Äì C4AI / IBM / FAPESP 2023 ‚Äì 202

In [None]:
result = chain.invoke({
    "job_description": job_description,
    "profile": source
})

print(result)

Token indices sequence length is longer than the specified maximum sequence length for this model (3400 > 512). Running this sequence through the model will result in indexing errors
Both `max_new_tokens` (=3400) and `max_length`(=20) seem to have been set. `max_new_tokens` will take precedence. Please refer to the documentation for more information. (https://huggingface.co/docs/transformers/main/en/main_classes/text_generation)


OutputParserException: Invalid json output: Voc√™ √© um recrutador t√©cnico.

Vaga:
Descri√ß√£o da vaga

Buscamos profissional com especialidade em aplicar Intelig√™ncia Artificial Generativa para integrar nossa equipe de projetos voltados ao atendimento ao cliente. Como integrante do time, ser√° respons√°vel por desenvolver e implementar globalmente solu√ß√µes inovadoras utilizando principalmente tecnologias de IA generativa, contribuindo diretamente para otimizar nosso neg√≥cio e transformar a experi√™ncia do cliente atrav√©s de solu√ß√µes tecnol√≥gicas avan√ßadas.

Responsabilidades e atribui√ß√µes

Desenvolver de ponta a ponta solu√ß√µes de neg√≥cio utilizando tecnologias de IA generativa e aprendizado de m√°quina;
Utilizar ferramentas low/no-code como aceleradores do desenvolvimento e implementa√ß√£o de solu√ß√µes;
Identificar e implementar solu√ß√µes t√©cnicas otimizadas para atender requisitos espec√≠ficos de projeto;
Analisar sistematicamente oportunidades de melhoria cont√≠nua em sistemas j√° desenvolvidos;
Maximizar a escalabilidade, desempenho, usabilidade e confiabilidade dos aplicativos desenvolvidos;
Demonstrar iniciativa de aprendizado aut√¥nomo e atualiza√ß√£o constante sobre novas tecnologias emergentes;
Participar ativamente dos eventos Scrum e garantir comprometimento com cronogramas e entregas acordadas;
Elaborar documenta√ß√£o t√©cnica detalhada do projeto.

Requisitos e qualifica√ß√µes

Experi√™ncia profissional comprovada no desenvolvimento de chatbots, agentes de IA e sistemas aut√¥nomos utilizando modelos de linguagem avan√ßados;
Profici√™ncia em programa√ß√£o Python e bibliotecas relacionadas a IA/ML;
Experi√™ncia s√≥lida no desenvolvimento e implementa√ß√£o de APIs RESTful;
Profici√™ncia na linguagem SQL;
Compreens√£o dos fundamentos te√≥ricos dos modelos generativos de linguagem e suas aplica√ß√µes pr√°ticas;
Conhecimento t√©cnico em Engenharia de Prompt;
Experi√™ncia com plataformas de computa√ß√£o em nuvem: Azure, Google Cloud ou AWS;
Forma√ß√£o superior completa;
Ingl√™s avan√ßado/fluente.

Diferenciais:

Experi√™ncia pr√°tica com Microsoft Power Platform, especialmente Copilot Studio, Power Apps e Power Automate;
Desenvolvimento de agentes de voz utilizando tecnologias de IA generativa;
Experi√™ncia em fine-tuning e contextualiza√ß√£o de modelos de linguagem para casos de uso espec√≠ficos;
Familiaridade com Databricks e com ecossistema Azure (AI Foundry, AI services, Speech services, AI search e ML);
Experi√™ncia profissional no setor de Consumer Packaged Goods (CPG);
J√° ter trabalhado sob a metodologia Agile e framework Scrum.

Informa√ß√µes adicionais

Vale refei√ß√£o ou alimenta√ß√£o ifood;
Vale transporte;
B√¥nus;
Plano de sa√∫de e Telemedicina;
Conv√™nio odontol√≥gico;
Conv√™nio Farm√°cia;
Seguro de vida;
Instituto Ambev de Previd√™ncia Privada;
Aux√≠lio Material Escolar;
Cesta de Natal e Kit Congelado;
Brinquedos de Natal;
Empresa cidad√£ (licen√ßa maternidade e paternidade) e presente do beb√™;
Desconto mensal em produtos AMBEV;
Banco de horas;
Wellhub (Gympass);
Fretado;
Abono anual referente a um sal√°rio.

OL√Å, SOMOS A AMBEV TECH! üíõüçªüíª

Isso mesmo, o Hub de Tecnologia da Ambev!

Somos respons√°veis por impulsionar a transforma√ß√£o digital da Ambev. O match perfeito entre o portf√≥lio da maior cervejaria do mundo e solu√ß√µes de Data & Analytics, Ciberseguran√ßa, Infraestrutura, Suporte, Field, Engenharia e Arquitetura de Software. Contamos com cerca de 50 Squads, que atuam em mais de 100 produtos, e cada linha de c√≥digo criada aqui conecta nossa paix√£o por tecnologia aos mais diversos brindes e suas raz√µes.

Do campo ao copo, entregamos solu√ß√µes simples e escal√°veis usando tecnologia de ponta para transformar o dia a dia de milhares de pessoas. E isso s√≥ √© poss√≠vel gra√ßas a um time incr√≠vel que faz acontecer, com inova√ß√£o, senso de dono e muito orgulho de ser tech.

PROTAGONIZAMOS SOLU√á√ïES GLOBAIS

Muitas das nossas solu√ß√µes s√£o escaladas para a Ambev Global Tech, hub de tecnologia da Anheuser-Busch InBev (AB InBev), multinacional de bebidas e cervejas, e para outras unidades de neg√≥cio da companhia. Com escrit√≥rios espalhados por pa√≠ses como Estados Unidos, M√©xico, √çndia, Argentina e Brasil, estamos conectados a uma rede global de inova√ß√£o e tecnologia para transformar a Ambev em uma plataforma que conecta pessoas e o ecossistema.

NOSSO JEITO TECH DE SER

Por aqui, sonhamos grande e sabemos a import√¢ncia de ter equipes cada vez mais diversas. √â atrav√©s da pluralidade de ideias, experi√™ncias e opini√µes que conseguimos pensar fora da caixa e criar solu√ß√µes inovadoras. Por isso, contamos com nosso Comit√™ de Autenticidade Tech para olhar com muito carinho e responsabilidade todas as quest√µes relacionadas √† inclus√£o.

QUER TRABALHAR COM A GENTE?

Para atuar na Ambev Tech com projetos nacionais, temos unidades em Blumenau (SC), Maring√° (PR), S√£o Paulo (SP) e Jaguari√∫na (SP), e contamos tamb√©m com um time remoto em v√°rios cantos do Brasil e Am√©rica Latina. Atuamos com os modelos de trabalho remoto, h√≠brido e presencial, que ir√£o depender da especifica√ß√£o da vaga e de sua localidade, combinado?

Para projetos internacionais, na Ambev Global Tech, a contrata√ß√£o acontece no modelo presencial, em Campinas (SP).

Quer criar solu√ß√µes que v√£o do campo ao copo, do c√≥digo √† mesa do bar? Vem com a gente e confira todas as nossas oportunidades!

We‚Äôre here for tech and beer.



Perfil do candidato:
Felipe Castro
Data Scientist | Machine Learning | NLP | Applied AI
S√£o Paulo ‚Äì SP | (11) 93938-8082 | felmateos@alumni.usp.br | linkedin.com/in/felmateos | github.com/felmateos | kaggle.com/felmateos
EXPERI√äNCIA PROFISSIONAL
Ita√∫ Unibanco 2025 ‚Äì 2026
Analista de Dados S√£o Paulo, SP
‚Ä¢ Desenvolvimento de modelo de Reconhecimento de Entidades Nomeadas (NER) com aprendizado supervisionado e fine-tuning de LLMs.
‚Ä¢ Aplica√ß√£o em textos corporativos para identifica√ß√£o autom√°tica de produtos e volumes, aumentando a rastreabilidade de ofertas.
‚Ä¢ Uso de Python, Transformers e PyTorch em ambiente produtivo.
Ita√∫ Unibanco 2024 ‚Äì 2025
Estagi√°rio de Ci√™ncia de Dados S√£o Paulo, SP
‚Ä¢ Sistema de OCR com extra√ß√£o autom√°tica de entidades e valores em documentos estruturados e semiestruturados.
‚Ä¢ Uso de IA Generativa para substituir processos manuais, reduzindo tempo de processamento e aumentando efici√™ncia operacional.
USP ‚Äì C4AI / IBM / FAPESP 2023 ‚Äì 2024
Pesquisador Bolsista em Processamento de Linguagem Natural S√£o Paulo, SP
‚Ä¢ Inicia√ß√£o Cient√≠fica em classifica√ß√£o morfossint√°tica de textos sobre vacina√ß√£o contra COVID-19.
‚Ä¢ EDA, limpeza, rotula√ß√£o com ferramentas de PLN e an√°lise de distribui√ß√£o dos dados.
FORMA√á√ÉO ACAD√äMICA
Universidade de S√£o Paulo (USP) S√£o Paulo, SP
Mestrado em Sistemas de Informa√ß√£o in√≠cio previsto Mar 2026
Universidade de S√£o Paulo (USP) S√£o Paulo, SP
Bacharelado em Sistemas de Informa√ß√£o 2020 ‚Äì 2024
PROJETOS
Predi√ß√£o de Renda com Machine Learning 2025
Projeto de Ci√™ncia de Dados ‚Äì Kaggle
‚Ä¢ Pipeline de ML estruturado com Kedro para predi√ß√£o de renda anual.
‚Ä¢ Valida√ß√£o cruzada estratificada e avalia√ß√£o com F1-score e Precision-Recall para dados desbalanceados.
‚Ä¢ An√°lises estat√≠sticas e interpreta√ß√£o de vari√°veis para gera√ß√£o de insights socioecon√¥micos.
‚Ä¢ GitHub: github.com/felmateos/income-analysis
ATIVIDADES EXTRACURRICULARES
USP ‚Äì Diret√≥rio Acad√™mico de Sistemas de Informa√ß√£o 2023
Monitor de Introdu√ß√£o √† Programa√ß√£o S√£o Paulo, SP
HYPE ‚Äì Ci√™ncia de Dados (Entidade Estudantil) 2022 ‚Äì 2024
Diretor de Gest√£o de Pessoas S√£o Paulo, SP
CERTIFICA√á√ïES
CS50P ‚Äì Introduction to Programming with Python ‚Äî Harvard University (2024)
SQL for Data Science ‚Äî University of California, Davis (2024)
Artificial Intelligence Fundamentals ‚Äî IBM (2023)
Data Science Foundations ‚Äî IBM (2023)
CONHECIMENTOS
Linguagens: Python, SQL | Bibliotecas: Pandas, NumPy, scikit-learn, PyTorch, Transformers, TensorFlow
Ferramentas: AWS, Git, DataBricks, Kedro, QuickSight | Metodologias: Scrum, CRISP-DM | Idiomas: Portugu√™s Nativo, Ingl√™s C1

Tarefa:
Analise a vaga e o perfil do candidato e gere uma an√°lise de gaps.
For troubleshooting, visit: https://docs.langchain.com/oss/python/langchain/errors/OUTPUT_PARSING_FAILURE 