In [17]:
from transformers import pipeline

from langchain_core.prompts import PromptTemplate
from langchain_core.output_parsers import PydanticOutputParser
from langchain_community.llms import HuggingFacePipeline
import torch
from huggingface_hub import InferenceClient


from pydantic import BaseModel
from typing import List

import os
from dotenv import load_dotenv

load_dotenv()

True

In [13]:
token = os.getenv("HF_TOKEN")

In [14]:
class Gap(BaseModel):
    title: str
    description: str
    impact: str
    actions: List[str]

class GapAnalysis(BaseModel):
    company_name: str
    job_title: str
    generation_date: str
    gaps: List[Gap]

In [15]:
print(torch.mps.is_available())
print(torch.mps.device_count())
print(torch.backends.mps.is_built())



True
1
True


In [None]:
hf_pipeline = pipeline(
    "text-generation",
    model="deepseek-ai/DeepSeek-R1-Distill-Qwen-7B",
    max_new_tokens=256,
    device='mps',
    dtype=torch.float16
)

llm = HuggingFacePipeline(pipeline=hf_pipeline)

Loading weights:  16%|‚ñà‚ñå        | 54/339 [00:04<00:23, 12.03it/s, Materializing param=model.layers.4.mlp.up_proj.weight]             


KeyboardInterrupt: 

In [None]:
print(hf_pipeline.model.device)


mps:0


In [None]:
parser = PydanticOutputParser(pydantic_object=GapAnalysis)

In [None]:
prompt = PromptTemplate(
    input_variables=["job_description", "profile"],
    template=
"""
Voc√™ √© um recrutador t√©cnico.

Vaga:
{job_description}

Perfil do candidato:
{profile}

Tarefa:
Analise a vaga e o perfil do candidato e gere uma an√°lise de gaps retorne em formato JSON.
""",
    partial_variables={
        "format_instructions": parser.get_format_instructions()
    }
)

In [None]:
parser.get_format_instructions()

'The output should be formatted as a JSON instance that conforms to the JSON schema below.\n\nAs an example, for the schema {"properties": {"foo": {"title": "Foo", "description": "a list of strings", "type": "array", "items": {"type": "string"}}}, "required": ["foo"]}\nthe object {"foo": ["bar", "baz"]} is a well-formatted instance of the schema. The object {"properties": {"foo": ["bar", "baz"]}} is not well-formatted.\n\nHere is the output schema:\n```\n{"$defs": {"Gap": {"properties": {"title": {"title": "Title", "type": "string"}, "description": {"title": "Description", "type": "string"}, "impact": {"title": "Impact", "type": "string"}, "actions": {"items": {"type": "string"}, "title": "Actions", "type": "array"}}, "required": ["title", "description", "impact", "actions"], "title": "Gap", "type": "object"}}, "properties": {"company_name": {"title": "Company Name", "type": "string"}, "job_title": {"title": "Job Title", "type": "string"}, "generation_date": {"title": "Generation Date"

In [None]:
chain = prompt | llm | parser

In [None]:
with open('./01_jobs/job_1.txt', 'r') as f:

    job_description = f.read()

job_description

'Descri√ß√£o da vaga\n\nBuscamos profissional com especialidade em aplicar Intelig√™ncia Artificial Generativa para integrar nossa equipe de projetos voltados ao atendimento ao cliente. Como integrante do time, ser√° respons√°vel por desenvolver e implementar globalmente solu√ß√µes inovadoras utilizando principalmente tecnologias de IA generativa, contribuindo diretamente para otimizar nosso neg√≥cio e transformar a experi√™ncia do cliente atrav√©s de solu√ß√µes tecnol√≥gicas avan√ßadas.\n\nResponsabilidades e atribui√ß√µes\n\nDesenvolver de ponta a ponta solu√ß√µes de neg√≥cio utilizando tecnologias de IA generativa e aprendizado de m√°quina;\nUtilizar ferramentas low/no-code como aceleradores do desenvolvimento e implementa√ß√£o de solu√ß√µes;\nIdentificar e implementar solu√ß√µes t√©cnicas otimizadas para atender requisitos espec√≠ficos de projeto;\nAnalisar sistematicamente oportunidades de melhoria cont√≠nua em sistemas j√° desenvolvidos;\nMaximizar a escalabilidade, desempenho, u

In [None]:
with open('./02_source/source.txt', 'r') as f:

    source = f.read()

source

'Felipe Castro\nData Scientist | Machine Learning | NLP | Applied AI\nS√£o Paulo ‚Äì SP | (11) 93938-8082 | felmateos@alumni.usp.br | linkedin.com/in/felmateos | github.com/felmateos | kaggle.com/felmateos\nEXPERI√äNCIA PROFISSIONAL\nIta√∫ Unibanco 2025 ‚Äì 2026\nAnalista de Dados S√£o Paulo, SP\n‚Ä¢ Desenvolvimento de modelo de Reconhecimento de Entidades Nomeadas (NER) com aprendizado supervisionado e fine-tuning de LLMs.\n‚Ä¢ Aplica√ß√£o em textos corporativos para identifica√ß√£o autom√°tica de produtos e volumes, aumentando a rastreabilidade de ofertas.\n‚Ä¢ Uso de Python, Transformers e PyTorch em ambiente produtivo.\nIta√∫ Unibanco 2024 ‚Äì 2025\nEstagi√°rio de Ci√™ncia de Dados S√£o Paulo, SP\n‚Ä¢ Sistema de OCR com extra√ß√£o autom√°tica de entidades e valores em documentos estruturados e semiestruturados.\n‚Ä¢ Uso de IA Generativa para substituir processos manuais, reduzindo tempo de processamento e aumentando efici√™ncia operacional.\nUSP ‚Äì C4AI / IBM / FAPESP 2023 ‚Äì 202

In [None]:
result = chain.invoke({
    "job_description": job_description,
    "profile": source
})

print(result)

Both `max_new_tokens` (=256) and `max_length`(=20) seem to have been set. `max_new_tokens` will take precedence. Please refer to the documentation for more information. (https://huggingface.co/docs/transformers/main/en/main_classes/text_generation)


: 

: 

In [None]:
response = client.text_generation(
    prompt,
    max_new_tokens=256,
    temperature=0.0
)
