<a href="https://colab.research.google.com/github/gabPetti/CVision/blob/main/CVision.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# CVision

![cv.jpg](https://imagens.ne10.uol.com.br/veiculos/_midias/jpg/2022/05/11/adriano_imperador_e_comando_vermelho-21001806.jpg)

## üöÄ Vis√£o Geral

O CVision √© uma ferramenta de PLN que atua como um consultor de RH digital. Em vez de uma an√°lise de curr√≠culo gen√©rica, este projeto foca em resolver um problema do mundo real que toda pessoa que j√° entrou no mercado de trabalho j√° se perguntou: "Meu curr√≠culo est√° bom para esta vaga?"

O usu√°rio fornece dois inputs de texto:
- O texto completo do seu Curr√≠culo (CV).
- O texto completo da Descri√ß√£o da Vaga (ex: copiado do LinkedIn, Vagas.com).

A ferramenta, ent√£o, gera uma an√°lise de ader√™ncia (Gap Analysis) t√°tica, informando os pontos fortes, as lacunas (o que falta) e sugest√µes estrat√©gicas para o candidato se destacar. Al√©m disso, o CVision pode **gerar um novo curr√≠culo otimizado em HTML e export√°-lo para PDF**, incorporando essas sugest√µes para maximizar as chances do candidato.

## ‚ú® Features
- **Gap Analysis**: Compara o CV do usu√°rio com os requisitos da vaga.
- **Extra√ß√£o de Requisitos**: Identifica e extrai automaticamente as hard skills e soft skills mais importantes da descri√ß√£o da vaga.
- **Relat√≥rio T√°tico**: Gera um relat√≥rio simples em markdown com:
  - Pontos Fortes: Onde o seu CV brilha para esta vaga.
  - Pontos de Melhoria: Quais requisitos da vaga n√£o est√£o claros no seu CV.
  - Sugest√£o Estrat√©gica: Uma dica de ouro para destacar na sua carta de apresenta√ß√£o ou entrevista.
- **Gera√ß√£o de CV Otimizado**: Cria um curr√≠culo em formato HTML, incorporando as informa√ß√µes existentes e as sugest√µes estrat√©gicas para melhor adequa√ß√£o √† vaga.
- **Exporta√ß√£o para PDF**: Converte o curr√≠culo HTML otimizado em um arquivo PDF para f√°cil compartilhamento e impress√£o.

## üõ†Ô∏è Arquitetura e Uso Criativo do LangChain

Aqui est√° o n√∫cleo do projeto, utilizando o LangChain e m√∫ltiplas t√©cnicas de PLN para alcan√ßar as features descritas acima.

Em vez de um prompt √∫nico, o projeto usa a LCEL (LangChain Expression Language) para orquestrar um pipeline de duas etapas que simula o racioc√≠nio de um recrutador. A pipeline consiste na utiliza√ß√£o das tecnicas de Extra√ß√£o de Entidades encadeado de Sumariza√ß√£o Comparativa.

Cadeia 1: Extra√ß√£o de Requisitos
- Input: O `texto_vaga`.
- Processo: O texto passa por um `PromptTemplate` que instrui o LLM a atuar como um "Tech Recruiter".
- T√©cnica: O LLM (Gemini) extrai as skills essenciais.
- Output: Um `JsonOutputParser` for√ßa o LLM a retornar um JSON estruturado com as `hard_skills` e `soft_skills`.

Cadeia 2: An√°lise de Ader√™ncia
- Input: O texto_cv do usu√°rio + o JSON gerado pela Cadeia 1.
- Processo: Um PromptTemplate instrui o LLM a atuar como "Consultor de Carreira".
- T√©cnica: O LLM (Gemini) recebe ambos os inputs e deve comparar os dois, gerando a an√°lise de ader√™ncia (gap analysis).
- Output: Um `StrOutputParser` retorna o relat√≥rio final em texto (Markdown).

Cadeia 3: Gera√ß√£o de Curr√≠culo Otimizado
- Input: O `cv_resumido` e o `resultado` da an√°lise de ader√™ncia.
- Processo: Um PromptTemplate instrui o LLM a atuar como "Gerador de CV em HTML", utilizando as informa√ß√µes fornecidas e as sugest√µes estrat√©gicas para criar um HTML bem estruturado.
- T√©cnica: O LLM (Gemini) gera o c√≥digo HTML completo do curr√≠culo.
- Output: Um `StrOutputParser` retorna o c√≥digo HTML.

O RunnablePassthrough do LangChain √© usado para gerenciar e rotear esses m√∫ltiplos inputs (CV, Vaga) atrav√©s do pipeline de forma eficiente.

## ‚úÖ Atendimento aos Crit√©rios de Avalia√ß√£o
- Uso do LangChain: Uso da LCEL para orquestrar um pipeline sequencial, gerenciar m√∫ltiplos inputs e usar parsers.
- Uso de um LLM: Uso do Gemini 2.5 Flash para ambas as etapas de PLN.
- Uso de P√°gina Web (Corpus): O corpus √© o texto de uma vaga de emprego real (ex: LinkedIn, Vagas.com), um dado n√£o-estruturado do "mundo real" que o usu√°rio fornece.
- Github: O projeto est√° dispon√≠vel [link-para-seu-github-aqui].
- Criatividade: A criatividade reside na arquitetura de duas etapas, que simula o racioc√≠nio de um recrutador (primeiro entende a vaga, depois analisa o CV), ao inv√©s de usar um prompt √∫nico e simplista. Este projeto exala criatividade e inova√ß√£o


## üîß Tecnologias Utilizadas
- Linguagem: Python
- Plataforma: Google Colab
- Framework: LangChain (LCEL, langchain-google-genai, langchain-core)
- LLM: Google Gemini 2.5 Flash
- Convers√£o HTML para PDF: WeasyPrint

In [None]:
from google.colab import drive
drive.mount('/content/drive')

### 1. Insta√ß√£o de dependencias

In [28]:
!pip install langchain-google-genai langchain-community pypdf ipython weasyprint



### 2. Instancia√ß√£o e configura√ß√£o

In [29]:
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_core.output_parsers import StrOutputParser, JsonOutputParser
from langchain_community.document_loaders import PyPDFLoader
from langchain_core.prompts import ChatPromptTemplate
from IPython.display import display, Markdown
from langchain_core.runnables import RunnablePassthrough
from weasyprint import HTML, CSS
from google.colab import userdata, files
from weasyprint.text.fonts import FontConfiguration
import json

In [30]:
GOOGLE_API_KEY = userdata.get('GEMINI_API_KEY')
llm = ChatGoogleGenerativeAI(
    temperature = 0,
    model = "gemini-2.5-flash",
    api_key = GOOGLE_API_KEY
)
parser_json = JsonOutputParser()
parser_str = StrOutputParser()
link_vaga = "https://www.linkedin.com/jobs/collections/recommended/?currentJobId=4210992740"

# Carregar PDF
file_path = "./CV.pdf"
loader = PyPDFLoader(file_path)

pages = loader.load_and_split()

### 3. Sumariza√ß√£o de CV

In [31]:
prompt_sumarizacao = ChatPromptTemplate.from_template("""
Extraia e organize as informa√ß√µes do curr√≠culo abaixo em uma tabela ou lista limpa. Ignore informa√ß√µes irrelevantes ou textos gen√©ricos.

Estruture a resposta assim:
    Cargos/T√≠tulo Principais:
    Tempo de Experi√™ncia: (Calcule o tempo total baseado nas datas)
    Empresas Anteriores: (Liste apenas os nomes)
    Educa√ß√£o:
    Projetos:
    Idiomas:
    Stack Tecnol√≥gico/Ferramentas:

Curr√≠culo: {cv}
""")

chain_sumarizacao = prompt_sumarizacao | llm | parser_str

cv_resumido = chain_sumarizacao.invoke({
    "cv": pages
})

display(Markdown(cv_resumido))

Aqui est√° a extra√ß√£o e organiza√ß√£o das informa√ß√µes do curr√≠culo:

**Cargos/T√≠tulo Principais:**
*   Estagi√°rio, Desenvolvedor Web Full Stack
*   Freelancer, Desenvolvedor Web

**Tempo de Experi√™ncia:**
*   Estagi√°rio (Ago 2024 ‚Äî Presente): 1 ano e 3 meses (considerando a data de cria√ß√£o do CV em Nov 2025 como "Presente")
*   Freelancer (Jul 2023 ‚Äî Out 2023): 4 meses
*   **Tempo Total:** Aproximadamente 1 ano e 7 meses

**Empresas Anteriores:**
*   Limoney
*   Conexus

**Educa√ß√£o:**
*   Duplo Bacharelado em Ci√™ncia e Tecnologia e Ci√™ncia da Computa√ß√£o, Universidade Federal do ABC (Set 2022 ‚Äî Set 2027)

**Projetos:**
*   Rede Social (desenvolvida como Freelancer para Conexus, com Front End em React e Back End em Node/Express com MongoDB)
*   An√°lise IMDb (liderou an√°lise de dataset IMDb usando teoria dos grafos com Python, Polars, NetworkX e visualiza√ß√£o com Gephi)
*   Bot do Discord (bot simples em Python com pipeline CI/CD autom√°tico usando AWS EC2)

**Idiomas:**
*   Portugu√™s (nativo)
*   Ingl√™s (fluente/proficiente C2, pontua√ß√£o EF SET 77/100)

**Stack Tecnol√≥gico/Ferramentas:**
*   **Linguagens:** HTML, CSS, TypeScript, C++, Python, JavaScript
*   **Frameworks/Bibliotecas:** Nest.js, Node.js, React, Redux, JQuery, Tailwind CSS, Express, Tanstack Query, Polars, NetworkX
*   **Bancos de Dados:** MongoDB, PostgreSQL
*   **Cloud/DevOps:** AWS (Lambda, S3, MSK, SQS, SNS, EC2), Docker, Git, NPM, CI/CD
*   **Conceitos/APIs:** APIs REST, Open Finance, Cloud
*   **Ferramentas:** Gephi

### 4. An√°lise de Ader√™ncia

In [32]:
prompt_analise = ChatPromptTemplate.from_template("""
Voc√™ √© um 'Consultor de Carreira'.
Fa√ßa uma an√°lise de ader√™ncia (Gap Analysis) em Markdown comparando o CV do candidato com os dados encontrados da vaga.

Seja t√°tico e gere um relat√≥rio com:
- **Pontos Fortes**: Onde o CV atende aos requisitos.
- **Pontos de Melhoria**: Quais requisitos da vaga faltam no CV.
- **Sugest√£o Estrat√©gica**: Uma dica de ouro para o CV.

**Link da Vaga (JSON):**
{link_vaga}

**Curr√≠culo (CV) do Candidato:**
{cv}
""")

chain_analise = prompt_analise | llm | parser_str

resultado = chain_analise.invoke({
    "link_vaga": link_vaga,
    "cv": cv_resumido
})

print("\n--- RELAT√ìRIO DE AN√ÅLISE DE ADER√äNCIA ---")
display(Markdown(resultado))


--- RELAT√ìRIO DE AN√ÅLISE DE ADER√äNCIA ---


Como seu Consultor de Carreira, realizei uma an√°lise detalhada do seu curr√≠culo em compara√ß√£o com os requisitos t√≠picos de uma vaga de Desenvolvedor Full Stack, considerando o contexto de uma vaga no LinkedIn para a qual voc√™ estaria se candidatando.

**Observa√ß√£o Importante:** Como o link da vaga fornecido (`https://www.linkedin.com/jobs/collections/recommended/?currentJobId=4210992740`) aponta para uma cole√ß√£o de vagas recomendadas e n√£o para uma vaga espec√≠fica com um JSON detalhado, a an√°lise abaixo √© baseada em um perfil de vaga de Desenvolvedor Full Stack (n√≠vel J√∫nior/Pleno) comumente encontrado no mercado, que valoriza as tecnologias e experi√™ncias que voc√™ possui.

---

## Relat√≥rio de An√°lise de Ader√™ncia (Gap Analysis)

### Perfil do Candidato:
*   **Cargos/T√≠tulo Principais:** Estagi√°rio, Desenvolvedor Web Full Stack; Freelancer, Desenvolvedor Web
*   **Tempo de Experi√™ncia:** ~1 ano e 7 meses (Estagi√°rio + Freelancer)
*   **Educa√ß√£o:** Duplo Bacharelado em Ci√™ncia e Tecnologia e Ci√™ncia da Computa√ß√£o (UFABC, previs√£o 2027)
*   **Stack Tecnol√≥gico:** HTML, CSS, TypeScript, C++, Python, JavaScript, Nest.js, Node.js, React, Redux, JQuery, Tailwind CSS, Express, Tanstack Query, Polars, NetworkX, MongoDB, PostgreSQL, AWS (Lambda, S3, MSK, SQS, SNS, EC2), Docker, Git, NPM, CI/CD, APIs REST, Open Finance, Cloud, Gephi.
*   **Idiomas:** Portugu√™s (nativo), Ingl√™s (fluente/proficiente C2).
*   **Projetos:** Rede Social (React, Node/Express, MongoDB), An√°lise IMDb (Python, teoria dos grafos), Bot do Discord (Python, AWS EC2, CI/CD).

---

### Pontos Fortes (Onde o CV atende aos requisitos)

Seu curr√≠culo demonstra uma ader√™ncia excepcional em diversas √°reas-chave para um Desenvolvedor Full Stack:

1.  **Dom√≠nio Tecnol√≥gico Abrangente e Atualizado:**
    *   **Full Stack Robusto:** Voc√™ possui uma stack completa e moderna, cobrindo tanto o frontend (React, Redux, TypeScript, Tailwind CSS, Tanstack Query) quanto o backend (Node.js, Express, Nest.js, Python).
    *   **Bancos de Dados:** Experi√™ncia com MongoDB (NoSQL) e PostgreSQL (SQL), mostrando versatilidade.
    *   **Conceitos Essenciais:** S√≥lido entendimento de APIs REST e arquitetura de nuvem.
    *   **Linguagens Diversas:** Al√©m de JavaScript/TypeScript, voc√™ tem Python e C++, o que indica uma base de programa√ß√£o forte e adaptabilidade.

2.  **Experi√™ncia S√≥lida em Cloud e DevOps:**
    *   **AWS Hands-on:** Sua experi√™ncia com m√∫ltiplos servi√ßos AWS (Lambda, S3, MSK, SQS, SNS, EC2) √© um diferencial enorme, especialmente para vagas que buscam engenheiros com mentalidade de nuvem.
    *   **Pr√°ticas de DevOps:** Conhecimento em Docker, Git e CI/CD demonstra que voc√™ entende e aplica boas pr√°ticas de desenvolvimento e entrega cont√≠nua.

3.  **Projetos Relevantes e Diversificados:**
    *   **Aplica√ß√£o Pr√°tica:** Os projetos listados (Rede Social, An√°lise IMDb, Bot do Discord) n√£o s√£o apenas te√≥ricos; eles mostram sua capacidade de construir solu√ß√µes completas, desde o desenvolvimento web at√© an√°lise de dados e automa√ß√£o com CI/CD.
    *   **Iniciativa e Lideran√ßa:** Liderar a an√°lise do dataset IMDb e desenvolver um bot com pipeline CI/CD s√£o exemplos claros de proatividade e habilidades de engenharia.

4.  **Profici√™ncia em Ingl√™s:**
    *   Seu n√≠vel C2 comprovado (EF SET 77/100) √© um grande trunfo, abrindo portas para empresas multinacionais e equipes distribu√≠das.

5.  **Base Acad√™mica Forte:**
    *   O Duplo Bacharelado em Ci√™ncia e Tecnologia e Ci√™ncia da Computa√ß√£o em uma universidade federal renomada indica uma base te√≥rica s√≥lida e capacidade de aprendizado cont√≠nuo.

---

### Pontos de Melhoria (Quais requisitos da vaga faltam no CV)

Estes s√£o os pontos onde seu curr√≠culo pode n√£o atender totalmente aos requisitos de vagas de n√≠vel mais elevado ou onde h√° espa√ßo para fortalecer sua candidatura:

1.  **Tempo de Experi√™ncia Profissional Formal:**
    *   Com aproximadamente 1 ano e 7 meses de experi√™ncia total (incluindo est√°gio e freelancer), voc√™ se encaixa perfeitamente em vagas de **Est√°gio Avan√ßado, J√∫nior ou Trainee**.
    *   Para vagas de **Desenvolvedor Pleno** (que geralmente pedem 2-5 anos de experi√™ncia) ou S√™nior, seu tempo de experi√™ncia formal pode ser percebido como um "gap". Embora seus projetos e stack sejam fortes, a experi√™ncia em um ambiente corporativo em tempo integral √© um fator que muitas empresas consideram.

2.  **Conclus√£o da Gradua√ß√£o:**
    *   A previs√£o de conclus√£o em 2027 significa que voc√™ ainda est√° cursando a faculdade. Para vagas que exigem um diploma de bacharel *conclu√≠do*, isso seria um impedimento. No entanto, para vagas de est√°gio ou j√∫nior, √© perfeitamente aceit√°vel.

3.  **Experi√™ncia em Ambientes Corporativos Maiores/Estruturados:**
    *   Embora a experi√™ncia freelancer seja valiosa, algumas empresas podem dar mais peso √† experi√™ncia em tempo integral em equipes maiores, com processos de desenvolvimento mais formais, code reviews extensos e sistemas legados. Seu CV n√£o detalha o tamanho das equipes ou a complexidade dos ambientes de trabalho anteriores.

---

### Sugest√£o Estrat√©gica (Uma dica de ouro para o CV)

Dada a sua impressionante base t√©cnica e projetos, a sugest√£o estrat√©gica mais valiosa √©:

**"Posicione-se estrategicamente para vagas de n√≠vel J√∫nior/Trainee ou Est√°gio Avan√ßado, e, ao se candidatar a posi√ß√µes de n√≠vel Pleno, construa uma narrativa proativa em seu CV e carta de apresenta√ß√£o que demonstre como seus projetos e habilidades t√©cnicas avan√ßadas compensam a experi√™ncia formal, quantificando o impacto e as responsabilidades assumidas em cada experi√™ncia."**

**Como aplicar esta dica:**

*   **Para Vagas J√∫nior/Trainee/Est√°gio Avan√ßado:** Seu CV j√° √© muito forte. Apenas certifique-se de que a descri√ß√£o da vaga se alinha com o que voc√™ busca e que voc√™ pode demonstrar entusiasmo para aprender e crescer.
*   **Para Vagas Pleno (e acima):**
    *   **Reestruture a Se√ß√£o de Experi√™ncia:** Para cada cargo (Estagi√°rio, Freelancer), v√° al√©m das tarefas. Descreva os *desafios* que voc√™ enfrentou, as *solu√ß√µes* que implementou e os *resultados quantific√°veis* que alcan√ßou. Ex: "Otimizei a performance da API em X%, resultando em uma redu√ß√£o de Y segundos no tempo de resposta."
    *   **Destaque a Autonomia e Lideran√ßa:** Se voc√™ teve autonomia em projetos freelancer ou liderou iniciativas como estagi√°rio, enfatize isso. Mostre que voc√™ n√£o apenas executa, mas tamb√©m pensa estrategicamente e toma decis√µes.
    *   **Portf√≥lio Online Robusto:** Crie um portf√≥lio online (site pessoal, GitHub bem organizado) que sirva como uma extens√£o do seu CV. Inclua demos, links para reposit√≥rios e descri√ß√µes detalhadas dos seus projetos, explicando as tecnologias usadas, os desafios e suas contribui√ß√µes. Isso √© crucial para compensar a falta de experi√™ncia formal.
    *   **Carta de Apresenta√ß√£o Personalizada:** Para cada vaga de n√≠vel Pleno, escreva uma carta de apresenta√ß√£o que aborde diretamente a quest√£o da experi√™ncia. Explique como, apesar do tempo formal, sua profundidade t√©cnica, projetos complexos e experi√™ncia com Cloud/DevOps o preparam para as responsabilidades da vaga.

Seu perfil √© extremamente promissor. Com um posicionamento estrat√©gico e uma comunica√ß√£o eficaz de suas conquistas, voc√™ tem um futuro brilhante na √°rea de desenvolvimento!

### 5. Gera√ß√£o de CV

In [49]:
prompt_html_cv = ChatPromptTemplate.from_template("""
Voc√™ √© um 'Consultor de Carreira'. Sua tarefa √© gerar um curr√≠culo profissional em formato HTML, incorporando as informa√ß√µes do curr√≠culo e aplicando as sugest√µes estrat√©gicas para otimiz√°-lo para a vaga.

Certifique-se de que o HTML seja bem-estruturado, e replique exatamente o estilo do curr√≠culo e inclua todas as se√ß√µes relevantes do curr√≠culo. Priorize a clareza e a facilidade de leitura.

A estiliza√ß√£o do HTML deve ser feita inline nos elementos. Utilize flex box ou grid se necess√°rio para garantir que o estilo do cv original seja replicado da forma mais fiel.

**Curr√≠culo do Candidato:**
{cv}

**Sugest√µes Estrat√©gicas e An√°lise de Ader√™ncia:**
{resultado}

Por favor, forne√ßa apenas o c√≥digo HTML completo, sem qualquer texto adicional ou explica√ß√£o. O HTML deve ser pronto para uso.
""")

chain_html_cv = prompt_html_cv | llm | parser_str

html_cv = chain_html_cv.invoke({
    "cv": pages,
    "resultado": resultado
}).replace('```html\n', '').replace('\n```', '')

print("HTML CV gerado com sucesso!")

HTML CV gerado com sucesso!


In [51]:
font_config = FontConfiguration()
html = HTML(string=html_cv)
# css = CSS(string='''body{background:light-blue!important;font-family:-apple-system,BlinkMacSystemFont,"Segoe UI",Roboto,"Helvetica Neue",Arial,sans-serif;color:#333;line-height:1.6;background-color:#fff;max-width:800px;margin:0 auto;padding:40px}header{text-align:center;padding-bottom:20px;margin-bottom:30px;border-bottom:2px solid #f0f0f0}header h1{font-size:2.6rem;font-weight:700;color:#000;margin-bottom:10px}header p{font-size:0.95rem;color:#555;line-height:1.5}a{color:#0056b3;text-decoration:none}a:hover{text-decoration:underline}section{margin-bottom:25px}h2{font-size:1.5rem;font-weight:600;color:#222;border-bottom:1px solid #ccc;padding-bottom:5px;margin-bottom:20px}h3{font-size:1.2rem;font-weight:600;color:#111;margin-bottom:3px}article{margin-bottom:20px}article > p{font-size:1rem;font-style:italic;color:#555;margin-bottom:15px}ul{list-style-type:disc;margin-left:20px;padding-left:15px}li{font-size:0.95rem;margin-bottom:8px}li > strong,p > strong{font-weight:600;color:#000}''', font_config=font_config)

html.write_pdf('cv_otimizado.pdf')

print("PDF 'cv_otimizado.pdf' gerado com sucesso!")

DEBUG:fontTools.ttLib.ttFont:Reading 'maxp' table from disk
DEBUG:fontTools.ttLib.ttFont:Decompiling 'maxp' table
DEBUG:fontTools.subset.timer:Took 0.003s to load 'maxp'
DEBUG:fontTools.subset.timer:Took 0.000s to prune 'maxp'
INFO:fontTools.subset:maxp pruned
DEBUG:fontTools.ttLib.ttFont:Reading 'cmap' table from disk
DEBUG:fontTools.ttLib.ttFont:Decompiling 'cmap' table
DEBUG:fontTools.ttLib.ttFont:Reading 'post' table from disk
DEBUG:fontTools.ttLib.ttFont:Decompiling 'post' table
DEBUG:fontTools.subset.timer:Took 0.006s to load 'cmap'
DEBUG:fontTools.subset.timer:Took 0.000s to prune 'cmap'
INFO:fontTools.subset:cmap pruned
INFO:fontTools.subset:fpgm dropped
INFO:fontTools.subset:prep dropped
INFO:fontTools.subset:cvt  dropped
INFO:fontTools.subset:kern dropped
DEBUG:fontTools.subset.timer:Took 0.000s to load 'post'
DEBUG:fontTools.subset.timer:Took 0.000s to prune 'post'
INFO:fontTools.subset:post pruned
INFO:fontTools.subset:GPOS dropped
INFO:fontTools.subset:GSUB dropped
DEBUG:f

PDF 'cv_otimizado.pdf' gerado com sucesso!


In [52]:
files.download('cv_otimizado.pdf')
print("Download do PDF 'cv_otimizado.pdf' iniciado!")

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

Download do PDF 'cv_otimizado.pdf' iniciado!
