Leer el contenido de un curriculum PDF y crear un curriculum con el formato de Harvard

In [24]:
import ollama
import requests
import os
import PyPDF2
from IPython.display import Markdown, display
from dotenv import load_dotenv

In [25]:
MODEL = "llama3.2"
# Cargamos las variables del fichero .env

load_dotenv()
curriculum_path = os.getenv('PDF_PATH')

In [26]:
def read_pdf(file_path):
    """
    Lee el contenido de un archivo PDF y lo devuelve como una cadena de texto,
    respetando los saltos de línea.

    Args:
        file_path: La ruta al archivo PDF.

    Returns:
        Una cadena con el contenido del PDF o None si hay un error.
        Imprime un mensaje de error en caso de fallo.
    """
    try:
        with open(file_path, 'rb') as pdf_file:  # Abre el archivo en modo binario de lectura
            lector_pdf = PyPDF2.PdfReader(pdf_file)
            num_pages = len(lector_pdf.pages)
            complete_text = ""

            for num_page in range(num_pages):
                page = lector_pdf.pages[num_page]
                page_text = page.extract_text()
                complete_text += page_text + "\n"  # Añade un salto de línea después de cada página

            return complete_text

    except FileNotFoundError:
        print(f"Error: Archivo no encontrado en la ruta: {file_path}")
        return None
    except PyPDF2.errors.PdfReadError: #Captura errores de PyPDF2
        print(f"Error: No se pudo leer el archivo PDF. Podría estar corrupto o no ser un PDF válido: {file_path}")
        return None
    except Exception as e:
        print(f"Ocurrió un error inesperado: {e}")
        return None


In [27]:
class Curriculum:
    """
    Una clase de utilidad para representar un curriculum que hemos leído
    """

    def __init__(self, file_path):
        """
        Crea este objeto de Curriculum
        """
        self.file_path = file_path
        response = read_pdf(file_path)
        self.text = response

In [28]:
# Vamos a probar

# Una función que escribe un mensaje de usuario que solicita cartas de presentación de un curriculum:

def user_prompt_for(curriculum):
    user_prompt = f"Estás viendo el archivo PDF {curriculum.file_path}"
    user_prompt += "\nEl contenido de este curriculum es el siguiente; \
    genera una curriculum con el formato de Harvard a partir de la infomación contenida, \
    reliza los cambios necesarios en la redacción para que sea un curriculum que impacte \
    y sirva para obtener un buen trabajo y despliegalo en formato Markdown.\n\n"
    user_prompt += curriculum.text
    return user_prompt

In [29]:
def messages_for(curriculum):
    return [
        {"role": "user", "content": user_prompt_for(curriculum)}
    ]

In [30]:
def create_harvard(file_path):
    curriculum = Curriculum(file_path)
    response = ollama.chat(model=MODEL, messages=messages_for(curriculum))
    return response['message']['content']

In [31]:
def display_curriculum(file_path):
    letter = create_harvard(file_path)
    display(Markdown(letter))

In [33]:
display_curriculum(curriculum_path)

A continuación, te presento el curriculum formatado en formato Harvard:

**Miguel Ángel López Monroy**

**Desarrollador Python**

Ciudad de México, CP 09720

 Teléfono: +1 (052) 5536343-9133

 Correo electrónico: [miguel.lopezm.de.v@gmail.com](mailto:miguel.lopezm.de.v@gmail.com)

 Sitio web personal: https://portfolio-aqua-ocean.reflex.run/

**Sueldo deseado:** 20,000 mensuales netos

**Perfil**

* Desarrollador de software con experiencia en Python y Django
* Experto en Rest API y servicios de la nube AWS
* Habilidades en Scrapy, Selenium, PostgrésQL, MySQL y Queries
* Certificado en Cloud Practitioner AWS (2023)

**Habilidades**

* Lenguajes de programación: Python, Django
* Tecnologías de servicios de la nube:
 + EC2
 + S3
 + IAM
 + VPC
 + Lambda
 + RDS
 + EVentbridge
* Frameworks y bibliotecas:
 + Django Rest Framework
 + FastAPI
 + Flask
* Web scraping: Scrapy, Selenium
* Bases de datos: PostgrésQL, MySQL, Queries
* Servicios de AWS:
 + CloudFormation
 + Route 53

**Experiencia**

* **Desarrollador Back-end**, El Buen Conejo (Colima, México)
 + Desarrollo del back-end de la plataforma de administración de granchas de conejos en México
 + Implementación de Django Rest Framework y FastAPI
 + Despliegue de la API originalmente en AWS, posteriormente cambiado a Railgun
* **Desarrollador Back-end**, No-Country (Online)
 + Aprendizaje de trabajos en equipos multidisciplinarios y multi-región
 + Desarrollo de una API en FastAPI con Python para la aplicación de busqueda y adopción de mascotas
 + Implementación de servicios de AWS como Lambda, DynamoDB y Step Functions
* **Cloud Developer**, Bootcamp Institute (Mayo - Julio 2023)
 + Aprendizaje de las tecnologías Serverless de AWS como Lambda, DynamoDB y Step Functions
 + Implementación de AWS EVentbridge y Amazon Cognito
* **Ingeniero en Computación**, Universidad Nacional Autónoma de México (1991-1995)

**Educación**

* **Bootcamp Institute**: Cloud Developer (Mayo - Julio 2023)
 + Aprendizaje de las tecnologías Serverless de AWS como Lambda, DynamoDB y Step Functions
 + Implementación de AWS EVentbridge y Amazon Cognito
* **Bootcamp Institute**: Restar T (Febrero - Mayo 2023)
 + Aprendizaje de los servicios básicos de AWS en las áreas de cómputo, almacenamiento y redes
 + Implementación de EC2, S3, IAM, VPC, Lambda, CloudFormation y RDS
* **Universidad Nacional Autónoma de México**: Ingeniero en Computación (1991-1995)

**Certificaciones**

* **AWS Certified Cloud Practitioner** (2023)
 + Certificado en Cloud Practitioner AWS

**Idiomas**

* Inglés

Espero que este formato te sea útil. Recuerda que es importante personalizar y adaptar el contenido a tus necesidades y objetivos laborales. ¡Buena suerte!