In [None]:
import sys
from pathlib import Path


project_root = Path.cwd().parent


if str(project_root) not in sys.path:
    sys.path.append(str(project_root))

from src.text_utils import crear_input_oferta, crear_input_cv
from sentence_transformers import SentenceTransformer, util
import pandas as pd

model = SentenceTransformer('all-MiniLM-L6-v2')
print("Rutas configuradas y módulos importados correctamente.")

In [None]:
def get_baseline_score(offer_row, cv_row):
    # Formatear el texto usando tu utilidad
    offer_text = crear_input_oferta(offer_row)
    cv_text = crear_input_cv(cv_row)
    
    # Generar los embeddings
    offer_embedding = model.encode(offer_text, convert_to_tensor=True)
    cv_embedding = model.encode(cv_text, convert_to_tensor=True)
    
    # Calcular similitud del coseno
    cosine_score = util.cos_sim(offer_embedding, cv_embedding)
    return cosine_score.item()

In [None]:
# Carga de los datos procesados
try:
    offers_df = pd.read_csv(project_root / 'data/01_processed/offers_processed.csv')
    cvs_df = pd.read_csv(project_root / 'data/01_processed/cvs_processed.csv')
    print("Datos cargados correctamente.")
except FileNotFoundError as e:
    print(f"Error: No se pudo encontrar el archivo {e.filename}. Asegúrate de que la estructura de carpetas es correcta.")

# Carga del modelo de embeddings para el baseline
print("Cargando modelo de embeddings...")
baseline_model = SentenceTransformer('all-MiniLM-L6-v2')
print("Modelo baseline cargado.")