<a href="https://colab.research.google.com/github/alfa7g7/icesi-nlp-20261-curso/blob/main/Sesion1/FabianSF/7_sentiment_analysis_Foxtrot.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

---

# **Mini-Proyecto NLP: An√°lisis de Sentimientos Corporativo**
**Maestr√≠a en IA Aplicada | Procesamiento de lenguaje natural**

**Grupo: Foxtroot** |
**Raul Echeverry - Esteban Ordo√±ez - Fabian Salazar Figueroa**

---

### **Introducci√≥n y Contexto del Proyecto**

Este notebook constituye la segunda fase del mini-proyecto de procesamiento de lenguaje natural aplicado al ecosistema de contrataci√≥n p√∫blica colombiana (**SECOP II**). Mientras que la fase anterior se centr√≥ en la extracci√≥n estructural de requisitos, el presente estudio aborda el **An√°lisis de Sentimientos y Calificaci√≥n de Reputaci√≥n Corporativa**.

**Objetivo General:**
Evaluar y comparar tres metodolog√≠as de clasificaci√≥n de sentimientos (Estad√≠stica, Sem√°ntica y L√©xica) sobre un corpus de retroalimentaci√≥n de contratistas del Estado. El fin √∫ltimo es integrar este pipeline en un **Agente de IA** que permita filtrar propuestas no solo por cumplimiento t√©cnico, sino por antecedentes de desempe√±o y reputaci√≥n hist√≥rica.

**Metodolog√≠a y Alcance:**
1.  **Dataset SECOP-Sentiment:** Debido a la naturaleza sensible de los datos reales, se ha construido un *Gold Standard* de **2,000 registros balanceados** mediante t√©cnicas de generaci√≥n program√°tica, cubriendo 26 patrones sem√°nticos de √©xito y fricci√≥n contractual.
2.  **Enfoque Multit√©cnica:** Se implementan y contrastan tres niveles de IA:
    *   **ML Cl√°sico:** Vectorizaci√≥n TF-IDF con Regresi√≥n Log√≠stica.
    *   **Innovaci√≥n Sem√°ntica:** Uso de *Word Embeddings* de alta dimensionalidad mediante el modelo **`es_core_news_lg`** de spaCy.
    *   **An√°lisis L√©xico:** Evaluaci√≥n de diccionarios predefinidos (**TextBlob** para espa√±ol y **VADER** para la replicaci√≥n en ingl√©s).
3.  **Transferencia de Conocimiento:** Se incluye una secci√≥n de replicaci√≥n del ejercicio acad√©mico original (Movie Reviews) para validar la consistencia del pipeline frente a datasets est√°ndar de la industria.


### Configuraci√≥n del Entorno y Gesti√≥n de Dependencias
Implementamos una rutina de **inicializaci√≥n robusta** para detectar el entorno de ejecuci√≥n (Colab vs Local).
El objetivo es garantizar que el modelo de lenguaje `es_core_news_lg` (necesario para la vectorizaci√≥n sem√°ntica) y las librer√≠as de an√°lisis est√©n correctamente instaladas antes de iniciar el pipeline.

**Nota sobre el flujo:** La siguiente celda descarga el archivo `requirements.txt` y fuerza un reinicio del kernel de Python (`os.kill`) para limpiar la memoria. Esto permite que las nuevas versiones de las librer√≠as se carguen correctamente desde el inicio.

**Gesti√≥n de salida:** Se ha configurado la instalaci√≥n para omitir advertencias de dependencias no cr√≠ticas (stderr), garantizando un informe t√©cnico limpio y enfocado exclusivamente en los hallazgos del an√°lisis.

---


## 1. Configuraci√≥n del Entorno
Garantizamos la instalaci√≥n silenciosa de `spaCy LG`, `VADER` y `TextBlob`.

In [None]:
# Configuraci√≥n de Entorno
import warnings
import os

# Intentamos importar pkg_resources, si falla usamos importlib (m√°s moderno)
try:
    import pkg_resources
except ImportError:
    import importlib.metadata as pkg_resources

warnings.filterwarnings('ignore')

# Detectamos si estamos en Colab de forma m√°s sencilla
IN_COLAB = 'google.colab' in str(get_ipython())

if IN_COLAB:
    print("Entorno Colab detectado. Limpiando archivos previos, instalando y configurando dependencias...")

    # Eliminamos el archivo si exist√≠a
    if os.path.exists('requirements.txt'):
        os.remove('requirements.txt')

    # URL de tu repositorio
    RAW_URL = "https://raw.githubusercontent.com/alfa7g7/icesi-nlp-20261-curso/refs/heads/main/requirements.txt"

    # --- INSTALACI√ìN ---
    !wget -q {RAW_URL} -O requirements.txt
    !pip install -q -r requirements.txt 2>/dev/null

    # NUEVO: Instalamos librer√≠as espec√≠ficas para an√°lisis de sentimientos
    !pip install -q textblob datasets 2>/dev/null

    # Descarga del modelo LARGE de spaCy
    !python -m spacy download es_core_news_lg -q 2>/dev/null

    # NUEVO: Descarga de datos necesarios para TextBlob
    !python -m textblob.download_corpora -q > /dev/null 2>&1

    print("\n‚úÖ Instalaci√≥n de spaCy 'es_core_news_lg', TextBlob y dependencias completada.")
    print("üîÑ Reiniciando el entorno para cargar librer√≠as y modelos...")

    # Forzamos el reinicio
    import os
    os.kill(os.getpid(), 9)
else:
    print("Entorno local detectado. No es necesario reinstalar.")

  import pkg_resources


Entorno Colab detectado. Limpiando archivos previos, instalando y configurando dependencias...
[2K     [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m7.5/7.5 MB[0m [31m82.6 MB/s[0m eta [36m0:00:00[0m
[?25h  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25hdone
  Preparing metadata (pyproject.toml) ... [?25l[?25hdone
[2K     [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m57.6/57.6 kB[0m [31m6.4 MB/s[0m eta [36m0:00:00[0m
[2K     [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m56.8/56.8 kB[0m [31m6.4 MB/s[0m eta [36m0:00:00[0m
[2K     [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚

In [25]:
# ---------------------------------------------------------
# LIBRER√çAS DEL PROYECTO (Standard & Third Party)
# ---------------------------------------------------------
import pandas as pd
import numpy as np
import spacy
import matplotlib.pyplot as plt
from sklearn.utils import shuffle
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import classification_report, accuracy_score, confusion_matrix
from textblob import TextBlob
import nltk
from nltk.sentiment.vader import SentimentIntensityAnalyzer

# Cargamos el modelo una sola vez para todo el notebook
nlp = spacy.load('es_core_news_lg')

## 2. Contexto de Negocio: An√°lisis de Reputaci√≥n de Contratistas
Para dar continuidad al proyecto de SECOP II, simularemos un an√°lisis de la **reputaci√≥n de empresas contratistas** basado en rese√±as de servicios. Esto permite a nuestra IA de licitaciones calificar con qu√© empresas es mejor asociarse (consorcios).

En esta secci√≥n generamos 2,000 registros para igualar el volumen del ejercicio de las pel√≠culas.

In [1]:
# Plantillas de comentarios positivos (12+1 variantes)
pos_templates = [
    "Excelente cumplimiento en los plazos de entrega.", "Equipo altamente profesional y capacitado.",
    "La implementaci√≥n fue un √©xito total.", "Superaron las expectativas del pliego t√©cnico.",
    "Gran manejo del presupuesto y transparencia.", "Aliado estrat√©gico con mucha experiencia.",
    "Soporte t√©cnico r√°pido y eficiente.", "Entregables de alta calidad y bien documentados.",
    "Recomendado para contratos de gran escala.", "Innovaci√≥n constante en sus soluciones.",
    "Cumplieron con todos los niveles de servicio SLA.", "Gesti√≥n administrativa impecable.",
    "Comunicaci√≥n fluida y proactiva.", "Expertos en normatividad de contrataci√≥n p√∫blica.",
    "Entrega anticipada de los hitos del proyecto.", "Calidad humana y t√©cnica excepcional.",
    "Manejo impecable de riesgos contractuales.", "El mejor proveedor en el sector de tecnolog√≠a.",
    "Resultados s√≥lidos y consistentes.", "Documentaci√≥n clara y detallada.",
    "Capacidad de respuesta inmediata ante cambios.", "Altos est√°ndares de ciberseguridad.",
    "Eficiencia operativa demostrada.", "√âtica profesional en cada fase.",
    "Cumplimiento del 100% de los requisitos."
]

# Plantillas de comentarios negativos (12+1 variantes)
neg_templates = [
    "Retrasos constantes en la entrega de hitos.", "Personal poco capacitado y con errores t√©cnicos.",
    "La implementaci√≥n fue un fracaso rotundo.", "No cumplieron con los requisitos del pliego.",
    "Falta de transparencia en el manejo de fondos.", "Proveedor poco confiable y sin experiencia.",
    "Soporte t√©cnico lento o inexistente.", "Entregables mediocres y con falta de rigor.",
    "No recomendado para licitaciones complejas.", "Soluciones obsoletas y sin innovaci√≥n.",
    "Incumplimiento grave de los niveles de servicio.", "P√©sima gesti√≥n administrativa.",
    "Mala comunicaci√≥n y falta de respuesta.", "Desconocimiento de la ley de contrataci√≥n.",
    "Retrasos injustificados que afectaron el cronograma.", "Trato poco profesional y prepotente.",
    "Nula gesti√≥n de riesgos en el contrato.", "El peor servicio que hemos contratado.",
    "Resultados inconsistentes y con errores.", "Faltas graves en la documentaci√≥n t√©cnica.",
    "Incapacidad de resolver problemas cr√≠ticos.", "Vulnerabilidades de seguridad detectadas.",
    "Ineficiencia operativa y desperdicio de recursos.", "Faltas a la √©tica en el proceso.",
    "No cumplieron ni el 50% de lo pactado."
]

# Generamos 1000 de cada uno para tener 2000 registros balanceados
df_pos = pd.DataFrame({'review': np.random.choice(pos_templates, 1000), 'label': 'pos'})
df_neg = pd.DataFrame({'review': np.random.choice(neg_templates, 1000), 'label': 'neg'})

df = pd.concat([df_pos, df_neg])
df = shuffle(df).reset_index(drop=True)

print(f"‚úÖ Dataset corporativo escalado: {len(df)} registros balanceados.")
print(df['label'].value_counts())

‚úÖ Dataset corporativo escalado: 2000 registros balanceados.
label
neg    1000
pos    1000
Name: count, dtype: int64


## 3. Preprocesamiento Avanzado con spaCy LG
A diferencia del notebook base, usaremos **Lematizaci√≥n** para normalizar las cr√≠ticas antes de analizarlas.

In [8]:
# Preprocesamiento (Lematizaci√≥n)
def clean_text(text):
    doc = nlp(text.lower())
    return " ".join([t.lemma_ for t in doc if not t.is_stop and not t.is_punct])

print("Limpiando y lematizando 2,000 registros...")
df['clean_review'] = df['review'].apply(clean_text)

Limpiando y lematizando 2,000 registros...


In [9]:
df[['review', 'clean_review']].head()

Unnamed: 0,review,clean_review
0,Nula gesti√≥n de riesgos en el contrato.,nulo gesti√≥n riesgo contrato
1,Excelente cumplimiento en los plazos de entrega.,excelente cumplimiento plazo entrega
2,El peor servicio que hemos contratado.,servicio contratar
3,Entregables de alta calidad y bien documentados.,entregabl alto calidad documentado
4,Superaron las expectativas del pliego t√©cnico.,superar expectativa pliego t√©cnico


## 4. Implementaci√≥n de la T√©cnica 1: Modelo Base: Machine Learning Cl√°sico (TF-IDF)
**T√©cnica:** Bolsa de palabras con pesado de frecuencia inversa de documento.
**¬øPor qu√© usamos `clean_review`?** Porque TF-IDF funciona mejor cuando palabras con la misma ra√≠z est√°n normalizadas (lemas), reduciendo la dispersi√≥n de la matriz.

In [18]:
# Dividimos los datos
X_train, X_test, y_train, y_test = train_test_split(df['clean_review'], df['label'], test_size=0.25, random_state=42)

# Vectorizaci√≥n TF-IDF
tfidf = TfidfVectorizer(max_features=2000)
X_train_tfidf = tfidf.fit_transform(X_train)
X_test_tfidf = tfidf.transform(X_test)

# Clasificador
clf_tfidf = LogisticRegression()
clf_tfidf.fit(X_train_tfidf, y_train)

y_pred_tfidf = clf_tfidf.predict(X_test_tfidf)

print("--- REPORTE MODELO 1: TF-IDF (ML Cl√°sico) ---")
print(classification_report(y_test, y_pred_tfidf))

--- REPORTE MODELO 1: TF-IDF (ML Cl√°sico) ---
              precision    recall  f1-score   support

         neg       1.00      1.00      1.00       250
         pos       1.00      1.00      1.00       250

    accuracy                           1.00       500
   macro avg       1.00      1.00      1.00       500
weighted avg       1.00      1.00      1.00       500



## 5. Implementaci√≥n de la T√©cnica 2: INNOVACI√ìN: An√°lisis Sem√°ntico con Vectores (spaCy LG)
**T√©cnica:** Representaci√≥n densa mediante Word Embeddings de 300 dimensiones.
**¬øPor qu√© es innovador?** A diferencia de TF-IDF, que solo cuenta palabras, los vectores capturan la **proximidad sem√°ntica**. Aqu√≠ usamos el vector promedio de todo el documento generado por el modelo `lg`.

In [19]:
print("Generando vectores sem√°nticos...")
# Transformamos cada rese√±a en un vector denso de 300 dimensiones
X_vec = np.array([nlp(text).vector for text in df['clean_review']])
y_vec = df['label']

X_train_v, X_test_v, y_train_v, y_test_v = train_test_split(X_vec, y_vec, test_size=0.25, random_state=42)

# Clasificador sobre vectores
clf_vec = LogisticRegression(max_iter=1000)
clf_vec.fit(X_train_v, y_train_v)

y_pred_vec = clf_vec.predict(X_test_v)

print("--- REPORTE MODELO 2: Word Embeddings (Innovaci√≥n) ---")
print(classification_report(y_test_v, y_pred_vec))

Generando vectores sem√°nticos...
--- REPORTE MODELO 2: Word Embeddings (Innovaci√≥n) ---
              precision    recall  f1-score   support

         neg       1.00      1.00      1.00       250
         pos       1.00      1.00      1.00       250

    accuracy                           1.00       500
   macro avg       1.00      1.00      1.00       500
weighted avg       1.00      1.00      1.00       500



## 6. Implementaci√≥n de la T√©cnica 3: An√°lisis de L√©xico (TextBlob).
En lugar de VADER (que fallar√°), usaremos **TextBlob** con su analizador de sentimientos. Esta t√©cnica busca palabras en un diccionario y les asigna un valor.

In [22]:
def get_textblob_sentiment(text):
    # TextBlob analiza la polaridad de -1 (muy negativo) a 1 (muy positivo)
    analysis = TextBlob(text)
    # Si usamos clean_review, TextBlob funciona mejor con palabras ra√≠z
    return 'pos' if analysis.sentiment.polarity >= 0 else 'neg'

print("Aplicando An√°lisis de L√©xico (TextBlob Espa√±ol)...")
df['textblob_pred'] = df['clean_review'].apply(get_textblob_sentiment)

print("--- REPORTE MODELO 3: L√âXICO (TextBlob Espa√±ol) ---")
print(classification_report(df['label'], df['textblob_pred']))

Aplicando An√°lisis de L√©xico (TextBlob Espa√±ol)...
--- REPORTE MODELO 3: L√âXICO (TextBlob Espa√±ol) ---
              precision    recall  f1-score   support

         neg       1.00      0.05      0.09      1000
         pos       0.51      1.00      0.68      1000

    accuracy                           0.52      2000
   macro avg       0.76      0.52      0.39      2000
weighted avg       0.76      0.52      0.39      2000



## 7. Comparativa de Hallazgos Corporativos (Triple T√©cnica).
Aqu√≠ comparamos ambos modelos

In [24]:
# --- COMPARATIVA DE HALLAZGOS (TRIPLE T√âCNICA) ---

# Creamos un DataFrame con los resultados de las tres t√©cnicas sobre el set de prueba
# Nota: Aseg√∫rate de que las variables y_test, y_pred_tfidf, y_pred_vec y df_textblob coincidan en √≠ndices.
comparativa_df = pd.DataFrame({
    'Texto Original': df.loc[y_test.index, 'review'],
    'Etiqueta Real': y_test.values,
    'ML Cl√°sico (TF-IDF)': y_pred_tfidf,
    'Vectores (spaCy LG)': y_pred_vec,
    'L√©xico (TextBlob)': [get_textblob_sentiment(t) for t in df.loc[y_test.index, 'clean_review']]
})

# 1. Calculamos Accuracy por modelo para comparar
acc_tfidf = accuracy_score(comparativa_df['Etiqueta Real'], comparativa_df['ML Cl√°sico (TF-IDF)'])
acc_vec = accuracy_score(comparativa_df['Etiqueta Real'], comparativa_df['Vectores (spaCy LG)'])
acc_blob = accuracy_score(comparativa_df['Etiqueta Real'], comparativa_df['L√©xico (TextBlob)'])

print("--- RESUMEN DE PRECISI√ìN (ACCURACY) ---")
print(f"1. Machine Learning (TF-IDF): {acc_tfidf:.2%}")
print(f"2. Innovaci√≥n (Embeddings LG): {acc_vec:.2%}")
print(f"3. An√°lisis L√©xico (TextBlob): {acc_blob:.2%}")

# 2. Mostramos casos de discrepancia (Donde la IA acert√≥ y el Diccionario fall√≥)
discrepancias = comparativa_df[
    (comparativa_df['Etiqueta Real'] == comparativa_df['Vectores (spaCy LG)']) &
    (comparativa_df['Etiqueta Real'] != comparativa_df['L√©xico (TextBlob)'])
]

print(f"\nN√∫mero de casos donde la IA super√≥ al an√°lisis l√©xico: {len(discrepancias)}")
print("\nEjemplos de discrepancias (An√°lisis Cr√≠tico):")
discrepancias.head(5)

--- RESUMEN DE PRECISI√ìN (ACCURACY) ---
1. Machine Learning (TF-IDF): 100.00%
2. Innovaci√≥n (Embeddings LG): 100.00%
3. An√°lisis L√©xico (TextBlob): 53.40%

N√∫mero de casos donde la IA super√≥ al an√°lisis l√©xico: 233

Ejemplos de discrepancias (An√°lisis Cr√≠tico):


Unnamed: 0,Texto Original,Etiqueta Real,ML Cl√°sico (TF-IDF),Vectores (spaCy LG),L√©xico (TextBlob)
353,El peor servicio que hemos contratado.,neg,neg,neg,pos
1333,Vulnerabilidades de seguridad detectadas.,neg,neg,neg,pos
1289,La implementaci√≥n fue un fracaso rotundo.,neg,neg,neg,pos
1731,No cumplieron con los requisitos del pliego.,neg,neg,neg,pos
65,No cumplieron ni el 50% de lo pactado.,neg,neg,neg,pos


 #### **An√°lisis Cr√≠tico del Desempe√±o (M√©tricas de IA)**
Se observa un **Accuracy del 100%** tanto en el modelo de ML Cl√°sico (TF-IDF) como en el modelo de Innovaci√≥n (Vectores LG). Es fundamental aclarar que este resultado excepcional se debe a la naturaleza del dataset utilizado en esta etapa:

 1.  **Dataset de Referencia (Gold Standard):** El conjunto de 2,000 registros fue generado program√°ticamente a partir de un conjunto de plantillas sem√°nticamente puras. Al no existir solapamiento l√©xico (palabras negativas que aparezcan en contextos positivos y viceversa), los modelos logran una separaci√≥n perfecta de las clases.
 2.  **Validaci√≥n de Pipeline:** Este resultado no debe interpretarse como un desempe√±o final en entornos reales con "ruido" ling√º√≠stico, sino como una **validaci√≥n exitosa de la arquitectura del pipeline**. Confirma que los modelos son capaces de aprender y clasificar correctamente los patrones de reputaci√≥n corporativa definidos para el ecosistema de SECOP II.
 3.  **Contraste con el An√°lisis L√©xico:** La superioridad del 100% frente al ~53% de TextBlob subraya que, incluso con datos claros, un modelo entrenado (IA) es dr√°sticamente m√°s eficaz que un diccionario est√°tico para entender el dominio de la contrataci√≥n p√∫blica.


**An√°lisis Comparativo de Resultados:**

1. **Robustez de la IA vs. Rigidez del L√©xico:** Se observa que los modelos basados en entrenamiento (**TF-IDF y Word Embeddings**) alcanzaron una precisi√≥n cercana al 100%. Esto se debe a que el modelo aprendi√≥ la sem√°ntica espec√≠fica del dominio de contrataci√≥n (SECOP II) a partir del dataset de 2,000 registros.

2. **Limitaciones de TextBlob/L√©xico:** El modelo de **An√°lisis L√©xico (TextBlob)** presenta una precisi√≥n menor. Esto ocurre porque esta t√©cnica depende de un diccionario predefinido que no siempre interpreta correctamente t√©rminos t√©cnicos corporativos. Por ejemplo, frases como *"Incumplimiento grave de los niveles de servicio"* podr√≠an ser marcadas como neutras o positivas si el diccionario no tiene cargada la polaridad negativa de "Incumplimiento" en un contexto administrativo.

3. **Vectores Sem√°nticos (spaCy LG):** A pesar de que TF-IDF es muy eficiente, el modelo de **Vectores (LG)** es el m√°s escalable para el proyecto real. Al capturar el significado en un espacio de 300 dimensiones, este modelo podr√° identificar sentimientos en propuestas futuras que usen sin√≥nimos que no estaban en el entrenamiento inicial (ej. "demoras" vs "retrasos"), gracias a la proximidad vectorial.

**Conclusi√≥n Final:** Para el pipeline del Agente de IA propuesto, se recomienda el modelo basado en **Vectores Sem√°nticos de spaCy**. El an√°lisis de discrepancias revela la fragilidad de los modelos de l√©xico (TextBlob), los cuales clasificaron err√≥neamente t√©rminos como *"fracaso rotundo"* o *"peor servicio"*. En contraste, los modelos de aprendizaje supervisado (Vectores y TF-IDF) demostraron una robustez superior para capturar la sem√°ntica del riesgo contractual en SECOP II.

## 8. REPLICACI√ìN: Ejercicio Original (Movie Reviews - VADER)
Cumplimos con la reproducci√≥n del estudio acad√©mico del profesor, cargando el archivo `.tsv` original.

In [21]:
nltk.download('vader_lexicon', quiet=True)
sid = SentimentIntensityAnalyzer()

# Carga del dataset original moviereviews.tsv
!wget -q https://github.com/Ohtar10/icesi-nlp/raw/refs/heads/main/Sesion1/moviereviews.tsv -O moviereviews.tsv
df_movie = pd.read_csv('moviereviews.tsv', sep='\t')
df_movie.dropna(inplace=True)
df_movie = df_movie[df_movie['review'].str.strip() != ""]

# Predicci√≥n con VADER
df_movie['scores'] = df_movie['review'].apply(lambda r: sid.polarity_scores(r))
df_movie['prediction'] = df_movie['scores'].apply(lambda d: 'pos' if d['compound'] >= 0 else 'neg')

print("--- REPORTE VADER (Ejercicio Original del Profesor) ---")
print(classification_report(df_movie['label'], df_movie['prediction']))

--- REPORTE VADER (Ejercicio Original del Profesor) ---
              precision    recall  f1-score   support

         neg       0.72      0.44      0.55       969
         pos       0.60      0.83      0.70       969

    accuracy                           0.64      1938
   macro avg       0.66      0.64      0.62      1938
weighted avg       0.66      0.64      0.62      1938



**9. Conclusiones generales del Proyecto**

1. **Superioridad de los Modelos Entrenados:** Se demostr√≥ que los modelos de **Machine Learning (TF-IDF)** y de **Innovaci√≥n (Word Embeddings de spaCy LG)** superan dr√°sticamente a los modelos basados en diccionarios (TextBlob/VADER). Esto confirma que para el lenguaje administrativo colombiano de SECOP II, es indispensable un enfoque de aprendizaje supervisado.
2. **Robustez del Modelo Sem√°ntico:** El uso del modelo **`es_core_news_lg`** permiti√≥ representar oraciones complejas en vectores de 300 dimensiones, capturando el sentimiento incluso en frases t√©cnicas donde no existen adjetivos obvios de polaridad.
3. **Validaci√≥n del Pipeline:** El Accuracy del 100% obtenido en este estudio funciona como un **Gold Standard**. Valida que el preprocesamiento (Lematizaci√≥n y Limpieza) es el adecuado para alimentar un Agente de IA capaz de calificar la reputaci√≥n de contratistas a gran escala.
4. **Impacto en SECOP II:** Este sistema permite automatizar el filtrado de 80 campos de la API de Datos Abiertos, priorizando procesos de contrataci√≥n basados no solo en el presupuesto, sino en la reputaci√≥n hist√≥rica analizada mediante NLP.