# Proyecto Final: Resúmenes de Reseñas Académicas


In [1]:
!pip install rouge_score

Collecting rouge_score
  Downloading rouge_score-0.1.2.tar.gz (17 kB)
  Preparing metadata (setup.py) ... [?25l[?25hdone
Building wheels for collected packages: rouge_score
  Building wheel for rouge_score (setup.py) ... [?25l[?25hdone
  Created wheel for rouge_score: filename=rouge_score-0.1.2-py3-none-any.whl size=24935 sha256=2c9022e3edebb11ce370325745631ee1708577ddc61911ccd3d70f9c979dafb3
  Stored in directory: /root/.cache/pip/wheels/5f/dd/89/461065a73be61a532ff8599a28e9beef17985c9e9c31e541b4
Successfully built rouge_score
Installing collected packages: rouge_score
Successfully installed rouge_score-0.1.2


In [2]:
import pandas as pd
from transformers import pipeline
from nltk.translate.bleu_score import sentence_bleu, SmoothingFunction
from rouge_score import rouge_scorer

comentarios = pd.read_csv('CSV/Comentarios_Profesores_Generalizado.csv')
listado = pd.read_csv('CSV/Listado_profesores_Generalizado.csv')
comentarios_referencia = pd.read_csv('CSV/Comentarios_Referencia.csv')

try:
    modelo_resumen = pipeline("summarization", model="facebook/bart-large-cnn")
    print("Modelo cargado exitosamente.")
except Exception as e:
    print("Error cargando el modelo:", e)
    #modelo_beto = None
    modelo_resumen = None

def listado_profesores():
    print("Listado de profesores:")
    #Obtenemos el listado
    profesores_unicos = comentarios['Profesor'].unique()
    for index, profesor in enumerate(profesores_unicos):
        print(f"\t{index + 1}. {profesor}")

def ver_comentarios(profesores_unicos):
    try:
        numero_profesor = int(input('Ingrese el numero del profesor: '))
        if 1 <= numero_profesor <= len(profesores_unicos):
            profesor = profesores_unicos[numero_profesor - 1]
            comentarios_profesor = comentarios[comentarios['Profesor'] == profesor]
            if comentarios_profesor.empty:
                print(f"No hay comentarios disponibles para {profesor}.")
                return
            print(f"Comentarios del profesor {profesor}:")
            for index, comentario in comentarios_profesor.iterrows():
                print(f"\t{index+1}. {comentario['Comentario']}")
        else:
            print('Opcion invalida, intente de nuevo')
    except ValueError:
        print('Opcion invalida, intente de nuevo')

def generar_opinion(profesores_unicos):
    try:
        numero_profesor = int(input('Ingrese el numero del profesor: '))
        if 1 <= numero_profesor <= len(profesores_unicos):
            profesor = profesores_unicos[numero_profesor - 1]
            print(f"Generando opinión del profesor {profesor}:")
            comentarios_profesor = comentarios[comentarios['Profesor'] == profesor]["Comentario"]
            if comentarios_profesor.empty:
                print(f"No hay comentarios disponibles para {profesor}.")
                return

            comentarios_profesor = comentarios_profesor.dropna()
            comentarios_profesor = comentarios_profesor.astype(str)

            if len(comentarios_profesor) <= 4:
                print(f"El profesor {profesor} tiene {len(comentarios_profesor)} comentarios. Mostrando todos los comentarios disponibles:")
                for comentario in comentarios_profesor:
                    print(f"- {comentario}")
                return

            elif 5 <= len(comentarios_profesor) < 9:
                texto_base = ' '.join(comentarios_profesor.tolist())
            else:
                texto_base = ' '.join(comentarios_profesor.sample(n=9, random_state=37).tolist())

            print(f"Texto base para generación: {texto_base}")

            if modelo_resumen is None:
                print("El modelo de resumen no está disponible. Verifica su carga.")
                return

            if not texto_base.strip():
                print("No hay suficiente texto base para generar un resumen.")
                return

            try:
                opinion_generada = modelo_resumen(
                    texto_base, max_length=300, min_length=150, do_sample=False
                )[0]['summary_text']
                print("\n############################################\n")
                print(f"Resumen generado: {opinion_generada}")

                return opinion_generada #Obtener la opinion

            except Exception as e:
                print("Error generando la opinión:", e)
                return None
        else:
            print('Opción inválida, intente de nuevo 1')
            return None
    except ValueError:
        print('Opción inválida, intente de nuevo 2')
        return None

# Calcular la métrica de BLEU
def calcular_bleu(opinion_generada, comentarios_ref):
    # Tokenizar los comentarios de referencia y la opinión generada
    referencia_bleu = [ref.split() for ref in comentarios_ref]
    opinion_bleu = opinion_generada.split()

    #BLEU normal
    score_bleu = sentence_bleu(referencia_bleu, opinion_bleu)
    print(f"BLEU score: {score_bleu:.4f}")

    # Configuración para BLEU-1 y suavizado
    score_bleu1 = sentence_bleu(
        referencia_bleu,
        opinion_bleu,
        weights=(1, 0, 0, 0),  # Solo considera unigramas
        smoothing_function=SmoothingFunction().method1  # Aplica suavizado
    )
    print(f"BLEU-1 score: {score_bleu1:.4f}")
    return score_bleu, score_bleu1

# Calcular la métrica de ROUGE
def calcular_rouge(opinion_generada, comentarios_ref):
    scorer = rouge_scorer.RougeScorer(['rouge1', 'rouge2', 'rougeL'], use_stemmer=True)
    scores_rouge = scorer.score(' '.join(comentarios_ref), opinion_generada)
    print("ROUGE scores:")
    print(f"ROUGE-1: {scores_rouge['rouge1']}") # Unigramas
    print(f"ROUGE-2: {scores_rouge['rouge2']}") # Bigramas
    print(f"ROUGE-L: {scores_rouge['rougeL']}") # Subsecuencia común más larga
    return scores_rouge

def evaluar_opinion(opinion_generada):
    numero_profesor = int(input('Ingrese el numero del profesor nuevamente: '))
    numeros_unicos = comentarios_referencia['Numero'].unique().astype(int)
    if numero_profesor in numeros_unicos:
        comentarios_ref = comentarios_referencia[comentarios_referencia['Numero'].astype(str) == str(numero_profesor)]["Comentario"].dropna() # Sin valores nulos
        print("\n ** Evaluando la opinión generada: **")
        for i, comentario in enumerate(comentarios_ref, 1):
            print(f"Opinión de referencia: {comentario}")
        # Evaluar con BLEU
        print("\nMétrica BLEU:")
        bleu_score = calcular_bleu(opinion_generada, comentarios_ref)
        # Evaluar con ROUGE
        print("\nMétrica ROUGE:")
        rouge_scores = calcular_rouge(opinion_generada, comentarios_ref)
        #return bleu_score, rouge_scores
    else:
        print('No existen comentarios de referencia para ese profesor')
        #return None, None

def sub_menu():
    profesores_unicos = comentarios['Profesor'].unique()
    while True:
        print('MENU')
        print('1. Ver comentarios')
        print('2. Generar opinion')
        print('3. Evaluar opinión generada')
        print('4. Salir')

        try:
            opcion = int(input('Ingrese una opcion: '))
            if opcion == 1:
                ver_comentarios(profesores_unicos)
            elif opcion == 2:
                opinion_generada = generar_opinion(profesores_unicos)
            elif opcion == 3:
                if opinion_generada:
                    #print(opinion_generada)
                    evaluar_opinion(opinion_generada)
                else:
                    print("Primero debe generar una opinión antes de evaluarla.")
            elif opcion == 4:
                break
            else:
                print('Opcion invalida, intente de nuevo')
        except ValueError:
            print('Opcion invalida, intente de nuevo')


if __name__ == '__main__':
    profesores_unicos = comentarios['Profesor'].unique()
    while True:
        print('MENU')
        print('1. Listado de profesores')
        print('2. Salir')

        try:
            opcion = int(input('Ingrese una opcion: '))
            if opcion == 1:
                listado_profesores()
                sub_menu()
            elif opcion == 2:
                break
            else:
                print('Opcion invalida, intente de nuevo')
        except ValueError:
            print('Opcion invalida, intente de nuevo')

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


config.json:   0%|          | 0.00/1.58k [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/1.63G [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/363 [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/899k [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/456k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.36M [00:00<?, ?B/s]

Device set to use cpu


Modelo cargado exitosamente.
MENU
1. Listado de profesores
2. Salir
Ingrese una opcion: 1
Listado de profesores:
	1. Fanny Adan Sosa
	2. Rafael Aguilar Garcia
	3. Fernando Aguilar Sanchez
	4. Daniel Aguilar Velazquez
	5. Veronica Agustin Dominguez
	6. Cecilia Albortante Morato
	7. Alberto Jesus Alcantara Mendez
	8. Juan Jesus Alcaraz Torres
	9. Eduardo Aldana
	10. Mario Aldape Perez
	11. Miguel Angel Aleman Arce
	12. Eduardo Alfaro Miranda
	13. Rocio Almazan Farfan
	14. Sanchez Manilla Angeles Alejandra
	15. Maribel Aragon
	16. Moises Arango Leon
	17. David Araujo Diaz
	18. Elsa Leticia Arcos Diaz
	19. Jaqueline Arzate Gordillo
	20. Cristhian Alejandro Avila Sanches
	21. Marco Antonio Barranco Jimenez
	22. Daniel Alejandro Barrios Alvarado
	23. Daniel Barrios
	24. Ricardo Barron Hernandez
	25. Josue Barron Vera
	26. Sandra Ivette Bautista Rosales
	27. Fredy Baños Santander
	28. Ana Karen Benitez
	29. Ivan Eduardo Blanco Almazan
	30. Alejandro Botello Castillo
	31. Israel Buitron Damaso

The hypothesis contains 0 counts of 3-gram overlaps.
Therefore the BLEU score evaluates to 0, independently of
how many N-gram overlaps of lower order it contains.
Consider using lower n-gram order or use SmoothingFunction()
The hypothesis contains 0 counts of 4-gram overlaps.
Therefore the BLEU score evaluates to 0, independently of
how many N-gram overlaps of lower order it contains.
Consider using lower n-gram order or use SmoothingFunction()



 ** Evaluando la opinión generada: **
Opinión de referencia: El profesor es descrito como alguien accesible y tranquilo el cual es ideal para los estudiantes que quieren obtener una buena calificación, pues solo debes cumplir con los trabajos que pide. Pero las clases suelen ser teóricas y a veces aburridas o confusas debido al uso excesivo de diapositivas y porque luego se confunde o tartamudea, aun así es considerado un buen profesor para aprender lo básico, pero no cubre el temario por completo, pero puedes aprender por tu cuenta. 

Métrica BLEU:
BLEU score: 0.0000
BLEU-1 score: 0.2500

Métrica ROUGE:
ROUGE scores:
ROUGE-1: Score(precision=0.30434782608695654, recall=0.3373493975903614, fmeasure=0.32)
ROUGE-2: Score(precision=0.04395604395604396, recall=0.04878048780487805, fmeasure=0.046242774566474)
ROUGE-L: Score(precision=0.20652173913043478, recall=0.2289156626506024, fmeasure=0.21714285714285714)
MENU
1. Ver comentarios
2. Generar opinion
3. Evaluar opinión generada
4. Salir


The hypothesis contains 0 counts of 3-gram overlaps.
Therefore the BLEU score evaluates to 0, independently of
how many N-gram overlaps of lower order it contains.
Consider using lower n-gram order or use SmoothingFunction()
The hypothesis contains 0 counts of 4-gram overlaps.
Therefore the BLEU score evaluates to 0, independently of
how many N-gram overlaps of lower order it contains.
Consider using lower n-gram order or use SmoothingFunction()



 ** Evaluando la opinión generada: **
Opinión de referencia: Algunos comentarios mencionan que la profesora es empática, comprensible y apoya a los estudiantes, además de que sus exámenes suelen estar basados en ejercicios vistos en clase. Sin embargo, muchos critican que no domina los temas, se confunde al explicar y que en ocasiones se enoja por sus propios errores, lo que dificulta el aprendizaje además que suele dejar trabajos difíciles para entregarse en poco tiempo.

Métrica BLEU:
BLEU score: 0.0000
BLEU-1 score: 0.2750

Métrica ROUGE:
ROUGE scores:
ROUGE-1: Score(precision=0.38095238095238093, recall=0.4507042253521127, fmeasure=0.41290322580645156)
ROUGE-2: Score(precision=0.13253012048192772, recall=0.15714285714285714, fmeasure=0.14379084967320263)
ROUGE-L: Score(precision=0.16666666666666666, recall=0.19718309859154928, fmeasure=0.18064516129032257)
MENU
1. Ver comentarios
2. Generar opinion
3. Evaluar opinión generada
4. Salir
Ingrese una opcion: 2
Ingrese el numero del pr

The hypothesis contains 0 counts of 2-gram overlaps.
Therefore the BLEU score evaluates to 0, independently of
how many N-gram overlaps of lower order it contains.
Consider using lower n-gram order or use SmoothingFunction()
The hypothesis contains 0 counts of 3-gram overlaps.
Therefore the BLEU score evaluates to 0, independently of
how many N-gram overlaps of lower order it contains.
Consider using lower n-gram order or use SmoothingFunction()
The hypothesis contains 0 counts of 4-gram overlaps.
Therefore the BLEU score evaluates to 0, independently of
how many N-gram overlaps of lower order it contains.
Consider using lower n-gram order or use SmoothingFunction()



 ** Evaluando la opinión generada: **
Opinión de referencia: El profe es exigente pero favorece a quienes tienen bases solidas de la materia, haciendo asi difícil y tedioso al momento de cursar con el, también porque las practicas y exámenes suelen ser demasiados complicados y a veces dependemos de lo que otros compañeros hagan para resolver las practicas

Métrica BLEU:
BLEU score: 0.0000
BLEU-1 score: 0.1778

Métrica ROUGE:
ROUGE scores:
ROUGE-1: Score(precision=0.20202020202020202, recall=0.37735849056603776, fmeasure=0.26315789473684215)
ROUGE-2: Score(precision=0.01020408163265306, recall=0.019230769230769232, fmeasure=0.013333333333333332)
ROUGE-L: Score(precision=0.13131313131313133, recall=0.24528301886792453, fmeasure=0.1710526315789474)
MENU
1. Ver comentarios
2. Generar opinion
3. Evaluar opinión generada
4. Salir
Ingrese una opcion: 2
Ingrese el numero del profesor: 283
Generando opinión del profesor Sanchez Vargas Perla Rebeca:
Texto base para generación: Como profesora es

The hypothesis contains 0 counts of 3-gram overlaps.
Therefore the BLEU score evaluates to 0, independently of
how many N-gram overlaps of lower order it contains.
Consider using lower n-gram order or use SmoothingFunction()
The hypothesis contains 0 counts of 4-gram overlaps.
Therefore the BLEU score evaluates to 0, independently of
how many N-gram overlaps of lower order it contains.
Consider using lower n-gram order or use SmoothingFunction()



 ** Evaluando la opinión generada: **
Opinión de referencia: La profa tiene una muy buena reputación, destacándose por explicar los temas de manera clara y estructurada deja tareas, especialmente en equipo, que ayudan a preparar los exámenes departamentales. En general, es considerada una excelente profesora, dedicada a que sus estudiantes aprendan, aunque es necesario estudiar por cuenta propia y mantenerse al día con el ritmo de la clase para obtener buenos resultados.

Métrica BLEU:
BLEU score: 0.0000
BLEU-1 score: 0.2597

Métrica ROUGE:
ROUGE scores:
ROUGE-1: Score(precision=0.3037974683544304, recall=0.3582089552238806, fmeasure=0.3287671232876712)
ROUGE-2: Score(precision=0.02564102564102564, recall=0.030303030303030304, fmeasure=0.027777777777777776)
ROUGE-L: Score(precision=0.13924050632911392, recall=0.16417910447761194, fmeasure=0.1506849315068493)
MENU
1. Ver comentarios
2. Generar opinion
3. Evaluar opinión generada
4. Salir
Ingrese una opcion: 2
Ingrese el numero del prof

The hypothesis contains 0 counts of 2-gram overlaps.
Therefore the BLEU score evaluates to 0, independently of
how many N-gram overlaps of lower order it contains.
Consider using lower n-gram order or use SmoothingFunction()
The hypothesis contains 0 counts of 3-gram overlaps.
Therefore the BLEU score evaluates to 0, independently of
how many N-gram overlaps of lower order it contains.
Consider using lower n-gram order or use SmoothingFunction()
The hypothesis contains 0 counts of 4-gram overlaps.
Therefore the BLEU score evaluates to 0, independently of
how many N-gram overlaps of lower order it contains.
Consider using lower n-gram order or use SmoothingFunction()



 ** Evaluando la opinión generada: **
Opinión de referencia: La verdad, el profe sabe muchísimo, es bueno en temas como matemáticas, física y hasta computación cuántica. Muchas veces da las clases estilo cátedra, y se pone a hablar de cosas súper interesantes, pero que no siempre tienen que ver con el temario. A veces eso te motiva, pero otras veces te puedes perder y si hace tedioso, algunas veces no es muy puntual o llega a faltar.

Métrica BLEU:
BLEU score: 0.0000
BLEU-1 score: 0.1807

Métrica ROUGE:
ROUGE scores:
ROUGE-1: Score(precision=0.26136363636363635, recall=0.30666666666666664, fmeasure=0.2822085889570552)
ROUGE-2: Score(precision=0.0, recall=0.0, fmeasure=0.0)
ROUGE-L: Score(precision=0.125, recall=0.14666666666666667, fmeasure=0.13496932515337423)
MENU
1. Ver comentarios
2. Generar opinion
3. Evaluar opinión generada
4. Salir
Ingrese una opcion: 2
Ingrese el numero del profesor: 30
Generando opinión del profesor Alejandro Botello Castillo:
Texto base para generación: Pro

The hypothesis contains 0 counts of 4-gram overlaps.
Therefore the BLEU score evaluates to 0, independently of
how many N-gram overlaps of lower order it contains.
Consider using lower n-gram order or use SmoothingFunction()



 ** Evaluando la opinión generada: **
Opinión de referencia: Es mu engreído y egocéntrico pero a veces cuenta chascarrillos, sus clases son pura teoria y diapositivas, las practicas son individuales y puro copiar y pegar las sentencias para ejecutarlas, se tienen que entregar en la hora y media de clase y recomiendo llevar el software ya listo porque si no es imposible terminarlas, la asistencia vale un 80% y si tienes 3 faltas no te permite hacer examen, los examenes son difíciles y en dos partes pero si repasas las diapositivas te va bien, el proyecto final lo revisa durante los 3 parciales y es en equipo.

Métrica BLEU:
BLEU score: 0.0000
BLEU-1 score: 0.2242

Métrica ROUGE:
ROUGE scores:
ROUGE-1: Score(precision=0.27722772277227725, recall=0.27722772277227725, fmeasure=0.27722772277227725)
ROUGE-2: Score(precision=0.06, recall=0.06, fmeasure=0.06)
ROUGE-L: Score(precision=0.12871287128712872, recall=0.12871287128712872, fmeasure=0.12871287128712872)
MENU
1. Ver comentarios
2. Gene

Your max_length is set to 300, but your input_length is only 279. Since this is a summarization task, where outputs shorter than the input are typically wanted, you might consider decreasing max_length manually, e.g. summarizer('...', max_length=139)


Generando opinión del profesor Ana Karen Benitez:
Texto base para generación: No sabe jugar bien al billar :v se preocupa por que aprendas, hace muy dinamica y amena la clase, se explica bien Siento que para que un profesor sea bueno debe gustarle dar clase, es de los pocos profesores que le gusta dar clase y lo transmite, es fácil y dinámica su clase, (su sonrisa es otro asunto muy bonito :3) [Comentario esperando revisión] Super linda la profesora. No te sube nada de puntos para que pases y varios se enojan por eso, pero la recomiendo mucho. En las actividades de lectura y cosas así te ayuda en vez de sentarse, es buena! Switch Places, Taco Time, Maluma is Handsome.... :v :v :v :3 :3 :3 Auqnue está joven es bastante buena, explica bien la gramática y hace muchas actividades, te incita a participar porque es divertida y aparte está bonita :v la recomiendo

############################################

Resumen generado: Super linda la profesora. No sabe jugar bien al billar :v se preoc

The hypothesis contains 0 counts of 3-gram overlaps.
Therefore the BLEU score evaluates to 0, independently of
how many N-gram overlaps of lower order it contains.
Consider using lower n-gram order or use SmoothingFunction()
The hypothesis contains 0 counts of 4-gram overlaps.
Therefore the BLEU score evaluates to 0, independently of
how many N-gram overlaps of lower order it contains.
Consider using lower n-gram order or use SmoothingFunction()



 ** Evaluando la opinión generada: **
Opinión de referencia: Es una maestra joven y bastante buena, se nota que le gusta dar clase y la hace amena, por lo que es fácil, divertida y dinámica, te deja muchas actividades e incita a participar, pero tambien te ayuda, es bonita.

Métrica BLEU:
BLEU score: 0.0000
BLEU-1 score: 0.2400

Métrica ROUGE:
ROUGE scores:
ROUGE-1: Score(precision=0.28205128205128205, recall=0.5238095238095238, fmeasure=0.36666666666666664)
ROUGE-2: Score(precision=0.03896103896103896, recall=0.07317073170731707, fmeasure=0.05084745762711864)
ROUGE-L: Score(precision=0.14102564102564102, recall=0.2619047619047619, fmeasure=0.18333333333333332)
MENU
1. Ver comentarios
2. Generar opinion
3. Evaluar opinión generada
4. Salir
Ingrese una opcion: 4
MENU
1. Listado de profesores
2. Salir
Ingrese una opcion: 2
