# **Processamento de Linguagem Natural [2024-Q2]**
Prof. Alexandre Donizeti Alves

<br>

---

## **PROJETO PRÁTICO** [LangChain + Grandes Modelos de Linguagem + API]

### **EQUIPE**
---

**Integrante 01:**

Nome: `GABRIEL SPONDA FREITAS BETTARELLO`
<br>
RA: `11201932580`

<br>

**Integrante 02:**

Nome: `GABRIEL BELLOMI MEALE`
<br>
RA: `11091915`

<br>

### **GRANDE MODELO DE LINGUAGEM (*Large Language Model - LLM*)**
---


**LLM**: GPT-3.5 Turbo

**Link para a documentação oficial**: https://platform.openai.com/docs/models/gpt-3-5-turbo

<br>

### **API**
---

**API**: OpenAI API

**Site oficial**: https://openai.com/api/

**Link para a documentação oficial**: https://platform.openai.com/docs/overview

<br>

### **DESCRIÇÃO**
---

O projeto consiste em uma análise automatizada de avaliações de alunos sobre professores utilizando técnicas de processamento de linguagem natural (PLN). Ele processa textos para identificar sentimentos predominantes, fornece recomendações sobre os professores, e resume feedbacks em um parágrafo. Utilizando o modelo de linguagem GPT-3.5-turbo, o sistema analisa cada comentário dos alunos e classifica as emoções expressas. O resultado é uma apresentação estruturada que inclui os sentimentos mais comuns, uma recomendação global (Recomendado, Não Recomendado ou Mista) e um resumo dos pontos fortes e fracos mencionados nas avaliações.

<br>

**Técnicas de PLN Utilizadas:**

- Análise de Sentimentos: O projeto identifica e classifica as emoções expressas nos comentários dos alunos.
- Detecção de Emoções: Determina quais sentimentos predominam em cada avaliação para informar as recomendações.
- Sumarização de Textos: Resume o feedback dos alunos em um parágrafo, destacando pontos fortes e fracos.

<br>

### **CRITÉRIOS DE AVALIAÇÃO**
---

Serão considerados como critérios de avaliação os seguintes pontos:

* Uso do framework **`LangChain`**. <span>&#9989;</span>

* Escolha e uso de um **LLM**. <span>&#9989;</span>

* Escolha e uso de uma **API**. <span>&#9989;</span>

* Vídeo (5 a 10 minutos). <span>&#9989;</span>

* Criatividade no uso do framework **`LangChain`** em conjunto com o **LLM** e a **API**. <span>&#9989;</span>

<br>

### **IMPLEMENTAÇÃO**
---

#### Instalação de Pacotes

Este bloco de código é responsável pela instalação das bibliotecas necessárias para o projeto. As bibliotecas incluem `langchain`, que é usada para construir e gerenciar cadeias de linguagem, `langchain-openai` para integrar com os modelos da OpenAI, e `pandas` para manipulação de dados estruturados em DataFrames. A flag `-q` é utilizada para silenciar a saída do processo de instalação, tornando o notebook mais limpo.

In [1]:
!pip install -q langchain
!pip install -q langchain-openai
!pip install -q pandas

[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m50.4/50.4 kB[0m [31m1.8 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.0/1.0 MB[0m [31m13.8 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m395.9/395.9 kB[0m [31m20.0 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m150.6/150.6 kB[0m [31m8.4 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m76.4/76.4 kB[0m [31m3.9 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m77.9/77.9 kB[0m [31m4.6 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m141.9/141.9 kB[0m [31m8.5 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m58.3/58.3 kB[0m [31m3.2 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

#### Configuração da Chave da API

Este trecho de código importa as bibliotecas `getpass` e `os`, que são utilizadas para manipular variáveis de ambiente de forma segura. A chave da API da OpenAI é solicitada ao usuário por meio de `getpass.getpass()`, o que evita que a chave seja exibida em texto puro. A chave é então armazenada como uma variável de ambiente, permitindo que o código acesse a API de maneira segura e eficiente.

In [2]:
import getpass
import os

os.environ["OPENAI_API_KEY"] = getpass.getpass()

··········


#### Configuração do Modelo de Linguagem

Este bloco inicializa o modelo `ChatOpenAI` da biblioteca `langchain_openai`. O modelo selecionado é `gpt-3.5-turbo`, conhecido por suas capacidades de processamento de linguagem natural. A temperatura do modelo é definida como 0.3, o que controla a aleatoriedade das respostas geradas. Valores mais baixos de temperatura resultam em saídas mais determinísticas, enquanto valores mais altos introduzem mais variabilidade.

In [28]:
from langchain_openai import ChatOpenAI

modelo = ChatOpenAI(model="gpt-3.5-turbo", temperature=0.3)

#### Definição de Sentimentos Permitidos

Aqui, uma lista de sentimentos permitidos é definida. Esses sentimentos são usados para a análise das avaliações e são identificados como as emoções que o modelo deve reconhecer e classificar. A lista inclui sentimentos como "admiração", "adoração", "alívio", "ansiedade", entre outros. Essa lista serve como um filtro para garantir que apenas emoções relevantes sejam consideradas durante o processamento das avaliações.

In [23]:
sentimentos_permitidos = [
    "admiração", "adoração", "alívio", "anseio", "ansiedade", "apreciação estética", "arrebatamento", "calma",
    "confusão", "desejo sexual", "dor empática", "espanto", "estranhamento", "excitação", "horror", "inveja",
    "interesse", "júbilo", "medo", "nojo", "nostalgia", "raiva", "romance", "satisfação", "surpresa", "tédio", "tristeza"
]

#### Criação de Prompts para Análise

Este bloco define funções para criar prompts que serão utilizados nas análises:

- **`criar_prompt_emocoes`:** Esta função cria um prompt para identificar o sentimento principal em um texto, usando apenas os sentimentos listados previamente.
- **`criar_prompt_recomendacao`:** Esta função cria um prompt que determina se um professor é recomendado com base nos sentimentos agregados dos alunos, oferecendo opções de resposta como 'Recomendado', 'Não recomendado' ou 'Mista'.
- **`criar_prompt_resumo`:** Esta função gera um prompt que resume os feedbacks dos alunos em um parágrafo, destacando pontos fortes e fracos.

Essas funções utilizam o `ChatPromptTemplate` para estruturar as mensagens de entrada e saída, facilitando a integração com o modelo de linguagem.

In [29]:
from langchain.prompts import ChatPromptTemplate

def criar_prompt_emocoes():
    return ChatPromptTemplate.from_messages([
        ("system", f"Você é um assistente que identifica o sentimento principal em um texto dado. Use somente os seguintes sentimentos: {', '.join(sentimentos_permitidos)}. Você deve escolher ao menos um."),
        ("user", "Texto: {text}")
    ])

def criar_prompt_recomendacao():
    return ChatPromptTemplate.from_messages([
        ("system", "Você é um assistente que determina se um professor é recomendado com base nos sentimentos agregados de alunos que você detectou."),
        ("user", "Emoções: {emotions} - Responda com 'Recomendado', 'Não recomendado' ou 'Mista'.")
    ])

def criar_prompt_resumo():
    return ChatPromptTemplate.from_messages([
        ("system", "Você é um assistente que resume os feedbacks dos alunos em um parágrafo destacando os pontos fortes e fracos."),
        ("user", "Feedbacks: {feedbacks}")
    ])

#### Processamento de Avaliações

O código neste bloco importa `StrOutputParser` e `Counter` para auxiliar no processamento de textos e contagem de ocorrências, respectivamente. A função `processar_avaliacoes` percorre as avaliações dos professores, executando uma cadeia de prompts para determinar as emoções expressas nos textos, fazer recomendações e resumir feedbacks:

- **Identificação de Emoções:** As emoções expressas em cada avaliação são identificadas e armazenadas.
- **Filtragem e Contagem:** Apenas as emoções permitidas são mantidas e contadas para determinar quais são as mais relevantes.
- **Recomendação:** Baseando-se nas emoções filtradas, a função determina se o professor é recomendado.
- **Resumo:** Um resumo das avaliações é gerado, destacando os pontos principais.

Os resultados são compilados em uma lista de strings formatadas, cada uma representando um resumo e recomendação para um professor específico.

In [34]:
from langchain_core.output_parsers import StrOutputParser
from collections import Counter

def processar_avaliacoes(avaliacoes):
    prompt_emocoes = criar_prompt_emocoes()
    prompt_recomendacao = criar_prompt_recomendacao()
    prompt_resumo = criar_prompt_resumo()

    recomendacoes = []

    professores = avaliacoes["Professor"].unique()
    for professor in professores:
        avaliacoes_professor = avaliacoes[avaliacoes["Professor"] == professor]
        todas_emocoes = []
        todos_feedbacks = []

        for index, row in avaliacoes_professor.iterrows():
            texto = row["Avaliacao"]
            emocoes_chain = prompt_emocoes | modelo | StrOutputParser()
            emocoes = emocoes_chain.invoke({"text": texto}).strip().lower()
            todas_emocoes.append(emocoes)
            todos_feedbacks.append(texto)

        emocoes_filtradas = [sentimento for sentimento in todas_emocoes if sentimento in sentimentos_permitidos]

        if emocoes_filtradas:
            sentimentos_relevantes = Counter(emocoes_filtradas).most_common()
            sentimentos_relevantes = list(map(str, sentimentos_relevantes))

            recomendacao_chain = prompt_recomendacao | modelo | StrOutputParser()
            recomendacao = recomendacao_chain.invoke({"emotions": ", ".join(sentimentos_relevantes)}).strip()

            resumo_chain = prompt_resumo | modelo | StrOutputParser()
            resumo_feedback = resumo_chain.invoke({"feedbacks": " ".join(todos_feedbacks)}).strip()

            recomendacoes.append(f"{professor}: {recomendacao} - Sentimentos dos alunos: {', '.join(sentimentos_relevantes)} - Resumo das análises: {resumo_feedback}")

    return recomendacoes

#### Leitura de Avaliações

Este bloco utiliza a biblioteca `pandas` para ler um arquivo CSV contendo as avaliações dos alunos. O arquivo é carregado em um DataFrame, que é então passado para a função `processar_avaliacoes` para análise. A variável `nome_arquivo_entrada` especifica o nome do arquivo a ser lido, neste caso, 'avaliacao_next.csv'.

In [35]:
import pandas as pd

nome_arquivo_entrada = 'avaliacao_next.csv'
avaliacoes = pd.read_csv(nome_arquivo_entrada)

recomendacoes = processar_avaliacoes(avaliacoes)

#### Apresentação das Recomendações

Este trecho final do código utiliza `IPython.display.Markdown` e `display` para apresentar as recomendações de forma formatada e legível no Jupyter Notebook. Cada item na lista `recomendacoes` é transformado em markdown e exibido, permitindo uma visualização clara dos resultados analisados e formatados. A apresentação em markdown melhora a legibilidade e organização das informações, tornando-as mais compreensíveis para o usuário.

In [36]:
from IPython.display import Markdown, display

for item in recomendacoes:
    item_formatado = item.replace(" - ", "\n\n")
    display(Markdown(item_formatado))
    print("\n")

Alice: Com base nas emoções dos alunos, eu diria que o professor é **Recomendado**.

Sentimentos dos alunos: ('admiração', 10), ('confusão', 1)

Resumo das análises: A professora Alice é altamente elogiada por sua didática excelente, organização e disponibilidade para ajudar os alunos. Seu conhecimento sólido e habilidade de ensino são destacados, assim como a justiça de suas provas e a relação entre os exercícios e o conteúdo abordado em aula. No entanto, alguns alunos mencionam que as listas de exercícios e as provas podem ser desafiadoras, exigindo um esforço significativo para obter bons resultados. Além disso, sua exigência em relação ao formalismo e demonstrações pode ser considerada excessiva por alguns, o que pode impactar a nota final. Aqueles que se dedicam à disciplina elogiam a melhora no raciocínio e na compreensão da programação. Em resumo, a professora Alice é reconhecida por sua dedicação em ensinar e apoiar os alunos, embora sua exigência e o nível de dificuldade das avaliações possam representar um desafio para alguns estudantes.





Bob: Com base nas emoções agregadas dos alunos, eu diria que este professor é **Recomendado**.

Sentimentos dos alunos: ('admiração', 4), ('calma', 3), ('interesse', 2), ('confusão', 2), ('excitação', 1), ('medo', 1), ('satisfação', 1)

Resumo das análises: Os alunos destacam como pontos fortes do professor a disponibilidade para ajudar, a atenção às dúvidas dos alunos, a possibilidade de levar folha de resumo para as provas, a didática clara em algumas disciplinas e a preocupação em ensinar o conteúdo. No entanto, apontam como pontos fracos a cobrança de presença, a falta de condizência entre as listas de exercícios e as provas, a dificuldade das avaliações, a correção rigorosa em alguns casos, a aula maçante em determinadas disciplinas e a falta de clareza em algumas questões das provas. Alguns alunos mencionam que o professor pode ser grosso em certas situações e que as aulas podem ser confusas em determinados momentos. Em geral, os alunos reconhecem a boa vontade do professor em ensinar, mas destacam a necessidade de melhorias em alguns aspectos.





Charlie: Com base nas emoções agregadas dos alunos, eu diria que o professor é **Recomendado**.

Sentimentos dos alunos: ('admiração', 10), ('interesse', 4), ('calma', 3), ('confusão', 3), ('raiva', 1), ('satisfação', 1), ('ansiedade', 1), ('júbilo', 1), ('surpresa', 1)

Resumo das análises: O professor Charlie é reconhecido por sua vasta bagagem e conhecimento sobre o conteúdo, sendo elogiado por sua disponibilidade e didática. Se destaca por tornar as provas tranquilas e por oferecer pontos extras por participação e entrega de trabalhos. No entanto, alguns alunos apontam que ele pode divagar em alguns momentos e se empolgar demais, o que pode tornar as aulas um pouco confusas. Além disso, houve relatos de que a prova única e o método de avaliação podem não ser totalmente condizentes com o conteúdo abordado em sala. No geral, é considerado um professor amigável e que busca ajudar os alunos a obterem bons resultados.





<br>

### **VÍDEO**
---
<br>

**Link:** https://youtu.be/eZx3pil6Vdc