# **Processamento de Linguagem Natural [2023.Q3]**
Prof. Alexandre Donizeti Alves

### **ATIVIDADE PRÁTICA 04 [Uso da API da OpenAI com técnicas de PLN]**


A **ATIVIDADE PRÁTICA 04** deve ser feita utilizando o **Google Colab** com uma conta sua vinculada ao Gmail. O link do seu notebook, armazenado no Google Drive, além do link de um repositório no GitHub e os principais resultados da atividade, devem ser enviados usando o seguinte formulário:

> https://forms.gle/GzwCq3R7ExtE9g9a8


**IMPORTANTE**: A submissão deve ser feita até o dia 20/11 (segunda-feira) APENAS POR UM INTEGRANTE DA EQUIPE, até às 23h59. Por favor, lembre-se de dar permissão de ACESSO IRRESTRITO para o professor da disciplina de PLN.

### **EQUIPE**

---

**POR FAVOR, PREENCHER OS INTEGRANDES DA SUA EQUIPE:**


**Integrante 01:**

André Barros Balchiumas 11201920328

**Integrante 02:**

Guilherme Goncalves Braz 11201920453 

### **LIVRO**
---

`Processamento de Linguagem Natural - Conceitos, Técnicas e Aplicações em Português.`

>

Disponível gratuitamente em:
  
  > https://brasileiraspln.com/livro-pln/1a-edicao/.


**POR FAVOR, PREENCHER OS CAPITULOS SELECIONADOS PARA A SUA EQUIPE:**

`Primeiro capítulo: 6`

`Segundo capítulo: 19`


Implementar um `notebook` no `Google Colab` que faça uso da **API da OpenAI** aplicando, no mínimo, 3 técnicas de PLN. As técnicas devem ser aplicadas nos 2 (DOIS) capítulos do livro **Processamento de Linguagem Natural - Conceitos, Técnicas e Aplicações em Português**.

>

**RESTRIÇÃO**: É obrigatório usar o *endpoint* "*`Chat Completions`*".

>

As seguintes técnicas de PLN podem ser usadas:

*   Correção Gramatical
*   Classificação de Textos
*   Análise de Sentimentos
*   Detecção de Emoções
*   Extração de Palavras-chave
*   Tradução de Textos
*   Sumarização de Textos
*   **Similaridade de Textos**
*   **Reconhecimento de Entidades Nomeadas**
*   **Sistemas de Perguntas e Respostas**

>

Os capítulos devem ser os mesmos selecionados na **ATIVIDADE PRÁTICA 02**. Para consultar os capítulos, considere a seguinte planilha:

>

> https://docs.google.com/spreadsheets/d/1ZutzQ3v1OJgsgzCvCwxXlRIQ3ChXNlHNvB63JQvYsbo/edit?usp=sharing

>
>

**IMPORTANTE:** É obrigatório usar o e-mail da UFABC. Não é permitido alterar os capítulos já selecionados.



### **DESCRIÇÃO**
---

### **CRITÉRIOS DE AVALIAÇÃO**
---


Serão considerados como critérios de avaliação as técnicas usadas e a criatividade envolvida na aplicação das mesmas.




### **IMPLEMENTAÇÃO**
---

# Imports necessários

In [175]:
import os
import re
from pathlib import Path

# bibliotecas third-party
from requests import get  # pip install requests
from bs4 import BeautifulSoup as bs  # pip install beautifulsoup4
from openai import OpenAI # pip install openai
from dotenv import load_dotenv  # pip install python-dotenv


## Extração do texto capítulos 6 e 19 do livro

In [176]:
def extract_text_from_html(url : str) -> list[str]:
    content = []
    request = get(url)
    if request.status_code == 200:
        soup = bs(request.content.decode('utf-8'), features="html.parser")
        paragraphs = soup.find_all("p")
        for paragraph in paragraphs:
            content.append(paragraph.get_text())
    return content

In [177]:
cap6_raw = extract_text_from_html("https://brasileiraspln.com/livro-pln/1a-edicao/parte4/cap6/cap6.html")
cap6 = "\n".join(cap6_raw)

In [178]:
cap19_raw = extract_text_from_html("https://brasileiraspln.com/livro-pln/1a-edicao/parte8/cap19/cap19.html")
cap19 = "\n".join(cap19_raw)

## Localizando o arquivo .env dentro do repo

In [179]:
def find_dotenv() -> str:
    for root, dirs, files in os.walk(str(Path(os.getcwd()).parents[0])):
        if '.env' in files:
            dotenv_path = os.path.join(root, '.env')
            load_dotenv(dotenv_path)
            return dotenv_path
    return None

# Definição de técnicas de PLN com o Chat Completions (API v1.3.3)

In [180]:
client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))

In [181]:
def chat_with_api(system_role : str, prompt: str) -> str:
    try:
        response = client.chat.completions.create(
            messages = [
                {"role": "system", "content": system_role},
                {"role": "user", "content": prompt},
            ],
            model="gpt-3.5-turbo"
        )
        response_text = response.choices[0].message.content
        return response_text
    except Exception as e:
        print(f"Erro ao comunicar com a API: {e}")
        return None

## Técnica 1: Correção Gramatical

In [182]:
def correcao_gramatical(prompt : str) -> str:
    return chat_with_api(system_role="Você é um um assistente de correção textual que vai me ajudar a achar erros gramaticais no texto apresentado",
                         prompt=prompt)

## Técnica 2: Classificação de Textos

In [183]:
def sumarizacao_textos(prompt : str) -> str:
    return chat_with_api(system_role="Você é um um assistente de classificação textual que vai me ajudar a classificar o texto apresentado",
                         prompt=prompt)

## Técnica 3: Análise de Sentimentos

In [184]:
def analise_sentimentos(prompt : str) -> str:
    return chat_with_api(system_role="Você é um um assistente que faz análises sentimentais com base no texto apresentado",
                         prompt=prompt)

## Técnica 4: Detecção de Emoções

In [185]:
def deteccao_emocoes(prompt : str) -> str:
    return chat_with_api(system_role="Você é um um assistente de detecção de emoções com base no texto apresentado",
                         prompt=prompt)

## Técnica 5: Extração de Palavras-chave

In [186]:
def extraca_palavras_chave(prompt : str) -> str:
    return chat_with_api(system_role="Você é um um assistente textual que vai me ajudar a extrair palavras-chave do texto apresentado",
                         prompt=prompt)

## Técnica 6: Tradução de Textos

In [187]:
def traducao_textos(prompt : str) -> str:
    return chat_with_api(system_role="Você é um um assistente textual que vai me ajudar a traduzir textos do inglês para o português",
                         prompt=prompt)

## Técnica 7: Sumarização de Textos

In [188]:
def sumarizacao_textos(prompt : str) -> str:
    return chat_with_api(system_role="Você é um um assistente de sumarização textual que vai me ajudar a sumarizar o texto apresentado",
                         prompt=prompt)

## Técnica 8: Similaridade de Textos

In [189]:
def similaridade_textos(prompt : str) -> str:
    return chat_with_api(system_role="Você é um um assistente textual que vai me ajudar a encontrar similaridades nos textos apresentados",
                         prompt=prompt)

## Técnica 9: Reconhecimento de Entidades Nomeadas

In [190]:
def recon_entidades_nomeadas(prompt : str) -> str:
    return chat_with_api(system_role="Você é um um assistente textual que vai me ajudar a reconhecer/encontar entidades nomeadas no texto apresentado",
                         prompt=prompt)