# **Processamento de Linguagem Natural [2024-Q2]**
Prof. Alexandre Donizeti Alves

### **PROJETO PRÁTICO** [LangChain + Grandes Modelos de Linguagem + API]


O **PROJETO PRÁTICO** deve ser feitO utilizando o **Google Colab** com uma conta sua vinculada ao Gmail. O link do seu notebook, armazenado no Google Drive, o link de um repositório no GitHub e o link de um vídeo do projeto em execução detalhando os principais resultados da atividade, devem ser enviados usando o seguinte formulário:

> https://forms.gle/D4gLqP1iGgyn2hbH8


**IMPORTANTE**: A submissão deve ser feita até o dia **08/09 (domingo)** APENAS POR UM INTEGRANTE DA EQUIPE, até às 23h59. Por favor, lembre-se de dar permissão de ACESSO IRRESTRITO para o professor da disciplina de PLN.

### **EQUIPE**

---

**POR FAVOR, PREENCHER OS INTEGRANDES DA SUA EQUIPE:**


**Integrante 01:**

`Por favor, informe o seu nome completo e RA:` Vitor Inacio da Silva 11201810048

**Integrante 02:**

`Por favor, informe o seu nome completo e RA:` João Pedro Genga Carneiro 11201810740

### **GRANDE MODELO DE LINGUAGEM (*Large Language Model - LLM*)**

---

Cada equipe deve selecionar um Grande Modelo de Linguagem (*Large Language Model - LMM*). Cada modelo pode ser escolhido por até 5 equipes.



Por favor, informe os dados do LLM selecionada:

>


**LLM**: Google Gemini 1.5 flash

>

**Link para a documentação oficial**: https://ai.google.dev/gemini-api?hl=pt-br



### **API**
---

Por favor, informe os dados da API selecionada:

**API**: Accuweather

**Site oficial**: https://developer.accuweather.com/

**Link para a documentação oficial**: https://developer.accuweather.com/accuweather-current-conditions-api/apis/get/currentconditions/v1/%7BlocationKey%7D






**IMPORTANTE**: cada **API** pode ser usada por até 4 equipes.

### **DESCRIÇÃO**
---

Implementar um `notebook` no `Google Colab` que faça uso do framework **`LangChain`** (obrigatório) e de um **LLM** aplicando, no mínimo, DUAS técnicas de PLN. As técnicas podem ser aplicada em qualquer córpus obtido a partir de uma **API** ou a partir de uma página Web.

O **LLM** e a **API** selecionados devem ser informados na seguinte planilha:

> https://docs.google.com/spreadsheets/d/1iIUZcwnywO7RuF6VEJ8Rx9NDT1cwteyvsnkhYr0NWtU/edit?usp=sharing

>
As seguintes técnicas de PLN podem ser usadas:

*   Correção Gramatical
*   Classificação de Textos
*   Análise de Sentimentos
*   Detecção de Emoções
*   Extração de Palavras-chave
*   Tradução de Textos
*   Sumarização de Textos
*   Similaridade de Textos
*   Reconhecimento de Entidades Nomeadas
*   Sistemas de Perguntas e Respostas
>

**IMPORTANTE:** É obrigatório usar o e-mail da UFABC.


### **CRITÉRIOS DE AVALIAÇÃO**
---


Serão considerados como critérios de avaliação os seguintes pontos:

* Uso do framework **`LangChain`**.

* Escolha e uso de um **LLM**.

* Escolha e uso de uma **API**.

* Vídeo (5 a 10 minutos).

* Criatividade no uso do framework **`LangChain`** em conjunto com o **LLM** e a **API**.




**IMPORTANTE**: todo o código do notebook deve ser executado. Código sem execução não será considerado.

### **IMPLEMENTAÇÃO**
---

# Conexão com a API

Instalar a biblioteca requests para fazer requisições HTTP com REST APIs.

In [None]:
!pip install requests -qU

Utilizamos a API pública da AccuWeather (https://developer.accuweather.com/) que retorna as condições climáticas atuais para um local específico.

Os detalhes da API estão disponíveis em (https://developer.accuweather.com/accuweather-current-conditions-api/apis/get/currentconditions/v1/%7BlocationKey%7D). Nesse caso específico utilizamos o endpoint Current Conditions.

**IMPORTANTE:** Nessa versão, que é a gratuita a API do AccuWeather comporta no máximo 50 requisições por dia.

A classe AccuWeatherAPI fornece uma interface simples para acessar informações de previsão do tempo da API AccuWeather. O método get_location_key permite recuperar a chave de uma cidade específica, que é usada para consultas futuras. O método get_forecast retorna as condições climáticas detalhadas para um determinado local, usando a chave da cidade. O método interpret_weather processa os dados da previsão e fornece um resumo interpretativo das condições climáticas, incluindo temperatura, precipitação, radiação UV e umidade relativa, oferecendo conselhos práticos como recomendações para proteção UV e atividades ao ar livre.

Essas inferências em relação as condições climáticas são geradas via regras no código seguindo informações disponíveis publicamente (https://www.who.int/news-room/questions-and-answers/item/radiation-the-ultraviolet-(uv)-index e https://www.cgesp.org/v3/umidade-relativa-do-ar.jsp) assim o modelo utilizado não precisa inventar informações, o que melhora a precisão das respostas.

In [None]:
import requests

class AccuWeatherAPI:
    def __init__(self, api_key):
        self.api_key = api_key
        self.base_url = "http://dataservice.accuweather.com"

    def get_location_key(self, city_name):
        """Obter a chave de uma cidade específica"""
        url = f"{self.base_url}/locations/v1/cities/search"
        params = {"apikey": self.api_key, "q": city_name}
        response = requests.get(url, params=params)
        if response.status_code == 200:
            data = response.json()
            if data:
                return data[0]['Key']
        return None

    def get_forecast(self, location_key):
        """Obter a previsão do tempo detalhada para um local específico"""
        url = f"{self.base_url}/currentconditions/v1/{location_key}"
        params = {"apikey": self.api_key, "details": True}
        response = requests.get(url, params=params)
        if response.status_code == 200:
            return response.json()
        else:
            print(f"Error: {response.status_code}, {response.text}")
            return None


    """Inferências geradas com base nas informações climáticas obtidas."""
    def interpret_weather(self, forecast):
        """Consolidar informações chave para interpretação pelo LLM"""
        weather_text = forecast[0].get('WeatherText', 'Unknown')
        temperature = forecast[0]['Temperature']['Metric']['Value']
        has_precipitation = forecast[0]['HasPrecipitation']
        precipitation_type = forecast[0].get('PrecipitationType', 'None')
        is_daytime = forecast[0]['IsDayTime']
        uv_index = forecast[0]['UVIndex']
        relative_humidity = forecast[0]['RelativeHumidity']

        weather_description = f"The weather is currently {weather_text} with a temperature of {temperature}°C."

        if has_precipitation:
            weather_description += f" There is {precipitation_type}."
        else:
            weather_description += " No precipitation is expected."

        """As recomendações para se proteger contra a radiação UV nociva do sol vem de: https://www.who.int/news-room/questions-and-answers/item/radiation-the-ultraviolet-(uv)-index"""
        uv_description = ""
        if uv_index <= 2:
            uv_description = "Low - You can safely enjoy being outside!"
        elif uv_index <= 7:
            uv_description = "Moderate - Seek shade during midday hours! Slip on a shirt, slop on sunscreen and slap on a hat!"
        else:
            uv_description = "High - Avoid being outside during midday hours! Make sure you seek shade! Shirt, sunscreen, and hat are a must!"

        """Dados sobre a escala de umidade relativa do ar obtidos de: https://www.cgesp.org/v3/umidade-relativa-do-ar.jsp"""
        humidity_description = ""
        if relative_humidity < 12:
            humidity_description = "Critically low - Uncomfortably dry"
        if relative_humidity < 30:
            humidity_description = "Low - Dry"
        elif relative_humidity < 70:
            humidity_description = "Moderate - Comfortable"
        else:
            humidity_description = "High - Uncomfortably humid"

        return {
            'temperature': f"{temperature} °C",
            'weather_text': weather_text,
            'is_daytime': is_daytime,
            'weather_description': weather_description,
            'has_precipitation': has_precipitation,
            'precipitation_type': precipitation_type,
            'rain_today': has_precipitation and precipitation_type.lower() == 'rain',
            'umbrella_advice': has_precipitation and is_daytime,
            'uv_index': uv_index,
            'uv_description': uv_description,
            'relative_humidity': relative_humidity,
            'humidity_description': humidity_description,
            'activity_advice': not has_precipitation and humidity_description == 'Moderate - Comfortable' and float(str(temperature).split()[0])  > 20,
        }

# LangChain + Google Gemini

## Engenharia de prompt

Instalando a biblioteca LangChain

In [None]:
!pip install langchain -qU

Aqui definimos um template para o prompt visando padronizar a leitura, feita pelo modelo, das perguntas do usuário.

In [None]:
from langchain.prompts import PromptTemplate

# Cria um template de prompt dinâmico
prompt_template = PromptTemplate(
    input_variables=["query", "temp", "weather_text", "is_daytime", "weather_description", "has_preciptation", "precipitation_type",
                     "rain_today", "umbrella_advice", "uv_index", "uv_description", "relative_humidity", "humidity_description", "activity_advice"],
    template="""
    You are a weather assistant. The user asked: "{query}"

    Based on the following data:
    Temperature: {temp},
    Conditions: {weather_text},
    Is it daytime?: {is_daytime},
    Weather summary: {weather_description},
    Precipitation?: {has_precipitation},
    Precipitation type: {precipitation_type},
    Will it rain?: {rain_today},
    Is it recommended to bring an umbrella?: {umbrella_advice},
    UV Index: {uv_index},
    UV recommendation: {uv_description},
    Relative humidity: {relative_humidity},
    Relative humidity classification: {humidity_description},
    Is it recommended to practice outside activities/sports?: {activity_advice}

    Please respond naturally to the user's question.
    """
)

Este método cria um dicionário de dados com as varáveis climáticas obtidas e a pergunta do usuário

In [None]:
# Criar um dicionário de dados com as varáveis climáticas obtidas e a pergunta do usuário

def set_prompt_values(query, weather_info):
  prompt_values = {
      "query": query,
      "temp": weather_info['temperature'],
      "weather_text": weather_info['weather_text'],
      "is_daytime": "Yes" if weather_info['is_daytime'] else "No",
      "weather_description": weather_info['weather_description'],
      "has_precipitation": "Yes" if weather_info['has_precipitation'] else "No",
      "precipitation_type": weather_info['precipitation_type'],
      "rain_today": "Yes" if weather_info['rain_today'] else "No",
      "umbrella_advice": "Yes" if weather_info['umbrella_advice'] else "No",
      "uv_index": weather_info['uv_index'],
      "uv_description": weather_info['uv_description'],
      "relative_humidity": weather_info['relative_humidity'],
      "humidity_description": weather_info['humidity_description'],
      "activity_advice": "Yes" if weather_info['activity_advice'] else "No",
  }

  prompt = prompt_template.format(**prompt_values)

  return prompt

## Conexão com o modelo

Instalar ou atualizar o pacote langchain-google-genai, que é uma integração da biblioteca LangChain com os modelos de inteligência artificial da Google.

In [None]:
# Instalando o pacote langchain-google-genai
!pip install langchain-google-genai -qU

Configurar a classe Model para interagir com a API Generative AI do Google, usando o modelo gemini-1.5-flash da biblioteca langchain_google_genai. O construtor da classe (__init__) define a chave de autenticação da API no ambiente e inicializa o modelo de geração de texto. A classe oferece dois métodos principais: make_request, que envia um prompt para o modelo e retorna a resposta, e traduzir_texto, que traduz um texto de um idioma para outro. O método traduzir_texto cria um prompt específico para tradução e utiliza make_request para obter e retornar a tradução solicitada.

A chave da API do Google está definida no código para facilitar as operações.

In [None]:
import os
import re
from langchain_google_genai import ChatGoogleGenerativeAI

class Model():
    def __init__(self):
        # Inserir a chave de autenticação para acessar a API Generative AI do Google
        os.environ["GOOGLE_API_KEY"] = 'AIzaSyBDkdkjXzYQykd2OPSkvtbUI7D1DNKkUVM'

        # Utilizar o modelo gemini-1.5-flash
        self.modelo = ChatGoogleGenerativeAI(model="gemini-1.5-flash")

    def make_request(self, prompt):
      resposta = self.modelo.invoke(prompt)
      return resposta

    def traduzir_texto(self, texto, idioma_origem="pt-br", idioma_destino="en-us"):
        # Cria o prompt de tradução
        prompt = f"""
            You are a language translator.
            Translate the following text from {idioma_origem} to {idioma_destino}: '{texto}'.
            Respond with the translated text only.
        """

        # Faz a requisição ao modelo para a tradução
        traducao = self.make_request(prompt)
        return traducao

# Chat

Este código define uma classe chamada ChatModel, que é responsável por gerenciar uma conversa focada em perguntas sobre o clima. Ele traduz perguntas feitas pelo usuário em português para o inglês, envia as perguntas ao modelo e guarda o histórico de interações do chat, e depois traduz a resposta também para o português.

Aqui está como ele funciona de forma geral:

- Iniciação da Classe: Quando a classe ChatModel é criada, ela carrega um modelo de linguagem e um histórico de perguntas e respostas que só envolve questões sobre o clima.

- Histórico de Conversas: O código mantém um registro de todas as perguntas e respostas relacionadas ao clima em uma lista, que pode ser consultada para dar contexto às respostas futuras do modelo.

- Geração de Perguntas: Quando o usuário faz uma pergunta sobre o clima, essa pergunta é traduzida para o inglês (já que o modelo parece funcionar melhor em inglês), e um prompt é criado. Esse prompt inclui tanto a pergunta do usuário quanto o histórico de interações anteriores, além de informações adicionais sobre o clima.

- Resposta do Modelo: O prompt gerado é enviado ao modelo, que responde com base no contexto dado. Essa resposta, inicialmente em inglês, é então traduzida de volta para o português para ser exibida ao usuário.

- Ciclo de Conversa: O programa continua em um loop, onde o usuário pode continuar fazendo perguntas sobre o clima. A cada interação, a pergunta e a resposta são adicionadas ao histórico, permitindo que o modelo entenda melhor o contexto das conversas passadas e forneça respostas mais precisas.

In [None]:
class ChatModel:
    def __init__(self):
        self.model = Model()
        self.weather_history = []  # Apenas perguntas e respostas sobre o clima

    def add_to_history(self, user_message, model_response):
        # Adicionar ao histórico somente as perguntas e respostas sobre o clima
        self.weather_history.append(f"User: {user_message}")
        self.weather_history.append(f"Model: {model_response}")

    def generate_prompt(self, user_question, weather_info):
        # Traduzir a pergunta do usuário para o inglês
        question_in_english = self.model.traduzir_texto(texto=user_question, idioma_origem="pt-br", idioma_destino="en-us")
        question_in_english = question_in_english.content
        # Criar o prompt com base nas informações do clima e no histórico
        history_text = "\n".join(self.weather_history)
        prompt = f"{history_text}\nUser: {question_in_english}\nWeather info: {weather_info}\nModel:"

        return prompt, question_in_english  # Retorna a pergunta em inglês para adicionar ao histórico

    def get_response(self, prompt):
        # Fazer a requisição ao modelo
        response = self.model.make_request(prompt)

        # Verificar o tipo da resposta e acessar o campo content
        if hasattr(response, 'content'):
            response_content = response.content
        else:
            response_content = str(response)  # Assumindo que seja uma string ou outro tipo

        # Traduzir a resposta para o português
        response_in_portuguese = self.model.traduzir_texto(response_content, idioma_origem="en-us", idioma_destino="pt-br")

        return response_content, response_in_portuguese  # Retorna as duas versões da resposta

    def chat(self, weather_info):
        while True:
            user_question = input("Digite sua pergunta sobre o clima: ")

            # Gera o prompt e obtém a resposta
            prompt, question_in_english = self.generate_prompt(user_question, weather_info)

            # Não há necessidade de acessar .content, pois question_in_english é uma string
            response_in_english, response_in_portuguese = self.get_response(prompt)

            # Adicionar somente a pergunta sobre o clima e a resposta ao histórico
            self.add_to_history(question_in_english, response_in_english)

            # Exibir a resposta ao usuário
            print(response_in_portuguese.content)

# Aplicação

In [None]:
# Exemplo de uso no fluxo do programa
if __name__ == "__main__":
    try:
        accuweather = AccuWeatherAPI("9xhyFBB8RZXhrWyQhGgh4o5GTfo54qgu")
        location_key = accuweather.get_location_key("São Paulo")
        forecast = accuweather.get_forecast(location_key)
        weather_info = accuweather.interpret_weather(forecast)

        chat_model = ChatModel()
        chat_model.chat(weather_info)
    except KeyboardInterrupt:
        print("\nProgram interrupted by user. Exiting gracefully...")
    finally:
        # Saindo do programa
        print("Cleanup if needed.")


Digite sua pergunta sobre o clima: Como está o céu agora, e como está a temperatura?
O céu está limpo e a temperatura é de 23,9°C. 


Program interrupted by user. Exiting gracefully...
Cleanup if needed.
