<a href="https://colab.research.google.com/github/adalves-ufabc/2024.Q2-PLN/blob/main/2024_Q2_PLN_AULA_12_Notebook_23.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Processamento de Linguagem Natural [2024-Q2]**
Prof. Alexandre Donizeti Alves


## **LangChain [Engenharia de *Prompts*]**
---


In [59]:
#@title Instalando o pacote LangChain
!pip install -qU langchain

In [60]:
#@title Versão do LangChain

import langchain

print(langchain.__version__)

0.2.12


In [61]:
#@title Integração com o pacote da OpenAI
!pip install -qU langchain-openai

In [62]:
#@title Definindo a chave da API da OpenAI

import getpass
import os

os.environ["OPENAI_API_KEY"] = getpass.getpass()

··········


## **Engenharia de *Prompts***

**Engenharia de *prompts*** é o processo de criar, ajustar e otimizar comandos (ou "*prompts*") dados a modelos de linguagem para obter respostas mais precisas, úteis ou relevantes.

Essa prática envolve a formulação cuidadosa de perguntas ou instruções para garantir que o modelo compreenda e responda de maneira adequada ao que está sendo solicitado.

In [None]:
from langchain_openai import ChatOpenAI
from langchain.prompts import PromptTemplate

In [None]:
template = """Question: {question}

Answer: Let's think step by step."""

prompt = PromptTemplate(template=template, input_variables=["questao"])

In [None]:
modelo = ChatOpenAI()

In [None]:
chain = prompt | modelo

In [None]:
questao = "Quantos títulos Ayrton Senna ganhou na F1? Responda em português"

resposta = chain.invoke(questao)

In [None]:
resposta

AIMessage(content='\nAyrton Senna ganhou três títulos na Fórmula 1, nos anos de 1988, 1990 e 1991.', response_metadata={'token_usage': {'completion_tokens': 35, 'prompt_tokens': 42, 'total_tokens': 77}, 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None}, id='run-0446694b-6ac8-4e50-98ad-116ab3376f89-0', usage_metadata={'input_tokens': 42, 'output_tokens': 35, 'total_tokens': 77})

In [None]:
resposta.content

'\nAyrton Senna ganhou três títulos na Fórmula 1, nos anos de 1988, 1990 e 1991.'

Outro exemplo:

In [65]:
from langchain.prompts import PromptTemplate
from langchain_openai import ChatOpenAI

template = """Question: {question}

Answer: Let's think step by step.
1. Determine the number of terms (n) in the series.
2. Use the formula for the sum of the first n natural numbers: S = n*(n+1)/2.
3. Calculate the result based on the provided n."""

prompt = PromptTemplate(template=template, input_variables=["question"])

modelo = ChatOpenAI()

chain = prompt | modelo

question = "What is the sum of the first 100 natural numbers?"

resposta = chain.invoke({"question": question})

In [66]:
resposta.content

'1. The number of terms in the series is 100.\n2. Using the formula for the sum of the first n natural numbers: S = 100*(100+1)/2 = 100*101/2 = 5050.\n3. Therefore, the sum of the first 100 natural numbers is 5050.'

In [67]:
from IPython.display import Markdown

Markdown(resposta.content)

1. The number of terms in the series is 100.
2. Using the formula for the sum of the first n natural numbers: S = 100*(100+1)/2 = 100*101/2 = 5050.
3. Therefore, the sum of the first 100 natural numbers is 5050.

Quando executado, o código calculará a soma passo a passo, mostrando como o modelo determina `n` e aplica a fórmula para chegar à resposta final. Este exemplo é interessante porque demonstra como um problema matemático pode ser resolvido de maneira estruturada, guiando o modelo através do processo lógico de cálculo.

**Extração de Informação**

In [None]:
from langchain_openai import ChatOpenAI

In [None]:
modelo = ChatOpenAI( temperature = 0.1, max_tokens = 256 )

In [None]:
prompt = PromptTemplate(
    input_variables=["texto"],
    template =
    'TEXTO: {texto}\n' \
    'Dado o texto acima, extraia informações importantes no formato abaixo:\n' \
    '<CHAVE>: <VALOR>'\
    'Preserve a exata formatação apresentada.'
)

In [None]:
texto = "Alan Mathison Turing (Londres, 23 de junho de 1912 — Wilmslow, Cheshire, 7 de junho de 1954)"\
        "foi um matemático, cientista da computação, lógico, criptoanalista, filósofo e biólogo teórico "\
        "britânico. Turing foi altamente influente no desenvolvimento da moderna ciência da computação "\
        "teórica, proporcionando uma formalização dos conceitos de algoritmo e computação com a máquina "\
        "de Turing, que pode ser considerada um modelo de um computador de uso geral. Ele é amplamente "\
        "considerado o pai da ciência da computação teórica e da inteligência artificial. Apesar dessas "\
        "realizações ele nunca foi totalmente reconhecido em seu país de origem durante sua vida por ser "\
        "homossexual e porque grande parte de seu trabalho foi coberto pela Lei de Segredos Oficiais."

In [None]:
chain = prompt | modelo

resposta = chain.invoke({"texto": texto})

In [None]:
resposta.content

'Nome: Alan Mathison Turing\nData de nascimento: 23 de junho de 1912\nLocal de nascimento: Londres\nData de falecimento: 7 de junho de 1954\nLocal de falecimento: Wilmslow, Cheshire\nProfissões: matemático, cientista da computação, lógico, criptoanalista, filósofo e biólogo teórico\nContribuições: desenvolvimento da moderna ciência da computação teórica, formalização dos conceitos de algoritmo e computação com a máquina de Turing, considerado o pai da ciência da computação teórica e da inteligência artificial\nDesafios enfrentados: falta de reconhecimento em seu país de origem durante sua vida por ser homossexual e cobertura de parte de seu trabalho pela Lei de Segredos Oficiais.'

In [None]:
saida = resposta.content

saida = saida.replace('\n', '\n\n')

In [None]:
from IPython.display import Markdown

Markdown(saida)

Nome: Alan Mathison Turing

Data de nascimento: 23 de junho de 1912

Local de nascimento: Londres

Data de falecimento: 7 de junho de 1954

Local de falecimento: Wilmslow, Cheshire

Profissões: matemático, cientista da computação, lógico, criptoanalista, filósofo e biólogo teórico

Contribuições: desenvolvimento da moderna ciência da computação teórica, formalização dos conceitos de algoritmo e computação com a máquina de Turing, considerado o pai da ciência da computação teórica e da inteligência artificial

Desafios enfrentados: falta de reconhecimento em seu país de origem durante sua vida por ser homossexual e cobertura de parte de seu trabalho pela Lei de Segredos Oficiais.

**Análise de Sentimentos**

In [None]:
texto = "1 - Minha Experiência na loja foi incrível."\
        "2 - Eu acho que podiam melhorar o produto."\
        "3 - O atendimento foi horrível!"\
        "4 - Não volto mais."\
        "5 - Recomendo demais a banoffe. É uma delícia!"

In [None]:
prompt = PromptTemplate(
    input_variables=["texto"],
    template =
    'Classifique os exemplos a seguir de acordo com as ' \
    'seguintes polaridades Positivo, Negativo e Neutro.\n' \
    'EXEMPLOS:\n{texto}'
)

In [None]:
chain = prompt | modelo

resultado = chain.invoke({"texto": texto})

In [None]:
print(resultado.content)

1 - Positivo
2 - Neutro
3 - Negativo
4 - Negativo
5 - Positivo


In [None]:
prompt = PromptTemplate(
    input_variables=["texto"],
    template =
    'Classifique os exemplos a seguir de acordo com as polaridades Positivo, Negativo e Neutro.'\
    'Utilize o seguinte formato ###DECLARAÇÃO: <DECLARAÇÃO>\n###POLARIDADE: <POLARIDADE>.\n' \
    '{texto}'
)

In [None]:
chain = prompt | modelo

resultado = chain.invoke({"texto": texto})

print(resultado.content)

###DECLARAÇÃO: Minha Experiência na loja foi incrível.
###POLARIDADE: Positivo.

###DECLARAÇÃO: Eu acho que podiam melhorar o produto.
###POLARIDADE: Neutro.

###DECLARAÇÃO: O atendimento foi horrível!
###POLARIDADE: Negativo.

###DECLARAÇÃO: Não volto mais.
###POLARIDADE: Negativo.

###DECLARAÇÃO: Recomendo demais a banoffe. É uma delícia!
###POLARIDADE: Positivo.


**Perguntas e Respostas**

In [None]:
modelo = ChatOpenAI( temperature = 0.1, max_tokens = 512)

In [None]:
prompt = PromptTemplate(
    input_variables=["texto"],
    template =
    'Dado o texto a seguir: {texto}\n' \
    'Gere quatro questões e suas respectivas respostas utilizando o template abaixo.\n'\
    'Preserve a exata formatação do template apresentado:'\
    'PERGUNTA: <pergunta gerada>'\
    'RESPOSTA: <resposta>'
)

In [None]:
texto = 'Alan Mathison Turing (Londres, 23 de junho de 1912 — Wilmslow, Cheshire, 7 de junho de 1954) '\
        'foi um matemático, cientista da computação, lógico, criptoanalista, filósofo e biólogo teórico '\
        'britânico. Turing foi altamente influente no desenvolvimento da moderna ciência da computação '\
        'teórica, proporcionando uma formalização dos conceitos de algoritmo e computação com a máquina '\
        'de Turing, que pode ser considerada um modelo de um computador de uso geral. Ele é amplamente '\
        'considerado o pai da ciência da computação teórica e da inteligência artificial. Apesar dessas '\
        'realizações ele nunca foi totalmente reconhecido em seu país de origem durante sua vida por ser '\
        'homossexual e porque grande parte de seu trabalho foi coberto pela Lei de Segredos Oficiais.'

In [None]:
chain = prompt | modelo

resposta = chain.invoke({"texto": texto})

In [None]:
from IPython.display import Markdown

Markdown(resposta.content)

PERGUNTA: Qual foi a contribuição de Alan Turing para a ciência da computação?
RESPOSTA: Alan Turing foi altamente influente no desenvolvimento da moderna ciência da computação teórica, proporcionando uma formalização dos conceitos de algoritmo e computação com a máquina de Turing, que pode ser considerada um modelo de um computador de uso geral.

PERGUNTA: Por que Alan Turing é considerado o pai da ciência da computação teórica e da inteligência artificial?
RESPOSTA: Ele é amplamente considerado o pai da ciência da computação teórica e da inteligência artificial devido às suas contribuições significativas no desenvolvimento dessas áreas.

PERGUNTA: Por que Alan Turing não foi totalmente reconhecido em seu país de origem durante sua vida?
RESPOSTA: Alan Turing não foi totalmente reconhecido em seu país de origem durante sua vida por ser homossexual e porque grande parte de seu trabalho foi coberto pela Lei de Segredos Oficiais.

PERGUNTA: Qual foi a principal invenção de Alan Turing que influenciou a ciência da computação?
RESPOSTA: A principal invenção de Alan Turing que influenciou a ciência da computação foi a máquina de Turing, que formalizou os conceitos de algoritmo e computação e é considerada um modelo de um computador de uso geral.

In [None]:
prompt = PromptTemplate(
    input_variables=["texto"],
    template =
    'Dado o texto a seguir: {texto}\n' \
    'Gere 3 questões com 4 alternativas cada e suas respectivas respostas utilizando o template abaixo.\n'\
    'Preserve a exata formatação do template apresentado:'\
    'PERGUNTA: <pergunta gerada>'\
    'ALTERNATIVA <A>: <alternativa A>'\
    'ALTERNATIVA <B>: <alternativa B>'\
    'ALTERNATIVA <C>: <alternativa C>'\
    'ALTERNATIVA <D>: <alternativa D>'\
    'RESPOSTA: <ALTERNATIVA>'
)

In [None]:
chain = prompt | modelo

resposta = chain.invoke({"texto": texto})

In [None]:
saida = resposta.content

saida = saida.replace('\n', '\n\n')

In [None]:
from IPython.display import Markdown

Markdown(saida)

PERGUNTA: Qual foi a contribuição de Alan Turing para a ciência da computação teórica?

ALTERNATIVA A: Desenvolvimento da máquina de Turing.

ALTERNATIVA B: Descoberta da penicilina.

ALTERNATIVA C: Criação da teoria da relatividade.

ALTERNATIVA D: Invenção do telefone.

RESPOSTA: ALTERNATIVA A



PERGUNTA: Por que Alan Turing não foi totalmente reconhecido em seu país de origem durante sua vida?

ALTERNATIVA A: Por ser homossexual.

ALTERNATIVA B: Por ser um cientista ruim.

ALTERNATIVA C: Por ter roubado ideias de outros cientistas.

ALTERNATIVA D: Por ser muito jovem.

RESPOSTA: ALTERNATIVA A



PERGUNTA: Qual é o apelido dado a Alan Turing por ser considerado o pai da ciência da computação teórica?

ALTERNATIVA A: Gênio da matemática.

ALTERNATIVA B: Mestre da lógica.

ALTERNATIVA C: Pai da inteligência artificial.

ALTERNATIVA D: Rei da criptografia.

RESPOSTA: ALTERNATIVA C

**Padrão Persona**


* Introduz ao modelo uma representação fictícia ou não, normalmente a de um especialista em um domínio ou personalidade específica.

* É usado para moldar a forma como o modelo responde, imitando características ou comportamentos de um tipo específico de usuário.



**Um advogado especialista**

In [None]:
modelo = ChatOpenAI( temperature = 0.1, max_tokens = 512)

In [None]:
texto = 'Escreva como se fosse um advogado brasileiro especialista em direito penal.'\
        'Pontue de forma resumida as possíveis penas para um caso de lesão corporal leve '\
        'sem contexto de violência doméstica.'

resposta = modelo.invoke(texto)

In [None]:
from IPython.display import Markdown

Markdown(resposta.content)

Como advogado especialista em direito penal, é importante ressaltar que a lesão corporal leve é um crime previsto no Código Penal Brasileiro, no artigo 129. A pena para esse tipo de crime pode variar de acordo com as circunstâncias do caso, mas geralmente inclui penas como prestação de serviços à comunidade, pagamento de multa, detenção de três meses a um ano, ou até mesmo a suspensão condicional da pena.

É importante ressaltar que a pena pode ser agravada caso o crime seja cometido com violência doméstica, o que pode resultar em penas mais severas, como a detenção de seis meses a um ano.

Portanto, é fundamental que o acusado busque a orientação de um advogado especializado em direito penal para garantir seus direitos e uma defesa adequada no processo judicial.

**Instrutor de História**

In [None]:
persona = """
Você é um professor de história muito experiente. Você explica conceitos históricos de forma clara e interessante,
e sempre fornece contexto adicional para ajudar seus alunos a entenderem melhor o assunto.
"""

prompt = PromptTemplate(
    input_variables = ["pergunta"],
    template = persona + "\n\nPergunta: {pergunta}\nResposta:"
)

chain = prompt | modelo

pergunta = "Qual foi o impacto da Revolução Francesa na Europa?"

resposta = chain.invoke({"pergunta": pergunta})

In [None]:
from IPython.display import Markdown

Markdown(resposta.content)

A Revolução Francesa teve um impacto profundo e duradouro na Europa. Em primeiro lugar, ela inspirou movimentos revolucionários em outros países europeus, como a Revolução de 1848, que buscavam derrubar monarquias absolutistas e estabelecer governos mais democráticos. Além disso, a Revolução Francesa promoveu ideais de liberdade, igualdade e fraternidade que influenciaram o pensamento político e social em toda a Europa.

A Revolução Francesa também teve um impacto econômico significativo, pois levou à abolição do sistema feudal na França e à redistribuição de terras entre a população. Isso teve repercussões em outros países europeus, onde as elites dominantes começaram a temer revoltas populares e a buscar reformas para evitar a propagação da revolução.

Por fim, a Revolução Francesa contribuiu para o surgimento do nacionalismo na Europa, à medida que as nações buscavam se unificar em torno de ideais comuns e se libertar do domínio estrangeiro. Isso levou a conflitos e guerras entre as potências europeias, como as Guerras Napoleônicas, que moldaram a geopolítica do continente por décadas.

Em resumo, a Revolução Francesa teve um impacto profundo na Europa, influenciando não apenas a política e a economia, mas também a cultura e a sociedade como um todo. Seus efeitos foram sentidos por muitos anos após o seu término e continuam a ser estudados e debatidos até os dias de hoje.

**Referência:**

Este notebook foi adaptado a partir do seguinte material:

**Tutorial Prompting and Fine-Tuning Pre-trained Generative Language Models**

*Johny Moreira, Altigran da Silva, Luciano Barbosa*

SIMPÓSIO BRASILEIRO DE BANCO DE DADOS [SBBD 2023]

>

Disponível em: https://github.com/guardiaum/tutorial-sbbd2023
