# 4 - Inferring
 Além de extrair rótulos, extrair nomes, compreender o sentimento de um texto, 
 Se você deseja extrair um sentimento positivo ou negativo de um texto,
 no fluxo tradicional de aprendizado de máquina, você teria que coletar o conjunto de dados
 de rótulos, treinar um modelo, descobrir como implantar o modelo em algum lugar na nuvem e
 fazer inferências. Isso pode funcionar bem, mas é muito trabalho para passar por esse processo.
 
 Além disso, para cada tarefa, como sentimento versus extração de nomes, você precisa treinar
  e implantar um modelo separado. Uma das coisas realmente boas sobre os grandes modelos de
  linguagem é que, para muitas tarefas como essas, você pode apenas escrever um prompt e começar
  a gerar resultados quase imediatamente. Isso proporciona uma velocidade tremenda no desenvolvimento de aplicativos. E você também pode usar apenas um modelo, uma API, para fazer muitas tarefas diferentes, em vez de precisar descobrir como treinar e implantar muitos modelos diferentes. Com isso, vamos ao código para ver como você pode aproveitar isso.
  
  Aqui está nosso código inicial usual. Vou executá-lo. O exemplo mais adequado que usarei é uma análise para uma lâmpada. Então, "Precisava de uma boa lâmpada para o quarto e esta tinha espaço adicional" e assim por diante. Então, vou escrever um prompt para classificar o sentimento disso. E se eu quiser que o sistema me diga, sabe, qual é o sentimento, posso simplesmente escrever: "Qual é o sentimento da seguinte análise do produto", com o delimitador usual e o texto da análise, e assim por diante. E vamos executar isso. E isso diz: "O sentimento da análise do produto é positivo", o que na verdade parece bem correto. Essa lâmpada não é perfeita, mas o cliente parece bastante satisfeito. Parece ser uma empresa ótima que se preocupa com os clientes e produtos. Acho que o sentimento positivo parece ser a resposta correta. Agora isso imprime toda a sentença: "O sentimento da análise do produto é positivo". Se você quisesse uma resposta mais concisa para facilitar o pós-processamento, eu posso pegar esse prompt e adicionar outra instrução para dar respostas com apenas uma palavra, seja positivo ou negativo.
  
  Então, ele apenas imprime "positivo" assim, o que facilita para um pedaço de texto pegar essa saída e processá-la e fazer algo com ela. Vamos ver outro prompt, ainda usando a análise da lâmpada. Aqui, eu tenho, é "Identificar uma lista de emoções que o autor da análise a seguir está expressando. Inclua no máximo cinco itens nesta lista." Então, os grandes modelos de linguagem são muito bons em extrair coisas específicas de um texto. Neste caso, estamos expressando as emoções e isso pode ser útil para entender como seus clientes pensam sobre um determinado produto. Para muitas organizações de suporte ao cliente, é importante entender se um usuário específico está extremamente chateado. Então, você pode ter um problema de classificação diferente, como "O autor da análise a seguir está expressando raiva?". Porque se alguém está realmente com raiva, pode ser necessário prestar mais atenção em uma análise do cliente, ter o suporte ao cliente ou o sucesso do cliente para descobrir o que está acontecendo e resolver as coisas para o cliente. Nesse caso, o cliente não está com raiva. E observe que, com o aprendizado supervisionado, se eu quisesse construir todos esses classificadores, não teria como fazer isso com o aprendizado supervisionado em apenas alguns minutos, como você viu eu fazer neste vídeo. 
  
 Talvez pergunte se o cliente está expressando encanto ou pergunte se há alguma peça faltando e veja se você pode criar um prompt para fazer diferentes inferências sobre essa análise da lâmpada.
 
  Vou mostrar mais algumas coisas que você pode fazer com este sistema, especificamente extrair
  informações mais detalhadas de uma análise de cliente. A extração de informações é a parte do
  PLN, do Processamento de Linguagem Natural, que se relaciona a pegar um pedaço de texto e
  extrair certas coisas que você deseja saber do texto. Então, neste prompt, estou pedindo para
  identificar os seguintes itens, o item comprado e o nome da empresa que fabricou o item.
  
  
  Novamente, se você estiver tentando resumir muitas análises de um site de comércio eletrônico
  de compras on-line, pode ser útil para sua grande coleção de análises descobrir quais foram os
  itens, quem fabricou o item, descobrir o sentimento positivo e negativo, para acompanhar as
  tendências sobre sentimento positivo ou negativo para itens específicos ou para fabricantes
  específicos. E, neste exemplo, vou pedir a ele para formatar sua resposta como um objeto JSON
  com "Item" e "Marca" como chaves. 

In [21]:
import openai

openai.api_key = "HERE YOUR API KEY"

def get_completion(prompt, model = "gpt-3.5-turbo"):
    messages = [ {"role": "user", "content": prompt}]
    response = openai.ChatCompletion.create(
      model = model,
      messages = messages,
      temperature = 0,
    )
    return response.choices[0].message["content"]

#  Product review text

In [22]:


lamp_review = """
Precisava de uma boa lâmpada para o meu quarto, e esta tinha \
espaço adicional e um preço não muito alto. Chegou rapidamente.  \
O fio da lâmpada quebrou durante o transporte e a empresa prontamente \
enviou outro. Chegou em poucos dias também. Foi fácil de montar. \
Tive uma peça faltando, então entrei em contato com o suporte e eles \
rapidamente me enviaram a peça que faltava! Parece que a Lumina é uma \
ótima empresa que se preocupa com seus clientes e produtos!!
"""


# Sentiment (positive/negative)

In [23]:


# Prompt para identificar o sentimento da análise do produto
prompt = f"""
Qual é o sentimento da seguinte análise do produto, 
que está delimitada com três acentos graves?

Texto da análise: '''{lamp_review}'''
"""
response = get_completion(prompt)
print(response)

O sentimento da análise é positivo.


# Prompt para identificar o sentimento da análise do produto(positivo ou negativo)
_fornecendo uma resposta mais concisa_

In [24]:

prompt = f"""
Qual é o sentimento da seguinte análise do produto, 
que está delimitada com três acentos graves?

Dê sua resposta como uma única palavra, seja "positivo" \
ou "negativo".

Texto da análise: '''{lamp_review}'''
"""
response = get_completion(prompt)
print(response)

positivo


#  Identify types of emotions

In [25]:

#  Prompt para identificar uma lista de emoções expressas na análise do produto

prompt = f"""
Identifique uma lista de emoções que o autor da \
seguinte análise está expressando. Inclua no máximo \
cinco itens na lista. Formate sua resposta como uma lista de \
palavras em minúsculas separadas por vírgulas.

Texto da análise: '''{lamp_review}'''
"""
response = get_completion(prompt)
print(response)

satisfação, gratidão, confiança, surpresa, admiração


In [26]:
#  Identify anger

#  Prompt para identificar se o autor da análise está expressando raiva

prompt = f"""
O autor da seguinte análise está expressando raiva? \
A análise está delimitada com três acentos graves. \
Dê sua resposta como "sim" ou "não".

Texto da análise: '''{lamp_review}'''
"""
response = get_completion(prompt)
print(response)

Não.


# Identifique raiva

In [27]:
prompt = f"""
O autor da seguinte avaliação está expressando raiva?\
A avaliação está delimitada com três acentos graves. \
Forneça sua resposta como sim ou não.

Texto da avaliação: '''{lamp_review}'''
"""
resposta = get_completion(prompt)
print(resposta)


Não


#  Extract product and company name from customer reviews

_Prompt para identificar os seguintes itens do texto da análise:_
   - Item comprado pelo revisor
   - Empresa que fabricou o item

In [28]:
prompt = f"""
Identifique os seguintes itens do texto da análise:
- Item comprado pelo revisor
- Empresa que fabricou o item

A análise está delimitada com três acentos graves.
Formate sua resposta como um objeto JSON com as chaves "Item" e "Marca".
Se a informação não estiver presente, use "desconhecido" como valor.
Faça sua resposta o mais breve possível.

Texto da análise: '''{lamp_review}'''
"""
response = get_completion(prompt)
print(response)


{
  "Item": "lâmpada",
  "Marca": "Lumina"
}


#  Doing multiple tasks at once

_Prompt para identificar os seguintes itens do texto da análise:_
 - Sentimento (positivo ou negativo)
 - O revisor está expressando raiva? (verdadeiro ou falso)
 - Item comprado pelo revisor
 - Empresa que fabricou o item

In [29]:
prompt = f"""
Identifique os seguintes itens do texto da análise:
- Sentimento (positivo ou negativo)
- O revisor está expressando raiva? (verdadeiro ou falso)
- Item comprado pelo revisor
- Empresa que fabricou o item

A análise está delimitada com três acentos graves.
Formate sua resposta como um objeto JSON com as chaves "Sentimento", "Raiva", "Item" e "Marca".
Se a informação não estiver presente, use "desconhecido" como valor.
Faça sua resposta o mais breve possível.
Formate o valor da Raiva como um booleano.

Texto da análise: '''{lamp_review}'''
"""
response = get_completion(prompt)
print(response)


{
  "Sentimento": "positivo",
  "Raiva": false,
  "Item": "lâmpada",
  "Marca": "Lumina"
}


#  Inferring topics

In [30]:

story = """
Em uma recente pesquisa conduzida pelo governo,
funcionários do setor público foram solicitados a avaliar seu nível
de satisfação com o departamento em que trabalham.
Os resultados revelaram que a NASA era o departamento mais popular,
com uma classificação de satisfação de 95%.

Um funcionário da NASA, John Smith, comentou sobre os resultados,
afirmando: "Não estou surpreso que a NASA tenha ficado em primeiro lugar.
É um ótimo lugar para trabalhar, com pessoas incríveis e oportunidades incríveis.
Estou orgulhoso de fazer parte de uma organização tão inovadora."

Os resultados também foram bem recebidos pela equipe de gerenciamento da NASA,
com o diretor Tom Johnson declarando: "Estamos encantados em saber que nossos funcionários estão satisfeitos com o trabalho na NASA.
Temos uma equipe talentosa e dedicada que trabalha incansavelmente para alcançar nossos objetivos, e é fantástico ver que o trabalho árduo está valendo a pena."

A pesquisa também revelou que a Administração da Previdência Social tinha a menor classificação de satisfação,
com apenas 45% dos funcionários indicando que estavam satisfeitos com seu trabalho.
O governo se comprometeu a abordar as preocupações levantadas pelos funcionários na pesquisa e trabalhar para melhorar a satisfação no trabalho em todos os departamentos.
"""
#  Inferring 5 topics
prompt = f"""
Determine cinco tópicos que estão sendo discutidos no texto a seguir, que está delimitado por três acentos graves.

IMPORTANTE
- Cada item deve ter somente uma ou duas palavras.
- No caso de Orgão ou empresa traga somente o nome.

Formate sua resposta como uma lista numerada de itens separados por vírgulas.

Texto da amostra: '''{story}'''
"""
response = get_completion(prompt)
print(response)




1. Pesquisa de satisfação
2. Departamento mais popular
3. NASA
4. Administração da Previdência Social
5. Melhoria da satisfação no trabalho


In [31]:
response.split(sep=',')

topic_list = [
    "nasa", "governo local", "engenharia", 
    "satisfação do funcionário", "governo federal"
]

#  Make a news alert for certain topics

In [32]:
prompt = f"""
Determine se cada item na seguinte lista de tópicos \
é um tópico no texto abaixo, que está delimitado por \
três acentos graves.

Dê sua resposta como uma lista com o nome do topico separado por ":" e com 0 ou 1 para cada tópico.

Lista de tópicos: {", ".join(topic_list)}

Exemplo de texto: '''{story}'''
"""
response = get_completion(prompt)
print(response)



nasa: 1
governo local: 0
engenharia: 0
satisfação do funcionário: 1
governo federal: 1


In [39]:
topic_dict = {i.split(': ')[0]: int(i.split(': ')[1]) for i in response.split(sep='\n')}
if topic_dict['nasa'] == 1:
    print("ALERT: New NASA story!")
  


ALERT: New NASA story!
