<a href="https://colab.research.google.com/github/adalves-ufabc/2024.Q2-PLN/blob/main/2024_Q2_PLN_AULA_12_Notebook_21.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Processamento de Linguagem Natural [2024-Q2]**
Prof. Alexandre Donizeti Alves

## **API da Groq**
---



**Groq** é uma empresa de tecnologia que desenvolve hardware e software voltados para computação de alto desempenho, particularmente em aplicações de IA e aprendizado de máquina. Fundada por ex-engenheiros da Google, a **Groq** é conhecida por seus chips de processamento (chamados de "*Tensor Streaming Processor*" ou *TSP*) que são projetados para acelerar tarefas de IA, como a inferência de modelos de aprendizado profundo.

Para criar uma chave:

> https://console.groq.com/keys

In [None]:
#@title Instalando a biblioteca da API
!pip install -q -U groq

[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m103.5/103.5 kB[0m [31m2.1 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m75.6/75.6 kB[0m [31m2.1 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m77.9/77.9 kB[0m [31m3.3 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m58.3/58.3 kB[0m [31m2.5 MB/s[0m eta [36m0:00:00[0m
[?25h

In [None]:
#@title Versão da API

import groq

print(groq.__version__)

0.9.0


In [None]:
#@title Definindo a chave da API

import getpass
import os

os.environ["GROQ_API_KEY"] = getpass.getpass()

··········


In [None]:
#@title Teste

from groq import Groq

cliente = Groq()

resposta = cliente.chat.completions.create(
    messages = [{"role": "user", "content": "Qual a capital do Brasil? Responde apenas o nome"}],
    model = "llama3-8b-8192",
)

In [None]:
resposta

ChatCompletion(id='chatcmpl-a6874be6-aead-4324-8664-73e226115edd', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='Brasília', role='assistant', function_call=None, tool_calls=None))], created=1722944826, model='llama3-8b-8192', object='chat.completion', system_fingerprint='fp_179b0f92c9', usage=CompletionUsage(completion_tokens=4, prompt_tokens=21, total_tokens=25, completion_time=0.002426555, prompt_time=0.003841207, queue_time=None, total_time=0.006267762), x_groq={'id': 'req_01j4kr7bdsf7xrdfh0dhztkg6g'})

In [None]:
print(resposta.choices[0].message.content)

Brasília


In [None]:
#@title Lista de Modelos

import requests
import os

api_key = os.environ.get("GROQ_API_KEY")

url = "https://api.groq.com/openai/v1/models"

headers = {
    "Authorization": f"Bearer {api_key}",
    "Content-Type": "application/json"
}

resposta = requests.get(url, headers=headers)

In [None]:
resposta.json()

{'object': 'list',
 'data': [{'id': 'gemma2-9b-it',
   'object': 'model',
   'created': 1693721698,
   'owned_by': 'Google',
   'active': True,
   'context_window': 8192,
   'public_apps': None},
  {'id': 'gemma-7b-it',
   'object': 'model',
   'created': 1693721698,
   'owned_by': 'Google',
   'active': True,
   'context_window': 8192,
   'public_apps': None},
  {'id': 'llama-3.1-70b-versatile',
   'object': 'model',
   'created': 1693721698,
   'owned_by': 'Meta',
   'active': True,
   'context_window': 131072,
   'public_apps': None},
  {'id': 'llama-3.1-8b-instant',
   'object': 'model',
   'created': 1693721698,
   'owned_by': 'Meta',
   'active': True,
   'context_window': 131072,
   'public_apps': None},
  {'id': 'llama3-70b-8192',
   'object': 'model',
   'created': 1693721698,
   'owned_by': 'Meta',
   'active': True,
   'context_window': 8192,
   'public_apps': None},
  {'id': 'llama3-8b-8192',
   'object': 'model',
   'created': 1693721698,
   'owned_by': 'Meta',
   'active'

In [None]:
dados = resposta.json()

largura_id = max(len(model['id']) for model in dados['data']) + 2
largura_owner = max(len(model['owned_by']) for model in dados['data']) + 2

print(f"{'ID'.ljust(largura_id)} Proprietário")

for modelo in dados['data']:
    print(f"{modelo['id'].ljust(largura_id)} {modelo['owned_by']}")

ID                                      Proprietário
gemma2-9b-it                            Google
gemma-7b-it                             Google
llama-3.1-70b-versatile                 Meta
llama-3.1-8b-instant                    Meta
llama3-70b-8192                         Meta
llama3-8b-8192                          Meta
llama3-groq-70b-8192-tool-use-preview   Groq
llama3-groq-8b-8192-tool-use-preview    Groq
llama-guard-3-8b                        Meta
mixtral-8x7b-32768                      Mistral AI
whisper-large-v3                        OpenAI


https://console.groq.com/docs/quickstart

https://github.com/groq/groq-api-cookbook

**Integração com o LangChain**

In [None]:
!pip install -qU langchain-groq

[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/50.4 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m50.4/50.4 kB[0m [31m2.5 MB/s[0m eta [36m0:00:00[0m
[?25h[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/379.9 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[91m╸[0m [32m378.9/379.9 kB[0m [31m17.3 MB/s[0m eta [36m0:00:01[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m379.9/379.9 kB[0m [31m10.1 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m140.2/140.2 kB[0m [31m11.2 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m141.1/141.1 kB[0m [31m10.8 MB/s[0m eta [36m0:00:00[0m
[?25h

In [None]:
from langchain_groq import ChatGroq

modelo = ChatGroq(model="llama3-8b-8192")

In [None]:
from langchain_core.messages import HumanMessage, SystemMessage

mensagens = [
    SystemMessage(content="Traduza o seguinte do Inglês para o Português"),
    HumanMessage(content="hi!"),
]

resposta = modelo.invoke(mensagens)

In [None]:
resposta

AIMessage(content='Olá!', response_metadata={'token_usage': {'completion_tokens': 4, 'prompt_tokens': 32, 'total_tokens': 36, 'completion_time': 0.002400138, 'prompt_time': 0.005497658, 'queue_time': None, 'total_time': 0.007897796}, 'model_name': 'llama3-8b-8192', 'system_fingerprint': 'fp_a97cfe35ae', 'finish_reason': 'stop', 'logprobs': None}, id='run-9a0792b6-c468-4314-8c1b-dd265b3053c3-0', usage_metadata={'input_tokens': 32, 'output_tokens': 4, 'total_tokens': 36})

In [None]:
resposta.content

'Olá!'

**ChatPromptTemplate**

In [None]:
from langchain_core.prompts import ChatPromptTemplate

system_template = "Traduza o seguinte para {idioma}:"

prompt_template = ChatPromptTemplate.from_messages(
    [("system", system_template), ("user", "{texto}")]
)

resultado = prompt_template.invoke({"idioma": "italiano", "texto": "hi"})

resultado

ChatPromptValue(messages=[SystemMessage(content='Traduza o seguinte para italiano:'), HumanMessage(content='hi')])

In [None]:
resultado.to_messages()

[SystemMessage(content='Traduza o seguinte para italiano:'),
 HumanMessage(content='hi')]

In [None]:
chain =  prompt_template | modelo

resposta = chain.invoke({"idioma": "português", "texto": "hi"})

In [None]:
resposta

AIMessage(content='Olá!', response_metadata={'token_usage': {'completion_tokens': 4, 'prompt_tokens': 27, 'total_tokens': 31, 'completion_time': 0.002408538, 'prompt_time': 0.005813214, 'queue_time': None, 'total_time': 0.008221751999999999}, 'model_name': 'llama3-8b-8192', 'system_fingerprint': 'fp_a97cfe35ae', 'finish_reason': 'stop', 'logprobs': None}, id='run-554ae75c-c63d-4744-9b7f-3f8d16805ca2-0', usage_metadata={'input_tokens': 27, 'output_tokens': 4, 'total_tokens': 31})

In [None]:
resposta.content

'Olá!'

**Encadeando componentes com LCEL**

In [None]:
from langchain_core.output_parsers import StrOutputParser

parser = StrOutputParser()

In [None]:
chain = prompt_template | modelo | parser

In [None]:
chain.invoke({"idioma": "portugues", "texto": "hi"})

'Olá!'

**Cadeias**

In [None]:
from langchain_groq import ChatGroq
from langchain_core.messages import HumanMessage

In [None]:
modelo = ChatGroq()

In [None]:
from langchain_core.prompts import ChatPromptTemplate

prompt = ChatPromptTemplate.from_template("Me conte uma piada sobre {assunto}")
chain = prompt | modelo

In [None]:
resposta = chain.invoke({"assunto": "papagaio"})

In [None]:
from IPython.display import Markdown

Markdown(resposta.content)

Claro, aqui está uma piada engraçada sobre papagaio:

Por que o papagaio nunca fica sem dinheiro?

Porque ele sempre diz: "Dá-me mais um real, por favor!"

Espero que você tenha se divertido com essa piada sobre papagaio!

Mais um exemplo:

In [None]:
from langchain_groq import ChatGroq

modelo = ChatGroq(model="llama3-8b-8192")

prompt = ChatPromptTemplate.from_messages(
    [
        (
            "system",
            "Você é um assistente que traduz {idioma_input} para {idioma_output}.",
        ),
        ("human", "{input}"),
    ]
)

chain = prompt | modelo

resposta = chain.invoke(
    {
        "idioma_input": "Inglês",
        "idioma_output": "Português",
        "input": "I love programming.",
    }
)

In [None]:
resposta.content

'Eu amo programação.'

**Referência**:

> https://python.langchain.com/v0.2/docs/tutorials/llm_chain/