## Documentação do Groq
https://console.groq.com/docs/text-chat

## Uso de Groq com geração de texto, transcrição de video e imagem.

In [2]:
# importando e forçando a leitura do dotenv pois existem mais de 2 api key no .env
from dotenv import load_dotenv, find_dotenv
load_dotenv(find_dotenv())

True

In [1]:
from groq import Groq
client = Groq()

In [5]:
mensagens = [
    {
        "role": "user",
        "content": "Explique a diferença entre LLMOps e MLOps. Responda em português"
    }
]

response = client.chat.completions.create(
    messages=mensagens,
    model="llama3-8b-8192"
)

response

ChatCompletion(id='chatcmpl-9b138c16-e1ce-42d3-a560-8add47a6acc0', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='Uma pergunta muito pertinente!\n\nLLMOps e MLOps são abreviaturas que se referem a duas abordagens diferentes para gerenciar e implementar modelos de machine learning (ML) em uma empresa. Embora sejam relacionadas, elas se diferem em sua abordagem e foco.\n\n**LLMOps** (Legacy Line ML Operations) é uma abordagem que se concentra em automatizar egregar a totalidade do ciclo de vida de um modelo de machine learning, incluindo modelagem, depuração, treinamento, implantação, monitoramento e manutenção. Ela envolve a criação de pipelines de dados, construção de pipeline de produção, gerenciamento de versões, seguimento de mudanças e implantação de modelos em produção.\n\nLLMOps se concentra em simplificar e automatizar todas as etapas do ciclo de vida de um modelo de machine learning, tornando o processo mais eficiente e esca

In [6]:
print(response.choices[0].message.content)

Uma pergunta muito pertinente!

LLMOps e MLOps são abreviaturas que se referem a duas abordagens diferentes para gerenciar e implementar modelos de machine learning (ML) em uma empresa. Embora sejam relacionadas, elas se diferem em sua abordagem e foco.

**LLMOps** (Legacy Line ML Operations) é uma abordagem que se concentra em automatizar egregar a totalidade do ciclo de vida de um modelo de machine learning, incluindo modelagem, depuração, treinamento, implantação, monitoramento e manutenção. Ela envolve a criação de pipelines de dados, construção de pipeline de produção, gerenciamento de versões, seguimento de mudanças e implantação de modelos em produção.

LLMOps se concentra em simplificar e automatizar todas as etapas do ciclo de vida de um modelo de machine learning, tornando o processo mais eficiente e escalável. Essa abordagem é comum em empresas que já têm uma presença significativa em machine learning e precisam gerenciar e estabilizar um grande número de modelos em produção

## Stream
Gerar texto de forma parcial. Em casos onde a resposta acaba sendo um texto maior, é possível usar o Stream para que a resposta comece a ser mostrada para o usuário conforme seja gerada.

In [7]:
mensagens = [
    {
        "role": "user",
        "content": "Explique a diferença entre LLMOps e MLOps. Responda em português"
    }
]

stream = client.chat.completions.create(
    messages=mensagens,
    model="llama3-8b-8192",
    stream=True
)

for chunck in stream:
    print(chunck.choices[0].delta.content, end="", flush=True)

stream

O termo LLMOps (Low-Level Machine Learning Operations) se refere ao conjunto de práticas, ferramentas e técnicas utilizadas para gerenciar e automatizar o ciclo de vida de desenvolvimento de modelos de aprendizado de máquina (ML) de baixo nível, isto é, modelos que foram treinados e otimizados para problemas específicos.

O termo MLOps (Machine Learning Operations), por outro lado, se refere ao conjunto de práticas, ferramentas e técnicas utilizadas para gerenciar e automatizar o ciclo de vida de desenvolvimento de modelos de aprendizado de máquina de alto nível, isto é, modelos que são mais complexos e se beneficiam de um maior grau de automatização e monitoramento.

Em outras palavras, LLMOps se concentra em gerenciar e automatizar os processos de desenvolvimento de modelos de ML de baixo nível, enquanto MLOps se concentra em gerenciar e automatizar os processos de desenvolvimento de modelos de ML de alto nível, que são mais complexos e envolvem uma maior quantidade de variáveis e co

<groq.Stream at 0x1e22ae9bf50>

## Transcrição de áudio

In [8]:
# Função tem como objetivo melhorar a legibilidade de um texto transcrito, limitando o comprimento de cada linha sendo então
# responsável por evitar que o texto da transcrição seja grande ao ponto de precisar usar a barra de rolagem para o lado

import textwrap

def format_text(response):
    text = response.text
    text_formatted = textwrap.fill(text, width=100)
    print(text_formatted)

In [12]:
from groq import Groq

client = Groq()

arquivo = "../files/curso.mp3"

# Abaixo foi necessário usar o prompt pois nos testes foi verificado que o llm não entendia as palavras Hugging Face e Gradio
with open(arquivo, "rb") as audio:
    transcricao = client.audio.transcriptions.create(
        file=(arquivo, audio.read()),
        model="whisper-large-v3",
        response_format="json",
        language="pt",
        prompt="Este é um curso de Hugging Face que usa aplicação com Gradio"
    )
    format_text(transcricao)


 Seja muito bem-vindo e bem-vinda ao curso Desbravando a IA com Python Explorando modelos de Hugging
Face Neste curso eu quero te mostrar uma das maiores plataformas de inteligência artificial que
possui diversos modelos prontos que é a plataforma do Hugging Face E o meu objetivo neste curso é
explorar dois tipos de modelos Modelos relacionados a processamento de linguagem natural onde
estaremos trabalhando com análise de sentimentos, vamos trabalhar também com informações de
perguntas e respostas, vamos trabalhar também com modelos que nos ajudem a resumir textos e assim
por diante. Por outro lado, nós teremos também modelos relacionados à visão computacional. Estaremos
trabalhando com aplicações para segmentar imagens, classificar imagens, detectar objetos e muito
mais. Space além disso em algumas sessões você vai ter a oportunidade de construir o teu modelo é
uma interface web para o teu modelo utilizando a biblioteca Gradio e também vamos aprender a colocar
a aplicação que construi

## Vision

In [19]:
import textwrap

def format_text(response):
    text = response.content
    text_formatted = textwrap.fill(text, width=100)
    print(text_formatted)

In [None]:
completion = client.chat.completions.create(
    model="llama-3.2-11b-vision-preview",
    messages=[{
        "role": "user",
        "content": [
            {"type": "text", "text": "O que há nesta imagem?"},
            {"type": "image_url", "image_url": {
                "url": "https://uploads.jovemnerd.com.br/wp-content/uploads/2025/04/the_last_of_us_poster_ellie_e_jo__r07jq6.jpg?ims=1210x544/filters:quality(75)"
            }}
        ]
    }],
    temperature=1,
    max_tokens=1024,
    top_p=1,
    stream=False,
    stop=None
)


In [None]:
format_text(completion.choices[0].message)