# Análise de sentimentos do dataset do IMDB usando Llama 3 70B.

Aluno: Leandro Carísio Fernandes

O objetivo é fazer análise de sentimentos na base do IMDB usando algumas técnicas de engenharia de prompt.

De acordo com a planilha, tenho que fazer as análises de índice 6019:6482 e as de índice 18519:18982.

# Parâmetros


Acesso à API GROQ: https://console.groq.com/playground . Nessa mesma página é possível gerar os prompts e já obter o código das chamadas.

In [3]:
from getpass import getpass
GROQ_API = getpass("API groq")

API groq ········


In [58]:
ARQUIVO_RESULTADOS_EXPERIMENTOS = 'resultados.csv'

EXP_1_ZERO_SHOT = {
    'NOME': 'llama_3_70b_zero_shot',
    'REFAZER': False
}
MODELO = "llama3-70b-8192"

In [2]:
!pip install Groq



# Leitura do dataset

Datasets completo de treino e teste:

In [15]:
import pandas as pd

train_dataset = pd.read_csv('imdb_train.csv')
test_dataset = pd.read_csv('imdb_test.csv')

Dataset filtrado para os experimentos.

Fiquei de fazer a classificação dos índices 6019:6482 e 18519:18982

In [43]:
import os

def carrega_df_exprerimentos():
    return pd.read_csv(ARQUIVO_RESULTADOS_EXPERIMENTOS, index_col=0)
def salva_df_experimentos():
    df_experimentos.to_csv(ARQUIVO_RESULTADOS_EXPERIMENTOS, index=True)
    
if os.path.exists(ARQUIVO_RESULTADOS_EXPERIMENTOS):
    df_experimentos = carrega_df_exprerimentos()
else:
    print("Não há arquivo com os resultados dos experimentos.")
    print("Criando arquivo vazio com apenas os textos e classificações.")
    # Recupera o texto e classificação dos índices 6019:6482 e 18519:18982
    indices = list(range(6019, 6482)) + list(range(18519, 18982))
    df_experimentos = test_dataset.iloc[indices]
    salva_df_experimentos()

In [18]:
df_experimentos.head()

Unnamed: 0,text,label
6019,I had the privilege of seeing this powerful pl...,Negative
6020,"************* SPOILERS BELOW ************* ""'N...",Negative
6021,This film is likely to be a real letdown unles...,Negative
6022,Picking this up along with the rest of the Mar...,Negative
6023,"Jumpin' Butterballs, this movie stinks! It's a...",Negative


In [19]:
df_experimentos.tail()

Unnamed: 0,text,label
18977,I am so glad Zac was in 'The Suite life of Zac...,Positive
18978,"When I first saw the ad for this, I was like '...",Positive
18979,I read the above comment and cannot believe it...,Positive
18980,"I was wandering through my local library, brow...",Positive
18981,"Wonderful songs, sprightly animation and authe...",Positive


# Funções para acessar o modelo

In [41]:
from groq import Groq

client = Groq(api_key=GROQ_API)

def chat_completion(user_message, system_message = None, temperature=0, max_tokens=1024, top_p=1):
    # Documentação: https://console.groq.com/docs/text-chat
    messages = []
    if system_message is not None:
        messages.append({
            # Set an optional system message. This sets the behavior of the
            # assistant and can be used to provide specific instructions for
            # how it should behave throughout the conversation.
            "role": "system",
            "content": system_message
        })
        messages.append({
            # Set a user message for the assistant to respond to.
            "role": "user",
            "content": user_message
        })
        chat_completion = client.chat.completions.create(
            messages=messages,
            
            # The language model which will generate the completion.
            model=MODELO,
            
            #
            # Optional parameters
            #
            
            # Controls randomness: lowering results in less random completions.
            # As the temperature approaches zero, the model will become deterministic
            # and repetitive.
            temperature=temperature,
            
            # The maximum number of tokens to generate. Requests can use up to
            # 32,768 tokens shared between prompt and completion.
            max_tokens=max_tokens,
            
            # Controls diversity via nucleus sampling: 0.5 means half of all
            # likelihood-weighted options are considered.
            top_p=1,
            
            # A stop sequence is a predefined or user-specified text string that
            # signals an AI to stop generating content, ensuring its responses
            # remain focused and concise. Examples include punctuation marks and
            # markers like "[end]".
            stop=None,
            
            # If set, partial message deltas will be sent.
            stream=False,
    )

    # Retorna o texto da primeira mensagem e, caso seja necessário usar depois,
    # todo o objeto
    return chat_completion.choices[0].message.content, chat_completion

In [59]:
from tqdm import tqdm

def classifica_varias_sentencas(nome_experimento, refazer_experimento, prompt, system_message = None, temperature=0, max_tokens=1024, top_p=1, msg=None):
    # Percorre o data frame de experimentos
    for index, row in tqdm(df_experimentos.iterrows(), total=df.shape[0], desc=msg):
        # Extrai a mensagem do usuário a partir do prompt
        user_message = prompt.format(sentence=row['text'])
        
        # É necessário refazer a chamada se refazer_experimento for True ou se ainda não tiver
        # nenhum resultado.
        # Do jeito que essa função foi montada, eu faço uma chamada e salvo no csv
        # Dessa forma, se der algum problema, basta chamar de novo com Refazer = False que 
        # o experimento será completado
        resposta_atual_experimento = df_experimentos.at[index, nome_experimento]
        if refazer_experimento or resposta_atual_experimento == '':
            resposta_ai, _ = chat_completion(user_message, system_message, temperature, max_tokens, top_p)
            df_experimentos.at[index, nome_experimento] = resposta_ai
            salva_df_experimentos()

In [61]:
def inicializa_df_para_experimento(nome_experimento, refazer_experimento = False):
    if refazer_experimento or nome_experimento not in df_experimentos.columns:
        df_experimentos[nome_experimento] = ''
        salva_df_experimentos()

## Experimento 1 - Llama 3 - 70B - Zero-shot

No experimento mais simples, considera exatamente o mesmo prompt utilizado na Aula 6, sem mensagem de sistema.

In [67]:
prompt_zero_shot = """You are a sentiment classifier. Use only "positive" or "negative" in your answer.

Sentece: {sentence}"""

inicializa_df_para_experimento(EXP_1_ZERO_SHOT['NOME'], )
classifica_varias_sentencas(EXP_1_ZERO_SHOT['NOME'], EXP_1_ZERO_SHOT['REFAZER'], prompt_zero_shot, system_message = None, temperature=0, max_tokens=1024, top_p=1, msg='Experimento 1')

# Experimento 2 - Llama 3 - 70B - Few-shot

''

# Experimento 3 - Llama 3 - 70B - Chain of Thought

# Experimento 4 - Llama 3 - 70B - Tree of Thought