In [None]:
!pip install openai==0.28

Collecting openai==0.28
  Downloading openai-0.28.0-py3-none-any.whl.metadata (13 kB)
Downloading openai-0.28.0-py3-none-any.whl (76 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m76.5/76.5 kB[0m [31m2.1 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: openai
  Attempting uninstall: openai
    Found existing installation: openai 1.78.1
    Uninstalling openai-1.78.1:
      Successfully uninstalled openai-1.78.1
Successfully installed openai-0.28.0


In [None]:
import openai
import pandas as pd
from sklearn.metrics import classification_report, accuracy_score
import time

# Configuração da chave API da OpenAI
openai.api_key = "x"

# Carregar dados de teste
df_test = pd.read_csv('campanhas.csv')

# Função para classificar usando OpenAI GPT
def classify_with_gpt(h1, h2, cta):
    prompt = f"""
Você é um especialista em CRM que analisa campanhas publicitárias de banners exibidas em um aplicativo de um banco e corretora de investimentos.

Cada campanha possui um título (H1), um subtítulo (H2) e uma chamada para ação (CTA). Seu objetivo é avaliar, com base apenas no conteúdo textual dessas três partes, se a campanha terá desempenho acima da média ou abaixo da média em termos de CTR (taxa de cliques).

A média histórica de CTR nesse canal gira em torno de 0,85%, e é essencial considerar o sentimento, emoção e estrutura semântica dos textos para avalia-lo.

Para auxiliar na classificação, segue alguns exemplos de comunicação que tiveram bons e maus resultados:

Exemplos 1

Título (H1): Crédito rápido e fácil
Subtítulo (H2): Taxas reduzidas usando seus investimentos como garantia
CTA: Quero simular!

Hipótese: Campanha utilizou palavras como "rápido" e "fácil" para transmitir um sentimento bom para o cliente, além disso, trouxe uma vantagem com "taxas reduzidas"

Exemplos 2

Título (H1): IPCA + 5,80% a.a.
Subtítulo (H2): Com pagamento de juros semestrais e isenção de IR
CTA: Confira!
CTR: Acima média

Hipótese: Campanha mostra "isenção de IR" como uma vantagem, além de mostrar IPCA +5,8 que pode ser uma opção de investimento boa para o publico alvo dessa campanha

Exemplos 3

Título (H1): Peça seu Cartão Rico!
Subtítulo (H2): Aproveite condições especiais por 30 dias.
CTA: Saiba mais
CTR: Acima média

Hipótese: Campanha traz "condições especiais por 30 dias" para mostrar exclusividade e que escassez

Exemplos 4

Título (H1): 47% de redução em parcela
Subtítulo (H2): Contrate o consórcio para a moto dos seus sonhos.
CTA: Saber mais
CTR: Acima média

Hipótese: Campanha traz um argumento de parcela reduzida, além disso menciona moto como sonho, o que pode fazer sentido para muitos clientes

Exemplos 5

Título (H1): 115% do CDI!
Subtítulo (H2): Produto desbloqueado especialmente para você
CTA: Clique aqui
CTR: Acima média

Hipótese: Campanha traz sentimento bom para o cliente ao indicar que o produto foi desbloqueado especialmente para ele

Exemplos 6

Título (H1): Liquidez e Rentabilidade
Subtítulo (H2): Mantenha uma gestão de caixa eficiente e segura.
CTA: Saiba mais!
CTR: Acima média

Hipótese: Campanha traz as vantagens oferecidas, com Liquidez e Rentabilidade, além do sentimento de segurança e eficiência

Exemplo 7

Título (H1): Abra sua conta PJ!
Subtítulo (H2): Invista no seu negócio pela XP!
CTA: Falar com assessor!
CTR: Abaixo média

Exemplo 8

Título (H1): WEBINAR XP
Subtítulo (H2): Saiba sobre as perspectivas de mercado para 2024
CTA: Acessar Live
CTR: Abaixo média

Exemplo 9

Título (H1): Segurança e retorno!
Subtítulo (H2): Cuide do seu futuro com a Previdência Az Quest XP.
CTA: Saiba mais
CTR: Abaixo média

Exemplo 10

Título (H1): Abra sua conta PJ!
Subtítulo (H2): Invista no seu negócio pela XP!
CTA: Saiba mais!
CTR: Abaixo média

Agora, com base nesse histórico de campanhas/resultados, analisando o tom da mensagem, o sentimento/emoção passado e o contexto da campanha, preciso que classifique o seguinte conteudo:

Título (H1): {h1}
Subtítulo (H2): {h2}
CTA: {cta}

Responda apenas com: Acima ou Abaixo."""

    response = openai.ChatCompletion.create(
        model="gpt-3.5-turbo",
        messages=[{"role": "user", "content": prompt}],
        temperature=0,
        max_tokens=5
    )

    # Obter resposta do modelo
    prediction = response.choices[0].message['content'].strip()
    return prediction

# Lista para armazenar predições
predictions = []

# Realizar predições com controle de limites (rate limit)
for index, row in df_test.iterrows():
    try:
        prediction = classify_with_gpt(row['H1'], row['H2'], row['CTA'])
        predictions.append(prediction)
        # Espera para respeitar limites da API (máx. 3 requisições por minuto no seu caso)
        time.sleep(21)
    except Exception as e:
        print(f"Erro na requisição {index}: {e}")
        predictions.append("Erro")

# Avaliar resultados
df_test['predictions'] = predictions

# Tratamento de erros caso ocorram durante as chamadas
df_results = df_test[df_test['predictions'].isin(['Acima', 'Abaixo'])]

# Mapear as predições textuais para valores binários
mapa_pred = {'Acima': 1, 'Abaixo': 0}
df_results['pred_bin'] = df_results['predictions'].map(mapa_pred)

# Avaliação dos resultados
print(classification_report(df_results['ACIMA_MEDIA'], df_results['pred_bin']))
print('Acurácia:', accuracy_score(df_results['ACIMA_MEDIA'], df_results['pred_bin']))
df_results['ACIMA_MEDIA'] = df_results['ACIMA_MEDIA'].astype(int)
