## Calcular um score de satisfação heurístico para cada cliente.

### Como o Score de Satisfação é Calculado (Modelo Heurístico)

O score é um valor entre 0 e 100, onde 100 representa a máxima satisfação. Ele é construído com base nos seguintes fatores e pesos:

1.  **Score Base:** Todos os clientes começam com um score de 50.
2.  **Fatores Positivos (Aumentam a satisfação):**
    *   **Frequência de Pedidos:** +2 pontos por pedido (limite de +20 pontos). Clientes que compram mais frequentemente são geralmente mais satisfeitos.
    *   **Valor Total Gasto:** +1 ponto para cada R$100 gastos (limite de +30 pontos). Clientes que gastam mais tendem a estar mais engajados e satisfeitos.
    *   **Tempo de Vida do Cliente:** +5 pontos para cada ano desde o cadastro (limite de +25 pontos). Clientes mais antigos e leais são um bom sinal de satisfação.
    *   **Entrega Rápida:** +5 pontos se a média de dias de entrega for menor ou igual a 3 dias (apenas para clientes com pedidos entregues).
    *   **Número de Interações/Chamados (Ouvidoria) com sentimento positivo:** +5 pontos por interação (limite de -50 pontos). Muitas interações podem indicar problemas ou insatisfação.
3.  **Fatores Negativos (Diminuem a satisfação):**
    *   **Número de Interações/Chamados (Ouvidoria) com sentimento negativo:** -5 pontos por interação (limite de -50 pontos). Muitas interações podem indicar problemas ou insatisfação.
    *   **Interações Não Resolvidas:** -10 pontos *adicionais* por interação não resolvida (limite de -50 pontos). Chamados abertos sem resolução são um forte indicador de insatisfação.
    *   **Tempo Médio de Entrega Longo:** -1 ponto para cada dia de atraso acima de 7 dias na média de entrega (limite de -20 pontos). Entregas demoradas afetam a experiência do cliente.

Todos os scores são então limitados entre 0 e 100.


In [1]:
from pymongo import MongoClient
import pandas as pd
from datetime import datetime, timedelta

from sqlalchemy import create_engine,exc,text
from transformers import pipeline
from tqdm import tqdm # Importando tqdm para a barra de progresso

import warnings
warnings.filterwarnings("ignore")

In [3]:
from pymongo import MongoClient
import pandas as pd
from datetime import datetime
from sqlalchemy import create_engine, text
from transformers import pipeline
import torch

In [4]:
# ---------------- CONFIGURAÇÕES ----------------
BATCH_SIZE = 32
MAX_TOKEN_LENGTH = 128  # Limite para o modelo
USE_GPU = torch.cuda.is_available()
DEVICE = 0 if USE_GPU else -1

In [5]:
print(f"Dispositivo para Hugging Face: {'GPU' if USE_GPU else 'CPU'}")

# ---------------- PIPELINE DE SENTIMENTO ----------------
print("Carregando modelo de análise de sentimento Hugging Face (pode demorar na primeira vez)...")
try:
    sentiment_pipeline = pipeline(
        "sentiment-analysis",
        model="pysentimiento/bertweet-pt-sentiment",
        device=DEVICE,
        truncation=True,
        top_k=None  # Isso fará com que ele mostre os scores de todas as classes
    )
    print("Modelo de análise de sentimento carregado com sucesso.")
except Exception as e:
    print(f"Erro ao carregar o modelo Hugging Face: {e}")
    sentiment_pipeline = None

Dispositivo para Hugging Face: GPU
Carregando modelo de análise de sentimento Hugging Face (pode demorar na primeira vez)...


emoji is not installed, thus not converting emoticons or emojis into text. Install emoji: pip3 install emoji==0.6.0
Device set to use cuda:0


Modelo de análise de sentimento carregado com sucesso.


In [6]:
# ---------------- FUNÇÃO PARA BUSCAR INTERAÇÕES ----------------
def get_mongodb_data():
    if sentiment_pipeline is None:
        print("Análise de sentimento não disponível. Retornando DataFrame vazio.")
        return pd.DataFrame(columns=[
            'id_cliente', 'data', 'resolvido', 'tipo', 'descricao',
            'sentiment_label', 'sentiment_score_contribution'
        ])
    
    client = None 
    try:
        print("  - Conectando ao MongoDB e buscando coleção 'interacoes'...")
        
        if MONGO_CONFIG.get('username') and MONGO_CONFIG.get('password'):
            client = MongoClient(
                MONGO_CONFIG['host'],
                MONGO_CONFIG['port'],
                username=MONGO_CONFIG['username'],
                password=MONGO_CONFIG['password']
            )
        else:
            client = MongoClient(
                MONGO_CONFIG['host'],
                MONGO_CONFIG['port']
            )

        db = client[MONGO_CONFIG['database']]
        collection = db[MONGO_CONFIG['collection']]

        interacoes_data = list(collection.find(
            {},  # Filtro vazio para retornar todos os documentos
            {
                '_id': 0,           # Projeção - Não mostrar o _id
                'id_cliente': 1,
                'data': 1,
                'resolvido': 1,
                'tipo': 1,
                'descricao': 1
            }
        ))
        df = pd.DataFrame(interacoes_data)
        if df.empty:
            print("Nenhum dado encontrado na coleção 'interacoes'.")
            return df

        # Conversão de tipos de dados
        df['id_cliente'] = pd.to_numeric(df['id_cliente'], errors='coerce')
        df = df.dropna(subset=['id_cliente'])
        df['id_cliente'] = df['id_cliente'].astype(int)
        df['data'] = pd.to_datetime(df['data'])
        df['resolvido'] = df['resolvido'].astype(bool)

        # --- Processamento de Sentimento em Lotes (BATCH) com barra de progresso ---
        print("    - Iniciando análise de sentimento das descrições das interações...")
        
        descriptions_list = df['descricao'].tolist()
        
        sentiment_labels = []
        sentiment_scores_contribution = []
        
        batch_size = 64 # Ajuste conforme sua memória RAM/GPU.
        
        # AQUI ESTÁ A BARRA DE PROGRESSO!
        for i in tqdm(range(0, len(descriptions_list), batch_size), desc="Analisando Sentimento"):
            batch_descriptions = descriptions_list[i : i + batch_size]
            
            batch_sentiment_results = sentiment_pipeline(batch_descriptions)
            
            for results_for_text in batch_sentiment_results:
                if results_for_text:
                    melhor_resultado = max(results_for_text, key=lambda x: x['score'])
                    label = melhor_resultado['label']
                    
                    if label == 'POS':
                        score_contribution = 5
                    elif label == 'NEG':
                        score_contribution = -10
                    else: # NEU
                        score_contribution = 1
                else:
                    label = 'NEU'
                    score_contribution = 1
                
                sentiment_labels.append(label)
                sentiment_scores_contribution.append(score_contribution)
        
        print("    - Análise de sentimento concluída.") # Mensagem de conclusão
        
        df['sentiment_label'] = sentiment_labels
        df['sentiment_score_contribution'] = sentiment_scores_contribution

        return df
    
    except Exception as e:
        print(f"Erro ao buscar/processar dados do MongoDB: {e}")
        return pd.DataFrame()
    finally:
        if client:
            client.close()


In [7]:
# ---------------- FUNÇÃO DE SCORE DE SATISFAÇÃO ----------------
def calculate_satisfaction_score(clientes_df, pedidos_df, itens_df, interacoes_df):
    if clientes_df.empty:
        return pd.DataFrame(columns=['id', 'nome', 'satisfaction_score'])

    clientes_df['satisfaction_score'] = 50.0

    # --- Pedidos e Itens ---
    if not pedidos_df.empty and not itens_df.empty:
        itens_df['total_item_value'] = itens_df['quantidade'] * itens_df['precounitario']
        order_values = itens_df.groupby('idpedido')['total_item_value'].sum().reset_index()
        order_values.rename(columns={'total_item_value': 'valor_total_pedido'}, inplace=True)

        pedidos_df = pd.merge(pedidos_df, order_values, left_on='id', right_on='idpedido', how='left')
        pedidos_df['valor_total_pedido'] = pedidos_df['valor_total_pedido'].fillna(0)
        pedidos_df['delivery_days'] = (pedidos_df['datadaentrega'] - pedidos_df['datadopedido']).dt.days
        pedidos_df.loc[pedidos_df['delivery_days'] < 0, 'delivery_days'] = None

        summary = pedidos_df.groupby('idcliente').agg(
            num_pedidos=('id', 'count'),
            total_gasto=('valor_total_pedido', 'sum'),
            avg_delivery_days=('delivery_days', 'mean')
        ).reset_index()
        summary.rename(columns={'idcliente': 'id'}, inplace=True)
        clientes_df = pd.merge(clientes_df, summary, on='id', how='left')
        clientes_df.fillna({'num_pedidos':0, 'total_gasto':0.0, 'avg_delivery_days':0.0}, inplace=True)
    else:
        clientes_df['num_pedidos'] = 0
        clientes_df['total_gasto'] = 0.0
        clientes_df['avg_delivery_days'] = 0.0

    # --- Interações ---
    if not interacoes_df.empty:
        summary = interacoes_df.groupby('id_cliente').agg(
            num_interacoes=('id_cliente', 'count'),
            num_interacoes_nao_resolvidas=('resolvido', lambda x: (~x).sum()),
            total_sentiment_score=('sentiment_score_contribution', 'sum')
        ).reset_index()
        summary.rename(columns={'id_cliente': 'id'}, inplace=True)
        clientes_df = pd.merge(clientes_df, summary, on='id', how='left')
        clientes_df.fillna({'num_interacoes':0, 'num_interacoes_nao_resolvidas':0, 'total_sentiment_score':0.0}, inplace=True)
    else:
        clientes_df['num_interacoes'] = 0
        clientes_df['num_interacoes_nao_resolvidas'] = 0
        clientes_df['total_sentiment_score'] = 0.0

    # --- Cálculo do score ---
    clientes_df['satisfaction_score'] += (clientes_df['num_pedidos']*2).clip(upper=20)
    clientes_df['satisfaction_score'] += (clientes_df['total_gasto']/100).clip(upper=30)
    clientes_df['satisfaction_score'] += ((datetime.now() - clientes_df['cadastro']).dt.days / 365 * 5).clip(upper=25)
    clientes_df['satisfaction_score'] -= (clientes_df['num_interacoes']*5).clip(upper=50)
    clientes_df['satisfaction_score'] -= (clientes_df['num_interacoes_nao_resolvidas']*10).clip(upper=50)
    clientes_df['satisfaction_score'] -= clientes_df['avg_delivery_days'].apply(lambda x: max(0, x-7)).clip(upper=20)
    clientes_df['satisfaction_score'] += clientes_df['avg_delivery_days'].apply(lambda x: 5 if 0 < x <= 3 else 0)
    clientes_df['satisfaction_score'] += clientes_df['total_sentiment_score'].clip(-50,50)
    clientes_df['satisfaction_score'] = clientes_df['satisfaction_score'].clip(0,100)

    return clientes_df[['id','nome','satisfaction_score']]

In [8]:
## ---------------- EXECUÇÃO PRINCIPAL ----------------
if __name__ == "__main__":
    print("Iniciando geração do score de satisfação...\n")

    # --- MySQL ---
    engine = create_engine('mysql+pymysql://root:root@localhost:3308/vendas')
    conn = engine.connect()
    clientes_df = pd.read_sql(text("SELECT id, nome, cadastro FROM clientes"), conn)
    pedidos_df = pd.read_sql(text("SELECT id, idcliente, datadopedido, datadaentrega FROM pedidos"), conn)
    itens_df = pd.read_sql(text("SELECT idpedido, quantidade, precounitario FROM itens"), conn)

    clientes_df['id'] = clientes_df['id'].astype(int)
    clientes_df['cadastro'] = pd.to_datetime(clientes_df['cadastro'])

    # --- MongoDB ---
    interacoes_df = get_mongodb_data()

    # --- Cálculo do score ---
    satisfaction_scores_df = calculate_satisfaction_score(clientes_df, pedidos_df, itens_df, interacoes_df)

    print("\n--- Scores de Satisfação ---")
    print(satisfaction_scores_df.head(10).to_string(index=False))

Iniciando geração do score de satisfação...

  - Conectando ao MongoDB e buscando coleção 'interacoes'...
    - Iniciando análise de sentimento das descrições das interações...


You seem to be using the pipelines sequentially on GPU. In order to maximize efficiency please use a dataset  1.05it/s]
Analisando Sentimento: 100%|███████████████████████████████████████████████████████| 2487/2487 [44:54<00:00,  1.08s/it]


    - Análise de sentimento concluída.

--- Scores de Satisfação ---
 id                   nome  satisfaction_score
  5       Maria Liz Barros                95.0
  7        Heloisa Azevedo                99.0
 15     Ana Julia Carvalho                74.0
 22   Ana Beatriz Mendonça                64.0
 28 Silvano Carlos Menezes                90.0
 37           Caleb Santos                85.0
 39    Maria Clara Pimenta               100.0
 43    Enzo Gabriel Aragão                61.0
 49           Sara Peixoto               100.0
 53       Oliver Rodrigues                39.0


In [9]:
interacoes_df

Unnamed: 0,id_cliente,data,tipo,descricao,resolvido,sentiment_label,sentiment_score_contribution
0,28,2019-01-07,Reclamação,"""Olá! Estou muito descontente com o atendiment...",True,NEG,-10
1,1330,2019-01-07,Reclamação,Oi! Eu solicitei o pedido 1330 para o produto ...,True,NEU,1
2,418,2019-01-11,Reclamação,"""Estou muito descontente com o atendimento da ...",True,NEG,-10
3,1599,2019-01-12,Reclamação,"""Estou muito desapontado com a experiência que...",True,NEG,-10
4,3310,2019-01-12,Elogio,"""Olá, eu comprei o EcoTank L4260 e estou muito...",True,POS,5
...,...,...,...,...,...,...,...
159116,175653,2025-03-31,Reclamação,"Olá,\n\nQuero expressar minha desilusão com o ...",False,NEG,-10
159117,191240,2025-04-01,Reclamação,"Prezados responsáveis pela ouvidoria,\n\nEstou...",True,NEU,1
159118,165848,2025-04-01,Reclamação,Olá!\n\nEu sou um cliente regular da sua loja ...,True,NEG,-10
159119,92522,2025-04-02,Reclamação,"Estimada equipe da loja, sinto-me obrigado a r...",False,NEG,-10


In [10]:
interacoes_df.query('sentiment_label != "NEU"')

Unnamed: 0,id_cliente,data,tipo,descricao,resolvido,sentiment_label,sentiment_score_contribution
0,28,2019-01-07,Reclamação,"""Olá! Estou muito descontente com o atendiment...",True,NEG,-10
2,418,2019-01-11,Reclamação,"""Estou muito descontente com o atendimento da ...",True,NEG,-10
3,1599,2019-01-12,Reclamação,"""Estou muito desapontado com a experiência que...",True,NEG,-10
4,3310,2019-01-12,Elogio,"""Olá, eu comprei o EcoTank L4260 e estou muito...",True,POS,5
5,43,2019-01-13,Elogio,Eu estou absolutamente impressionado com a ate...,True,POS,5
...,...,...,...,...,...,...,...
159114,69095,2025-03-31,Elogio,Olá equipe de atendimento!\n\nEstou escrevendo...,True,POS,5
159115,82269,2025-03-31,Reclamação,Olá! Eu gostaria de fazer uma reclamação sobre...,True,NEG,-10
159116,175653,2025-03-31,Reclamação,"Olá,\n\nQuero expressar minha desilusão com o ...",False,NEG,-10
159118,165848,2025-04-01,Reclamação,Olá!\n\nEu sou um cliente regular da sua loja ...,True,NEG,-10


In [12]:
interacoes_df.to_csv(r'd:\lixo\sentimento.csv',index=False)