In [1]:
import pandas as pd
from supabase import create_client, Client
import os
import matplotlib.pyplot as plt

supabase_url = os.getenv('SUPABASE_URL')
supabase_key = os.getenv('SUPABASE_KEY') 

url: str = supabase_url
key: str = supabase_key

supabase: Client = create_client(url, key)

response = supabase.table('produtosKabum').select('*').execute()

df = pd.DataFrame(response.data)

df.head(3)

Unnamed: 0,id,data,id_kabum,categoria,subcategoria,nome,preco,preco_pix,descricao,openbox,imagem,site,url
0,264,2024-06-19T19:41:29.3192+00:00,128250,Hardware,Disco Rígido (HD),"HD Seagate IronWolf NAS, 14TB, 3.5´, SATA - ST...",3294.11,2799.99,Compre HD Seagate IronWolf NAS no KaBuM! As me...,0,,kabum,https://www.kabum.com.br/produto/128250
1,265,2024-06-19T19:41:29.432631+00:00,100916,Hardware,Disco Rígido (HD),"HD Seagate 2TB BarraCuda, 3.5', SATA - ST2000D...",494.11,419.99,"Um desempenho robusto e confiabilidade, Cache ...",0,https://images.kabum.com.br/produtos/fotos/100...,kabum,https://www.kabum.com.br/produto/100916
2,266,2024-06-19T19:41:29.517339+00:00,95803,Hardware,Disco Rígido (HD),"HD Seagate 4TB BarraCuda, 3.5', SATA - ST4000D...",823.52,699.99,O HD perfeito para armazenamento de todos os s...,0,https://images.kabum.com.br/produtos/fotos/958...,kabum,https://www.kabum.com.br/produto/95803


In [None]:
# ... código existente de importação e conexão ...

def criar_historico_completo(df_original):
    # Criar uma lista para armazenar os DataFrames processados
    dfs_processados = []
    
    # Obter lista única de IDs dos produtos
    produtos_unicos = df_original['id_kabum'].unique()
    
    for id_produto in produtos_unicos:
        # Selecionar dados do produto atual
        produto = df_original[df_original['id_kabum'] == id_produto].copy()
        
        # Converter e extrair apenas a data
        produto['data'] = pd.to_datetime(produto['data'])
        produto['data_somente'] = produto['data'].dt.date
        
        # Remover duplicatas por data
        produto_sem_duplicatas = produto.drop_duplicates(subset='data_somente')
        
        # Criar série de datas completa
        data_inicial = produto_sem_duplicatas['data_somente'].min()
        data_final = produto_sem_duplicatas['data_somente'].max()
        todas_as_datas = pd.date_range(data_inicial, data_final).date
        
        # Criar DataFrame com todas as datas
        df_datas_completas = pd.DataFrame({'data_somente': todas_as_datas})
        
        # Mesclar com dados do produto
        df_produto_completo = df_datas_completas.merge(
            produto_sem_duplicatas, 
            on='data_somente', 
            how='left'
        )
        
        # Preencher valores ausentes
        colunas_para_preencher = ['preco', 'preco_pix', 'nome', 'id_kabum', 'categoria', 'url']
        df_produto_completo[colunas_para_preencher] = df_produto_completo[colunas_para_preencher].ffill()
        
        dfs_processados.append(df_produto_completo)
    
    # Combinar todos os DataFrames processados
    historico_completo = pd.concat(dfs_processados, ignore_index=True)
    return historico_completo

# Criar o histórico completo
df_historico = criar_historico_completo(df)


In [7]:
def criar_ranking_descontos(df_historico):
    # Obter a data mais recente
    data_mais_recente = df_historico['data_somente'].max()
    
    # Calcular a data de 7 dias atrás
    data_7_dias = data_mais_recente - pd.Timedelta(days=7)
    
    # Criar DataFrame para análise
    df_analise = []
    
    for id_produto in df_historico['id_kabum'].unique():
        try:
            # Filtrar dados do produto
            produto = df_historico[df_historico['id_kabum'] == id_produto].copy()
            
            # Verificar se existem dados recentes para o produto
            dados_recentes = produto[produto['data_somente'] == data_mais_recente]
            if dados_recentes.empty:
                continue
                
            # Obter preço atual (mais recente)
            preco_atual = dados_recentes['preco_pix'].iloc[0]
            
            # Verificar dados dos últimos 7 dias
            dados_7_dias = produto[
                (produto['data_somente'] >= data_7_dias) & 
                (produto['data_somente'] < data_mais_recente)
            ]
            
            # Se não houver dados suficientes para comparação, pular
            if len(dados_7_dias) < 3:  # Exigir pelo menos 3 dias de dados
                continue
                
            # Calcular média dos últimos 7 dias
            media_7_dias = dados_7_dias['preco_pix'].mean()
            
            # Calcular desconto percentual
            desconto = ((media_7_dias - preco_atual) / media_7_dias) * 100
            
            df_analise.append({
                'id_kabum': id_produto,
                'nome': produto['nome'].iloc[0],
                'categoria': produto['categoria'].iloc[0],
                'preco_atual': preco_atual,
                'media_7_dias': media_7_dias,
                'desconto_percentual': desconto,
                'url': produto['url'].iloc[0]
            })
            
        except Exception as e:
            print(f"Erro ao processar produto {id_produto}: {str(e)}")
            continue
    
    # Criar DataFrame com os resultados
    df_descontos = pd.DataFrame(df_analise)
    
    if df_descontos.empty:
        print("Nenhum produto com dados suficientes para análise foi encontrado.")
        return pd.DataFrame()
    
    # Ordenar por desconto (maiores descontos primeiro)
    df_descontos = df_descontos.sort_values('desconto_percentual', ascending=False)
    
    # Arredondar valores numéricos
    df_descontos['preco_atual'] = df_descontos['preco_atual'].round(2)
    df_descontos['media_7_dias'] = df_descontos['media_7_dias'].round(2)
    df_descontos['desconto_percentual'] = df_descontos['desconto_percentual'].round(2)
    
    return df_descontos

# Criar o ranking de descontos
df_ranking = criar_ranking_descontos(df_historico)

In [12]:
df_ranking.head(10)[['nome', 'categoria', 'preco_atual', 'media_7_dias', 'desconto_percentual']]

Unnamed: 0,nome,categoria,preco_atual,media_7_dias,desconto_percentual
180,"Aircooler Redragon Tyr, LED Azul, Intel e AMD,...",Hardware,84.99,131.42,35.33
272,"Processador AMD Ryzen 9 5900X, 3.7GHz (4.8GHz ...",Hardware,2399.99,3479.36,31.02
290,"Processador AMD Ryzen 9 5950X, 3.4GHz (4.9GHz ...",Hardware,3599.99,5118.11,29.66
206,"Cooler Para Processador K-MEX AC02, LED ARGB, ...",Hardware,140.51,193.28,27.3
435,"SSD 1TB WD BLACK C50 para Xbox, WDBMPH0010BNC-...",Hardware,1299.99,1700.56,23.56
679,"SSD 1TB Kingston Nv3, M.2 2280, PCie 4.0 Nvme,...",Hardware,475.0,613.1,22.53
395,"Processador AMD Ryzen 9 7950X, 5.7GHz Max Turb...",Hardware,3659.99,4447.2,17.7
80,Placa Mãe ASRock Phantom Gaming B550 PG Riptid...,Hardware,1158.99,1395.0,16.92
387,"Processador AMD Ryzen 9 9900X, 4.4 GHz (5.6 GH...",Hardware,2999.99,3571.42,16.0
142,"SSD Crucial Bx500, 1TB, Sata 6GB/s 2.5, Leitur...",Hardware,401.9,473.35,15.09
