# EXTRACT 

In [6]:
import awswrangler as awr
import logging
import pandas as pd
import os

logging.basicConfig(
    level=logging.INFO,  # Exibe mensagens a partir de INFO
    format="%(asctime)s - %(levelname)s - %(message)s",
    handlers=[
        logging.StreamHandler()  # Garante logs no console
    ]
)

logging.info('\n ----------------------------------------------------------------------------------')
logging.info('\n Executando Rotina: Movimentação de Placas')

class Extract:

    def __init__(self):
        self.path = r"C:\Users\raphael.almeida\Documents\Processos\placas_movimentacoes"

    def extract_all_ativacoes(self):

        try:
            dir_query = os.path.join(self.path, 'sql', 'all_boards_ATIVOS.sql')
            with open(dir_query, 'r') as file:
                query = file.read()
            df_ativacoes = awr.athena.read_sql_query(query, database='silver')
            logging.info('\n ----------------------------------------------------------------------------------')
            logging.info('\n Consulta de ativações extraída com sucesso!')
            return df_ativacoes
        except Exception as e:
            logging.info('\n ----------------------------------------------------------------------------------')
            logging.info(f'\n Falha ao extrair a consulta de ativações: {e}')
            return None

    def extract_all_cancelamentos(self):

        try:
            dir_query = os.path.join(self.path, 'sql', 'all_boards_CANCELADOS.sql')
            with open(dir_query, 'r') as file:
                query = file.read()
            df_cancelamentos = awr.athena.read_sql_query(query, database='silver')
            logging.info('\n ----------------------------------------------------------------------------------')
            logging.info('\n Consulta de cancelamentos extraída com sucesso!')
            return df_cancelamentos
        except Exception as e:
            logging.info('\n ----------------------------------------------------------------------------------')
            logging.info(f'\n Falha ao extrair a consulta de cancelamentos: {e}')
            return None

    def extract_conf_boards(self):

        try:

            dir_query = os.path.join(self.path,'sql', 'listagem_mestra.sql')

            with open(dir_query, 'r') as file:
                query = file.read()

            df_conferencia = awr.athena.read_sql_query(query, database='silver')
        
            logging.info('\n ----------------------------------------------------------------------------------')
            logging.info('\n Consulta de dados históricos realizada com sucesso!')

            return df_conferencia

        except Exception as e:

            logging.info('\n ----------------------------------------------------------------------------------')
            logging.info(f'\n Falha ao extrair consulta de dados históricos: {e}')

extract = Extract()
df_ativacoes = extract.extract_all_ativacoes()
df_cancelamentos = extract.extract_all_cancelamentos()
df_conf = extract.extract_conf_boards()



# TRANSFORM

In [None]:
# IMPORTANDO MÓDULOS E PACOTES
import pandas as pd
import numpy as np
import datetime as dt
import logging
import numpy as np

class Transform:
        
    def __init__(self) -> None:
        pass

    # CRIANDO FUNÇÃO QUE IRÁ APLICAR O TRATAMENTO DE STATUS DAS PLACAS ATIVADAS
    def board_status_treatment(df, df_ontem, df_conf, status_filter_list):

        try:
            status_filter_list = ['CANCELADO', 'CANCELADA', 'FINALIZADO', 'FINALIZADA', 'NAO RENOVADO']

            if not df.empty:
                logging.info('\n ----------------------------------------------------------------------------------')
                logging.info(df.shape)
                row_count = 0
                for idx, row in df.iterrows():
                    row_count += 1
                    df_comp_ontem = df_ontem[df_ontem['chassi'] == row['chassi']]
                    df_comp_conf = df_conf[(df_conf['chassi'] == row['chassi']) & (df_conf['beneficio'] == row['beneficio'])].sort_values(by='data_ativacao', ascending=False)

                    if not df_comp_ontem.empty:                                        
                                if df_comp_ontem['empresa']!=row['empresa']:
                                    df.at[idx, 'status_beneficio'] = 'MIGRAÇÃO'
                                    df.at[idx, 'migration_from'] = 'NULL'
                                else:
                                    df.at[idx, 'status_beneficio'] = 'ATIVO'
                                    df.at[idx, 'migration_from'] = 'NULL'                     
                    else:
                        hist_datas_ativacao = sorted(df_comp_conf['data_ativacao_beneficio'].dropna().drop_duplicates().unique())                    
                        if len(hist_datas_ativacao) > 1:
                            penultimo_registro_data = hist_datas_ativacao[-2]
                            verification_penultima_row = df_comp_conf.loc[df_comp_conf['data_ativacao_beneficio'] == penultimo_registro_data]
                            
                            if verification_penultima_row['status_beneficio'].values[0] not in status_filter_list:
                                if verification_penultima_row['empresa'].values[0] != row['empresa']:
                                    df.at[idx, 'status_beneficio'] = 'MIGRAÇÃO' #EM ALGUM MOMENTO ELA ESTAVA COMO ATIVA NA OUTRA EMPRESA, NÃO FOI CANCELADA, MAS TAMBÉM NÃO ESTAVA ATIVA
                                    df.at[idx, 'migration_from'] = verification_penultima_row['empresa'].values[0]
                                else:
                                    df.at[idx, 'status_beneficio'] = 'RENOVAÇÃO' #NÃO TINHA STATUS DE CANCELAMENTO NA EMPRESA, MAS TAMBÉM NÃO ESTAVA ATIVA
                                    df.at[idx, 'migration_from'] = 'NULL'
                            else:
                                    df.at[idx, 'status_beneficio'] = 'REATIVAÇÃO'
                                    df.at[idx, 'migration_from'] = 'NULL'
                                    
                        else:
                            df.at[idx, 'status_beneficio'] = 'NOVO'
                            df.at[idx, 'migration_from'] = 'NULL'

                logging.info('\n ----------------------------------------------------------------------------------')
                logging.info(f'Total de linhas processadas: {row_count}')

            else:
                logging.info('\n ----------------------------------------------------------------------------------')
                logging.info('Nenhum registro de ativações para tratamento de dados. Dataframe vazio!')


        except Exception as e:

            logging.info('\n ----------------------------------------------------------------------------------')
            logging.info(f'Falha no tratamento de status das placas ativadas. Revise o código: {e}')

        return df

In [7]:
# IMPORTANDO MÓDULOS E PACOTES
import pandas as pd
import numpy as np
import datetime as dt
import logging


class Transform:
        
    def __init__(self) -> None:
        pass

    def transforming_files(self):

#DEFININDO DATAFRAMES VAZIOS 
        try:

            df_final_ativacoes = pd.DataFrame()
            df_final_cancelamentos = pd.DataFrame()

        except Exception as e:

            logging.info('\n ----------------------------------------------------------------------------------')
            logging.info('Falha ao definir dataframes.')

#TRANSFORMANDO DF_ATIV E SEGMENTANDO POR EMPRESA
        try:
            df_ativ_all_boards=df_ativacoes
            df_final_cancelamentos=df_cancelamentos
            
            #extract = Extract()
            #df_final_cancelamentos = extract.extract_all_cancelamentos()
            #df_ativ_all_boards = extract.extract_all_ativacoes()

            df_ativ_all_boards['data_ativacao_beneficio'] = pd.to_datetime(df_ativ_all_boards['data_ativacao_beneficio']).dt.date
                        
            df_ativ_all_boards['beneficio'] = df_ativ_all_boards['beneficio'].replace('REPARAÇÃO OU REPOSIÇÃO DO VEÍCULO', 'CASCO (VEÍCULO)').replace('REPARAÇÃO OU REPOSIÇÃO DO (SEMI)REBOQUE', 'CASCO (R/SR)').replace('REPARAÇÃO OU REPOSIÇÃO DO COMPLEMENTO', 'CASCO (COMPLEMENTO)')
            
            df_ativ_viavante = df_ativ_all_boards[df_ativ_all_boards['empresa'] == 'Viavante']
            df_ativ_stcoop = df_ativ_all_boards[df_ativ_all_boards['empresa'] == 'Stcoop']
            df_ativ_segtruck = df_ativ_all_boards[df_ativ_all_boards['empresa'] == 'Segtruck']
            df_ativ_tag = df_ativ_all_boards[df_ativ_all_boards['empresa'] == 'Tag']

            df_final_cancelamentos = df_final_cancelamentos

        except Exception as e:

            logging.info('\n ----------------------------------------------------------------------------------')  
            logging.info(f'Falha ao realizar a segmentação dos dataframes: {e}')

# SELECIONANDO APENAS AS ATIVAÇÕES CORRESPONDENTES AOS BENEFICIOS 'CASCO' / 'TERCEIRO' POR UM REGEX PADRÃO
        try:
            ids_beneficios_segtruck = [2, 3, 4, 7, 24, 25, 26, 29]
            ids_beneficios_stcoop = [24, 25, 26, 29]
            ids_beneficios_viavante = [40, 41, 42, 45]
            ids_beneficios_tag = [2, 3, 4, 7, 24, 25, 26, 29, 34, 35, 36, 37, 38, 39]

            df_ativ_viavante = df_ativ_viavante.loc[df_ativ_viavante['id_beneficio'].isin(ids_beneficios_viavante)]
            df_ativ_stcoop = df_ativ_stcoop.loc[df_ativ_stcoop['id_beneficio'].isin(ids_beneficios_stcoop)]
            df_ativ_segtruck = df_ativ_segtruck.loc[df_ativ_segtruck['id_beneficio'].isin(ids_beneficios_segtruck)]
            df_ativ_tag = df_ativ_tag.loc[df_ativ_tag['id_beneficio'].isin(ids_beneficios_tag)]

        except Exception as e:

            logging.info('\n ----------------------------------------------------------------------------------')  
            logging.info(f'Falha ao padronizar nomenclaturas referente aos beneficios pré-estabelecidos: {e}')

# CONCATENANDO E CRIANDO COLUNA DE MIGRAÇÃO (MIGRATION_FROM) 
        try:

            df_final_ativacoes = pd.concat([df_ativ_viavante, df_ativ_stcoop, df_ativ_segtruck, df_ativ_tag])

            if not df_final_ativacoes.empty:
                df_final_ativacoes['migration_from'] = np.nan

        except Exception as e:
            logging.info('\n ----------------------------------------------------------------------------------')
            logging.info(f'Falha na criação da coluna de migração e concatenação de dataframes: {e}')

    # DEFININDO COLUNAS QUE SERÃO UTILIZADAS NO DATAFRAME FINAL
        try:
           
            df_final_ativacoes = df_final_ativacoes[[
                'placa', 'chassi', 'id_placa', 'id_veiculo', 'id_carroceria', 'matricula', 'conjunto', 'unidade', 'consultor', 'status_beneficio', 
                'cliente', 'data_registro', 'data_ativacao_beneficio', 'suporte', 'data_filtro', 'empresa', 'migration_from'
            ]]

            logging.info('\n ----------------------------------------------------------------------------------')
            logging.info(f'Processo de seleção de colunas realizado com sucesso!')

        except Exception as e:
            logging.info('\n ----------------------------------------------------------------------------------')
            logging.info(f'Falha ao definir colunas: {e}')

    # RETIRANDO DUPLICATAS
        try:
            df_final_ativacoes = df_final_ativacoes.drop_duplicates(subset=['chassi'])

            logging.info('\n ----------------------------------------------------------------------------------')
            logging.info(f'Duplicatas retiradas com sucesso.')

        except Exception as e:
            logging.info('\n ----------------------------------------------------------------------------------')
            logging.info(f'Falha ao retirar duplicatas. Revise o código: {e}')

# TRATANDO DADOS NULOS NOS DATAFRAMES
        try:
            df_final_ativacoes['placa'] = df_final_ativacoes['placa'].fillna('SEM-PLACA')
            df_final_ativacoes['chassi'] = df_final_ativacoes['chassi'].fillna('NULL')
            df_final_ativacoes['id_placa'] = df_final_ativacoes['id_placa'].fillna(0)
            df_final_ativacoes['id_veiculo'] = df_final_ativacoes['id_veiculo'].fillna(0)
            df_final_ativacoes['id_carroceria'] = df_final_ativacoes['id_carroceria'].fillna(0)
            df_final_ativacoes['matricula'] = df_final_ativacoes['matricula'].fillna(0)
            df_final_ativacoes['conjunto'] = df_final_ativacoes['conjunto'].fillna(0)
            df_final_ativacoes['unidade'] = df_final_ativacoes['unidade'].fillna('NULL')
            df_final_ativacoes['consultor'] = df_final_ativacoes['consultor'].fillna('NULL')
            df_final_ativacoes['status_beneficio'] = df_final_ativacoes['status_beneficio'].fillna('NULL')
            df_final_ativacoes['cliente'] = df_final_ativacoes['cliente'].fillna('NULL')
            df_final_ativacoes['data_registro'] = df_final_ativacoes['data_registro'].fillna(pd.Timestamp('1900-01-01'))
            df_final_ativacoes['data_ativacao_beneficio'] = df_final_ativacoes['data_ativacao_beneficio'].fillna(pd.Timestamp('1900-01-01'))
            df_final_ativacoes['suporte'] = df_final_ativacoes['suporte'].fillna('NULL')
            df_final_ativacoes['data_filtro'] = df_final_ativacoes['data_filtro'].fillna(pd.Timestamp('1900-01-01'))
            df_final_ativacoes['empresa'] = df_final_ativacoes['empresa'].fillna('NULL')
            df_final_ativacoes['migration_from'] = df_final_ativacoes['migration_from'].fillna('NULL')

            df_final_cancelamentos['placa'] = df_final_cancelamentos['placa'].fillna('SEM-PLACA')
            df_final_cancelamentos['chassi'] = df_final_cancelamentos['chassi'].fillna('NULL')
            df_final_cancelamentos['id_placa'] = df_final_cancelamentos['id_placa'].fillna(0)
            df_final_cancelamentos['id_veiculo'] = df_final_cancelamentos['id_veiculo'].fillna(0)
            df_final_cancelamentos['id_carroceria'] = df_final_cancelamentos['id_carroceria'].fillna(0)
            df_final_cancelamentos['matricula'] = df_final_cancelamentos['matricula'].fillna(0)
            df_final_cancelamentos['conjunto'] = df_final_cancelamentos['conjunto'].fillna(0)
            df_final_cancelamentos['unidade'] = df_final_cancelamentos['unidade'].fillna('NULL')
            df_final_cancelamentos['status'] = df_final_cancelamentos['status'].fillna('NULL')
            df_final_cancelamentos['cliente'] = df_final_cancelamentos['cliente'].fillna('NULL')
            df_final_cancelamentos['data'] = df_final_cancelamentos['data'].fillna(pd.Timestamp('1900-01-01'))
            df_final_cancelamentos['data_cancelamento'] = df_final_cancelamentos['data_cancelamento'].fillna(pd.Timestamp('1900-01-01'))
            df_final_cancelamentos['usuario_cancelamento'] = df_final_cancelamentos['usuario_cancelamento'].fillna('NULL')
            df_final_cancelamentos['data_filtro'] = df_final_cancelamentos['data_filtro'].fillna(pd.Timestamp('1900-01-01'))
            df_final_cancelamentos['empresa'] = df_final_cancelamentos['empresa'].fillna('NULL')
            df_final_cancelamentos['migracao'] = df_final_cancelamentos['migracao'].fillna('NULL')
            df_final_cancelamentos['renegociacao'] = df_final_cancelamentos['renegociacao'].fillna('NULL')
            df_final_cancelamentos['data_substituicao'] = df_final_cancelamentos['data_substituicao'].fillna(pd.Timestamp('1900-01-01'))

            logging.info('\n ----------------------------------------------------------------------------------')
            logging.info('\n Processo de Transformacao de Dados concluido com sucesso!')

        except Exception as e:
            logging.info('\n ----------------------------------------------------------------------------------')
            logging.info(f'Falha ao realizar tratamento de dados: {e}')
     
            return df_final_ativacoes, df_final_cancelamentos
    
transform = Transform()
df_final_ativacoes, df_final_cancelamentos = transform.transforming_files()

        


In [8]:
df_final_ativacoes_ativos = df_final_ativacoes[df_final_ativacoes['status_beneficio']=='ATIVO']
df_final_ativacoes_ativos.shape[0]

32908

In [9]:
df_final_ativacoes_ativos.head()

Unnamed: 0,placa,chassi,id_placa,id_veiculo,id_carroceria,matricula,conjunto,unidade,consultor,status_beneficio,cliente,data_registro,data_ativacao_beneficio,suporte,data_filtro,empresa,migration_from
31977,TAX8B12,9539J8TH9SR202365,15566883,15566883,0,5485,8355,UNIDADE LONDRINA,Gismary Orasmo,ATIVO,SANTORINI TRANSPORTE E LOGISTICA LTDA,2025-01-16,2025-01-16,Camilla Minho,2025-08-27,Viavante,
31979,TAX8B23,9539J8TH0SR203680,15566726,15566726,0,5485,8355,UNIDADE LONDRINA,Gismary Orasmo,ATIVO,SANTORINI TRANSPORTE E LOGISTICA LTDA,2025-01-16,2025-01-16,Camilla Minho,2025-08-27,Viavante,
31980,PHT5C27,97TD0N412K2001627,14227,0,14227,5488,8360,UNIDADE CUIABA,Isabella Santos,ATIVO,JAFRE RANGEL DE SOUZA,2025-01-16,2025-01-16,João Paulo Ribeiro Pinto,2025-08-27,Viavante,
31982,OKH0A38,9BVAG30C8EE824746,17376787,17376787,0,5489,18138,UNIDADE VILHENA,Vilma Girioli,ATIVO,CLEUVERSON PAZ REIS,2025-06-10,2025-06-10,Camilla Minho,2025-08-27,Viavante,
31984,RQP8I07,953998TH7NR202118,15928702,15928702,0,5493,8364,UNIDADE VILHENA,Vilma Girioli,ATIVO,JHONATAN MIRANDA PESSOA,2025-01-16,2025-01-16,VICTOR GABRIEL GOMES PICÃO,2025-08-27,Viavante,


transformando as planilhas excel em dataframe

In [12]:
xlsx_ontem = r"C:\Users\raphael.almeida\Documents\Processos\placas_movimentacoes\placas_movimentacoes_ontem.xlsx"
xlsx = r"C:\Users\raphael.almeida\Documents\Processos\placas_movimentacoes\placas_movimentacoes.xlsx"

df_ontem = pd.read_excel(xlsx_ontem, engine='openpyxl', sheet_name= 'ATIVAÇÕES')
df = pd.read_excel(xlsx, engine='openpyxl')
status_filter_list = ['CANCELADO', 'CANCELADA', 'FINALIZADO', 'FINALIZADA', 'NAO RENOVADO']

In [14]:
df_ativacoes_tratado = Transform.board_status_treatment(df, df_ontem, df_conf, status_filter_list)

In [18]:
xlsx_path = r"C:\Users\raphael.almeida\Documents\Processos\placas_movimentacoes\df_tratado.xlsx"
df_ativacoes_tratado.to_excel(xlsx_path, engine='openpyxl', index=False)

In [17]:
df_ativacoes_tratado['status_beneficio'].unique()

array(['ATIVO'], dtype=object)

# LOAD

In [None]:
# IMPORTANDO MÓDULOS E PACOTES
import logging
import openpyxl
import os
import pandas as pd
import logging


file_path = r"C:\Users\raphael.almeida\Documents\Processos\placas_acompanhamento\template\placas_movimentacoes.xlsx"
destination_dir = r"C:\Users\raphael.almeida\OneDrive - Grupo Unus\analise de dados - Arquivos em excel\Relatório de Ativações Placas"
destination_path = os.path.join(destination_dir, os.path.basename(file_path))

with pd.ExcelWriter(destination_path, engine='openpyxl') as writer:
    df_final_ativacoes.to_excel(writer, index=False, sheet_name='ATIVAÇÕES')


logging.info('\n ----------------------------------------------------------------------------------')
logging.info('\n Processo de Carregamento de Dados concluido com sucesso!')




    


2025-08-26 09:55:58,998 - INFO - 
 ----------------------------------------------------------------------------------
2025-08-26 09:55:59,000 - INFO - 
 Processo de Carregamento de Dados concluido com sucesso!
