In [2]:
import pandas as pd

In [None]:
try:
    # Tente ler o arquivo com a codificação 'cp1252', comum para arquivos em português no Windows.
    # Se falhar, ele tentará 'latin1' como alternativa.
    df = pd.read_csv('.././data/files/log_cotacoes.csv', sep=';', encoding='cp1252', low_memory=False)
except UnicodeDecodeError:
    df = pd.read_csv('.././data/files/log_cotacoes.csv', sep=';', encoding='latin1', low_memory=False)

# --- 1. Limpeza dos Nomes das Colunas ---
# Remove as quebras de linha ('\n') dos nomes das colunas e espaços extras.
df.columns = [col.replace('\n', ' ').strip() for col in df.columns]

# --- 2. Correção dos Tipos de Dados Numéricos ---
# Lista de colunas que deveriam ser números, mas são lidas como texto.
colunas_numericas = ['Quantidade Cotada', 'Quantidade Confirmada', 'R$ Médio Cotado', 'R$ Cotado']

for coluna in colunas_numericas:
    if coluna in df.columns:
        # Converte a coluna para string para poder usar o '.str'
        df[coluna] = df[coluna].astype(str)
        # Remove o ponto de milhar (ex: 1.000 -> 1000)
        df[coluna] = df[coluna].str.replace('.', '', regex=False)
        # Troca a vírgula do decimal por ponto (ex: 33,50 -> 33.50)
        df[coluna] = df[coluna].str.replace(',', '.', regex=False)
        # Converte a coluna para o tipo numérico. Erros serão transformados em 'NaN' (Not a Number).
        df[coluna] = pd.to_numeric(df[coluna], errors='coerce')

# --- 3. Correção dos Tipos de Dados de Data ---
# Lista de colunas que deveriam ser datas
colunas_data = ['Data Importação', 'Data Alteração', 'Data Vencimento']

for coluna in colunas_data:
    if coluna in df.columns:
        # Converte a coluna para o tipo data. Erros serão transformados em 'NaT' (Not a Time).
        df[coluna] = pd.to_datetime(df[coluna], errors='coerce')


# --- Verificação Final ---
# Mostra as 5 primeiras linhas do DataFrame corrigido.
print("--- DataFrame após a limpeza ---")
print(df.head())

# Mostra as informações e os tipos de dados corrigidos.
print("\n--- Informações do DataFrame corrigido ---")
df.info()

--- DataFrame após a limpeza ---
                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                              ï»¿"Data
ImportaÃ§Ã£o" IntegraÃ§Ã£o CotaÃ§Ã£o\nCÃ³digo Cliente\nCNPJ  Cliente\nCÃ³digo Cliente\nNome                                      Estado Produto CÃ³digo\nBbraun Produto DescriÃ§Ã£o\nIntegradora                   UsuÃ¡rio Envio\nResposta SituaÃ§Ã£o\nItem Tipo\nPrecificaÃ§Ã£o Data\nAlteraÃ§Ã£o                                Data\nVencimento Produto CÃ³digo\nIntegradora Contrato Marca\nSolicitada  Atendente      Cliente\nContato    

In [15]:
df.head(50)

Unnamed: 0,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7,Unnamed: 8,Unnamed: 9,Unnamed: 10,Unnamed: 11,Unnamed: 12,Unnamed: 13,Unnamed: 14,Unnamed: 15,Unnamed: 16,Unnamed: 17,Unnamed: 18,Unnamed: 19,Unnamed: 20,Unnamed: 21,"ï»¿""Data"
"ImportaÃ§Ã£o""",IntegraÃ§Ã£o,CotaÃ§Ã£o\nCÃ³digo,Cliente\nCNPJ,Cliente\nCÃ³digo,Cliente\nNome,Estado,Produto CÃ³digo\nBbraun,Produto DescriÃ§Ã£o\nIntegradora,UsuÃ¡rio Envio\nResposta,SituaÃ§Ã£o\nItem,Tipo\nPrecificaÃ§Ã£o,Data\nAlteraÃ§Ã£o,Data\nVencimento,Produto CÃ³digo\nIntegradora,Contrato,Marca\nSolicitada,Atendente,Cliente\nContato,Quantidade\nCotada,Quantidade\nConfirmada,R$ MÃ©dio\nCotado,R$\nCotado
06/03/2025,Bionexo,380935458,05868278000280,20050157,Unimed Fortaleza Cooperativa de Trabalho Medico Ltda.,CE,409081,DISPOSITIVO OCLUSOR COMBI RED,conf,Respondida,Manual,"domingo, 27 '27e' julho '27e' 2025 18:37:57",06/03/2025,MMH.GR.00045063,NÃO,-,lara.oliveira,Marcia 85 999956441,500,0,02900,14500
06/03/2025,Bionexo,380935458,05868278000280,20050157,Unimed Fortaleza Cooperativa de Trabalho Medico Ltda.,CE,834213,EXTENSOR DE EQUIPO PEDIATRICO 20CM (PERFUSOR SET)- UNIDADE,conf,Confirmada,Negociacao,"domingo, 27 '27e' julho '27e' 2025 18:37:57",06/03/2025,MMH.GR.00022203,NÃO,-,lara.oliveira,Marcia 85 999956441,4.620,5.880,72200,"33.356,40"
11/06/2025,Bionexo,392730607,76591569000130,20048316,AssociaÃ§Ã£o Hospitalar de ProteÃ§Ã£o Ã InfÃ¢ncia Dr. Raul Carneiro - Hospital Pequeno PrÃ­ncipe,PR,1051250P,COLA CIRURGICA (ADESIVO TISSULAR) REF:1051250P | Frasco | *BBRAUN,conf,Confirmada,Negociacao,"quinta-feira, 10 '10e' julho '10e' 2025 15:29:25",13/06/2025,3402,NÃO,*BBRAUN,emanoel.severo,Sabrina Lima,85,85,3918540,"33.307,59"
11/06/2025,GTPlan,428599,92815000000168,20006035,Irmandade da Santa Casa deMisericordia de Porto Alegre,RS,,acidos graxos insaturados 20ml,conf,Pendente,,"quarta-feira, 2 '2e' julho '2e' 2025 16:56:40",19/06/2025,164589,NÃO,ACEITA ALTERNATIVA,gabriela.silva,Ismael Vizzotto Collioni | ismael.vizzotto@santacasa.org.br |,720,0,00000,000
11/06/2025,GTPlan,428599,92815000000168,20006035,Irmandade da Santa Casa deMisericordia de Porto Alegre,RS,,adaptador duplo para conexao ar e o2,conf,Pendente,,"quarta-feira, 2 '2e' julho '2e' 2025 16:56:40",19/06/2025,177463,NÃO,MEDSTAR IMPORTACAO E EXPORTACAO LTDAACEITA ALTERNATIVA,gabriela.silva,Ismael Vizzotto Collioni | ismael.vizzotto@santacasa.org.br |,1,0,00000,000
11/06/2025,GTPlan,428599,92815000000168,20006035,Irmandade da Santa Casa deMisericordia de Porto Alegre,RS,,"agulha descartavel 23gx1 0,6x25mm",conf,Pendente,,"quarta-feira, 2 '2e' julho '2e' 2025 16:56:40",19/06/2025,55489,NÃO,BD BECTON DICKINSON INDUSTRIAS CIRURGICAS LTDA ACEITA ALTERNATIVA,gabriela.silva,Ismael Vizzotto Collioni | ismael.vizzotto@santacasa.org.br |,1.000,0,00000,000
11/06/2025,GTPlan,428599,92815000000168,20006035,Irmandade da Santa Casa deMisericordia de Porto Alegre,RS,,"agulha para acupuntura esteril 0,25x15mm",conf,Pendente,,"quarta-feira, 2 '2e' julho '2e' 2025 16:56:40",19/06/2025,161345,NÃO,CIRURGICA FERNANDES COMERCIO DE MATERIAIS CIRURGICOS E HOSPITALARES SOCIEDADE LIMITADAACEITA ALTERNATIVA,gabriela.silva,Ismael Vizzotto Collioni | ismael.vizzotto@santacasa.org.br |,500,0,00000,000
11/06/2025,GTPlan,428599,92815000000168,20006035,Irmandade da Santa Casa deMisericordia de Porto Alegre,RS,,agulha para fistula arterial/venosa com dispositivo de seguranca 15gx1 c/2un,conf,Pendente,,"quarta-feira, 2 '2e' julho '2e' 2025 16:56:40",19/06/2025,161337,NÃO,"FRESENIUS KABI BRASIL LTDA, \r\nFRESENIUS MEDICAL CARE LTDAACEITA ALTERNATIVA",gabriela.silva,Ismael Vizzotto Collioni | ismael.vizzotto@santacasa.org.br |,20,0,00000,000
11/06/2025,GTPlan,428599,92815000000168,20006035,Irmandade da Santa Casa deMisericordia de Porto Alegre,RS,,"agulha roxa descartavel 24gx3/4 0,55x20mm",conf,Pendente,,"quarta-feira, 2 '2e' julho '2e' 2025 16:56:40",19/06/2025,65883,NÃO,BD BECTON DICKINSON INDUSTRIAS CIRURGICAS LTDA ACEITA ALTERNATIVA,gabriela.silva,Ismael Vizzotto Collioni | ismael.vizzotto@santacasa.org.br |,3.000,0,00000,000
