<a href="https://colab.research.google.com/github/leonardobora/my-portfolio/blob/main/Filtro_Syslog_1605.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [14]:
import re
from datetime import datetime
import os # Importado para manipulação de nomes de arquivo

def filtrar_logs_com_metricas_e_data(input_filepath, output_filepath_com_data):
    """
    Filtra as linhas de um arquivo de log que contêm 'ber', 'password' ou 'loop'.
    Salva as linhas filtradas no arquivo de saída especificado, que inclui a data atual.
    Imprime a contagem de linhas antes e depois do filtro.
    """
    try:
        total_linhas_original = 0
        linhas_apos_filtro = 0

        print(f"Iniciando processamento do arquivo: {input_filepath}")
        print(f"Arquivo de saída será: {output_filepath_com_data}")

        # Abre o arquivo de entrada para leitura e o de saída para escrita.
        # Usar encoding='utf-8' e errors='ignore' ajuda a lidar com caracteres variados nos logs.
        with open(input_filepath, 'r', encoding='utf-8', errors='ignore') as infile, \
             open(output_filepath_com_data, 'w', encoding='utf-8') as outfile:
            for line in infile:
                total_linhas_original += 1
                # Busca pelas palavras-chave (ignorando maiúsculas/minúsculas)
                if re.search(r'(ber|password|loop)', line, re.IGNORECASE):
                    outfile.write(line)
                    linhas_apos_filtro += 1

        # Imprime os logs de execução básicos
        print(f"\n--- Relatório de Execução ---")
        print(f"Arquivo de entrada: {input_filepath}")
        print(f"Total de linhas lidas do arquivo original: {total_linhas_original}")
        print(f"Arquivo de saída: {output_filepath_com_data}")
        print(f"Total de linhas escritas no arquivo filtrado (contendo 'ber', 'password' ou 'loop'): {linhas_apos_filtro}")

        return True, f"Filtragem concluída. Arquivo salvo em: {output_filepath_com_data}"
    except FileNotFoundError:
        # Tratamento específico para arquivo não encontrado
        return False, f"Erro Crítico: O arquivo de entrada '{input_filepath}' não foi encontrado. Por favor, verifique o nome e se ele está no diretório correto do Colab."
    except Exception as e:
        # Tratamento para outros erros inesperados
        return False, f"Erro Crítico durante o processamento: {str(e)}"

def executar_filtragem_interativa_colab():
    """
    Função principal para ser executada no Google Colab.
    Solicita o nome do arquivo de entrada ao usuário,
    gera o nome do arquivo de saída com base no original, adicionando "_filtrado" e a data atual,
    e então executa a filtragem.
    """
    print("--- Ferramenta de Filtragem de Logs ---")
    print("Certifique-se de que o arquivo de log original já foi carregado para o ambiente do Google Colab.")

    # Solicita o nome do arquivo de entrada via caixa de texto no Colab
    nome_arquivo_entrada = input("Por favor, digite o nome do arquivo de log a ser analisado (ex: syslog_original.txt): ")

    # Extrai o nome base do arquivo de entrada (sem extensão)
    nome_base_entrada, extensao_entrada = os.path.splitext(nome_arquivo_entrada)

    # Define o sufixo para o arquivo filtrado
    sufixo_filtrado = "_filtrado"

    # Obtém a data atual no formato AAAAMMDD
    data_hoje_str = datetime.now().strftime("%Y%m%d")

    # Monta o nome do arquivo de saída
    # Formato: nomeoriginal_filtrado_AAAAMMDD.txt
    nome_arquivo_saida = f"{nome_base_entrada}{sufixo_filtrado}_{data_hoje_str}{extensao_entrada}"

    # Chama a função de filtragem com os nomes de arquivo definidos
    sucesso, mensagem_retorno = filtrar_logs_com_metricas_e_data(nome_arquivo_entrada, nome_arquivo_saida)

    # Imprime a mensagem final com o resultado da operação
    print(f"\n{mensagem_retorno}")

executar_filtragem_interativa_colab()



--- Ferramenta de Filtragem de Logs ---
Certifique-se de que o arquivo de log original já foi carregado para o ambiente do Google Colab.
Por favor, digite o nome do arquivo de log a ser analisado (ex: syslog_original.txt): sip_suporte_1.txt
Iniciando processamento do arquivo: sip_suporte_1.txt
Arquivo de saída será: sip_suporte_1_filtrado_20250516.txt

--- Relatório de Execução ---
Arquivo de entrada: sip_suporte_1.txt
Total de linhas lidas do arquivo original: 6887
Arquivo de saída: sip_suporte_1_filtrado_20250516.txt
Total de linhas escritas no arquivo filtrado (contendo 'ber', 'password' ou 'loop'): 239

Filtragem concluída. Arquivo salvo em: sip_suporte_1_filtrado_20250516.txt
