1 - Importações

In [34]:
# Importar bibliotecas necessárias
import pandas as pd
import os
!pip install -q pandas openpyxl

2 - Definição de constantes

In [35]:
def verificar_arquivos_existem(cursistas_file, emails_file=None):
    """
    Verifica se os arquivos necessários existem.
    
    Args:
        cursistas_file (str): Caminho para o arquivo de cursistas
        emails_file (str, optional): Caminho para o arquivo de emails
    """
    errors = []
    
    if not os.path.exists(cursistas_file):
        errors.append(f"Arquivo de cursistas não encontrado: {cursistas_file}")
    
    if emails_file and not os.path.exists(emails_file):
        errors.append(f"Arquivo de emails não encontrado: {emails_file}")
        
    return errors

In [36]:
# Define file paths
cursistas_file = '/home/emanoel/Downloads/avamec_inscricoes/Cursistas Turma A/Cursistas Turma_A.xlsx'

# Define matching columns
matching_column_cursistas = '[0] login'
matching_column_ava = 'Login do Membro'
error_column_ava = 'Erro Apresentado?'
login_existente_column = 'Login existente'

3 - Carregar dados dos cursistas

In [37]:
# Load the cursistas dataframe
try:
    df_cursistas = pd.read_excel(cursistas_file)
    # Clean the matching column in df_cursistas
    df_cursistas[matching_column_cursistas] = df_cursistas[matching_column_cursistas].astype(str).str.strip().str.lower()
except FileNotFoundError as e:
    print(f"Error loading cursistas file: {e}. Make sure the file path is correct.")
    raise SystemExit(f"Error loading cursistas file: {e}. Cannot proceed.")

4 - Função de verificação de emails capturados em uma sessão do meet

In [None]:
def verificar_emails(cursistas_file, emails_file):
    """
    Verifica se os emails fornecidos existem na planilha de cursistas.
    
    Args:
        cursistas_file (str): Caminho para o arquivo de cursistas
        emails_file (str): Caminho para o arquivo com lista de emails
    """
    # Verificar existência dos arquivos
    errors = verificar_arquivos_existem(cursistas_file, emails_file)
    if errors:
        for error in errors:
            print(f"Erro: {error}")
        return
        
    try:
        # Carrega planilha de cursistas
        df_cursistas = pd.read_excel(cursistas_file)
        
        # Verifica se a coluna de email existe
        if '[2] E-mail' not in df_cursistas.columns:
            print("Erro: Coluna '[2] E-mail' não encontrada na planilha de cursistas")
            return
        
        # Carrega arquivo com emails para verificar
        try:
            with open(emails_file, 'r') as f:
                emails_verificar = [email.strip().lower() for email in f.readlines() if email.strip()]
        except UnicodeDecodeError:
            print("Erro: Arquivo de emails com encoding inválido. Use UTF-8")
            return
            
        if not emails_verificar:
            print("Erro: Arquivo de emails está vazio")
            return
        
        # Converte emails dos cursistas para lowercase para comparação
        emails_cursistas = df_cursistas['[2] E-mail'].str.strip().str.lower()
        
        # Verifica emails
        emails_encontrados = []
        emails_nao_encontrados = []
        emails_invalidos = []
        
        for email in emails_verificar:
            if '@' not in email:
                emails_invalidos.append(email)
            elif email in emails_cursistas.values:
                emails_encontrados.append(email)
            else:
                emails_nao_encontrados.append(email)
        
        # Exibe resultados
        print("\nResultados da verificação de emails:")
        print(f"Total de emails verificados: {len(emails_verificar)}")
        print(f"Emails encontrados: {len(emails_encontrados)}")
        print(f"Emails não encontrados: {len(emails_nao_encontrados)}")
        print(f"Emails inválidos: {len(emails_invalidos)}")
        
        if emails_nao_encontrados:
            print("\nEmails não encontrados na planilha:")
            for email in emails_nao_encontrados:
                print(f"{email}")
                
        if emails_invalidos:
            print("\nEmails com formato inválido:")
            for email in emails_invalidos:
                print(f"- {email}")
                
    except FileNotFoundError as e:
        print(f"Erro ao carregar arquivos: {e}")
    except pd.errors.EmptyDataError:
        print("Erro: A planilha de cursistas está vazia")
    except Exception as e:
        print(f"Erro inesperado: {e}")

5 - Execução da verificação

In [39]:
# Exemplo de uso da função
verificar_emails(
    '/home/emanoel/Downloads/avamec_inscricoes/Cursistas Turma A/Cursistas Turma_A.xlsx',
    '/home/emanoel/Downloads/avamec_inscricoes/Cursistas Turma A/emails_verificar.txt'
)


Resultados da verificação de emails:
Total de emails verificados: 207
Emails encontrados: 197
Emails não encontrados: 10
Emails inválidos: 0

Emails não encontrados na planilha:
- adrianamadja@gmail.com
- alexsantana7@gmail.com
- heidyani@gmail.com
- karla.lopes@ufc.br
- karlacristiner@ufc.br
- marques2022ufc@gmail.com
- sumarafrotadn@gmail.com
- vitoriaramos@ufc.br
- vsalesp4@gmail.com
- katiajeilson@gmail.com
