In [10]:
import pandas as pd

# Lendo o arquivo Excel 
df = pd.read_excel(r'C:\Users\lz6321\Downloads\Usuários Corpia x Office (1).xlsx')

# Criando um arquivo de análise
with open('analise_detalhada.txt', 'w', encoding='utf-8') as f:
    # Informações iniciais
    f.write(f'Total de linhas no arquivo: {len(df)}\n')
    f.write(f'Nomes das colunas no arquivo: {df.columns.tolist()}\n\n')
    
    # Convertendo as colunas para string e aplicando lower case
    df['Login'] = df.iloc[:, 0].astype(str).str.lower()  # Primeira coluna
    df['Usuario'] = df.iloc[:, 1].astype(str).str.lower()  # Segunda coluna
    
    # Estatísticas
    total_logins = len(df['Login'].unique())
    total_usuarios = len(df['Usuario'].unique())
    f.write(f'Total de logins únicos: {total_logins}\n')
    f.write(f'Total de usuários únicos: {total_usuarios}\n\n')
    
    # Encontrando logins que não têm correspondência com usuários
    logins_sem_usuario = []
    logins_com_usuario = []
    usuarios_encontrados_em_login = set()  # Para rastrear usuários que foram encontrados em logins
    
    # Para encontrar correspondências exatas
    correspondencias_exatas = []
    logins_unicos = df['Login'].unique()
    usuarios_unicos = df['Usuario'].unique()
    
    for usuario in usuarios_unicos:
        if usuario != 'nan' and usuario.strip() != '':
            # Procura por diferentes formatos de login
            formatos_possiveis = [f'grt/{usuario}', f'gsd/{usuario}', usuario]
            for formato in formatos_possiveis:
                if formato in logins_unicos:
                    correspondencias_exatas.append((formato, usuario))
    
    # Escrevendo correspondências exatas primeiro
    f.write('\nCORRESPONDÊNCIAS EXATAS ENCONTRADAS\n')
    f.write('=' * 50 + '\n')
    f.write(f'Total de correspondências exatas: {len(correspondencias_exatas)}\n\n')
    f.write('Lista completa de correspondências exatas:\n')
    for login, usuario in correspondencias_exatas:
        f.write(f'Login: {login} -> Usuário: {usuario}\n')
    
    # Agora procurando por correspondências parciais
    for login in logins_unicos:
        encontrou_usuario = False
        usuarios_encontrados = []
        
        for usuario in usuarios_unicos:
            if usuario != 'nan' and usuario.strip() != '' and usuario in login:
                encontrou_usuario = True
                usuarios_encontrados.append(usuario)
                usuarios_encontrados_em_login.add(usuario)
        
        if not encontrou_usuario:
            logins_sem_usuario.append(login)
        else:
            logins_com_usuario.append((login, usuarios_encontrados))
    
    # Usuários que não foram encontrados em nenhum login
    usuarios_sem_login = [u for u in usuarios_unicos if u != 'nan' and u.strip() != '' and u not in usuarios_encontrados_em_login]
    
    # Escrevendo análise detalhada
    f.write('\nANÁLISE DETALHADA\n')
    f.write('=' * 50 + '\n')
    f.write(f'Total de logins sem usuário correspondente: {len(logins_sem_usuario)}\n')
    f.write(f'Total de logins com usuário correspondente: {len(logins_com_usuario)}\n')
    f.write(f'Total de usuários sem login correspondente: {len(usuarios_sem_login)}\n\n')
    
    f.write('\nLista completa de logins sem correspondência:\n')
    for login in logins_sem_usuario:
        f.write(f'- {login}\n')
    
    f.write('\nLista completa de logins com correspondência parcial:\n')
    for login, usuarios in logins_com_usuario:
        f.write(f'- {login} -> corresponde a: {usuarios}\n')
        
    f.write('\nLista completa de usuários que não foram encontrados em nenhum login:\n')
    for usuario in usuarios_sem_login:
        f.write(f'- {usuario}\n')

# Criando DataFrames com os resultados
resultado_logins = pd.DataFrame({
    'Logins sem Usuário Correspondente': logins_sem_usuario
})

resultado_usuarios = pd.DataFrame({
    'Usuários sem Login Correspondente': usuarios_sem_login
})

# Salvando os resultados em arquivos Excel
resultado_logins.to_excel('logins_sem_usuario.xlsx', index=False)
resultado_usuarios.to_excel('usuarios_sem_login.xlsx', index=False)

# Mostrando os resultados básicos
print(f'Análise detalhada foi salva no arquivo "analise_detalhada.txt"')
print(f'\nResumo rápido:')
print(f'Total de logins únicos: {total_logins}')
print(f'Total de usuários únicos: {total_usuarios}')
print(f'Total de correspondências exatas encontradas: {len(correspondencias_exatas)}')
print(f'Total de logins sem correspondência: {len(logins_sem_usuario)}')
print(f'Total de usuários sem login: {len(usuarios_sem_login)}')

Análise detalhada foi salva no arquivo "analise_detalhada.txt"

Resumo rápido:
Total de logins únicos: 5246
Total de usuários únicos: 4949
Total de correspondências exatas encontradas: 0
Total de logins sem correspondência: 451
Total de usuários sem login: 148
