Comprehensions em Python

3.1 List Comprehensions Básicas

In [None]:
# Sintaxe básica: [expressão for item in iterável]

# Exemplo simples - quadrados
numeros = [1, 2, 3, 4, 5]
quadrados = [x**2 for x in numeros]
print(f"Números: {numeros}")
print(f"Quadrados: {quadrados}")

# Comparação com loop tradicional
# Forma tradicional
quadrados_tradicional = []
for x in numeros:
    quadrados_tradicional.append(x**2)

print(f"Resultado igual: {quadrados == quadrados_tradicional}")

# Transformações de strings
palavras = ['python', 'java', 'javascript']
maiusculas = [palavra.upper() for palavra in palavras]
tamanhos = [len(palavra) for palavra in palavras]
primeiras_letras = [palavra[0] for palavra in palavras]

print(f"\nPalavras originais: {palavras}")
print(f"Maiúsculas: {maiusculas}")
print(f"Tamanhos: {tamanhos}")
print(f"Primeiras letras: {primeiras_letras}")

# Operações matemáticas
precos = [10.50, 25.30, 15.75, 8.90]
precos_com_desconto = [preco * 0.9 for preco in precos]  # 10% desconto
precos_arredondados = [round(preco, 2) for preco in precos_com_desconto]

print(f"\nPreços originais: {precos}")
print(f"Com desconto: {precos_com_desconto}")
print(f"Arredondados: {precos_arredondados}")

# Trabalhando com range
pares = [x for x in range(0, 21, 2)]  # Números pares de 0 a 20
cubos = [x**3 for x in range(1, 6)]   # Cubos de 1 a 5

print(f"\nPares: {pares}")
print(f"Cubos: {cubos}")

# Processamento de dados estruturados
pessoas = [
    {'nome': 'Ana', 'idade': 25},
    {'nome': 'Bruno', 'idade': 30},
    {'nome': 'Carlos', 'idade': 35}
]

nomes = [pessoa['nome'] for pessoa in pessoas]
idades = [pessoa['idade'] for pessoa in pessoas]
apresentacoes = [f"{p['nome']} tem {p['idade']} anos" for p in pessoas]

print(f"\nNomes: {nomes}")
print(f"Idades: {idades}")
print("Apresentações:")
for apresentacao in apresentacoes:
    print(f"  {apresentacao}")

3.2 List Comprehensions com Condições

In [None]:
# Sintaxe com filtro: [expressão for item in iterável if condição]

# Filtrar números pares
numeros = range(1, 11)
pares = [x for x in numeros if x % 2 == 0]
impares = [x for x in numeros if x % 2 != 0]

print(f"Números: {list(numeros)}")
print(f"Pares: {pares}")
print(f"Ímpares: {impares}")

# Filtrar strings por critério
palavras = ['python', 'java', 'javascript', 'go', 'rust', 'c++']
palavras_longas = [p for p in palavras if len(p) > 4]
com_a = [p for p in palavras if 'a' in p]
maiusculas_curtas = [p.upper() for p in palavras if len(p) <= 4]

print(f"\nPalavras: {palavras}")
print(f"Palavras longas (>4): {palavras_longas}")
print(f"Com 'a': {com_a}")
print(f"Curtas em maiúscula: {maiusculas_curtas}")

# Filtrar dados estruturados
produtos = [
    {'nome': 'Notebook', 'preco': 2500, 'categoria': 'eletrônicos'},
    {'nome': 'Mouse', 'preco': 50, 'categoria': 'eletrônicos'},
    {'nome': 'Livro Python', 'preco': 80, 'categoria': 'livros'},
    {'nome': 'Cadeira', 'preco': 300, 'categoria': 'móveis'}
]

# Produtos caros (>100)
produtos_caros = [p['nome'] for p in produtos if p['preco'] > 100]

# Eletrônicos com preço
eletronicos = [f"{p['nome']}: R$ {p['preco']}" for p in produtos 
               if p['categoria'] == 'eletrônicos']

# Produtos com desconto (apenas os caros)
com_desconto = [{'nome': p['nome'], 'preco_original': p['preco'], 
                 'preco_desconto': p['preco'] * 0.9} 
                for p in produtos if p['preco'] > 200]

print(f"\nProdutos caros: {produtos_caros}")
print(f"Eletrônicos: {eletronicos}")
print("Produtos com desconto:")
for item in com_desconto:
    print(f"  {item['nome']}: R$ {item['preco_original']} -> R$ {item['preco_desconto']:.2f}")

# Múltiplas condições
numeros = range(1, 101)
especiais = [x for x in numeros if x % 3 == 0 and x % 5 == 0]  # Múltiplos de 3 E 5
divisiveis = [x for x in numeros if x % 2 == 0 or x % 3 == 0][:10]  # Primeiros 10

print(f"\nMúltiplos de 3 e 5: {especiais}")
print(f"Primeiros 10 divisíveis por 2 ou 3: {divisiveis}")

# Validação de dados
emails = ['user@email.com', 'invalid-email', 'test@domain.org', 'bad@', '@domain.com']
emails_validos = [email for email in emails if '@' in email and '.' in email.split('@')[-1]]

print(f"\nEmails: {emails}")
print(f"Emails válidos: {emails_validos}")

3.3 List Comprehensions Aninhadas

In [None]:
# Achatar listas aninhadas
matriz = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
achatada = [item for linha in matriz for item in linha]
print(f"Matriz: {matriz}")
print(f"Achatada: {achatada}")

# Equivalente com loops tradicionais
achatada_tradicional = []
for linha in matriz:
    for item in linha:
        achatada_tradicional.append(item)
print(f"Resultado igual: {achatada == achatada_tradicional}")

# Criar matriz com comprehension
# Matriz 3x3 com zeros
zeros = [[0 for _ in range(3)] for _ in range(3)]
print(f"\nMatriz de zeros: {zeros}")

# Matriz de multiplicação
tabuada = [[i * j for j in range(1, 4)] for i in range(1, 4)]
print(f"Tabuada 3x3: {tabuada}")

# Matriz identidade
identidade = [[1 if i == j else 0 for j in range(3)] for i in range(3)]
print(f"Matriz identidade: {identidade}")

# Processamento de dados aninhados
vendas_por_regiao = {
    'Norte': [1000, 1200, 800],
    'Sul': [1500, 1300, 1100],
    'Leste': [900, 1000, 1200]
}

# Todas as vendas em uma lista
todas_vendas = [venda for vendas in vendas_por_regiao.values() 
                for venda in vendas]
print(f"\nTodas as vendas: {todas_vendas}")
print(f"Total geral: R$ {sum(todas_vendas)}")

# Vendas acima de 1000 com região
vendas_altas = [(regiao, venda) for regiao, vendas in vendas_por_regiao.items() 
                for venda in vendas if venda > 1000]
print(f"Vendas > 1000: {vendas_altas}")

# Combinações de listas
cores = ['azul', 'vermelho']
tamanhos = ['P', 'M', 'G']
combinacoes = [f"{cor}-{tamanho}" for cor in cores for tamanho in tamanhos]
print(f"\nCombinações: {combinacoes}")

# Filtrar combinações
combinacoes_especiais = [f"{cor}-{tamanho}" for cor in cores for tamanho in tamanhos 
                        if not (cor == 'azul' and tamanho == 'P')]
print(f"Sem azul-P: {combinacoes_especiais}")

# Processamento de texto aninhado
frases = [
    "Python é uma linguagem incrível",
    "Java também é muito popular",
    "JavaScript domina a web"
]

# Todas as palavras
todas_palavras = [palavra for frase in frases for palavra in frase.split()]
print(f"\nTodas as palavras: {todas_palavras}")

# Palavras longas (>4 caracteres)
palavras_longas = [palavra for frase in frases for palavra in frase.split() 
                   if len(palavra) > 4]
print(f"Palavras longas: {palavras_longas}")

# Primeira letra de cada palavra
iniciais = [palavra[0].upper() for frase in frases for palavra in frase.split()]
print(f"Iniciais: {iniciais}")

3.4 Dict Comprehensions

In [None]:
# Sintaxe: {chave: valor for item in iterável}

# Criar dicionário de quadrados
numeros = range(1, 6)
quadrados_dict = {x: x**2 for x in numeros}
print(f"Quadrados: {quadrados_dict}")

# Inverter dicionário
original = {'a': 1, 'b': 2, 'c': 3}
invertido = {valor: chave for chave, valor in original.items()}
print(f"\nOriginal: {original}")
print(f"Invertido: {invertido}")

# Transformar lista em dicionário
palavras = ['python', 'java', 'go']
tamanhos_dict = {palavra: len(palavra) for palavra in palavras}
maiusculas_dict = {palavra: palavra.upper() for palavra in palavras}

print(f"\nTamanhos: {tamanhos_dict}")
print(f"Maiúsculas: {maiusculas_dict}")

# Filtrar dicionário
produtos = {
    'notebook': 2500,
    'mouse': 50,
    'teclado': 150,
    'monitor': 800
}

# Produtos caros (>100)
produtos_caros = {nome: preco for nome, preco in produtos.items() if preco > 100}
print(f"\nProdutos caros: {produtos_caros}")

# Aplicar desconto
com_desconto = {nome: preco * 0.9 for nome, preco in produtos.items()}
print(f"Com desconto: {com_desconto}")

# Categorizar por preço
def categorizar_preco(preco):
    if preco < 100:
        return 'barato'
    elif preco < 500:
        return 'médio'
    else:
        return 'caro'

categorias = {nome: categorizar_preco(preco) for nome, preco in produtos.items()}
print(f"Categorias: {categorias}")

# Agrupar dados
pessoas = [
    {'nome': 'Ana', 'idade': 25, 'cidade': 'SP'},
    {'nome': 'Bruno', 'idade': 30, 'cidade': 'RJ'},
    {'nome': 'Carlos', 'idade': 35, 'cidade': 'SP'}
]

# Dicionário nome -> idade
idades = {p['nome']: p['idade'] for p in pessoas}
print(f"\nIdades: {idades}")

# Filtrar por cidade
sp_pessoas = {p['nome']: p['idade'] for p in pessoas if p['cidade'] == 'SP'}
print(f"Pessoas de SP: {sp_pessoas}")

# Estatísticas por grupo
vendas_vendedor = {
    'Ana': [1000, 1200, 800],
    'Bruno': [900, 1100, 1000],
    'Carlos': [1500, 1300, 1100]
}

# Total por vendedor
totais = {vendedor: sum(vendas) for vendedor, vendas in vendas_vendedor.items()}
print(f"\nTotais por vendedor: {totais}")

# Média por vendedor
medias = {vendedor: sum(vendas)/len(vendas) for vendedor, vendas in vendas_vendedor.items()}
print(f"Médias: {medias}")

# Vendedores acima da média geral
media_geral = sum(totais.values()) / len(totais)
acima_media = {vendedor: total for vendedor, total in totais.items() 
               if total > media_geral}
print(f"Média geral: {media_geral:.2f}")
print(f"Acima da média: {acima_media}")

3.5 Set Comprehensions

In [None]:
# Sintaxe: {expressão for item in iterável}

# Set de quadrados (remove duplicatas automaticamente)
numeros = [1, 2, 2, 3, 3, 4, 5]
quadrados_set = {x**2 for x in numeros}
print(f"Números: {numeros}")
print(f"Quadrados únicos: {quadrados_set}")

# Primeiras letras únicas
palavras = ['python', 'java', 'javascript', 'php', 'go']
primeiras_letras = {palavra[0] for palavra in palavras}
print(f"\nPalavras: {palavras}")
print(f"Primeiras letras únicas: {primeiras_letras}")

# Extensões de arquivos
arquivos = ['doc.txt', 'image.jpg', 'script.py', 'data.csv', 'photo.jpg', 'code.py']
extensoes = {arquivo.split('.')[-1] for arquivo in arquivos}
print(f"\nArquivos: {arquivos}")
print(f"Extensões únicas: {extensoes}")

# Domínios de emails
emails = [
    'user1@gmail.com',
    'user2@yahoo.com', 
    'user3@gmail.com',
    'user4@hotmail.com',
    'user5@yahoo.com'
]

dominios = {email.split('@')[1] for email in emails}
print(f"\nEmails: {emails}")
print(f"Domínios únicos: {dominios}")

# Filtrar e remover duplicatas
numeros = range(1, 21)
multiplos_3_ou_5 = {x for x in numeros if x % 3 == 0 or x % 5 == 0}
print(f"\nMúltiplos de 3 ou 5 (1-20): {sorted(multiplos_3_ou_5)}")

# Caracteres únicos em texto
texto = "python programming"
caracteres_unicos = {char for char in texto if char != ' '}
vogais_unicas = {char for char in texto if char in 'aeiou'}

print(f"\nTexto: '{texto}'")
print(f"Caracteres únicos: {sorted(caracteres_unicos)}")
print(f"Vogais únicas: {sorted(vogais_unicas)}")

# Análise de dados
transacoes = [
    {'tipo': 'compra', 'categoria': 'alimentação', 'valor': 50},
    {'tipo': 'venda', 'categoria': 'eletrônicos', 'valor': 200},
    {'tipo': 'compra', 'categoria': 'alimentação', 'valor': 30},
    {'tipo': 'compra', 'categoria': 'transporte', 'valor': 25}
]

# Tipos únicos de transação
tipos_transacao = {t['tipo'] for t in transacoes}
print(f"\nTipos de transação: {tipos_transacao}")

# Categorias únicas
categorias_unicas = {t['categoria'] for t in transacoes}
print(f"Categorias: {categorias_unicas}")

# Categorias de compras acima de 40
categorias_compras_altas = {t['categoria'] for t in transacoes 
                           if t['tipo'] == 'compra' and t['valor'] > 40}
print(f"Categorias de compras > 40: {categorias_compras_altas}")

# Operações com sets
set1 = {x for x in range(1, 11) if x % 2 == 0}  # Pares 1-10
set2 = {x for x in range(5, 16) if x % 3 == 0}  # Múltiplos de 3 entre 5-15

print(f"\nSet 1 (pares 1-10): {sorted(set1)}")
print(f"Set 2 (múltiplos de 3, 5-15): {sorted(set2)}")
print(f"Interseção: {sorted(set1 & set2)}")
print(f"União: {sorted(set1 | set2)}")
print(f"Diferença (set1 - set2): {sorted(set1 - set2)}")

3.6 Expressões Condicionais em Comprehensions

In [None]:
# Operador ternário em comprehensions
# Sintaxe: [valor_se_true if condição else valor_se_false for item in iterável]

# Classificar números como par/ímpar
numeros = range(1, 11)
classificacao = ["par" if x % 2 == 0 else "ímpar" for x in numeros]
print(f"Números: {list(numeros)}")
print(f"Classificação: {classificacao}")

# Aplicar desconto condicional
precos = [50, 150, 300, 75, 200]
com_desconto = [preco * 0.9 if preco > 100 else preco for preco in precos]
print(f"\nPreços originais: {precos}")
print(f"Com desconto (>100): {com_desconto}")

# Normalizar dados
temperaturas_celsius = [0, 25, 100, -10, 37]
fahrenheit = [c * 9/5 + 32 if c is not None else None for c in temperaturas_celsius]
classificacao_temp = ["congelando" if c < 0 else "normal" if c < 30 else "quente" 
                     for c in temperaturas_celsius]

print(f"\nCelsius: {temperaturas_celsius}")
print(f"Fahrenheit: {fahrenheit}")
print(f"Classificação: {classificacao_temp}")

# Validação e correção de dados
idades = [25, -5, 150, 30, 0, 45]
idades_validas = [idade if 0 <= idade <= 120 else None for idade in idades]
idades_corrigidas = [idade if 0 <= idade <= 120 else 0 for idade in idades]

print(f"\nIdades originais: {idades}")
print(f"Idades válidas: {idades_validas}")
print(f"Idades corrigidas: {idades_corrigidas}")

# Processamento de strings
palavras = ['PYTHON', 'java', 'JavaScript', 'GO', 'rust']
normalizadas = [p.lower() if p.isupper() else p.upper() if p.islower() else p.title() 
                for p in palavras]
print(f"\nPalavras: {palavras}")
print(f"Normalizadas: {normalizadas}")

# Dicionários com condicionais
vendas = {'Ana': 1200, 'Bruno': 800, 'Carlos': 1500, 'Diana': 900}
bonus = {nome: venda * 0.1 if venda > 1000 else venda * 0.05 
         for nome, venda in vendas.items()}
status = {nome: "meta atingida" if venda >= 1000 else "abaixo da meta" 
          for nome, venda in vendas.items()}

print(f"\nVendas: {vendas}")
print(f"Bônus: {bonus}")
print(f"Status: {status}")

# Sets com condicionais
numeros = range(1, 21)
processados = {x**2 if x % 2 == 0 else x**3 for x in numeros}
print(f"\nProcessados (par²/ímpar³): {sorted(list(processados))[:10]}...")  # Primeiros 10

# Múltiplas condições aninhadas
notas = [95, 85, 75, 65, 55, 45]
conceitos = ["A" if nota >= 90 else 
            "B" if nota >= 80 else 
            "C" if nota >= 70 else 
            "D" if nota >= 60 else "F" 
            for nota in notas]

situacao = ["Aprovado" if conceito in ['A', 'B', 'C'] else "Reprovado" 
           for conceito in conceitos]

print(f"\nNotas: {notas}")
print(f"Conceitos: {conceitos}")
print(f"Situação: {situacao}")

# Tratamento de valores None/vazios
dados = ['Python', '', None, 'Java', '   ', 'Go', None]
limpos = [item.strip() if item else 'N/A' for item in dados if item is not None]
validos = [item if item and item.strip() else 'Vazio' for item in dados if item is not None]

print(f"\nDados originais: {dados}")
print(f"Limpos: {limpos}")
print(f"Válidos: {validos}")

3.7 Performance e Boas Práticas

In [None]:
import time
import sys

# Comparação de performance: comprehension vs loop tradicional
def benchmark_comprehensions(n=100000):
    dados = range(n)
    
    # List comprehension
    start = time.time()
    quadrados_comp = [x**2 for x in dados]
    tempo_comp = time.time() - start
    
    # Loop tradicional
    start = time.time()
    quadrados_loop = []
    for x in dados:
        quadrados_loop.append(x**2)
    tempo_loop = time.time() - start
    
    # Map (funcional)
    start = time.time()
    quadrados_map = list(map(lambda x: x**2, dados))
    tempo_map = time.time() - start
    
    print(f"Comprehension: {tempo_comp:.4f}s")
    print(f"Loop tradicional: {tempo_loop:.4f}s")
    print(f"Map: {tempo_map:.4f}s")
    print(f"Comprehension é {tempo_loop/tempo_comp:.2f}x mais rápida que loop")

benchmark_comprehensions(50000)  # Reduzido para exemplo

# Uso de memória: list vs generator
def comparar_memoria():
    n = 1000
    
    # List comprehension
    lista = [x**2 for x in range(n)]
    
    # Generator expression
    gerador = (x**2 for x in range(n))
    
    print(f"\nTamanho da lista: {sys.getsizeof(lista)} bytes")
    print(f"Tamanho do gerador: {sys.getsizeof(gerador)} bytes")
    print(f"Lista usa {sys.getsizeof(lista)/sys.getsizeof(gerador):.1f}x mais memória")

comparar_memoria()

# Boas práticas

# ✓ Use comprehensions para transformações simples
numeros = range(10)
quadrados = [x**2 for x in numeros]  # ✓ Simples e claro

# ✗ Evite comprehensions muito complexas
# complexa = [funcao1(funcao2(x)) if condicao_complexa(x) and outra_condicao(x) 
#            else funcao3(x) for x in dados if filtro_complexo(x)]  # ✗ Difícil de ler

# ✓ Prefira loops tradicionais para lógica complexa
def processar_dados_complexos(dados):
    resultado = []
    for item in dados:
        if item > 0:
            processado = item ** 2
            if processado % 2 == 0:
                resultado.append(processado)
            else:
                resultado.append(processado * 2)
    return resultado

# ✓ Use generator expressions para grandes volumes
def processar_arquivo_grande():
    # Simular linhas de arquivo
    linhas = [f"linha {i}" for i in range(1000)]
    
    # Generator - não carrega tudo na memória
    linhas_processadas = (linha.upper() for linha in linhas if 'erro' not in linha)
    
    # Processa uma por vez
    for linha in linhas_processadas:
        if '500' in linha:  # Exemplo: para no primeiro erro
            break
    
    return "Processamento concluído"

# ✓ Combine comprehensions com funções
def validar_email(email):
    return '@' in email and '.' in email.split('@')[-1]

emails = ['user@domain.com', 'invalid', 'test@site.org']
emails_validos = [email for email in emails if validar_email(email)]
print(f"\nEmails válidos: {emails_validos}")

# ✓ Use dict comprehensions para transformar dados
def normalizar_dados(dados_brutos):
    return {chave.lower(): str(valor).strip() 
            for chave, valor in dados_brutos.items() 
            if valor is not None}

dados = {'NOME': 'Ana  ', 'IDADE': 25, 'EMAIL': None, 'CIDADE': ' SP '}
normalizados = normalizar_dados(dados)
print(f"Dados normalizados: {normalizados}")

# ✓ Use set comprehensions para remover duplicatas
def extrair_dominios(emails):
    return {email.split('@')[1].lower() for email in emails 
            if '@' in email}

emails_teste = ['user@GMAIL.com', 'test@yahoo.com', 'admin@Gmail.COM']
dominios = extrair_dominios(emails_teste)
print(f"Domínios únicos: {dominios}")

print("\n=== RESUMO DE BOAS PRÁTICAS ===")
print("✓ Use comprehensions para transformações simples")
print("✓ Prefira loops tradicionais para lógica complexa")
print("✓ Use generator expressions para grandes volumes")
print("✓ Combine comprehensions com funções auxiliares")
print("✓ Mantenha comprehensions legíveis (máx 2 linhas)")
print("✓ Use dict comprehensions para transformar dados")
print("✓ Use set comprehensions para remover duplicatas")
print("✗ Evite comprehensions aninhadas muito profundas")
print("✗ Não sacrifique legibilidade por concisão")

3.8 Casos de Uso Práticos no Desenvolvimento

In [None]:
# 1. Processamento de dados de API
def processar_resposta_api(usuarios_api):
    """Processa resposta de API de usuários"""
    
    # Extrair apenas dados necessários
    usuarios_limpos = [{
        'id': user['id'],
        'nome': user['name'].title(),
        'email': user['email'].lower(),
        'ativo': user.get('active', True)
    } for user in usuarios_api if user.get('email')]
    
    # Separar ativos e inativos
    ativos = [u for u in usuarios_limpos if u['ativo']]
    inativos = [u for u in usuarios_limpos if not u['ativo']]
    
    # Criar índice por email
    indice_email = {u['email']: u for u in usuarios_limpos}
    
    return {
        'usuarios': usuarios_limpos,
        'ativos': ativos,
        'inativos': inativos,
        'indice_email': indice_email,
        'estatisticas': {
            'total': len(usuarios_limpos),
            'ativos': len(ativos),
            'inativos': len(inativos)
        }
    }

# Simular dados de API
api_response = [
    {'id': 1, 'name': 'ana silva', 'email': 'ANA@EMAIL.COM', 'active': True},
    {'id': 2, 'name': 'bruno santos', 'email': '', 'active': True},  # Email vazio
    {'id': 3, 'name': 'carlos oliveira', 'email': 'carlos@email.com', 'active': False}
]

resultado = processar_resposta_api(api_response)
print("Processamento de API:")
print(f"Total processados: {resultado['estatisticas']['total']}")
print(f"Usuários ativos: {len(resultado['ativos'])}")
print(f"Emails disponíveis: {list(resultado['indice_email'].keys())}")

# 2. Análise de logs de servidor
def analisar_logs_servidor(logs):
    """Analisa logs de servidor web"""
    
    # Parsear logs (formato: IP METHOD STATUS URL)
    logs_parseados = [{
        'ip': linha.split()[0],
        'method': linha.split()[1],
        'status': int(linha.split()[2]),
        'url': linha.split()[3]
    } for linha in logs if len(linha.split()) >= 4]
    
    # Análises com comprehensions
    analises = {
        # IPs únicos
        'ips_unicos': {log['ip'] for log in logs_parseados},
        
        # Contagem por status
        'status_counts': {},
        
        # URLs mais acessadas
        'urls_populares': {},
        
        # Erros (4xx e 5xx)
        'erros': [log for log in logs_parseados 
                 if log['status'] >= 400],
        
        # IPs suspeitos (muitos erros)
        'ips_suspeitos': set()
    }
    
    # Contar status codes
    for log in logs_parseados:
        status = log['status']
        analises['status_counts'][status] = analises['status_counts'].get(status, 0) + 1
    
    # URLs populares
    for log in logs_parseados:
        url = log['url']
        analises['urls_populares'][url] = analises['urls_populares'].get(url, 0) + 1
    
    # IPs com muitos erros
    erros_por_ip = {}
    for log in analises['erros']:
        ip = log['ip']
        erros_por_ip[ip] = erros_por_ip.get(ip, 0) + 1
    
    analises['ips_suspeitos'] = {ip for ip, count in erros_por_ip.items() if count > 2}
    
    return analises

logs_exemplo = [
    '192.168.1.1 GET 200 /home',
    '192.168.1.2 POST 404 /api/users',
    '192.168.1.1 GET 200 /about',
    '192.168.1.3 GET 500 /error',
    '192.168.1.2 GET 404 /missing',
    '192.168.1.2 POST 403 /admin'
]

analise = analisar_logs_servidor(logs_exemplo)
print(f"\nAnálise de Logs:")
print(f"IPs únicos: {len(analise['ips_unicos'])}")
print(f"Status codes: {analise['status_counts']}")
print(f"Total de erros: {len(analise['erros'])}")
print(f"IPs suspeitos: {analise['ips_suspeitos']}")

# 3. Processamento de dados de vendas
def gerar_relatorio_vendas(vendas):
    """Gera relatório completo de vendas"""
    
    # Calcular métricas por vendedor
    metricas_vendedor = {
        vendedor: {
            'total': sum(venda['valor'] for venda in vendas_vendedor),
            'quantidade': len(vendas_vendedor),
            'ticket_medio': sum(venda['valor'] for venda in vendas_vendedor) / len(vendas_vendedor),
            'produtos_vendidos': {venda['produto'] for venda in vendas_vendedor}
        }
        for vendedor, vendas_vendedor in {
            v['vendedor']: [venda for venda in vendas if venda['vendedor'] == v['vendedor']]
            for v in vendas
        }.items()
    }
    
    # Top performers
    top_vendedores = sorted(
        [(vendedor, dados['total']) for vendedor, dados in metricas_vendedor.items()],
        key=lambda x: x[1],
        reverse=True
    )
    
    # Produtos mais vendidos
    vendas_por_produto = {}
    for venda in vendas:
        produto = venda['produto']
        vendas_por_produto[produto] = vendas_por_produto.get(produto, 0) + venda['valor']
    
    produtos_top = sorted(vendas_por_produto.items(), key=lambda x: x[1], reverse=True)
    
    return {
        'metricas_vendedor': metricas_vendedor,
        'top_vendedores': top_vendedores,
        'produtos_top': produtos_top,
        'resumo': {
            'total_geral': sum(venda['valor'] for venda in vendas),
            'total_vendas': len(vendas),
            'ticket_medio_geral': sum(venda['valor'] for venda in vendas) / len(vendas)
        }
    }

vendas_exemplo = [
    {'vendedor': 'Ana', 'produto': 'Notebook', 'valor': 2500},
    {'vendedor': 'Bruno', 'produto': 'Mouse', 'valor': 50},
    {'vendedor': 'Ana', 'produto': 'Teclado', 'valor': 150},
    {'vendedor': 'Carlos', 'produto': 'Monitor', 'valor': 800},
    {'vendedor': 'Bruno', 'produto': 'Notebook', 'valor': 2500}
]

relatorio = gerar_relatorio_vendas(vendas_exemplo)
print(f"\nRelatório de Vendas:")
print(f"Total geral: R$ {relatorio['resumo']['total_geral']:,.2f}")
print(f"Top vendedor: {relatorio['top_vendedores'][0][0]} (R$ {relatorio['top_vendedores'][0][1]:,.2f})")
print(f"Produto mais vendido: {relatorio['produtos_top'][0][0]} (R$ {relatorio['produtos_top'][0][1]:,.2f})")

# 4. Validação e limpeza de dados
def limpar_dados_contatos(contatos_brutos):
    """Limpa e valida dados de contatos"""
    
    # Limpeza básica
    contatos_limpos = [{
        'nome': contato.get('nome', '').strip().title(),
        'email': contato.get('email', '').strip().lower(),
        'telefone': ''.join(filter(str.isdigit, contato.get('telefone', ''))),
        'cidade': contato.get('cidade', '').strip().title()
    } for contato in contatos_brutos]
    
    # Validações
    contatos_validos = [contato for contato in contatos_limpos if (
        contato['nome'] and 
        '@' in contato['email'] and 
        len(contato['telefone']) >= 10
    )]
    
    # Remover duplicatas por email
    emails_vistos = set()
    contatos_unicos = []
    for contato in contatos_validos:
        if contato['email'] not in emails_vistos:
            emails_vistos.add(contato['email'])
            contatos_unicos.append(contato)
    
    # Estatísticas
    cidades_unicas = {c['cidade'] for c in contatos_unicos if c['cidade']}
    dominios_email = {c['email'].split('@')[1] for c in contatos_unicos}
    
    return {
        'contatos_limpos': contatos_unicos,
        'estatisticas': {
            'total_original': len(contatos_brutos),
            'total_valido': len(contatos_unicos),
            'cidades_unicas': len(cidades_unicas),
            'dominios_email': len(dominios_email)
        },
        'cidades': sorted(cidades_unicas),
        'dominios': sorted(dominios_email)
    }

contatos_brutos = [
    {'nome': ' ana silva ', 'email': 'ANA@GMAIL.COM', 'telefone': '(11) 99999-9999', 'cidade': 'são paulo'},
    {'nome': 'bruno', 'email': 'bruno@email', 'telefone': '123', 'cidade': ''},  # Inválido
    {'nome': 'carlos oliveira', 'email': 'carlos@yahoo.com', 'telefone': '11987654321', 'cidade': 'Rio de Janeiro'},
    {'nome': ' ana silva ', 'email': 'ana@gmail.com', 'telefone': '11999999999', 'cidade': 'São Paulo'}  # Duplicata
]

resultado_limpeza = limpar_dados_contatos(contatos_brutos)
print(f"\nLimpeza de Dados:")
print(f"Original: {resultado_limpeza['estatisticas']['total_original']} contatos")
print(f"Válidos: {resultado_limpeza['estatisticas']['total_valido']} contatos")
print(f"Cidades: {resultado_limpeza['cidades']}")
print(f"Domínios: {resultado_limpeza['dominios']}")