Iteradores e Geradores em Python

4.1 Conceitos Básicos de Iteração

In [None]:
# Objetos iteráveis vs iteradores

# Lista é iterável
lista = [1, 2, 3, 4, 5]
print(f"Lista é iterável: {hasattr(lista, '__iter__')}")
print(f"Lista é iterador: {hasattr(lista, '__next__')}")

# Criar iterador a partir da lista
iterador = iter(lista)
print(f"\nIterador é iterável: {hasattr(iterador, '__iter__')}")
print(f"Iterador é iterador: {hasattr(iterador, '__next__')}")

# Usar next() manualmente
print(f"\nPrimeiro elemento: {next(iterador)}")
print(f"Segundo elemento: {next(iterador)}")
print(f"Terceiro elemento: {next(iterador)}")

# Iterar o restante
print("\nRestante dos elementos:")
for item in iterador:
    print(f"  {item}")

# Tentar usar iterador esgotado
try:
    print(next(iterador))
except StopIteration:
    print("\nIterador esgotado - StopIteration")

# Diferentes tipos iteráveis
iteraveis = {
    'string': 'Python',
    'tupla': (1, 2, 3),
    'dicionário': {'a': 1, 'b': 2},
    'set': {1, 2, 3},
    'range': range(3)
}

print("\nTipos iteráveis:")
for nome, obj in iteraveis.items():
    print(f"{nome}: {list(iter(obj))}")

4.2 Criando Iteradores Personalizados

In [None]:
# Iterador simples - contador
class Contador:
    def __init__(self, inicio, fim):
        self.atual = inicio
        self.fim = fim
    
    def __iter__(self):
        return self
    
    def __next__(self):
        if self.atual < self.fim:
            self.atual += 1
            return self.atual - 1
        else:
            raise StopIteration

# Testando o contador
contador = Contador(1, 5)
print("Contador de 1 a 4:")
for num in contador:
    print(f"  {num}")

# Iterador para números pares
class NumerosPares:
    def __init__(self, maximo):
        self.maximo = maximo
        self.atual = 0
    
    def __iter__(self):
        return self
    
    def __next__(self):
        if self.atual < self.maximo:
            resultado = self.atual
            self.atual += 2
            return resultado
        else:
            raise StopIteration

pares = NumerosPares(10)
print("\nNúmeros pares até 10:")
print(list(pares))

# Iterador para sequência Fibonacci
class Fibonacci:
    def __init__(self, max_count):
        self.max_count = max_count
        self.count = 0
        self.a, self.b = 0, 1
    
    def __iter__(self):
        return self
    
    def __next__(self):
        if self.count < self.max_count:
            self.count += 1
            if self.count == 1:
                return self.a
            elif self.count == 2:
                return self.b
            else:
                self.a, self.b = self.b, self.a + self.b
                return self.b
        else:
            raise StopIteration

fib = Fibonacci(10)
print("\nSequência Fibonacci (10 primeiros):")
print(list(fib))

4.3 Geradores com yield

In [None]:
# Gerador simples
def contador_gerador(inicio, fim):
    """Gerador que conta de inicio até fim-1"""
    atual = inicio
    while atual < fim:
        yield atual
        atual += 1

# Testando o gerador
gen = contador_gerador(1, 5)
print(f"Tipo do gerador: {type(gen)}")
print("Valores do gerador:")
for valor in gen:
    print(f"  {valor}")

# Gerador Fibonacci (mais simples que a classe)
def fibonacci_gerador(n):
    """Gera os primeiros n números da sequência Fibonacci"""
    a, b = 0, 1
    for _ in range(n):
        yield a
        a, b = b, a + b

print("\nFibonacci com gerador:")
fib_gen = fibonacci_gerador(10)
print(list(fib_gen))

# Gerador infinito (cuidado!)
def numeros_infinitos(inicio=0):
    """Gerador infinito de números"""
    num = inicio
    while True:
        yield num
        num += 1

# Usar apenas alguns valores
infinito = numeros_infinitos(100)
print("\nPrimeiros 5 de um gerador infinito:")
for i, valor in enumerate(infinito):
    if i >= 5:
        break
    print(f"  {valor}")

4.4 Generator Expressions

In [None]:
# Generator expression - sintaxe similar a list comprehension
# Sintaxe: (expressão for item in iterável)

# Comparação: lista vs gerador
numeros = range(10)

# Lista - carrega tudo na memória
quadrados_lista = [x**2 for x in numeros]
print(f"Lista: {quadrados_lista}")
print(f"Tipo: {type(quadrados_lista)}")

# Gerador - calcula sob demanda
quadrados_gen = (x**2 for x in numeros)
print(f"\nGerador: {quadrados_gen}")
print(f"Tipo: {type(quadrados_gen)}")
print(f"Valores: {list(quadrados_gen)}")

# Uso de memória
import sys
lista_grande = [x for x in range(1000)]
gen_grande = (x for x in range(1000))

print(f"\nMemória lista: {sys.getsizeof(lista_grande)} bytes")
print(f"Memória gerador: {sys.getsizeof(gen_grande)} bytes")

# Processamento lazy (preguiçoso)
def processar_numero(n):
    print(f"  Processando {n}")
    return n ** 2

print("\nCriando gerador (não executa ainda):")
gen_lazy = (processar_numero(x) for x in range(3))

print("\nIterando gerador (executa agora):")
for resultado in gen_lazy:
    print(f"Resultado: {resultado}")

# Filtros com generator expressions
numeros = range(20)
pares_quadrados = (x**2 for x in numeros if x % 2 == 0)
print(f"\nPares ao quadrado: {list(pares_quadrados)}")

# Processamento de strings
palavras = ['Python', 'Java', 'JavaScript', 'Go']
maiusculas = (palavra.upper() for palavra in palavras if len(palavra) > 3)
print(f"Palavras longas em maiúscula: {list(maiusculas)}")

# Aninhamento de generators
matriz = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
elementos = (item for linha in matriz for item in linha)
print(f"\nElementos da matriz: {list(elementos)}")

# Generator para processamento de dados
vendas = [100, 250, 80, 300, 150]
vendas_com_bonus = (venda * 1.1 if venda > 200 else venda for venda in vendas)
print(f"Vendas com bônus: {list(vendas_com_bonus)}")

4.5 Métodos de Geradores

In [None]:
# Métodos send(), throw() e close()

def gerador_interativo():
    """Gerador que pode receber valores"""
    print("Gerador iniciado")
    valor = None
    
    while True:
        try:
            # yield retorna o valor enviado via send()
            recebido = yield valor
            if recebido is not None:
                valor = recebido * 2
                print(f"Recebi {recebido}, calculei {valor}")
            else:
                valor += 1 if valor else 1
                print(f"Incrementei para {valor}")
        except GeneratorExit:
            print("Gerador sendo fechado")
            break
        except Exception as e:
            print(f"Erro capturado: {e}")
            valor = 0

# Testando send()
gen = gerador_interativo()
print(f"Primeiro next(): {next(gen)}")
print(f"Send 5: {gen.send(5)}")
print(f"Send 3: {gen.send(3)}")
print(f"Next normal: {next(gen)}")

# Testando throw()
try:
    gen.throw(ValueError, "Erro de teste")
    print(f"Após erro: {next(gen)}")
except StopIteration:
    pass

# Testando close()
gen.close()

# Gerador com estado
def contador_com_reset():
    """Contador que pode ser resetado"""
    contador = 0
    
    while True:
        comando = yield contador
        
        if comando == 'reset':
            contador = 0
            print("Contador resetado")
        elif comando == 'increment':
            contador += 1
        elif isinstance(comando, int):
            contador += comando
        else:
            contador += 1

print("\nContador com reset:")
contador = contador_com_reset()
print(f"Inicial: {next(contador)}")
print(f"Increment: {contador.send('increment')}")
print(f"Add 5: {contador.send(5)}")
print(f"Reset: {contador.send('reset')}")
print(f"Next: {next(contador)}")

# Pipeline de processamento
def fonte_dados():
    """Gera dados de entrada"""
    for i in range(10):
        yield i

def filtrar_pares(fonte):
    """Filtra apenas números pares"""
    for item in fonte:
        if item % 2 == 0:
            yield item

def elevar_ao_quadrado(fonte):
    """Eleva ao quadrado"""
    for item in fonte:
        yield item ** 2

# Criar pipeline
pipeline = elevar_ao_quadrado(filtrar_pares(fonte_dados()))
print(f"\nPipeline de processamento: {list(pipeline)}")

contador.close()  # Fechar gerador

4.6 Casos de Uso Práticos

In [None]:
# 1. Leitura de arquivo grande
def ler_arquivo_por_chunks(arquivo_simulado, chunk_size=3):
    """Lê arquivo em pedaços para economizar memória"""
    chunk = []
    
    for linha in arquivo_simulado:
        chunk.append(linha.strip())
        
        if len(chunk) == chunk_size:
            yield chunk
            chunk = []
    
    # Yield do último chunk se não estiver vazio
    if chunk:
        yield chunk

# Simular arquivo grande
arquivo_grande = [f"Linha {i}\n" for i in range(1, 11)]

print("Lendo arquivo em chunks:")
for i, chunk in enumerate(ler_arquivo_por_chunks(arquivo_grande)):
    print(f"Chunk {i+1}: {chunk}")

# 2. Processamento de dados em streaming
def processar_vendas_stream(vendas):
    """Processa vendas em tempo real"""
    total_acumulado = 0
    count = 0
    
    for venda in vendas:
        total_acumulado += venda['valor']
        count += 1
        media_atual = total_acumulado / count
        
        yield {
            'venda': venda,
            'total_acumulado': total_acumulado,
            'media_atual': media_atual,
            'count': count
        }

vendas_stream = [
    {'produto': 'A', 'valor': 100},
    {'produto': 'B', 'valor': 200},
    {'produto': 'C', 'valor': 150},
    {'produto': 'D', 'valor': 300}
]

print("\nProcessamento em streaming:")
for resultado in processar_vendas_stream(vendas_stream):
    print(f"Produto {resultado['venda']['produto']}: "
          f"Total={resultado['total_acumulado']}, "
          f"Média={resultado['media_atual']:.2f}")

# 3. Gerador de IDs únicos
def gerador_ids(prefixo="ID"):
    """Gera IDs únicos sequenciais"""
    contador = 1
    while True:
        yield f"{prefixo}_{contador:06d}"
        contador += 1

# Usar gerador de IDs
ids = gerador_ids("USER")
print("\nIDs gerados:")
for i in range(5):
    print(f"  {next(ids)}")

# 4. Cache com gerador
def fibonacci_com_cache():
    """Fibonacci com cache interno"""
    cache = {0: 0, 1: 1}
    n = 0
    
    while True:
        if n in cache:
            resultado = cache[n]
        else:
            resultado = cache[n-1] + cache[n-2]
            cache[n] = resultado
        
        yield resultado
        n += 1

fib_cache = fibonacci_com_cache()
print("\nFibonacci com cache:")
fibonacci_valores = [next(fib_cache) for _ in range(10)]
print(fibonacci_valores)

# 5. Simulador de dados em tempo real
import random
import time

def simular_sensor_temperatura():
    """Simula leituras de sensor de temperatura"""
    temperatura_base = 25.0
    
    while True:
        # Simular variação aleatória
        variacao = random.uniform(-2, 2)
        temperatura_atual = temperatura_base + variacao
        
        yield {
            'timestamp': time.time(),
            'temperatura': round(temperatura_atual, 2),
            'status': 'normal' if 20 <= temperatura_atual <= 30 else 'alerta'
        }
        
        # Pequena variação na base para próxima leitura
        temperatura_base += random.uniform(-0.1, 0.1)
        temperatura_base = max(15, min(35, temperatura_base))  # Limitar range

# Simular algumas leituras
sensor = simular_sensor_temperatura()
print("\nSimulação de sensor:")
for i in range(5):
    leitura = next(sensor)
    print(f"Temp: {leitura['temperatura']}°C - Status: {leitura['status']}")

# 6. Processamento de log em tempo real
def analisar_logs_tempo_real(logs):
    """Analisa logs conforme chegam"""
    contadores = {'info': 0, 'warning': 0, 'error': 0}
    
    for log in logs:
        # Extrair nível do log
        if 'ERROR' in log:
            nivel = 'error'
        elif 'WARNING' in log:
            nivel = 'warning'
        else:
            nivel = 'info'
        
        contadores[nivel] += 1
        
        yield {
            'log': log.strip(),
            'nivel': nivel,
            'contadores': contadores.copy(),
            'total': sum(contadores.values())
        }

logs_exemplo = [
    "INFO: Sistema iniciado",
    "INFO: Usuário logado",
    "WARNING: Memória baixa",
    "ERROR: Falha na conexão",
    "INFO: Backup concluído"
]

print("\nAnálise de logs em tempo real:")
for resultado in analisar_logs_tempo_real(logs_exemplo):
    print(f"{resultado['nivel'].upper()}: {resultado['contadores']}")

4.7 Performance e Boas Práticas

In [None]:
import sys
import time

# Comparação de memória: lista vs gerador
def comparar_memoria_uso():
    n = 10000
    
    # Lista - carrega tudo
    lista_completa = [x**2 for x in range(n)]
    
    # Gerador - calcula sob demanda
    gerador = (x**2 for x in range(n))
    
    print(f"Lista ({n} elementos): {sys.getsizeof(lista_completa):,} bytes")
    print(f"Gerador: {sys.getsizeof(gerador):,} bytes")
    print(f"Economia: {sys.getsizeof(lista_completa) / sys.getsizeof(gerador):.1f}x")

comparar_memoria_uso()

# Quando usar lista vs gerador
def benchmark_acesso_multiplo():
    """Compara performance para acesso múltiplo"""
    n = 1000
    
    # Lista - boa para acesso múltiplo
    start = time.time()
    lista = [x**2 for x in range(n)]
    # Simular múltiplos acessos
    for _ in range(3):
        soma = sum(lista)
    tempo_lista = time.time() - start
    
    # Gerador - precisa recriar para cada acesso
    start = time.time()
    for _ in range(3):
        gerador = (x**2 for x in range(n))
        soma = sum(gerador)
    tempo_gerador = time.time() - start
    
    print(f"\nAcesso múltiplo:")
    print(f"Lista: {tempo_lista:.4f}s")
    print(f"Gerador: {tempo_gerador:.4f}s")
    print(f"Lista é {tempo_gerador/tempo_lista:.1f}x mais rápida para acesso múltiplo")

benchmark_acesso_multiplo()

# Boas práticas

# ✓ Use geradores para grandes volumes de dados
def processar_arquivo_grande_eficiente(linhas):
    """Processa arquivo linha por linha"""
    for linha in linhas:
        if linha.strip():  # Pular linhas vazias
            yield linha.strip().upper()

# ✓ Use listas quando precisar de acesso aleatório
def criar_indice_rapido(dados):
    """Cria índice para acesso rápido"""
    return [item for item in dados]  # Lista para acesso por índice

# ✓ Combine geradores para pipelines eficientes
def pipeline_eficiente(dados):
    """Pipeline de processamento eficiente"""
    # Cada etapa é um gerador
    filtrados = (x for x in dados if x > 0)
    processados = (x**2 for x in filtrados)
    limitados = (x for i, x in enumerate(processados) if i < 100)
    return limitados

# ✗ Evite converter geradores desnecessariamente
def exemplo_ineficiente(dados):
    gen = (x**2 for x in dados)
    lista = list(gen)  # ✗ Perde a vantagem do gerador
    return lista

# ✓ Use geradores para processamento lazy
def carregar_dados_sob_demanda(fonte):
    """Carrega dados apenas quando necessário"""
    for item in fonte:
        # Processamento pesado só acontece quando yield é chamado
        resultado = processar_item_pesado(item)
        yield resultado

def processar_item_pesado(item):
    """Simula processamento pesado"""
    return item * 2  # Simplificado

# Exemplo de uso eficiente
dados_teste = range(10)
pipeline = pipeline_eficiente(dados_teste)
print(f"\nPipeline eficiente: {list(pipeline)}")

# Dicas de performance
print("\n=== DICAS DE PERFORMANCE ===")
print("✓ Use geradores para grandes volumes de dados")
print("✓ Use listas quando precisar de acesso múltiplo/aleatório")
print("✓ Combine geradores para criar pipelines eficientes")
print("✓ Prefira generator expressions para transformações simples")
print("✓ Use yield from para delegar a outros geradores")
print("✗ Evite converter geradores em listas desnecessariamente")
print("✗ Não use geradores para pequenos conjuntos de dados")
print("✗ Cuidado com geradores infinitos em loops")

# Quando usar cada abordagem
print("\n=== QUANDO USAR ===")
print("Geradores:")
print("  • Grandes volumes de dados")
print("  • Processamento em streaming")
print("  • Economia de memória é prioridade")
print("  • Processamento lazy/sob demanda")
print("\nListas:")
print("  • Pequenos conjuntos de dados")
print("  • Acesso múltiplo aos dados")
print("  • Acesso aleatório por índice")
print("  • Operações que precisam do tamanho (len)")