Importancia para a engenharia de dados:
Sua principal caracteristica é a imutabilidade. Uma vez que você cria uma tupla, não pode alterar, adicionar ou remover seus elementos.

    1- Segurança dos Dados: Garante que dados importantes, como registros lidos de um banco de dados ou configurações, não sejam acidentalmente modificados no meio de um processo.

    2- Performance: Tuplas são geralmente mais leves e rápidas de processar do que listas, pois o Python não precisa alocar recursos extras para possíveis modificações. 

    3- Uso como Chaves de Dicionário: Como são imutáveis (e, portanto, "hasheáveis"), tuplas podem ser usadas como chaves em dicionários. Isso é extremamente útil para criar chaves compostas. Listas não podem ser usadas para isso.

---

In [None]:
#Exemplo: contar quantos produtos um cliente comprou em uma 
# determinada loja. A chave seria (id_cliente, id_loja).

vendas = [
    (101, 1, 900),
    (102, 2, 901),
    (101, 1, 902),
    (103, 1, 900),
    (101, 2, 903),
    (101, 1, 904)
]

#Dicionario para armazenar a contagem de produtos por cleinte
contagem_por_cliente_loja = {}

for id_cliente, id_loja, id_produto in vendas:
    chave = (id_cliente, id_loja) #Criando a chava composta

    if chave in contagem_por_cliente_loja:
        contagem_por_cliente_loja[chave] += 1
    else:
        contagem_por_cliente_loja[chave] = 1

#A chave (101, 1) representa o cliente 101 na loja 1
print(contagem_por_cliente_loja)

#Para realizar consulta, basta usar a tupla como chave
print(f"O cliente 101 comprou {contagem_por_cliente_loja[(101, 1)]} produtos na loja 1.")

{(101, 1): 3, (102, 2): 1, (103, 1): 1, (101, 2): 1}
O cliente 101 comprou 3 produtos na loja 1.


In [4]:
#Ex: Tupla sendo usada para representar um registro imutável
# num banco de dados - consultando um banco de dados


dados_funcionarios = [
    (1, 'Ana Silva', 'Engenharia'),
    (2, 'Bruno Costa', 'Marketing'),
    (3, 'Carla Lima', 'Engenharia'),
]

#criando uma lista para os que tem cargo de "engenheiro"
eng = []
for registro in dados_funcionarios:
    #Desempacotamento para melhorar a leitura
    id, nome, dep = registro
    if dep == "Engenharia":
        eng.append(nome) #Adicionar o nome da pessoa a lista de engenheiros

print(f"Engenheiros na equipe: {eng}") 

Engenheiros na equipe: ['Ana Silva', 'Carla Lima']


In [None]:
#Ex

eventos_sensores = [
    ('2025-10-14T20:00:00Z', 'sensor-A', 22.5),
    ('2025-10-14T20:01:00Z', 'sensor-B', 55.0), # Inválido
    ('2025-10-14T20:01:15Z', 'sensor-D', 23.1),
    ('2025-10-14T20:02:00Z', 'sensor-C', -12.3), # Inválido
    ('2025-10-14T20:03:00Z', 'sensor-E', 49.9),
]

def validar_temperatura(eventos):
    validos=[]
    invalidos=[]

    for registro in eventos:
        #desempacotando para melhorar a leitura
        timestamp, id, temperatura = registro
        if -10 <= temperatura <= 50:
            validos.append(id)
        else:
            invalidos.append(id)
    return validos, invalidos #Retornar os valores - serem usados fora da função

validos, invalidos = validar_temperatura(eventos_sensores)
print(validos)

['sensor-A', 'sensor-D', 'sensor-E']


In [1]:
#Função que le um arquivo e precisa retornar um status.
#   a Tupla devolve valores imutaveis

def processar_logs(arquivo):
    
    #simular um processamento de arquivo log e retornar resumo
    linhas_lidas = 150_000
    linhas_erro = 700
    tempo_execucao =  45.6
    
    #retornar os valores quando a função for chamada
    return linhas_lidas, linhas_erro, tempo_execucao

#unpacking para organizar os valores
total, erros, tempo = processar_logs('arquivo')

print(f"processamento concluido!")
print(f"Total linhas: {total}")
print(f"Linhas com erro: {erros}")
print(f"Tempo processamento: {tempo}")

processamento concluido!
Total linhas: 150000
Linhas com erro: 700
Tempo processamento: 45.6


In [2]:
#Ex) Agregação de dados com chave composta
#   Você tem uma lista de registros de logs de acesso a um sistema. 
#   Cada registro é uma tupla (user_id, ip_address, action). 
#   Crie um dicionário que mapeia cada par (user_id, ip_address) 
#   para uma lista de todas as ações (action) que esse usuário 
#   realizou a partir daquele IP.

logs = [
    (10, '192.168.1.1', 'login'),
    (20, '10.0.0.5', 'view_page'),
    (10, '192.168.1.1', 'logout'),
    (15, '192.168.1.1', 'login'),
    (10, '200.201.202.1', 'login'), # Mesmo usuário, IP diferente
    (20, '10.0.0.5', 'submit_form'),
]

logs_agregados = {} #Dicionário vazio
for user_id, ip_address, action in logs:
    chave = (user_id, ip_address)

    #Contagem
    if chave in logs_agregados:
        logs_agregados[chave] += 1
    else:
        logs_agregados[chave] = 1

print("Contagem de acessos [user, ip]:")
print(logs_agregados)



Contagem de acessos [user, ip]:
{(10, '192.168.1.1'): 2, (20, '10.0.0.5'): 2, (15, '192.168.1.1'): 1, (10, '200.201.202.1'): 1}


In [None]:
#Ex) Sua tarefa é criar uma função que separa esses registros em
#  duas listas: uma para transações 'APROVADAS' e outra para as
#  demais.

transacoes = [
    ('TX1001', 55, 199.90, 'APROVADA'),
    ('TX1002', 73, 29.50, 'FALHA'),
    ('TX1003', 55, 75.00, 'APROVADA'),
    ('TX1004', 91, 500.10, 'EM_ANALISE'),
    ('TX1005', 73, 12.00, 'APROVADA'),
]

def transacao(list_transacoes):
    APROVADA = []
    FALHA = []

    for registro in list_transacoes:
        # Correção: desempacotamento correto
        transacao_id, id_user, valor, status = registro
        if status == 'APROVADA':
            APROVADA.append(transacao_id)
        else:
            FALHA.append(transacao_id)
    
    return FALHA, APROVADA

# Correção: passar a variável correta 'transacoes'
FALHA, APROVADA = transacao(transacoes)
print(f'Falhas: {FALHA}')
print(f'Aprovadas: {APROVADA}')

Falhas: ['TX1002', 'TX1004']
Aprovadas: ['TX1001', 'TX1003', 'TX1005']


In [6]:
"""
Ex) Você está analisando logs de eventos de um sistema. 
 Cada log é uma tupla com um formato variável: 
 (event_id, timestamp, event_type, ...outros_detalhes).

  Parte A: Crie um loop que processe uma lista desses logs. 
       Para cada log, extraia (pluck) apenas o event_id e o 
       event_type, ignorando todo o resto. Imprima o ID e o tipo de 
       cada evento.

   Parte B: Depois do loop, use o método .count() em uma lista de
       tipos de evento para descobrir quantas vezes o evento
       'ERROR' ocorreu.
"""
eventos = [
    (1, '2025-10-16T09:00:00', 'LOGIN', {'user': 'ana'}),
    (2, '2025-10-16T09:01:30', 'ERROR', {'code': 500, 'service': 'auth'}),
    (3, '2025-10-16T09:02:15', 'PURCHASE', {'user': 'bia', 'item': 123}),
    (4, '2025-10-16T09:03:00', 'LOGOUT', {'user': 'ana'}),
    (5, '2025-10-16T09:04:00', 'ERROR', {'code': 404, 'service': 'inventory'}),
]

def e1_eventos(e2_eventos):
    parteA=[]
    
    for registro in e2_eventos:

        #desempacotamento
        id, x, type, y = registro
        B = (id, type)

        #criar uma tupla com Id + Type porque o 
        #   [.append()] so aceita 1 parametro
        parteA.append(B)
    return parteA

def N_erros(e3_eventos):
    parteB=[]
    N=0

    for reg in e3_eventos:
        #desempacotamento
        id, x, type, y = reg
        if type == "ERROR":
            N += 1
    
    parteB.append(N)
    return parteB
            
parteB = N_erros(eventos)
parteA = e1_eventos(eventos)
print(parteA)
print(f'Quant de erros: {parteB}')

[(1, 'LOGIN'), (2, 'ERROR'), (3, 'PURCHASE'), (4, 'LOGOUT'), (5, 'ERROR')]
Quant de erros: [2]
