In [None]:
"""
Aplicação comum: preparar dados para limpeza antes de inserir num DataFrame
    Uso: Durante a extração de dados, você pode armazenar resultados intermediários, 
    como nomes de arquivos, colunas ou registros lidos de um CSV/JSON antes de 
    passá-los ao pandas.
"""

#Coletando dados brutos de uma API
data= [None, 3, 7, 9]

#Correção de dados incompletos
data[0]=0 #substituir a posição 0 por zero
print(data)


[0, 3, 7, 9]


In [None]:
"""
Aplicação comum: controle de etapas dentro de um data pipeline.
    Em pipelines de ETL, é comum gerar listas dinâmicas de tarefas 
    (tabelas, partições ou arquivos a processar).

"""

tabelas=["clientes", "produtos"]

#adicionando mais uma planilha à lista de tabelas
tabelas.append("vendas")

#adicionando outra tabela a lista, so que no inicio da lista
tabelas.insert(0, "usuários")
print(tabelas)

#removendo um elemento da lista
tabelas.remove("produtos")
print(tabelas)


['usuários', 'clientes', 'produtos', 'vendas']
['usuários', 'clientes', 'vendas']


In [7]:
"""
Aplicação comum: juntar lotes de dados extraídos de múltiplos 
arquivos antes de processar.
    Uso: Em um pipeline, você pode combinar várias fontes 
    de dados.
"""

clientes = ["joao", "maria"]
clientes_novos = ["pedro", "julia"]

#juntar duas bases de dados com [.extend]
clientes.extend(clientes_novos)
print(clientes)

['joao', 'maria', 'pedro', 'julia']


In [8]:
arquivos = [
    "clientes_2025-01.csv", "vendas_2025-01.csv",
    "clientes_2025-02.csv", "vendas_2025-02.csv",
    "produtos_2025-01.csv"
]

clientes = [arq for arq in arquivos if "clientes" in arq]
print(clientes)

['clientes_2025-01.csv', 'clientes_2025-02.csv']


In [None]:
"""
Ex) ETL de logs:
Dada uma lista de strings representando logs de acesso:
["200,GET,/api/v1", "404,GET,/api/v2", "200,POST,/api/v3"]
→ Crie uma nova lista contendo apenas os endpoints com status 200.
"""
raw_data=["200,GET,/api/v1", "404,GET,/api/v2", "200,POST,/api/v3"]

#filtro por palavra
data = [reg for reg in raw_data if "200" in reg]
print(data)



['200,GET,/api/v1', '200,POST,/api/v3']


In [None]:
"""
Ex) Processamento de arquivos S3:
Suponha uma lista de nomes de arquivos:
["dados_2025-01.csv", "dados_2024-12.csv", "relatorio_2025-01.csv"]
→ Filtre apenas os arquivos de 2025 e ordene alfabeticamente.
"""
raw_data=["relatorio_2025-01.csv", "dados_2024-12.csv", "dados_2025-01.csv"]

#filtro por palavra
A2025=[reg for reg in raw_data if "2025" in reg]
print(f"Valores filtrados por 2025: \n{A2025}")
print("-"*15)
A2025.sort()
print(f"Valores em ordem alfabética: \n{A2025}")

Valores filtrados por 2025: 
['relatorio_2025-01.csv', 'dados_2025-01.csv']
---------------
Valores em ordem alfabética: 
['dados_2025-01.csv', 'relatorio_2025-01.csv']
