# Loops For e While em Python para Ciência de Dados

Loops **for** e **while** são ferramentas fundamentais em Python para automatizar tarefas repetitivas, como processar grandes conjuntos de dados, limpar informações ou realizar cálculos iterativos. Em ciência de dados, eles são amplamente usados para iterar sobre linhas de DataFrames, filtrar dados ou executar simulações. Este notebook explora o uso de loops com exemplos práticos, dicas de boas práticas e aplicações reais.

## Objetivos
- Compreender como usar loops **for** para iterar sobre listas, dicionários e DataFrames.
- Aplicar loops **while** para processamentos baseados em condições dinâmicas.
- Combinar loops com estruturas de dados comuns em ciência de dados.
- Aprender boas práticas para evitar loops ineficientes e erros comuns.

## Por que Loops são Importantes?
Em ciência de dados, você frequentemente precisa processar milhares ou milhões de registros. Loops permitem automatizar tarefas como:
- Categorizar dados (ex.: classificar clientes por faixa etária).
- Filtrar informações (ex.: encontrar outliers em uma coluna).
- Transformar dados (ex.: aplicar uma fórmula a cada linha).

**Nota**: Embora loops sejam poderosos, em ciência de dados, operações vetorizadas (usando bibliotecas como NumPy ou Pandas) são geralmente mais eficientes para grandes datasets. Este notebook foca em loops para cenários onde eles são apropriados ou necessários.

## 1. Loop For
O loop **for** é ideal para iterar sobre sequências, como listas, tuplas, dicionários ou linhas de um DataFrame. Ele executa um bloco de código para cada elemento da sequência, tornando-o perfeito para tarefas como categorização ou transformação de dados.

### Características
- **Sintaxe simples**: `for item in sequência:`.
- **Iterável**: Pode percorrer qualquer objeto iterável (listas, strings, range, etc.).
- **Uso comum**: Processar elementos de forma ordenada ou aplicar regras a cada item.

Vamos ver um exemplo prático de categorização de idades, um caso comum em análise de dados demográficos.

In [None]:
# Exemplo: Categorizando idades
idades = [22, 35, 28, 19, 40]
categorias = []

for idade in idades:
    if idade < 18:
        categorias.append("Menor")
    elif idade <= 35:
        categorias.append("Adulto Jovem")
    else:
        categorias.append("Adulto")

print("Idades:", idades)
print("Categorias:", categorias)

### Explicação do Exemplo
- **Lista de idades**: Representa uma coluna de dados, como em um dataset de clientes.
- **Loop for**: Itera sobre cada idade, aplicando uma regra de categorização.
- **Condições**: Usamos `if/elif/else` para classificar cada idade em uma categoria.
- **Lista de categorias**: Armazena os resultados, que poderiam ser usados em análises posteriores (ex.: visualizações ou relatórios).

### Dica de Boas Práticas
- **Evite loops aninhados desnecessários**: Muitos loops aninhados podem tornar o código lento. Considere estruturas alternativas, como dicionários ou operações vetorizadas.
- **Use list comprehensions quando possível**: Para tarefas simples, como a acima, você pode reescrever o loop como:
  ```python
  categorias = ['Menor' if idade < 18 else 'Adulto Jovem' if idade <= 35 else 'Adulto' for idade in idades]
  ```
  Isso é mais conciso e, em alguns casos, mais rápido.

### Exemplo Adicional: Iterando com `range`
Às vezes, você precisa iterar sobre índices. O método `range()` é útil para isso.

In [None]:
# Exemplo: Calculando a soma cumulativa de idades
idades = [22, 35, 28, 19, 40]
soma_cumulativa = []
soma = 0

for i in range(len(idades)):
    soma += idades[i]
    soma_cumulativa.append(soma)

print("Idades:", idades)
print("Soma cumulativa:", soma_cumulativa)

## 2. Loop While
O loop **while** executa um bloco de código enquanto uma condição específica permanece verdadeira. Ele é útil quando o número de iterações não é conhecido заранее, como em buscas ou simulações.

### Características
- **Condição controlada**: Executa até que a condição seja falsa.
- **Cuidado com loops infinitos**: Sempre garanta que a condição será eventualmente falsa.
- **Uso comum**: Processar dados até atingir um limite ou encontrar um valor específico.

Vamos ver um exemplo de busca em uma lista, simulando a procura por um valor atípico em um dataset.

In [None]:
# Exemplo: Encontrando o primeiro passageiro com idade > 50
idades = [22, 35, 55, 28, 19]
i = 0

while i < len(idades) and idades[i] <= 50:
    i += 1

if i < len(idades):
    print(f"Primeira idade > 50 encontrada: {idades[i]} na posição {i}")
else:
    print("Nenhuma idade > 50 encontrada")

### Explicação do Exemplo
- **Lista de idades**: Simula um dataset com informações de passageiros.
- **Loop while**: Continua até encontrar uma idade maior que 50 ou atingir o fim da lista.
- **Índice `i`**: Controla a posição atual na lista, permitindo acessar o elemento correspondente.
- **Saída**: Informa se a condição foi atendida e, se sim, qual valor e posição foram encontrados.

### Dica de Boas Práticas
- **Evite loops infinitos**: Sempre inclua uma condição de parada clara (ex.: `i < len(idades)`).
- **Use `break` para maior controle**: Se precisar sair do loop em uma condição específica, use `break`.
- **Considere alternativas**: Para buscas simples, métodos como `index()` ou compreensões podem ser mais diretos.

### Exemplo Adicional: Simulação com While
Um caso comum em ciência de dados é simular processos até atingir um limite, como acumular valores até ultrapassar um threshold.

In [None]:
# Exemplo: Acumulando idades até ultrapassar 100
idades = [22, 35, 28, 19, 40]
soma = 0
i = 0

while i < len(idades) and soma <= 100:
    soma += idades[i]
    i += 1

print(f"Soma acumulada: {soma} após {i} iterações")

## 3. Aplicações em Ciência de Dados
Loops são frequentemente combinados com bibliotecas como Pandas e NumPy. Aqui está um exemplo de como usar um loop **for** com um DataFrame (introduziremos Pandas brevemente, mas o foco é no loop).

### Exemplo: Categorizando Idades em um DataFrame

In [None]:
import pandas as pd

# Criando um DataFrame simples
data = pd.DataFrame({'Idade': [22, 35, 28, 19, 40]})

# Adicionando uma coluna de categorias
data['Categoria'] = ['Menor' if idade < 18 else 'Adulto Jovem' if idade <= 35 else 'Adulto' for idade in data['Idade']]

print(data)

### Explicação
- **Pandas DataFrame**: Estrutura tabular comum em ciência de dados.
- **List comprehension**: Substitui o loop explícito para maior eficiência, mas a lógica é a mesma.
- **Aplicação**: A nova coluna pode ser usada em análises ou visualizações.

## Conclusão
Loops **for** e **while** são ferramentas poderosas para automação em ciência de dados. Embora operações vetorizadas sejam preferíveis para grandes datasets, loops são indispensáveis em cenários específicos, como processamentos condicionais ou simulações. Pratique com datasets reais e explore bibliotecas como Pandas para maximizar o potencial dos loops!