
# üìò UC22 ‚Äì Aula 6 ‚Äî Filtros Compostos (Pandas)

![Python](https://img.shields.io/badge/Python-3.11+-blue?logo=python)
![Pandas](https://img.shields.io/badge/Pandas-Filtros%20Compostos-green?logo=pandas)
![Google Colab](https://img.shields.io/badge/Google%20Colab-Notebook-yellow?logo=googlecolab)
![Tempo](https://img.shields.io/badge/Dura%C3%A7%C3%A3o-90%20min-red)
![N%C3%ADvel](https://img.shields.io/badge/N%C3%ADvel-Iniciante%E2%9E%9CIntermedi%C3%81rio-purple)

**Turma:** 3¬∫ Ano ‚Äì Ensino M√©dio T√©cnico em Inform√°tica  
**Tema:** Combina√ß√£o de condi√ß√µes (E/OU/N√ÉO) para filtrar linhas em DataFrames  
**Ferramenta principal:** Google Colab

> ‚ÄúFiltros compostos s√£o como estrat√©gias de batalha: o segredo est√° na **combina√ß√£o**.‚Äù ‚Äì IAra ‚öîÔ∏è



## üéØ Objetivos de Aprendizagem
- Combinar condi√ß√µes com **AND (`&`)**, **OR (`|`)** e **NOT (`~`)** no Pandas.  
- Usar **par√™nteses** corretamente (ordem de avalia√ß√£o).  
- Criar filtros robustos com `isin`, `between`, `str.contains` (com `na=False`).  
- Alternar entre sintaxe padr√£o e **`.query()`** (com vari√°veis via `@`).  
- Montar **m√°scaras booleanas** reutiliz√°veis (c√≥digo claro e leg√≠vel).



## üìÇ Prepara√ß√£o do Ambiente (Google Drive)
Usaremos os mesmos arquivos das aulas anteriores, mantidos em **`Meu Drive/UC22/`**:

- `pokemons_pokedex.csv`  
- `escolas_estaduais_censo_escolar_2023.csv`


In [None]:

# üìÇ Montando o Google Drive
from google.colab import drive
drive.mount('/content/drive')

# üêç Importa√ß√µes essenciais
import pandas as pd

# üóÇÔ∏è Defini√ß√£o dos caminhos (ajuste conforme sua pasta)
caminho_poke = "/content/drive/MyDrive/UC22/pokemons_pokedex.csv"
caminho_escolas = "/content/drive/MyDrive/UC22/escolas_estaduais_censo_escolar_2023.csv"

# üì• Leitura dos datasets com codifica√ß√£o apropriada
df_poke = pd.read_csv(caminho_poke, encoding="utf-8")
df_escolas = pd.read_csv(caminho_escolas, encoding="latin-1", sep=",")

# üßπ Padroniza√ß√£o de nomes de colunas (min√∫sculas, sem espa√ßos)
df_poke.columns    = df_poke.columns.str.strip().str.lower().str.replace(" ", "_", regex=False)
df_escolas.columns = df_escolas.columns.str.strip().str.lower().str.replace(" ", "_", regex=False)

# üî§ Padroniza√ß√£o opcional para facilitar filtros de texto
if "no_municipio" in df_escolas.columns:
    df_escolas["no_municipio"] = df_escolas["no_municipio"].astype(str).strip().str.upper()

print("‚úÖ Pok√©mon:", df_poke.shape, " | colunas:", len(df_poke.columns))
print("‚úÖ Escolas:", df_escolas.shape, " | colunas:", len(df_escolas.columns))

# üîé Visualize as primeiras colunas para confirmar nomes
list(df_poke.columns)[:15]



## üß† Revis√£o R√°pida (Aula 5 ‚Üí Aula 6)
- Filtro **simples**: uma condi√ß√£o (ex.: `df['attack'] > 100`).  
- Filtros **compostos**: **duas ou mais condi√ß√µes** combinadas (ex.: ataque alto **E** velocidade alta).  
- Ap√≥s a leitura, **padronizamos os nomes de colunas** para min√∫sculas e com `_`.



## 1) Operadores l√≥gicos no Pandas (entre *Series* booleanas)
- **AND:** `cond1 & cond2` ‚Üí ambas verdadeiras  
- **OR:** `cond1 | cond2` ‚Üí pelo menos uma verdadeira  
- **NOT:** `~cond` ‚Üí inverte True/False

‚ö†Ô∏è **Importante:** Sempre use **par√™nteses** envolvendo cada condi√ß√£o!


In [None]:

# üéØ Exemplo 1 ‚Äî √Ågua E r√°pida E defensiva moderada
# Objetivo: Pok√©mon do tipo √Ågua com Speed > 70 E Defense >= 60
cond_tipo   = df_poke['type_1'] == 'Water'
cond_speed  = df_poke['speed'] > 70
cond_def    = df_poke['defense'] >= 60

mask = cond_tipo & cond_speed & cond_def  # AND entre as condi√ß√µes
agua_rapida_defensiva = df_poke[mask][['name','type_1','defense','speed','attack']].copy()

print("Qtd √Ågua & Speed>70 & Defense>=60:", agua_rapida_defensiva.shape[0])
agua_rapida_defensiva.head(10)


In [None]:

# üéØ Exemplo 2 ‚Äî Fogo OU Gelo com ataque alto (>100)
cond_tipo  = (df_poke['type_1'] == 'Fire') | (df_poke['type_1'] == 'Ice')
cond_atk   = df_poke['attack'] > 100

mask = cond_tipo & cond_atk  # (Fogo OU Gelo) E ataque alto
fogo_ou_gelo_fortes = df_poke[mask][['name','type_1','attack','speed']].copy()
fogo_ou_gelo_fortes.head(10)


In [None]:

# üéØ Exemplo 3 ‚Äî N√ÉO lend√°rio e muito veloz (Speed >= 120)
col_leg = 'legendary' if 'legendary' in df_poke.columns else None

if col_leg:
    mask = (~df_poke[col_leg]) & (df_poke['speed'] >= 120)
    nao_lendarios_rapidos = df_poke[mask][['name','type_1','speed', col_leg]].copy()
    nao_lendarios_rapidos.head(10)
else:
    print("‚ö†Ô∏è Coluna 'legendary' n√£o encontrada. Verifique df_poke.columns")



## 2) Fun√ß√µes √∫teis para compor filtros
### 2.1 `isin` ‚Äî pertence a uma lista


In [None]:

# üéØ Tipos alvo: Electric, Psychic, Dragon
alvos = ['Electric','Psychic','Dragon']
mask  = df_poke['type_1'].isin(alvos)
df_poke[mask][['name','type_1','attack','speed']].head(10)



### 2.2 `between` ‚Äî intervalo fechado [min, max]


In [None]:

# üéØ Attack entre 80 e 100 (inclusive), e Speed >= 80
mask = df_poke['attack'].between(80, 100) & (df_poke['speed'] >= 80)
df_poke[mask][['name','type_1','attack','speed']].head(10)



### 2.3 `str.contains` ‚Äî filtro de texto (com seguran√ßa contra NaN)


In [None]:

# üéØ Nomes que cont√™m 'mega' (qualquer caso), sem quebrar em valores NaN
mask_nome = df_poke['name'].astype(str).str.contains('mega', case=False, na=False)
df_poke[mask_nome][['name','type_1','attack','defense','speed']].head(10)



## 3) `.query()` como alternativa mais leg√≠vel
- Escreva condi√ß√µes como texto, semelhante a SQL.  
- Use `@variavel` para passar listas/valores Python.


In [None]:

# üéØ Exemplo com .query(): tipo em lista e ataque alto
tipos    = ['Fire','Ice']
ataque_corte = 100

resultado = df_poke.query("type_1 in @tipos and attack > @ataque_corte")[['name','type_1','attack','speed']].copy()
resultado.head(10)



## 4) M√°scaras booleanas reutiliz√°veis (c√≥digo limpo e leg√≠vel)


In [None]:

# üéØ Time ofensivo: Attack > 110 E Speed > 95, N√ÉO lend√°rio
col_leg = 'legendary' if 'legendary' in df_poke.columns else None

cond_ofensivo = (df_poke['attack'] > 110) & (df_poke['speed'] > 95)
cond_nao_leg  = ~df_poke[col_leg] if col_leg else True

mask_time = cond_ofensivo & cond_nao_leg
time_ofensivo = df_poke[mask_time].copy()

# Ordenamos para facilitar a escolha final
time_ofensivo = time_ofensivo.sort_values(by=['attack','speed'], ascending=False)
time_ofensivo[['name','type_1','attack','speed']].head(15)



## 5) Aplicando filtros compostos no dataset de Escolas (texto + OU/AND)


In [None]:

# üéØ Ex.: escolas em CAMPINAS OU SANTOS, com depend√™ncia ESTADUAL
if {'no_municipio','tp_dependencia'}.issubset(df_escolas.columns):
    cidades = ['CAMPINAS','SANTOS']
    mask_cidade = df_escolas['no_municipio'].isin(cidades)
    mask_dep    = df_escolas['tp_dependencia'].astype(str).str.upper().str.contains('ESTADUAL', na=False)

    escolas_alvo = df_escolas[mask_cidade & mask_dep][['no_entidade','no_municipio','tp_dependencia']].copy()
    print("Qtd escolas (Campinas ou Santos, Estadual):", escolas_alvo.shape[0])
    escolas_alvo.head(10)
else:
    print("‚ö†Ô∏è Verifique as colunas: no_municipio / tp_dependencia")



## ‚úÖ Mini-Lab (entregar no Classroom)
**Arquivo:** `UC22_Aula06_Pratica_SeuNome.ipynb`

### Parte 1 ‚Äî Pok√©mon
1. **Defensores √Ågeis:** Liste Pok√©mon com **defense ‚â• 100** **E** **speed ‚â• 90**. Mostre `name`, `type_1`, `defense`, `speed`, **ordenando** por `defense` (desc) e depois `speed` (desc).  
2. **Ataque ‚Äúna r√©gua‚Äù:** Selecione Pok√©mon com `attack` **entre 80 e 100** (inclusive) **OU** que sejam do tipo **Electric**. Mostre `name`, `type_1`, `attack`.  
3. **Filtro de texto seguro:** Encontre Pok√©mon cujo `name` contenha ‚Äúmega‚Äù (qualquer caso) **E** `attack > 100`. Mostre `name`, `type_1`, `attack`.  
4. **Listas de tipos:** Usando `isin`, filtre Pok√©mon cujo `type_1` perten√ßa a **['Water','Grass','Ground']** **E** `hp ‚â• 80`. Mostre `name`, `type_1`, `hp`.

### Parte 2 ‚Äî Escolas
1. Selecione escolas em **CAMPINAS OU SANTOS** **E** com `tp_dependencia` contendo **‚ÄúESTADUAL‚Äù** (mai√∫sculas). Mostre `no_entidade`, `no_municipio`, `tp_dependencia`.  
2. Se existir a coluna de **c√≥digo** (ex.: `co_entidade`), filtre escolas com c√≥digo **entre 35000000 e 35099999** **E** `no_municipio == 'S√ÉO PAULO'`. Mostre `co_entidade`, `no_entidade`, `no_municipio`.

> **Dica:** Crie **m√°scaras nomeadas** (ex.: `mask_cidade`, `mask_dep`) para deixar o c√≥digo claro.



### üìù Espa√ßo para suas respostas (execute os blocos e comente seus achados)


In [None]:

# üîß Resposta Pok√©mon 1 ‚Äî Defensores √Ågeis
mask = (df_poke['defense'] >= 100) & (df_poke['speed'] >= 90)
resp1 = df_poke[mask][['name','type_1','defense','speed']].copy().sort_values(['defense','speed'], ascending=[False, False])
print(resp1.shape)
resp1.head(15)


In [None]:

# üîß Resposta Pok√©mon 2 ‚Äî Attack 80‚Äì100 OU Electric
mask = df_poke['attack'].between(80, 100) | (df_poke['type_1'] == 'Electric')
resp2 = df_poke[mask][['name','type_1','attack']].copy()
print(resp2.shape)
resp2.head(15)


In [None]:

# üîß Resposta Pok√©mon 3 ‚Äî name cont√©m 'mega' E attack > 100
mask = df_poke['name'].astype(str).str.contains('mega', case=False, na=False) & (df_poke['attack'] > 100)
resp3 = df_poke[mask][['name','type_1','attack']].copy()
print(resp3.shape)
resp3.head(15)


In [None]:

# üîß Resposta Pok√©mon 4 ‚Äî tipos em lista E hp ‚â• 80
mask = df_poke['type_1'].isin(['Water','Grass','Ground']) & (df_poke['hp'] >= 80)
resp4 = df_poke[mask][['name','type_1','hp']].copy()
print(resp4.shape)
resp4.head(15)


In [None]:

# üîß Resposta Escolas 1 ‚Äî CAMPINAS OU SANTOS + Estadual
if {'no_municipio','tp_dependencia','no_entidade'}.issubset(df_escolas.columns):
    mask_cidade = df_escolas['no_municipio'].isin(['CAMPINAS','SANTOS'])
    mask_dep = df_escolas['tp_dependencia'].astype(str).str.upper().str.contains('ESTADUAL', na=False)
    resp_escolas1 = df_escolas[mask_cidade & mask_dep][['no_entidade','no_municipio','tp_dependencia']].copy()
    print(resp_escolas1.shape)
    resp_escolas1.head(15)
else:
    print("Verifique colunas: no_municipio, tp_dependencia, no_entidade")


In [None]:

# üîß Resposta Escolas 2 ‚Äî C√≥digo por faixa E munic√≠pio S√ÉO PAULO (se existir co_entidade)
if {'co_entidade','no_municipio','no_entidade'}.issubset(df_escolas.columns):
    mask_codigo = df_escolas['co_entidade'].between(35000000, 35099999)
    mask_mun = df_escolas['no_municipio'] == 'S√ÉO PAULO'
    resp_escolas2 = df_escolas[mask_codigo & mask_mun][['co_entidade','no_entidade','no_municipio']].copy()
    print(resp_escolas2.shape)
    resp_escolas2.head(15)
else:
    print("Colunas necess√°rias n√£o encontradas. Use df_escolas.columns para investigar.")



## üßØ Erros Comuns e Dicas
- **Faltam par√™nteses:** `cond1 & cond2` ‚Üí **sempre** `(cond1) & (cond2)`.  
- **`and`/`or`/`not`:** em Pandas, use `&`, `|`, `~` (os do Python l√≥gico n√£o funcionam entre Series).  
- **`KeyError`**: nome de coluna errado ‚Üí confira `df.columns`.  
- **`str.contains` com NaN:** use `na=False` e `astype(str)` para evitar erros.  
- **Tipos mistos:** ao comparar n√∫meros, garanta tipo num√©rico com `pd.to_numeric()` se necess√°rio.  
- **Filtro vazio:** n√£o √© erro; significa ‚Äúnenhuma linha atende √†s condi√ß√µes‚Äù.



## üìé Conclus√£o
Voc√™ aprendeu a **combinar condi√ß√µes** para criar filtros poderosos e leg√≠veis.  
Na **Aula 7**, vamos para **Agrupamentos com `groupby()`** ‚Äî m√©dias por tipo, contagens por categoria, top-N por grupo‚Ä¶ o cora√ß√£o das an√°lises comparativas!



---
*Notebook gerado em: 2025-09-12 12:59:02*
