
# 📘 UC22 – Aula 8 — Ordenação com `sort_values()` (Pandas)

![Python](https://img.shields.io/badge/Python-3.11+-blue?logo=python)
![Pandas](https://img.shields.io/badge/Pandas-sort_values-green?logo=pandas)
![Google Colab](https://img.shields.io/badge/Google%20Colab-Notebook-yellow?logo=googlecolab)
![Tempo](https://img.shields.io/badge/Dura%C3%A7%C3%A3o-90%20min-red)
![N%C3%ADvel](https://img.shields.io/badge/N%C3%ADvel-Iniciante%E2%9E%9CIntermedi%C3%81rio-purple)

**Turma:** 3º Ano – Ensino Médio Técnico em Informática  
**Tema:** Ordenação de dados em DataFrames com Pandas  
**Ferramenta principal:** Google Colab

> “Ordenar dados é como organizar a mochila: só quando tudo está no lugar certo conseguimos enxergar o que importa.” – IAra 🎒



## 🎯 Objetivos de Aprendizagem
- Usar `sort_values()` para ordenar **linhas**.  
- Ordenar de forma **crescente** e **decrescente**.  
- Ordenar por **uma** ou **múltiplas colunas** com critérios de desempate.  
- Aplicar ordenação em números e textos.  
- Combinar ordenação com seleção, filtros e agrupamentos.



## 📂 Preparação do Ambiente (Google Drive)
Usaremos os mesmos arquivos das aulas anteriores em **`Meu Drive/UC22/`**:

- `pokemons_pokedex.csv`  
- `escolas_estaduais_censo_escolar_2023.csv`


In [None]:

# 📂 Montando o Google Drive
from google.colab import drive
drive.mount('/content/drive')

# 🐍 Importações essenciais
import pandas as pd

# 🗂️ Definição dos caminhos (ajuste conforme sua pasta)
caminho_poke = "/content/drive/MyDrive/UC22/pokemons_pokedex.csv"
caminho_escolas = "/content/drive/MyDrive/UC22/escolas_estaduais_censo_escolar_2023.csv"

# 📥 Leitura dos datasets
# 1) Pokémon com UTF-8 (padrão)
# 2) Escolas com Latin-1 (acentos)
df_poke = pd.read_csv(caminho_poke, encoding="utf-8")
df_escolas = pd.read_csv(caminho_escolas, encoding="latin-1", sep=",")

# 🧹 Padronização de nomes de colunas (minúsculas, snake_case)
df_poke.columns    = df_poke.columns.str.strip().str.lower().str.replace(" ", "_", regex=False)
df_escolas.columns = df_escolas.columns.str.strip().str.lower().str.replace(" ", "_", regex=False)

# 🔤 Padronização opcional (facilita filtros e contagens)
if "no_municipio" in df_escolas.columns:
    df_escolas["no_municipio"] = df_escolas["no_municipio"].astype(str).str.strip().str.upper()

print("✅ Pokémon:", df_poke.shape, " | colunas:", len(df_poke.columns))
print("✅ Escolas:", df_escolas.shape, " | colunas:", len(df_escolas.columns))

# 👀 Conferir primeiras colunas
list(df_poke.columns)[:15]



## 1) Conceito de ordenação com `sort_values()`
`sort_values(by=...)` **reordena as linhas** do DataFrame de acordo com uma ou mais colunas.

**Sintaxe básica:**
```python
df.sort_values(by="coluna", ascending=True)  # crescente (padrão)
df.sort_values(by="coluna", ascending=False) # decrescente
```



## 2) Ordenação por **uma** coluna


In [None]:

# 🎯 Top 10 Pokémon mais rápidos
# Passo a passo:
# 1) Ordenamos por 'speed' em ordem decrescente (maiores primeiro).
# 2) Selecionamos colunas essenciais para leitura.
# 3) Pegamos as 10 primeiras linhas com .head(10).

top_speed = (
    df_poke.sort_values(by="speed", ascending=False)[["name","type_1","speed"]]
            .head(10)
)
top_speed



## 3) Ordenação por **múltiplas** colunas (com desempate)


In [None]:

# 🎯 Ordenar primeiro por 'type_1' (A→Z), depois por 'attack' (desc)
# Comentários:
# - Quando há empate em 'type_1', 'attack' decide a ordem.
# - 'ascending' aceita lista com o mesmo comprimento de 'by'.

por_tipo_ataque = (
    df_poke.sort_values(by=["type_1","attack"], ascending=[True, False])
           [["name","type_1","attack"]]
           .head(15)
)
por_tipo_ataque



## 4) Critérios de desempate explícitos


In [None]:

# 🎯 Empate por 'attack' resolvido com 'speed' (ambos desc)
desempate = (
    df_poke.sort_values(by=["attack","speed"], ascending=[False, False])
           [["name","attack","speed"]]
           .head(15)
)
desempate



## 5) Ordenando textos (strings)


In [None]:

# 🎯 Primeiros Pokémon em ordem alfabética
alfabetica = (
    df_poke.sort_values(by="name", ascending=True)[["name","type_1","attack"]]
           .head(15)
)
alfabetica



## 6) Aplicando ordenação no dataset de Escolas


In [None]:

# 🎯 Top 10 municípios com maior quantidade de escolas
# Estratégia:
# 1) Contar ocorrências de cada município (value_counts).
# 2) Ordenar em ordem decrescente (maiores primeiro).
# 3) Mostrar os 10 primeiros.

top10_municipios = (
    df_escolas["no_municipio"].value_counts()
               .sort_values(ascending=False)
               .head(10)
)
top10_municipios



## 7) (Opcional) Visualizando um ranking simples


In [None]:

# 📈 Gráfico simples (sem estilos) — Top 10 velocidades
# Regras do curso: usar matplotlib, um gráfico por vez, sem definir cores.

import matplotlib.pyplot as plt

top10_speed = df_poke.sort_values(by="speed", ascending=False).head(10)

plt.figure(figsize=(8,4))
plt.bar(top10_speed["name"], top10_speed["speed"])
plt.title("Top 10 Pokémon por Velocidade")
plt.xlabel("Pokémon")
plt.ylabel("Speed")
plt.xticks(rotation=45, ha="right")
plt.tight_layout()
plt.show()



## ✅ Checklist — Hoje você aprendeu
- Ordenar por **uma** coluna (crescente/decrescente).  
- Ordenar por **múltiplas** colunas com critérios de desempate.  
- Ordenar **strings** alfabeticamente.  
- Aplicar ordenação em **datasets diferentes** (Pokémon e Escolas).



## 🧪 Mini-Lab (entregar no Classroom)
**Arquivo:** `UC22_Aula08_Pratica_SeuNome.ipynb`

### Parte 1 — Pokémon
1. Liste os **10 Pokémon com maior `attack`**.  
2. Mostre os **10 Pokémon com maior `defense`** (ordem decrescente).  
3. Liste os **15 Pokémon mais rápidos** com `name`, `type_1`, `speed`.  
4. Ordene todos os Pokémon por `type_1` (A–Z) **e** `hp` (desc).

### Parte 2 — Escolas
1. Ordene alfabeticamente os nomes das escolas (`no_entidade`) e mostre os **20 primeiros**.  
2. Descubra os **10 municípios com mais escolas** e exiba em ordem decrescente.

> **Dica:** sempre confira `df.columns` antes de ordenar.



### 📝 Espaço para suas respostas (execute os blocos e comente seus achados)


In [None]:

# 🔧 Resposta Pokémon 1 — Top 10 por attack
resp1 = df_poke.sort_values(by="attack", ascending=False)[["name","type_1","attack"]].head(10)
resp1


In [None]:

# 🔧 Resposta Pokémon 2 — Top 10 por defense (decrescente)
resp2 = df_poke.sort_values(by="defense", ascending=False)[["name","type_1","defense"]].head(10)
resp2


In [None]:

# 🔧 Resposta Pokémon 3 — Top 15 por speed
resp3 = df_poke.sort_values(by="speed", ascending=False)[["name","type_1","speed"]].head(15)
resp3


In [None]:

# 🔧 Resposta Pokémon 4 — Ordenar por type_1 (A–Z) e hp (desc)
resp4 = df_poke.sort_values(by=["type_1","hp"], ascending=[True, False])[["name","type_1","hp"]]
resp4.head(20)


In [None]:

# 🔧 Resposta Escolas 1 — no_entidade em ordem alfabética (20 primeiros)
if "no_entidade" in df_escolas.columns:
    resp_escolas1 = df_escolas.sort_values(by="no_entidade", ascending=True)[["no_entidade"]].head(20)
    resp_escolas1
else:
    print("⚠️ Coluna 'no_entidade' não encontrada em df_escolas.")


In [None]:

# 🔧 Resposta Escolas 2 — Top 10 municípios por número de escolas (desc)
if "no_municipio" in df_escolas.columns:
    resp_escolas2 = (
        df_escolas["no_municipio"].value_counts()
                 .sort_values(ascending=False)
                 .head(10)
    )
    resp_escolas2
else:
    print("⚠️ Coluna 'no_municipio' não encontrada em df_escolas.")



## 🧯 Erros Comuns e Dicas
- **Coluna não encontrada**: confira com `df.columns`.  
- **Números como texto**: converta com `pd.to_numeric(col, errors="coerce")`.  
- **Alterar o DataFrame original**: `inplace=True` modifica a tabela; prefira atribuir a uma variável.  
- **Empates**: adicione mais colunas em `by=["col1","col2"]` para desempatar.



## 📎 Conclusão
Você aprendeu a **ordenar** dados com `sort_values()` e a construir **rankings** úteis para análise.  
No próximo encontro, vamos **visualizar** essas informações com **Matplotlib** para criar gráficos claros e objetivos.



---
*Notebook gerado em: 2025-09-12 13:24:11*
