
# 📘 UC22 – Aula 9 — Visualização com **Matplotlib**

![Python](https://img.shields.io/badge/Python-3.11+-blue?logo=python)
![Pandas](https://img.shields.io/badge/Pandas-Data%20Visualization-green?logo=pandas)
![Matplotlib](https://img.shields.io/badge/Matplotlib-3.x-orange)
![Google Colab](https://img.shields.io/badge/Google%20Colab-Notebook-yellow?logo=googlecolab)
![Tempo](https://img.shields.io/badge/Dura%C3%A7%C3%A3o-90%20min-red)
![N%C3%ADvel](https://img.shields.io/badge/N%C3%ADvel-Iniciante%E2%9E%9CIntermedi%C3%81rio-purple)

**Turma:** 3º Ano – Ensino Médio Técnico em Informática  
**Tema:** Gráficos com Matplotlib a partir de DataFrames Pandas  
**Ferramenta principal:** Google Colab

> “Bons gráficos contam histórias que os números sozinhos não contam.” – IAra 📈



## 🎯 Objetivos de Aprendizagem
- Criar gráficos básicos com **Matplotlib** usando dados do **Pandas**.  
- Entender quando usar **barras, linhas, histogramas, boxplots e dispersão**.  
- Ajustar **títulos, rótulos de eixos, rotação** e **layout**.  
- Salvar figuras em arquivo (PNG) para entregar no Classroom.  
- Aplicar boas práticas de **clareza** e **simplicidade** (um gráfico por vez).



## 📂 Preparação do Ambiente (Google Drive)
Usaremos os mesmos arquivos das aulas anteriores em **`Meu Drive/UC22/`**:

- `pokemons_pokedex.csv`  
- `escolas_estaduais_censo_escolar_2023.csv`


In [None]:

# 📂 Montando o Google Drive
from google.colab import drive
drive.mount('/content/drive')

# 🐍 Importações essenciais
import pandas as pd
import matplotlib.pyplot as plt

# 🗂️ Caminhos (ajuste conforme sua pasta)
caminho_poke = "/content/drive/MyDrive/UC22/pokemons_pokedex.csv"
caminho_escolas = "/content/drive/MyDrive/UC22/escolas_estaduais_censo_escolar_2023.csv"

# 📥 Leitura dos datasets
df_poke = pd.read_csv(caminho_poke, encoding="utf-8")
df_escolas = pd.read_csv(caminho_escolas, encoding="latin-1", sep=",")

# 🧹 Padronização de nomes de colunas (snake_case)
df_poke.columns    = df_poke.columns.str.strip().str.lower().str.replace(" ", "_", regex=False)
df_escolas.columns = df_escolas.columns.str.strip().str.lower().str.replace(" ", "_", regex=False)

# 🔤 Padronização opcional para facilitar filtros de texto
if "no_municipio" in df_escolas.columns:
    df_escolas["no_municipio"] = df_escolas["no_municipio"].astype(str).str.strip().str.upper()

print("✅ Pokémon:", df_poke.shape, " | colunas:", len(df_poke.columns))
print("✅ Escolas:", df_escolas.shape, " | colunas:", len(df_escolas.columns))

# 👀 Conferir primeiras colunas
list(df_poke.columns)[:15]



## 🧠 Revisão (Aulas 5–8 → Aula 9)
- Já sabemos **filtrar** e **ordenar** dados, além de **agrupar** com `groupby()`.  
- Agora vamos **visualizar**: transformar tabelas em **gráficos compreensíveis**.



## 1) Fundamentos de **Matplotlib**
- Um gráfico por vez (sem subplots nesta aula).  
- Fluxo básico:
  1) Preparar os dados (filtrar, ordenar, agrupar).  
  2) Criar a figura.  
  3) Plotar.  
  4) Ajustar título, eixos, rótulos.  
  5) `plt.tight_layout()` e `plt.show()`.



## 2) 📊 Barras — comparar categorias
**Quando usar?** Comparar valores por categoria (ex.: quantidade por tipo).


In [None]:

# 🎯 Top 10 tipos por quantidade de Pokémon
contagem_tipo = df_poke['type_1'].value_counts().head(10)

plt.figure(figsize=(8,4))            # 1) criar figura
plt.bar(contagem_tipo.index, contagem_tipo.values)  # 2) plotar barras
plt.title("Top 10 tipos por quantidade de Pokémon") # 3) título
plt.xlabel("type_1")                                  # 4) rótulo eixo X
plt.ylabel("Quantidade")                              # 5) rótulo eixo Y
plt.xticks(rotation=45, ha="right")                   # 6) girar rótulos
plt.tight_layout()                                    # 7) ajustar layout
plt.show()                                            # 8) exibir



## 3) 📈 Linhas — evolução/ordem (ranking simples)
**Quando usar?** Evolução no tempo ou leitura ordenada (ranking suave).


In [None]:

# 🎯 Top 15 velocidades — linha para visualizar tendência decrescente
top_speed = df_poke.sort_values(by="speed", ascending=False).head(15)

plt.figure(figsize=(8,4))
plt.plot(range(len(top_speed)), top_speed["speed"])   # índice como eixo X
plt.title("Top 15 Pokémon por Velocidade (tendência)")
plt.xlabel("Posição no ranking (0–14)")
plt.ylabel("Speed")
plt.tight_layout()
plt.show()



## 4) 📊 Histograma — distribuição de valores
**Quando usar?** Entender como um atributo numérico se distribui.


In [None]:

# 🎯 Distribuição de Attack
plt.figure(figsize=(8,4))
plt.hist(df_poke["attack"].dropna(), bins=20)  # 20 faixas
plt.title("Distribuição de Attack (Pokémon)")
plt.xlabel("Attack")
plt.ylabel("Frequência")
plt.tight_layout()
plt.show()



## 5) 📦 Boxplot — resumo estatístico (mediana, quartis, outliers)
**Quando usar?** Comparar distribuição entre grupos ou ver outliers.


In [None]:

# 🎯 Boxplot simples — Attack
plt.figure(figsize=(6,4))
plt.boxplot(df_poke["attack"].dropna(), vert=True)
plt.title("Boxplot de Attack (Pokémon)")
plt.ylabel("Attack")
plt.tight_layout()
plt.show()



## 6) 🟣 Dispersão (scatter) — relação entre duas variáveis
**Quando usar?** Investigar correlação (ex.: Attack vs. Speed).


In [None]:

# 🎯 Relação entre Attack e Speed
amostra = df_poke.dropna(subset=["attack","speed"]).sample(min(200, len(df_poke)), random_state=42)

plt.figure(figsize=(6,4))
plt.scatter(amostra["attack"], amostra["speed"])
plt.title("Dispersão: Attack vs Speed (amostra)")
plt.xlabel("Attack")
plt.ylabel("Speed")
plt.tight_layout()
plt.show()



## 7) Aplicando em **Escolas** — ranking de municípios


In [None]:

# 🎯 Top 10 municípios com mais escolas
if "no_municipio" in df_escolas.columns:
    top10_mun = df_escolas["no_municipio"].value_counts().head(10)

    plt.figure(figsize=(8,4))
    plt.bar(top10_mun.index, top10_mun.values)
    plt.title("Top 10 municípios por número de escolas")
    plt.xlabel("Município")
    plt.ylabel("Quantidade")
    plt.xticks(rotation=45, ha="right")
    plt.tight_layout()
    plt.show()
else:
    print("⚠️ Coluna 'no_municipio' não encontrada.")



## 8) 💾 Salvando uma figura (PNG)


In [None]:

# 🎯 Exemplo: salvar o boxplot de Attack como PNG
plt.figure(figsize=(6,4))
plt.boxplot(df_poke["attack"].dropna())
plt.title("Boxplot de Attack (Pokémon)")
plt.ylabel("Attack")
plt.tight_layout()
plt.savefig("boxplot_attack.png", dpi=150)  # salva no diretório atual
plt.show()

print("Arquivo salvo: boxplot_attack.png")



## ✅ Checklist — Hoje você aprendeu
- A criar **barras, linhas, histogramas, boxplots e dispersão**.  
- A ajustar **títulos**, **rótulos** e **rotação** de eixos.  
- A **salvar** imagens para entregar no Classroom.  
- A partir de resultados de **filtro, ordenação e agrupamento**.



## 🧪 Mini-Lab (entregar no Classroom)
**Arquivo:** `UC22_Aula09_Pratica_SeuNome.ipynb`

### Parte 1 — Pokémon
1. **Barras:** Top 10 tipos (`type_1`) por **média de `attack`** (use `groupby` + `mean` e depois gráfico).  
2. **Histograma:** Distribuição de `speed` com **30 bins**.  
3. **Boxplot:** `defense` (comente o que observou: mediana, cauda, outliers).  
4. **Dispersão:** `hp` vs `defense` (amostra de até 300). O que percebe na relação?

### Parte 2 — Escolas
1. **Barras:** Top 10 municípios por **número de escolas**.  
2. **Barras:** Contagem por **`tp_dependencia`** (se existir).

> **Regra do curso:** use **matplotlib**, **um gráfico por célula**, **sem definir cores/estilos**.



### 📝 Espaço para suas respostas (execute os blocos e comente seus achados)


In [None]:

# 🔧 Resposta Pokémon 1 — Barras: média de attack por type_1 (Top 10)
media_attack_tipo = (
    df_poke.groupby('type_1')['attack'].mean().sort_values(ascending=False).head(10)
)

plt.figure(figsize=(8,4))
plt.bar(media_attack_tipo.index, media_attack_tipo.values)
plt.title("Top 10 tipos por média de Attack")
plt.xlabel("type_1")
plt.ylabel("Média de Attack")
plt.xticks(rotation=45, ha="right")
plt.tight_layout()
plt.show()


In [None]:

# 🔧 Resposta Pokémon 2 — Histograma de speed (30 bins)
plt.figure(figsize=(8,4))
plt.hist(df_poke['speed'].dropna(), bins=30)
plt.title("Histograma de Speed (Pokémon)")
plt.xlabel("Speed")
plt.ylabel("Frequência")
plt.tight_layout()
plt.show()


In [None]:

# 🔧 Resposta Pokémon 3 — Boxplot de defense
plt.figure(figsize=(6,4))
plt.boxplot(df_poke['defense'].dropna())
plt.title("Boxplot de Defense (Pokémon)")
plt.ylabel("Defense")
plt.tight_layout()
plt.show()


In [None]:

# 🔧 Resposta Pokémon 4 — Dispersão: hp vs defense (amostra até 300)
amostra = df_poke.dropna(subset=["hp","defense"]).sample(min(300, len(df_poke)), random_state=42)

plt.figure(figsize=(6,4))
plt.scatter(amostra['hp'], amostra['defense'])
plt.title("Dispersão: HP vs Defense (amostra)")
plt.xlabel("HP")
plt.ylabel("Defense")
plt.tight_layout()
plt.show()


In [None]:

# 🔧 Resposta Escolas 1 — Barras: Top 10 municípios (contagem)
if "no_municipio" in df_escolas.columns:
    top10_mun = df_escolas['no_municipio'].value_counts().head(10)
    plt.figure(figsize=(8,4))
    plt.bar(top10_mun.index, top10_mun.values)
    plt.title("Top 10 municípios por número de escolas")
    plt.xlabel("Município")
    plt.ylabel("Quantidade")
    plt.xticks(rotation=45, ha="right")
    plt.tight_layout()
    plt.show()
else:
    print("⚠️ Coluna 'no_municipio' não encontrada.")


In [None]:

# 🔧 Resposta Escolas 2 — Barras: contagem por tp_dependencia (se existir)
if "tp_dependencia" in df_escolas.columns:
    cont_dep = df_escolas['tp_dependencia'].astype(str).value_counts()
    plt.figure(figsize=(6,4))
    plt.bar(cont_dep.index, cont_dep.values)
    plt.title("Contagem por tp_dependencia")
    plt.xlabel("tp_dependencia")
    plt.ylabel("Quantidade")
    plt.xticks(rotation=45, ha="right")
    plt.tight_layout()
    plt.show()
else:
    print("⚠️ Coluna 'tp_dependencia' não encontrada.")



## 🧯 Erros Comuns e Dicas
- **Usar seaborn**: nesta UC, **não use**.  
- **Vários gráficos no mesmo plot**: evite; um gráfico por célula.  
- **Definir cores/estilos**: **não personalize** cores/tema.  
- **Texto cortado**: use `plt.xticks(rotation=...)` e `plt.tight_layout()`.  
- **Escalas confusas**: cheque se sua métrica está no eixo correto.



## 📎 Conclusão
Você aprendeu a transformar tabelas em gráficos claros usando **Matplotlib**: barras, linhas, histogramas, boxplots e dispersões.  
Com isso, conseguimos **comunicar insights** que vieram das aulas de filtros, ordenação e agrupamento.



---
*Notebook gerado em: 2025-09-12 13:35:41*
