
# 📘 UC22 – Ciências de Dados  
## 🌟 Guia do 3º Trimestre – Versão para Alunos (Colab)

🎓 **Turma:** 3º Ano do Ensino Médio Técnico em Informática  
👨‍🏫 **Professor:** André Ricardo  
📌 **Tema:** *“Se tornar um Cientista Pokémon”*  

> Use este notebook como **roteiro prático** do trimestre. Cada aula tem explicações, exemplos e **Missões Pokémon**.  
> Preencha as respostas solicitadas em **células de texto** e **execute os códigos** nas células de código.



---
## ⚙️ Preparação do Ambiente (execute estas células primeiro)


In [None]:

# Se estiver no Google Colab, descomente a linha abaixo para usar o upload manual do CSV
# from google.colab import files

import pandas as pd
import matplotlib.pyplot as plt

# Configurações opcionais de exibição
pd.set_option('display.max_columns', None)
pd.set_option('display.width', 120)



### 📂 Carregar o dataset `pokemons_pokedex.csv`

Escolha **uma** das opções abaixo:

1) **Enviar (upload) manualmente** o arquivo `pokemons_pokedex.csv` do seu computador.  
2) **Ler de uma URL** (se seu professor disponibilizar um link).  
3) **Ler de um caminho local** já disponível no ambiente.


In [None]:

# 🔄 OPÇÃO 1: Upload manual (COLAB)
# Descomente para usar no Colab:
# uploaded = files.upload()  # selecione o arquivo pokemons_pokedex.csv
# import io
# df = pd.read_csv(io.BytesIO(uploaded['pokemons_pokedex.csv']))

# 🔗 OPÇÃO 2: URL (se houver)
# url = "https://SEU_LINK_AQUI/pokemons_pokedex.csv"
# df = pd.read_csv(url)

# 📁 OPÇÃO 3: Caminho local (por exemplo, se o arquivo já estiver no ambiente)
# Ajuste o caminho conforme necessário (no Colab, faça upload e use o nome do arquivo)
df = pd.read_csv("pokemons_pokedex.csv")

# Verifique rapidamente
df.head()



---
# 🔹 Módulo 1 – Revisão e Introdução aos Dados (Aulas 1 a 3)

### 🎯 Objetivos
- Entender **dados abertos** e **CSV**  
- Carregar e **explorar** um dataset com **Pandas**  
- Conhecer funções básicas: `read_csv`, `head`, `info`, `shape`



## 📍 Aula 1 – Revisão + Dados Abertos
**Tarefa:** Execute o código de exemplo e descreva (em 2–3 linhas) o que você observa.


In [None]:

# Exemplo simples usando o DataFrame já carregado (df)
print("Dimensões do dataset (linhas, colunas):", df.shape)
print("\nColunas disponíveis:")
print(df.columns.tolist())

# Visualize as 5 primeiras linhas
df.head()



**Resposta (escreva aqui):**  
> _Explique o que significam as dimensões e cite 3 colunas interessantes e por quê._



## 📍 Aula 2 – Estrutura de Arquivos CSV
**Conceitos:** separadores, cabeçalho, acentuação, codificação.  
**Exercício:** Mostre o número de valores **únicos** em cada coluna chave.


In [None]:

# Conte valores únicos em colunas selecionadas (ajuste conforme seu CSV)
colunas_chave = ['Name', 'Type 1', 'Type 2', 'Generation', 'Legendary']
for c in colunas_chave:
    if c in df.columns:
        print(f"{c}: {df[c].nunique()} valores únicos")



## 📍 Aula 3 – Primeiros Passos com Pandas


In [None]:

# Explorando estrutura
print("Informações gerais do DataFrame:")
print(df.info())

print("\nEstatísticas descritivas (numéricas):")
df.describe()



🎮 **Missão Pokémon (Módulo 1):**  
1) Quantos **Pokémon Lendários** existem?  
2) Liste **3** Pokémon que chamaram sua atenção (e explique por quê).  

_Escreva suas respostas nesta célula._



---
# 🔹 Módulo 2 – Manipulação de Dados (Aulas 4 a 9)

### 🎯 Objetivos
- Selecionar colunas  
- Aplicar filtros simples e compostos  
- Agrupar e ordenar dados  
- Criar gráficos básicos com **Matplotlib**



## 📍 Aula 4 – Seleção de Colunas
**Exemplo:** selecionar apenas `Name`, `Type 1`, `Attack`.


In [None]:

df[['Name', 'Type 1', 'Attack']].head()



**Tente você:** Mostre apenas as colunas **Name**, **Type 1** e **Speed**.


In [None]:

# Sua solução aqui:
df[['Name', 'Type 1', 'Speed']].head()



## 📍 Aula 5 – Filtros Simples
**Exemplo:** Pokémon do **tipo Elétrico** com **Speed > 80**.


In [None]:

eletricos_rapidos = df[(df['Type 1'] == 'Electric') & (df['Speed'] > 80)]
eletricos_rapidos.head()



**Tente você:** Quantos Pokémon do **tipo Fogo** têm **Attack > 90**?


In [None]:

# Sua solução:
fogo_fortes = df[(df['Type 1'] == 'Fire') & (df['Attack'] > 90)]
len(fogo_fortes), fogo_fortes[['Name','Attack']].head()



## 📍 Aula 6 – Filtros Compostos
**Exemplo:** Pokémon do **tipo Água** com **Speed > 70** e **Defense < 60**.


In [None]:

agua_condicoes = df[(df['Type 1'] == 'Water') & (df['Speed'] > 70) & (df['Defense'] < 60)]
agua_condicoes.head()



🎮 **Missão Pokémon:** Monte um **time defensivo** (alta defesa + ataque baixo).  
Dica: Defense >= 90 e Attack <= 70 (ajuste como quiser).  
Mostre os **10 primeiros**.


In [None]:

time_defensivo = df[(df['Defense'] >= 90) & (df['Attack'] <= 70)].sort_values(by='Defense', ascending=False)
time_defensivo[['Name','Type 1','Defense','Attack']].head(10)



## 📍 Aula 7 – Agrupamentos com `groupby()`
**Exemplo:** médias de **Attack**, **Speed** e **HP** por **Type 1**.


In [None]:

media_por_tipo = df.groupby('Type 1')[['Attack', 'Speed', 'HP']].mean().sort_values(by='Attack', ascending=False)
media_por_tipo.head(10)



**Tente você:** Qual **tipo** tem a maior **média de HP**?


In [None]:

df.groupby('Type 1')['HP'].mean().sort_values(ascending=False).head(10)



## 📍 Aula 8 – Ordenação com `sort_values()`
**Exemplo:** Top 10 em **Speed**.


In [None]:

top_10_speed = df.sort_values(by='Speed', ascending=False).head(10)
top_10_speed[['Name','Type 1','Speed']]



**Tente você:** Descubra o Pokémon com **maior Attack**.


In [None]:

df.sort_values(by='Attack', ascending=False)[['Name','Type 1','Attack']].head(1)



## 📍 Aula 9 – Gráficos (Matplotlib)
**Exemplo:** Quantidade de Pokémon por **Type 1**.


In [None]:

df['Type 1'].value_counts().plot(kind='bar')
plt.title("Quantidade de Pokémon por Tipo (Type 1)")
plt.xlabel("Tipo")
plt.ylabel("Quantidade")
plt.show()



🎮 **Missão Pokémon:** Crie um gráfico de **pizza** mostrando a proporção de **Pokémon Lendários**.


In [None]:

if 'Legendary' in df.columns:
    df['Legendary'].value_counts().plot(kind='pie', autopct='%1.1f%%')
    plt.title("Proporção de Pokémon Lendários")
    plt.ylabel("")
    plt.show()
else:
    print("Coluna 'Legendary' não encontrada no dataset.")



---
# 🔹 Módulo 3 – Higienização e Padronização (Aulas 10 a 12)

### 🎯 Objetivos
- Detectar e tratar **dados nulos**  
- **Padronizar textos** para evitar inconsistências



## 📍 Aula 10 – Detectando Dados Nulos


In [None]:

df.isnull().sum()



## 📍 Aula 11 – Tratando Nulos
**Exemplo:** preencher `Speed` ausente com a **média**.


In [None]:

if 'Speed' in df.columns:
    df['Speed'] = df['Speed'].fillna(df['Speed'].mean())
    df['Speed'].isnull().sum()
else:
    print("Coluna 'Speed' não encontrada.")



## 📍 Aula 12 – Padronização de Texto
**Exemplo:** padronizar `Type 1` com a primeira letra maiúscula.


In [None]:

if 'Type 1' in df.columns:
    df['Type 1'] = df['Type 1'].astype(str).str.strip().str.capitalize()
    sorted(df['Type 1'].unique())
else:
    print("Coluna 'Type 1' não encontrada.")



🎮 **Missão Pokémon (Módulo 3):**  
1) Mostre quantos **tipos únicos** existem após a padronização.  
2) Verifique se existem **espaços em branco** no início/fim dos nomes de Pokémon e corrija.


In [None]:

# (2) Remover espaços no início/fim dos nomes, se houver
if 'Name' in df.columns:
    antes = df['Name'].nunique()
    df['Name'] = df['Name'].astype(str).str.strip()
    depois = df['Name'].nunique()
    print("Únicos antes:", antes, "| únicos depois:", depois)
else:
    print("Coluna 'Name' não encontrada.")



---
# 🔹 Módulo 4 – Consolidação e Avaliação (Aulas 13 a 16)

- **Revisão prática** no Colab (exercícios integrados)  
- **Avaliação teórica** (conceitos e sintaxe)  
- **Estudo de caso Pokémon**: velocidade, tipos, gerações



### 🧪 Desafio Integrador (Exemplo)
1) Liste os **Top 5** Pokémon em **Speed** e **Attack** (duas tabelas separadas).  
2) Mostre a **média de HP por geração** em um **gráfico de barras**.


In [None]:

# (1) Top 5 em Speed e Attack
top5_speed = df.sort_values(by='Speed', ascending=False).head(5)[['Name','Type 1','Speed']]
top5_attack = df.sort_values(by='Attack', ascending=False).head(5)[['Name','Type 1','Attack']]

print("Top 5 Speed")
display(top5_speed)
print("\nTop 5 Attack")
display(top5_attack)

# (2) Média de HP por geração
if 'Generation' in df.columns:
    media_hp_gen = df.groupby('Generation')['HP'].mean()
    media_hp_gen.plot(kind='bar')
    plt.title("Média de HP por Geração")
    plt.xlabel("Geração")
    plt.ylabel("HP médio")
    plt.show()
else:
    print("Coluna 'Generation' não encontrada.")



---
# 🔹 Módulo 5 – Projeto Final: Pokédex Científica (Aulas 17 a 20)

### 🎯 Objetivo
Criar, em grupos, uma **Pokédex Científica** com **tabelas, gráficos e conclusões** em linguagem natural.



## 🧭 Roteiro do Projeto (Sugestão)
1) Escolha do tema do grupo: **Ataque**, **Defesa**, **Velocidade**, **Tipos** ou **Evoluções**  
2) Geração de **pelo menos 3 tabelas** e **2 gráficos** relevantes  
3) Escrita de **conclusões** (5–8 frases) explicando **o que os dados mostram**  
4) **Apresentação** breve (3–5 minutos) com os principais achados



## 📝 Estrutura do Relatório (modelo rápido)
- **Título do Grupo & Tema**  
- **Perguntas de Pesquisa** (ex.: *Quais são os tipos mais comuns?*)  
- **Metodologia** (quais filtros, agrupamentos, ordenações foram usados)  
- **Resultados** (tabelas + gráficos)  
- **Conclusões** (em linguagem natural)  
- **Créditos do grupo**


----
### Dicas finais
- Comente seus códigos com # explicações
- Salve seu notebook com frequência
- Revise se seus gráficos têm título e rótulos de eixos
- Valide as conclusões com os dados

Gerado em: 2025-09-09