# 🐼 Aprendendo Pandas

### Este notebook visa ensinar alguns módulos da essencial biblioteca do python "Pandas".

In [4]:
#Primeiramente, criemos nosso dataframe para que seja usado como exemplo.
import pandas as pd
colunas = ['Idade', 'Classe', 'Nível']
dados = [
    [21, 'Guerreiro', 7],
    [57, 'Mago', 15],
    [16, 'Escudeiro', 2],
    [12, 'Guerreiro', 20]]
df = pd.DataFrame(dados, columns = colunas)
df

Unnamed: 0,Idade,Classe,Nível
0,21,Guerreiro,7
1,57,Mago,15
2,16,Escudeiro,2
3,12,Guerreiro,20


## 🪙 1. Head/Tail
#### Primeiramente, vamos ver os módulos head e tail. Ambos servem para selecionar um dado n número de linha. Enquanto head seleciona as n primeiras linhas, tail seleciona as n últimas.

In [7]:
#Primeiro, vamos imprimir as 2 primeiras linhas:
print(df.head(2))
print('---------------------------')
#Agora, imprimamos a última linha:
print(df.tail(1))

   Idade     Classe  Nível
0     21  Guerreiro      7
1     57       Mago     15
---------------------------
   Idade     Classe  Nível
3     12  Guerreiro     20


## 📍 2. Iloc
#### O iloc é usado para selecionar dentro do dataframe linhas e colunas pelo índice.

In [17]:
#Iloc recebe dois parâmetros: iloc[linhas, colunas]
# Supondo que um monstro muito forte apareceu. A guilda deve selecionar os aventureiros baseados na classe 
#e nível. Desse modo, apliquemos iloc:
df.iloc[0:,1:3]

Unnamed: 0,Classe,Nível
0,Guerreiro,7
1,Mago,15
2,Escudeiro,2
3,Guerreiro,20


## 🙏 3. Concat/Merge
#### Caso tenhamos dois dataframes, podemos usar esses módulos para os juntar.

In [19]:
#Um veterano que estava fazenda uma longa missão voltou ao país:
colunas = ['Idade', 'Classe', 'Nível']
dados = [
    [37, 'Mago', 18]]
df2 = pd.DataFrame(dados, columns=colunas)

In [21]:
#A guilda precisa colocar ele na lista, para isso, utilizaremos concat:
df_novo = pd.concat([df, df2], ignore_index= True)
df_novo #Veja que o df_novo contém agora as informações do veterano também.

Unnamed: 0,Idade,Classe,Nível
0,21,Guerreiro,7
1,57,Mago,15
2,16,Escudeiro,2
3,12,Guerreiro,20
4,37,Mago,18


In [32]:
#Agora a guilda está solicitando as armas usadas por cada aventureiro. Suponhamos que não existem
#aventureiros com a mesma idade, portanto, eles podem ser identificados pela idade.
colunas = ['Idade', 'Arma']
dados = [
    [21, 'Espada'],
    [57, 'Cajado'],
    [16],
    [12, 'Ultra Greatsword'],
    [37, 'Espada pincél']]
df3 = pd.DataFrame(dados, columns=colunas)

#Agora, para adicionar a arma correspondente a cada aventureiro, usaremos o merge:
df = pd.merge(left=df_novo, right=df3, on='Idade', how='outer')
#left e right é a posição de cada dataframe, on é a interseção e how='outer' significa que é para manter
#linhas que tem objetos faltando
df

Unnamed: 0,Idade,Classe,Nível,Arma
0,12,Guerreiro,20,Ultra Greatsword
1,16,Escudeiro,2,
2,21,Guerreiro,7,Espada
3,37,Mago,18,Espada pincél
4,57,Mago,15,Cajado


## ❓ 4. Isnull
#### O módulo é usado para identificar se existem elementos faltantes.

In [36]:
#A guilda quer verificar se seus dados estão atualizados com todas as informações necessárias.
#Usaremos o módulo isnull, ele retorna False se o dado existe e True se estiver faltando
print(pd.isnull(df))
#Com isso, a guilda verificou que o escudeiro não declarou sua arma.

   Idade  Classe  Nível   Arma
0  False   False  False  False
1  False   False  False   True
2  False   False  False  False
3  False   False  False  False
4  False   False  False  False


## ↔️ 5. Get_dummies
#### O módulo é usado para entender quais elementos possuem o mesmo valor.

In [44]:
#A guilda precisa analisar a classe dos aventureiros disponíveis.
#Usaremos para isso get_dummies:
pd.get_dummies(df, columns=['Classe']) #O parâmetro columns seleciona as colunas a serem analisadas.
#A guilda com isso analisa a classe de cada um de seus elementos

Unnamed: 0,Idade,Nível,Arma,Classe_Escudeiro,Classe_Guerreiro,Classe_Mago
0,12,20,Ultra Greatsword,False,True,False
1,16,2,,True,False,False
2,21,7,Espada,False,True,False
3,37,18,Espada pincél,False,False,True
4,57,15,Cajado,False,False,True


## 🔝 6. Pivot
#### Esse módulo cria um dataframe com base em um atributo pivot

In [55]:
#A guilda precisa agora analisar uma correlação entre as armas e classes baseadas no nível.
#Para essa análise, usamos pivot, que separa os demais para cada pivot.
pd.pivot(df[['Nível','Arma', 'Classe']], columns='Nível') #columns, parâmetro para a coluna base da análise

Unnamed: 0_level_0,Arma,Arma,Arma,Arma,Arma,Classe,Classe,Classe,Classe,Classe
Nível,2,7,15,18,20,2,7,15,18,20
0,,,,,Ultra Greatsword,,,,,Guerreiro
1,,,,,,Escudeiro,,,,
2,,Espada,,,,,Guerreiro,,,
3,,,,Espada pincél,,,,,Mago,
4,,,Cajado,,,,,Mago,,


### Baseando-se nos módulos apresentados, espera-se que os aventureiros usem essas ferramentas para lhes ajudar nas próximas quests.

### Referências

Cassar, Daniel. LMA-203 1.0 - Tratamento de dados com pandas. Acesso em: 24 ago. 2025.