# Análise de dados - Pokemon

Fonte de dados: https://github.com/KeithGalli/pandas


# Questões:

1. Quantos pokemons existem (segundo a base de dados)?
1. Quantos tipos primários e secundários de poder existem?
1. Qual tipo de poder é mais atribuído aos pokemons?
1. Quantas gerações existem?
1. Qual geração possui mais pokemons?
1. Qual ou quais pokemons possuem a maior nota de Attack?
1. Qual ou quais pokemons possuem a MAIOR somatória de Attack e Defense?
    1. Qual o top 3 pokemons, considerando a soma das notas de Attack e Defense?
1. Qual ou quais pokemons possuem a MENOR somatória de Attack e Defense?
    1. Qual os 3 mais inferiores pokemons, considerando a soma das notas de Attack e Defense?
1. Quais os pokemons legendários? Quantos são?
1. Quantos pokemons possuem mais de 1 tipo de poder?

In [30]:
import pandas as pd
import plotly.express as px

In [31]:
df = pd.read_csv('pokemon.csv')
df.head()

Unnamed: 0,#,Name,Type 1,Type 2,HP,Attack,Defense,Sp. Atk,Sp. Def,Speed,Generation,Legendary
0,1,Bulbasaur,Grass,Poison,45,49,49,65,65,45,1,False
1,2,Ivysaur,Grass,Poison,60,62,63,80,80,60,1,False
2,3,Venusaur,Grass,Poison,80,82,83,100,100,80,1,False
3,3,VenusaurMega Venusaur,Grass,Poison,80,100,123,122,120,80,1,False
4,4,Charmander,Fire,,39,52,43,60,50,65,1,False


## 1 - Quantos pokemons existem?

In [32]:
df['#'].describe()

count    800.000000
mean     362.813750
std      208.343798
min        1.000000
25%      184.750000
50%      364.500000
75%      539.250000
max      721.000000
Name: #, dtype: float64

In [33]:
df.describe()

Unnamed: 0,#,HP,Attack,Defense,Sp. Atk,Sp. Def,Speed,Generation
count,800.0,800.0,800.0,800.0,800.0,800.0,800.0,800.0
mean,362.81375,69.25875,79.00125,73.8425,72.82,71.9025,68.2775,3.32375
std,208.343798,25.534669,32.457366,31.183501,32.722294,27.828916,29.060474,1.66129
min,1.0,1.0,5.0,5.0,10.0,20.0,5.0,1.0
25%,184.75,50.0,55.0,50.0,49.75,50.0,45.0,2.0
50%,364.5,65.0,75.0,70.0,65.0,70.0,65.0,3.0
75%,539.25,80.0,100.0,90.0,95.0,90.0,90.0,5.0
max,721.0,255.0,190.0,230.0,194.0,230.0,180.0,6.0


In [34]:
quant = df['#'].count()
print(f"Existem {quant} pokemons segundo essa base de dados.")


Existem 800 pokemons segundo essa base de dados.


## 2 - Quantos tipos primários e secundários de poder existem?

In [35]:
tipo_1 = df['Type 1'].nunique()
print(f"Existem {tipo_1} tipos primários de poder.")

Existem 18 tipos primários de poder.


In [36]:
tipo_2 = df['Type 2'].nunique()
print(f"Existem {tipo_2} tipos secundários de poder.")

Existem 18 tipos secundários de poder.


## 3 - Qual tipo de poder é mais atribuído aos pokemons?

In [38]:
type1 = (df.
         groupby('Type 1')['#'].count()
         .reset_index()
         .rename(columns = {'Type 1':'Type', '#':'contagem'})
         .sort_values(by='contagem',ascending=False)
        )
type2 = (df.groupby('Type 2')['#'].count()
         .reset_index()
         .rename(columns = {'Type 2':'Type','#':'contagem'})
         .sort_values(by='contagem',ascending=False)
        )
type12_concat = pd.concat([type1,type2], ignore_index=True)
type12_concat = (type12_concat
                .groupby('Type')['contagem']
                .sum()
                .reset_index()
                )
type12_concat = type12_concat.sort_values(by='contagem',ascending = False)
type12_concat.head()

Unnamed: 0,Type,contagem
17,Water,126
12,Normal,102
7,Flying,101
9,Grass,95
14,Psychic,90


Tipo Primário:

In [39]:
gr1 = px.bar(type1,
             x='Type',
             y='contagem'
            )
gr1 = gr1.update_traces(text = type1['contagem'],marker_color = 'pink')
gr1 = gr1.update_layout(title='Tipo primário de poder')
gr1

In [40]:
t1 = df['Type 1'].mode()[0].upper()
print(f"O tipo primário \033[1m{t1}\033[m possui maior número de usuários pokemons.")

O tipo primário [1mWATER[m possui maior número de usuários pokemons.


Tipo Secundário:

In [41]:
t2 = df['Type 2'].mode()[0].upper()
print(f"O tipo secundário \033[1m{t2}\033[m possui maior número de usuários pokemons.")

O tipo secundário [1mFLYING[m possui maior número de usuários pokemons.


In [42]:
gr2 = px.bar(type2,
            x='Type',
            y='contagem'
            )
gr2 = gr2.update_traces(text = type2['contagem'], marker_color = 'pink')
gr2 = gr2.update_layout(title = 'Tipo secundário de poder')
gr2

**Atribuição de poderes no geral**

In [43]:
gr3 = px.bar(type12_concat,
            x='Type',
            y='contagem')
gr3 = gr3.update_traces(text = type12_concat['contagem'], marker_color = 'pink')
gr3 = gr3.update_layout(title='Frequência total de poderes atribuídos aos personagens')
gr3

O poder mais atribuído aos pokemons é do tipo **Água**

## 4 - Quantas gerações existem?

In [44]:
n_g = df["Generation"].nunique()
print(f"Existem \033[1m{n_g}\033[m gerações.")

Existem [1m6[m gerações.


## 5 - Qual geração possui mais pokemons?

In [45]:
df["Generation"].value_counts().reset_index()

Unnamed: 0,index,Generation
0,1,166
1,5,165
2,3,160
3,4,121
4,2,106
5,6,82


In [46]:
r5 = df["Generation"].mode()[0]
print(f"A geração que mais possui pokemons é a \033[1m{r5}°")

A geração que mais possui pokemons é a [1m1°


## 6 - Qual ou quais pokemons possuem a maior nota de Attack?

### Top 3 com maiores notas de Attack:

In [47]:
df.nlargest(3,'Attack')

Unnamed: 0,#,Name,Type 1,Type 2,HP,Attack,Defense,Sp. Atk,Sp. Def,Speed,Generation,Legendary
163,150,MewtwoMega Mewtwo X,Psychic,Fighting,106,190,100,154,100,130,1,True
232,214,HeracrossMega Heracross,Bug,Fighting,80,185,115,40,105,75,2,False
424,383,GroudonPrimal Groudon,Ground,Fire,100,180,160,150,90,90,3,True


### TOP 1 - Nota de attack

In [48]:
max_attack = df["Attack"].max()
df_max = df[df["Attack"]== max_attack]
df_max

Unnamed: 0,#,Name,Type 1,Type 2,HP,Attack,Defense,Sp. Atk,Sp. Def,Speed,Generation,Legendary
163,150,MewtwoMega Mewtwo X,Psychic,Fighting,106,190,100,154,100,130,1,True


Qual ou quais pokemons possuem a menor nota de attack?

In [49]:
min_attack = df["Attack"].min()
df_min = df[df["Attack"] == min_attack]
df_min

Unnamed: 0,#,Name,Type 1,Type 2,HP,Attack,Defense,Sp. Atk,Sp. Def,Speed,Generation,Legendary
121,113,Chansey,Normal,,250,5,5,35,105,50,1,False
488,440,Happiny,Normal,,100,5,5,15,65,30,4,False


## 7 - Qual ou quais pokemons possuem a MAIOR somatória de Attack e Defense?
Qual o top 3 pokemons, considerando a soma das notas de Attack e Defense?

In [50]:
df7 = pd.DataFrame() #Cria um novo df
df7["name"] = df["Name"]
df7["soma_attack_defense"] = df['Attack'] + df['Defense'] 
df7

Unnamed: 0,name,soma_attack_defense
0,Bulbasaur,98
1,Ivysaur,125
2,Venusaur,165
3,VenusaurMega Venusaur,223
4,Charmander,95
...,...,...
795,Diancie,250
796,DiancieMega Diancie,270
797,HoopaHoopa Confined,170
798,HoopaHoopa Unbound,220


In [51]:
top3 = df7.nlargest(3,"soma_attack_defense")
print("\033[1m Os 3 Pokemons com maior somatório das notas de attack e defense são:")
top3

[1m Os 3 Pokemons com maior somatório das notas de attack e defense são:


Unnamed: 0,name,soma_attack_defense
333,AggronMega Aggron,370
224,SteelixMega Steelix,355
424,GroudonPrimal Groudon,340


## 8 - Qual ou quais pokemons possuem a MENOR somatória de Attack e Defense?
Quais os 3 pokemons mais inferiores, considerando a soma das notas de Attack e Defense?

In [52]:
inf3 = df7.nsmallest(3,'soma_attack_defense')
print("\033[1m Os 3 Pokemons com menor somatório das notas de attack e defense são:")
inf3

[1m Os 3 Pokemons com menor somatório das notas de attack e defense são:


Unnamed: 0,name,soma_attack_defense
121,Chansey,10
488,Happiny,10
261,Blissey,20


## 9 - Quais os pokemons legendários? Quantos são?

In [53]:
print("\033[1mPokemons legendários:")
df[df["Legendary"]==True]

[1mPokemons legendários:


Unnamed: 0,#,Name,Type 1,Type 2,HP,Attack,Defense,Sp. Atk,Sp. Def,Speed,Generation,Legendary
156,144,Articuno,Ice,Flying,90,85,100,95,125,85,1,True
157,145,Zapdos,Electric,Flying,90,90,85,125,90,100,1,True
158,146,Moltres,Fire,Flying,90,100,90,125,85,90,1,True
162,150,Mewtwo,Psychic,,106,110,90,154,90,130,1,True
163,150,MewtwoMega Mewtwo X,Psychic,Fighting,106,190,100,154,100,130,1,True
...,...,...,...,...,...,...,...,...,...,...,...,...
795,719,Diancie,Rock,Fairy,50,100,150,100,150,50,6,True
796,719,DiancieMega Diancie,Rock,Fairy,50,160,110,160,110,110,6,True
797,720,HoopaHoopa Confined,Psychic,Ghost,80,110,60,150,130,70,6,True
798,720,HoopaHoopa Unbound,Psychic,Dark,80,160,60,170,130,80,6,True


In [54]:
legendario = (df["Legendary"]==True).sum()
print(f"São \033[1m{legendario}\033[m pokemons legendários.")

São [1m65[m pokemons legendários.


## 10 - Quantos pokemons possuem mais de 1 tipo de poder?

In [55]:
type_nulo = df['Type 2'].isnull()
type_nulo.head()

0    False
1    False
2    False
3    False
4     True
Name: Type 2, dtype: bool

In [56]:
type2_nulo = df["Type 2"].isnull().sum()
print(f"{type2_nulo} pokemons não possuem 2 tipos de poder")

386 pokemons não possuem 2 tipos de poder


In [57]:
contador = 0
for valor in df['Type 2']:
    if pd.isnull(valor):
        cont = 0
    else:
        contador = contador + 1
        
print(f"{contador} pokemons possuem 2 tipos de poder.")

414 pokemons possuem 2 tipos de poder.
