**O objetivo deste notebook é fornecer uma análise exploratória de dados, utilizando dos métodos e bibliotecas estudados no curso de Ciências de Dados do IESB - Asa Sul, Turma 4, na disciplina P8967-CDNC-20184 (Ferramentas de Software para uso em Ciência de Dados II), com intuido de compor a nota total da disciplina. Disciplina ministrada pelo Prof. Marcos Guimarães
**

*Segue abaixo descrição fornecida por Alberto Barradas, usuário que disponibilizou o data set pelo link https://www.kaggle.com/abcsds/pokemon*

> "Este conjunto de dados inclui 721 Pokemon, incluindo seu número, nome, primeiro e segundo tipo e estatísticas básicas: HP, ataque, defesa, ataque especial, defesa especial e velocidade. Tem sido de grande utilidade ao ensinar estatísticas para crianças. Com certos tipos, você também pode dar uma introdução nerd ao aprendizado de máquina. Esses são os atributos brutos usados ​​para calcular quanto dano um ataque causará nos jogos. Este conjunto de dados é sobre os jogos de pokemon (NÃO cartões de Pokemon ou Pokemon Go).
> 
> Os dados descritos por Myles O'Neill são:
> 
> * **#: ID** para cada pokemon
> * **Nome:** Nome de cada pokemon
> * **Tipo 1:** Cada pokemon tem um tipo, isso determina fraqueza / resistência a ataques
> **Tipo 2:** Alguns pokemon são do tipo dual e têm 2
> * **Total:** soma de todas as estatísticas que vêm depois disso, um guia geral de quão forte é um pokemon
> * **HP:** pontos de vida, ou saúde, define quanto dano um pokemon pode suportar antes de desmaiar
> * **Ataque:** o modificador base para ataques normais (por exemplo, Scratch, Punch)
> * **Defesa:** a resistência ao dano base contra ataques normais
> * **SP Atk:** ataque especial, o modificador base para ataques especiais (por exemplo, explosão de fogo, raio de bolha)
> * **SP Def:** a resistência ao dano base contra ataques especiais
> * **Velocidade:** determina qual pokemon ataca primeiro a cada rodada
> 
> 
> Os dados desta tabela foram adquiridos de vários sites diferentes, incluindo:
> 
> * pokemon.com
> * pokemondb
> * bulapedia

  

**Análise desenvolvida por Alexander Cajueiro, matrícula 1831133138.**

Obs.: Nesta base de dados, os valores nulos não são ruídos, eles apenas indicam que os Pokémon não possuem um tipo secundário. Dito isso, não foi realizado tratamento para nulidade.

In [None]:
## Código gerado automaticamente pelo Kaggle.
## Incluídas importações de outras bibliotecas também.
import numpy as np # linear algebra
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)
import seaborn as sns
import matplotlib.pyplot as plt

import os
print(os.listdir("../input"))

** 1. Efetuando leitura do dataset e aramazendo no dataframe Pokedex.**

In [None]:
Pokedex = pd.read_csv('../input/Pokemon.csv')

**2. Efetuando leitura dos 5 primeiros registros da base para verificar atributos.****

In [None]:
Pokedex.head()

**2.1 Efetuando tratamento do datraframe para renomear os nomes das colunas Sp. Atk e Sp. Def.**

In [None]:
Pokedex.rename(columns={'Sp. Atk': 'SpAtk', 'Sp. Def': 'SpDef'}, inplace=True)

**3. Efetuando leitura dos 5 últimos registros da base.**

In [None]:
Pokedex.tail()

**4. Buscando 5 registros aleatórios da base.**

In [None]:
Pokedex.sample(5)

**5. Algumas medidas de posição e disperção.**

In [None]:
Pokedex.describe()

**6. Verificando a estrutura do dataset.**

In [None]:
Pokedex.info()

 Nota-se acima que o atributo Type 2 possui apenas 414 registros preenchidos, o restante encontra-se com valor nulo pois nem todos os Pokémon possuem tipo secundário.

**Partimos agora para uma análise exploratória para entendermos mais sobre a base de dados dos Pokémon ao responder algumas perguntas:**

**7. Qual a quantidade de Pokémons existentes para cada geração da franquia?**

In [None]:
Pokedex['Generation'].value_counts()

**8. Qual a quantidade de Pokémons existentes para cada geração da franquia? (Expressado graficamente.)**

In [None]:
sns.catplot(x='Generation',kind='count',data=Pokedex)

**9. Qual o percentual da distruibuição de frequência dos Pokémons para cada geração? (Expressado graficamente.)**

In [None]:
labels = ['1', '2', '3', '4', '5', '6']
sizes = [166, 165, 160, 121, 106, 82]
plt.pie(x=sizes, labels=labels, autopct='%1.1f%%')
plt.title("Percentual de Pokémons de cada Geração")
fig=plt.gcf()
fig.set_size_inches(9,9)
plt.show()

**10. Quais os Pokémons com maiores valores para cada tipo de Status?**

**10.1 Quais Pokémons com maior e menor HP?**

In [None]:
maiorHP = Pokedex[Pokedex.HP  == Pokedex.HP.max()]
print('Pokémon com maior HP: ')
maiorHP

In [None]:
menorHP = Pokedex[Pokedex.HP  == Pokedex.HP.min()]
print('Pokémon com menor HP: ')
menorHP

**10.2 Quais Pokémons com maior e menor Ataque?**

In [None]:
maiorAttack = Pokedex[Pokedex.Attack  == Pokedex.Attack.max()]
print('Pokémon com maior Ataque: ')
maiorAttack

In [None]:
menorAttack = Pokedex[Pokedex.Attack  == Pokedex.Attack.min()]
print('Pokémon com menor Ataque: ')
menorAttack

**10.3 Quais Pokémons com maior e menor Defesa?**

In [None]:
maiorDefense = Pokedex[Pokedex.Defense  == Pokedex.Defense.max()]
print('Pokémon com maior Defesa: ')
maiorDefense

In [None]:
menorDefense = Pokedex[Pokedex.Defense  == Pokedex.Defense.min()]
print('Pokémon com menor Defesa: ')
menorDefense

**10.3 Quais Pokémons com maior e menor Ataque Especial?**

In [None]:
maiorSpAtk = Pokedex[Pokedex['SpAtk']  == Pokedex['SpAtk'].max()]
print('Pokémon com maior Ataque Especial: ')
maiorSpAtk

In [None]:
menorSpAtk = Pokedex[Pokedex['SpAtk']  == Pokedex['SpAtk'].min()]
print('Pokémon com menor Ataque Especial: ')
menorSpAtk

**10.4 Quais Pokémons com maior e menor Defesa Especial?**

In [None]:
maiorSpDef = Pokedex[Pokedex['SpDef']  == Pokedex['SpDef'].max()]
print('Pokémon com maior Defesa Especial: ')
maiorSpDef

In [None]:
menorSpDef = Pokedex[Pokedex['SpDef']  == Pokedex['SpDef'].min()]
print('Pokémon com menor Defesa Especial: ')
menorSpDef

**10.5 Quais Pokémons com maior e menor Velocidade?**

In [None]:
maiorSpeed = Pokedex[Pokedex.Speed  == Pokedex.Speed.max()]
print('Pokémon com maior Velocidade: ')
maiorSpeed

In [None]:
menorSpeed = Pokedex[Pokedex.Speed  == Pokedex.Speed.min()]
print('Pokémon com menor Velocidade: ')
menorSpeed

**11. Algumas representações gráficas da distribuição de frequência de todos os Pokémon.**

**11.1 Qual a distruibuição de frequência do tipo primário dos Pokémons?**

In [None]:
Pokedex['Type 1'].value_counts()

**11.2 Qual a distruibuição de frequência do tipo primário dos Pokémons? (Expressado graficamente.)**

In [None]:
sns.catplot(x='Type 1',kind='count',data=Pokedex, height=11)

**11.3 Qual o percentual para cada tipo primário dos Pokémons? (Expressado graficamente.)**

In [None]:
labels = ['Water', 'Normal', 'Grass', 'Bug', 'Psychic', 'Fire', 'Rock', 'Electric', 'Ground', 'Dragon', 'Ghost', 'Dark'
, 'Poison', 'Fighting', 'Steel', 'Ice', 'Fairy', 'Flying']
sizes = [112, 98, 70, 69, 57, 52, 44, 44, 32, 32, 32, 31, 28, 27, 27, 24, 17, 4]
plt.pie(x=sizes, labels=labels, autopct='%1.1f%%')
plt.title('Percentual do tipo primário dos Pokémons')
fig=plt.gcf()
fig.set_size_inches(9,9)
plt.show()

**11.4 Qual a distruibuição de frequência do tipo secundário dos Pokémons?**

In [None]:
Pokedex['Type 2'].value_counts()

**11.5 Qual a distruibuição de frequência do tipo secundário dos Pokémons? (Expressado graficamente.)**

In [None]:
sns.catplot(x='Type 2',kind='count',data=Pokedex, height=11)

**11.6 Qual o percentual para cada tipo secundário dos Pokémons? (Expressado graficamente.)**

In [None]:
labels = ['Flying', 'Ground', 'Poison', 'Psychic', 'Fighting', 'Grass', 'Fairy', 'Steel', 'Dark', 'Dragon', 'Ice', 'Ghost'
, 'Water', 'Rock', 'Fire', 'Electric', 'Normal', 'Bug'
]
sizes = [97, 35, 34, 33, 26, 25, 23, 22, 20, 18, 14, 14, 14, 14, 12, 6, 4, 3]
plt.pie(x=sizes, labels=labels, autopct='%1.1f%%')
plt.title('Percentual do tipo secundário dos Pokémons')
fig=plt.gcf()
fig.set_size_inches(9,9)
plt.show()

**12. Algumas análises sobre os Pokémons lendários.**

In [None]:
lendarios = Pokedex[Pokedex.Legendary  == 1]
print('Pokémons lendários: ')
lendarios

**12.1 Quais lendários com maior e menor total de Status?**

In [None]:
maiorTotalLegen = lendarios[lendarios.Total  == lendarios.Total.max()]
print('Pokémon lendário com maior Total de Status: ')
maiorTotalLegen

In [None]:
menorTotalLegen = lendarios[lendarios.Total  == lendarios.Total.min()]
print('Pokémon lendário com menor Total de Status: ')
menorTotalLegen

**12.2 Qual a quantidade de Pokémon lendários em relação a quantidade de Pokémon regular?**

In [None]:
Pokedex['Legendary'].value_counts()

**12.3 Qual a quantidade de Pokémon lendários em relação a quantidade de Pokémon regular? (Expressado graficamente)**

In [None]:
sns.catplot(x='Legendary',kind='count',data=Pokedex, height=7)

**12.4 Qual o percentual de Pokémon lendários em relação a quantidade de Pokémon regular? (Expressado graficamente)**

In [None]:
labels = ['Regular', 'Legendary']
sizes = [735, 65]
plt.pie(x=sizes, labels=labels, autopct='%1.1f%%')
plt.title('Percentual do tipo secundário dos Pokémons')
fig=plt.gcf()
fig.set_size_inches(9,9)
plt.show()

**13 Seguem abaixo as distribuições de cada status dos Pokémon utilizando histogramas.**

In [None]:
## Biblioteca utilizada para ignorar warnings de execuções.
import warnings
# from beakerx import *
warnings.filterwarnings('ignore')

In [None]:
plt.figure(figsize=(10, 5))
HP = sns.distplot(Pokedex.HP, kde=False)
HP.set_title('HP')

In [None]:
plt.figure(figsize=(10, 5))
Attack = sns.distplot(Pokedex.Attack, kde=False)
Attack.set_title('Attack')

In [None]:
plt.figure(figsize=(10, 5))
Defense = sns.distplot(Pokedex.Defense, kde=False)
Defense.set_title('Defense')

In [None]:
plt.figure(figsize=(10, 5))
SpAtk = sns.distplot(Pokedex.SpAtk, kde=False)
SpAtk.set_title('SpAtk')

In [None]:
plt.figure(figsize=(10, 5))
SpDef = sns.distplot(Pokedex.SpDef, kde=False)
SpDef.set_title('SpDef')

In [None]:
plt.figure(figsize=(10, 5))
Speed = sns.distplot(Pokedex.Speed, kde=False)
Speed.set_title('Speed')

Feita análise exploratória acima, é possível obtermos algumas conclusões acerca dos status, tipos, raridade e outras informações sobre os Pokémons presentes em nossa Pokédex.

Dada a Pokédex contendo informações de Pokémons da primeira até a sexta geração, pudemos verificar que grande parte destes Pokémons fazem parte da Primeira, Segunda e Terceira geração, visto que:
- 20.7% dos Pokémons são da primeira geração
- 20.6% dos Pokémons são da segunda geração
- 20.0% dos Pokémon são da terceira geração

As três primeiras gerações juntas somam mais de 60% de todos os Pokémons desta Pokédex. As outras gerações apresentaram redução significativa como segue abaixo:
- 15.1% dos Pokémons são da quarta geração
- 13.2% dos Pokémons são da quinta geração
- 10.2% dos Pokémons são da sexta geração

Quanto as status, concluímos os seguintes itens: 
- Pudemos ver que o Pokémon com maior HP é também um Pokémon regular que não possui nível Lendário: Blissey que contém um total de 255 pontos em HP; Vimos também que há um Pokémon com uma carcterística bem única referente ao HP, que é o Shedinja, único Pokémon que possui apenas 1 ponto de HP.

- Mega Mewtwo é o Pokémon que contém o maior total de pontos em Ataque e Ataque Especial, diferenciando-se apenas em sua forma Mega Y e X onde Mega X possui o maior Ataque e a Mega Y possui o maior Ataque Especial.

- Em relação aos Pokémons defensivos há um empate entre três Pokémons que apresentam um total de 230 pontos em Defesa, são eles: Steelix Mega, Shuckle e Aggron Mega. Shuckle, além de possuir a pontuação máxima em defesa, é também o Pokémon que apresenta a maior pontuação em Defesa Especial, também com valor de 230, fazendo com que Shuckle se torne o melhor Pokémon quando se trata tanto de Defesa quanto de Defesa Especial.

- Enquanto Shuckle apresenta os maiores valores em suas defesas, ele apresenta também o menor valor em velocidade, empatado apenas com Munchlax e seus míseros 5 pontos de Speed. O vencedor em quesito velocidade é o Deoxys em sua Speed Form.

- Vimos que os Pokémons com tipos primários Água e Normal são os mais presentes em relação aos outros tipos, sendo presentados respectivamente por 14.0% e 12.3%. Já sobre o tipo secundário, o tipo Voador é mais presente do que qualquer outro tipo, tendo um percentual de presença de 23.4% enquanto que o segundo colocado, o tipo Solo, possui apenas 8.5%.

- Para finalizar, observamos que os Pokémons lendários realmente são de extrema raridade. 91.9% dos Pokémons são regulares e apenas 8.1% são lendários.