# Analisis Pokemon dari Berbagai Jenis

Nama: Ikhbar Firman Hanafi

Batch: 14

## Description

Pokemon yang merupakan singkatan dari 'pocket monster' banyak digemari oleh berbagai kalangan, baik dari film, kartu hingga video games. Berdasarkan wikipedia terdapat sekitar 900 pokemon dari berbagai jenis, seperti: type, generation, legendary, serta memiliki stat dan kemampuan yang berbeda-beda. Terdapat banyak sekali perdebatan dalam membandingkan pokemon mana yang lebih kuat, seperti pada pernyataan berikut:

'Pokemon mana yang memiliki serangan terkuat?'

'Pokemon legendary lebih kuat dari pokemon non legendary.'

Berdasarkan hal tersebut, peneliti tertarik untuk mengetahui fakta dari perdebatan dan pernyataan terkait jenis-jenis pokemon tersebut. Peniliti memilih untuk meninjau pokemon: 
1. single type dan dual type
2. legendary dan non legendary
3. yang memiliki atribut/stat serangan dan pertahanan terkuat.

Peniliti mengambil data mengenai pokemon dari https://www.kaggle.com/datasets/abcsds/pokemon. Adapun berikut penjelasan data tersebut:

This dataset includes 721 Pokemon, including their number, name, first and second type, and basic stats: HP, Attack, Defense, Special Attack, Special Defense, and Speed.

The feature of this data is:

- #: ID for each pokemon
- Name: Name of each pokemon
- Type 1: Each pokemon has a type, this determines weakness/resistance to attacks
- Type 2: Some pokemon are dual type and have 2
- Total: sum of all stats that come after this, a general guide to how strong a pokemon is
- HP: hit points, or health, defines how much damage a pokemon can withstand before fainting
- Attack: the base modifier for normal attacks (eg. Scratch, Punch)
- Defense: the base damage resistance against normal attacks
- SP Atk: special attack, the base modifier for special attacks (e.g. fire blast, bubble beam)
- SP Def: the base damage resistance against special attacks
- Speed: determines which pokemon attacks first each round

### Objective

1. Mengetahui perbedaan antara pokemon single type dan dual type
2. Mengetahui pokemon yang lebih kuat pada pokemon dual type dan pokemon single type
3. Mengetahui pokemon yang memiliki penyerangan terkuat
3. Mengetahui pokemon yang memiliki pertahanan terkuat
4. Mengetahui perbedaan antara pokemon legendary dan non legendary
5. Mengetahui pokemon yang lebih kuat pada pokemon legendary dan pokemon non legendary.

### Problem Statement

Rumusan masalah:

1. Bagaimana perbedaan antara pokemon single type dan dual type?
2. Apakah pokemon dual type lebih kuat dibanding pokemon single type?
3. Apa pokemon yang memiliki penyerangan terkuat?
3. Apa pokemon yang memiliki pertahanan terkuat?
4. Bagaimana perbedaan antara pokemon legendary dan non legendary?
5. Apakah pokemon legendary lebih kuat dari pada pokemon non legendary?

Batasan masalah:

Penelitian ini bersifat deskriptif yang cenderung pada pemaparan data dan pada proses analisis dilakukan dengan statistik sederhana. Peneliti tidak memiliki wawasan yang luas mengenai pokemon, sehingga proses penelitian ini hingga penarikan kesimpulannya hanya berdasarkan data saja.

## Working Area

Pertama kita akan import libraries yang diperlukan, yaitu Numpy dan Pandas.

In [None]:
import numpy as np
import pandas as pd

Load data dan membuat DataFrame dari file data CSV

In [None]:
data = pd.read_csv('Pokemon.csv')

Kita coba sekilas melihat 10 baris data pertama.

In [None]:
data.head(10)

Dari pengamatan 10 baris pertama, didapatkan:
1. Dari deskripsi data, kolom # menandakan 'ID' pokemon.

    Dari pengamatan pokemon dengan ID yang sama menandakan evolusinya.

    Seperti 'Charizard', 'CharizardMega Charizard X', dan 'CharizardMega Charizard Y' kesemuanya memiliki ID yang sama yaitu 6.
2. Penulisan nama pokemon yang mengandung 'Mega' perlu dirapihkan dengan menghilangkan huruf-furuf sebelum 'mega'. 

    misal 'CharizardMega Charizard X' menjadi 'Mega Charizard X'.
3. Terdapat Nan pada kolom type 2. Berdasarkan deskripsi data kemungkinan Nan disini bukanlah missing value,

    melainkan pokemon dengan type 2 Nan berarti hanya memiliki satu type (bukan dual type). 
    
    Agar tidak membingungkan penulisan 'Nan' pada type 2 akan diganti menjadi 'None'.
4. Kolom 'Total' menandakan total stat, agar lebih jelas kolom 'Total' akan diganti menjadi 'Total Stat'.

In [None]:
data.info()

Dari info data di atas, dari total 800 data hanya terdapat kolom 'Type 2' saja yang terdeteksi missing value.

Nan pada type 2 bukanlah missing value melainkan menandakan pokemon tidak memiliki dual type. Kolom lain telah memiliki Dtype yang sesuai.

Berikutnya kita akan coba mengganti 'Nan' menjadi 'None' pada kolom Type 2. Sebelum itu kita coba cek berapa banyak 'nan' di Type 2.

In [None]:
data['Type 2']

In [None]:
print(data['Type 2'].unique()) # Melihat jenis-jenis pokemon yang ada di Type 2
print(f'Total jenis Type 2 ada sebanyak {data["Type 2"].nunique()} tidak termasuk "nan"')
print(f'Terdapat {sum(data["Type 2"].isnull())} nan')

Dari pemaparan di atas, terdapat 1 jenis object nan pada Type 2, selebihnya memiliki type str. 

Kita akan ganti nan tersebut dengan data string 'None'.

In [None]:
filter_null_type2 = data["Type 2"].isnull() # Membuat suatu array yang berisikan True apabila 'Nan', dan False apabila bukan 'Nan'.
data["Type 2"][filter_null_type2] = 'None' # Mengubah 'Nan' pada kolom Type 2 menjadi str "None"

Cek apakah masih terdeteksi missing value pada kolom Type 2.

In [None]:
print(data['Type 2'].isnull().any()) #Pengecekan apakah masih terdeteksi missing value pada kolom Type 2
data['Type 2'].astype('category') #Mengubah dtype menjadi category apabila diinginkan

Berikutnya kita akan coba merapihkan nama pokemon yang mengandung 'Mega', misal :

'VenusaurMega Venusaur' akan kita ganti menjadi 'Mega Venusaur'.

In [None]:
# Buat fungsi untuk menghilangkan karakter sebelum "mega"
def del_before_mega(a):
    a_list = a.lower().split(' ')
    for k in range(len(a_list)):
        if 'mega' in a_list[k]:
            a_list[k] = a_list[k][-4:]
    a_new = ' '.join(a_list)
    return a_new.title()
# Contohnya pada 'VenusaurMega Venusaur':
print(del_before_mega('VenusaurMega Venusaur'))

Kita akan terapkan fungsi tersebut pada kolom Name

In [None]:
data['Name'] = data['Name'].apply(del_before_mega)

In [None]:
# Cek apakah fungsi tersebut sudah diterapkan dengan benar
data.head(10)

Terlihat pada index 7 dan 8 yang sebelumnya nama pokemon 'CharizardMega Charizard' telah berubah menjadi 'Mega Charizard'

Berikutnya kita akan mengganti nama kolom berikut:

'#' -> 'ID'

'Total' -> 'Total Stat'

In [None]:
data.rename(columns = {'#':'ID', 'Total':'Total Stat'}, inplace = True) #Mengganti nama kolom
data.head()

Kita akan coba meninjau pokemon single type dan dual type berdasarkan fitur "Type 1" dan "Type 2".

In [None]:
# Mengetahui banyaknya pokemon single type dan dual type

mask_none = data['Type 2'] == 'None' #Membuat suatu array yang berisikan Boolean dimana baris dengan data 'None' akan menjadi True, jika tidak 'False'
print(f'Banyak pokemon dengan single type adalah {sum(mask_none)}')
print(f'Banyak pokemon dengan dual type adalah {len(data) - sum(mask_none)}')

Banyak pokemon single type adalah 386, yang mana sesuai dengan jumlah null/Nan yang terdeteksi sebelumnya.

Dapat dilihat pokemon dual type lebih banyak dari pokemon single type. Berikutnya kita akan coba melihat berapa banyak jenis pokemon dari single type maupun dual type dengan Diagram Bar Chart berikut:

In [None]:
#Visualisasi pokemon Single Type
data[mask_none]['Type 1'].value_counts().plot(ylabel = 'Count',title = 'Single Type',kind = 'bar')

In [None]:
#Visualisasi pokemon Dual Type
data[~mask_none]['Type 1'].value_counts().plot(xlabel = 'Type 1',ylabel='Count',title = 'Dual type',alpha = 0.8,color = 'orange',kind = 'bar')

Dari kedua grafik tersebut dapat dilihat bahwa pokemon single type terbanyak adalah tipe 'Normal' dan 'Water'. Sedangkan pokemon dual type terbanyak adalah pokemon dengan Type 1 'Water' dan 'Bug'.

Berikutnya kita akan melihat pokemon yang lebih kuat dari single type atau dual type berdasarkan rata-rata 'Total Stat'.

In [None]:
print(f'Mean "Total Stat" dari single type adalah {round(data[mask_none]["Total Stat"].mean(),2)}')
print(f'Mean "Total Stat" dari dual type adalah {round(data[~mask_none]["Total Stat"].mean(),2)}')

Berdasarkan rata-rata Total Stat terlihat mean dual type = 456.63 > mean single type = 412.02. Untuk lebih spesifiknya kita akan membandingkan stat dari single type dan dual type pada grafik berikut.

In [None]:
data.iloc[:,5:-2][mask_none].mean().rename(index = 'Single Type').plot(ylabel = 'Mean',legend = True)
data.iloc[:,5:-2][~mask_none].mean().rename(index = 'Dual Type').plot(color = 'red',legend = True)

Berdasarkan grafik tersebut, mean dari tiap stat pada pokemon dual type lebih besar dari pokemon single type.

Selanjutnya kita akan coba mengetahui nama beserta generasi pokemon dengan serangan terkuat dan pertahanan terkuat.

Kita akan coba melihat pokemon dengan serangan terkuat dengan meninjau stat 'Attack' dan 'Sp. Atk'.

In [None]:
#Top 3 pokemon Attack tertinggi
top_att = data[['Name','Attack','Sp. Atk','Generation']].sort_values('Attack',ascending = False)[:3]
top_att

In [None]:
#Top 3 pokemon Sp. Atk tertinggi
top_spatk = data[['Name','Attack','Sp. Atk','Generation']].sort_values('Sp. Atk',ascending = False)[:3]
top_spatk

Dari pemaparan di atas terlihat Mega Mewtwo X memiliki Atttack tertinggi, sedangkan Mega Mewtwo Y memiliki Sp. Atk tertinggi. Keduanya berasal dari generasi 1 dan memiliki total Attck dan Sp. Atk yang sama yaitu 344. Mari kita lihat kedua stat pokemon tersebut dengan Grafik berikut.

In [None]:
# Visualisasi Bar Chart stat pada pokemon Mega Mewtwo X dan Mega Mewtwo Y

data.set_index('Name').iloc[[163,164],5:-2].transpose().plot(title = 'Comparison Stat',kind = 'bar', legend = True)

Berdasarkan grafik tersebut tidak terlihat perbedaan stat yang signifikan antara Mega Mewtwo X maupun Mega Mewtwo Y. Mega Mewtwo X lebih unggul dalam stat Attack dan Defense, sedangkan Mega Mewtwo Y lebih unggul dalam Special attack dan defense.

Kita akan coba melihat pokemon dengan pertahanan terkuat dengan meninjau stat 'HP', 'Defense', dan 'Sp. Def'.

In [None]:
#Top 3 pokemon Defense tertinggi
top_def = data[['Name','HP','Defense','Sp. Def','Generation']].sort_values('Defense',ascending = False)[:3]
top_def

In [None]:
#Top 3 pokemon Sp. Def tertinggi
top_spdef = data[['Name','HP','Defense','Sp. Def','Generation']].sort_values('Sp. Def',ascending = False)[:3]
top_spdef

In [None]:
#Top 3 pokemon HP tertinggi
top_hp = data[['Name','HP','Defense','Sp. Def','Generation']].sort_values('HP',ascending = False)[:3]
top_hp

Berdasarkan penjabaran di atas pokemon Shuckle memiliki stat tertinggi sebesar 230 dalam defense maupun sp.def, namun stat HP yang dimilikinya sangat kecil yaitu 20. Hal tersebut tidak membuat Shuckle dapat dikatakan memiliki pertahanan terkuat. Namun kita bisa melihat posisi teratas dalam HP, defense, dan sp. def didominasi oleh generasi 2.

Diperlukan analisis lebih lanjut terkait fitur HP, defense, dan sp. def dalam menentukan pokemon mana yang memiliki pertahanan terkuat. Misalkan pokemon dengan pertahanan terkuat ditentukan oleh 'Total Def', dimana Total Def = Hp + Defense + Sp.def.

In [None]:
data_def = data.copy()[['Name','HP','Defense','Sp. Def']] #Membuat copy dataframe dengan kolom stat
data_def['Total Def'] = data_def['HP'] + data_def['Defense'] + data_def['Sp. Def'] #Membuat kolom baru 'Total Def'
data_def.sort_values('Total Def', ascending = False)[:3] #Mengurutkan dataframe dan menampilkan tiga baris dengan Total Def tertinggi

In [None]:
#Visualisai Stat pertahanan
data_def.set_index('Name').sort_values('Total Def', ascending = False).iloc[:3,:].transpose().plot(kind = 'bar')

Berdasarkan fitur Total Def, Shuckle masih menduduki peringkat pertama dikarenakan stat Defense dan Sp. Def yang sangat tinggi, sedangkan di posisi kedua Blissey memiliki HP tertinggi namun stat Defense sangat rendah sebesar 10. Kita tetap tidak bisa menentukan pokemon mana yang memiliki pertahanan terkuat berdasarkan Total Def, mereka memiliki keunggulan tersendiri. Namun kita dapat menyimpulkan bahwa pokemon dengan pertahanan terkuat berasal dari generasi 2.

Berikutnya kita akan coba melihat perbedaan antara pokemon Legendary dan pokemon yang bukan Legendary.

Kita akan coba melihat banyaknya pokemon yang legendary dan non legendary dari data set ini.

In [None]:
total_legend = data['Legendary'].sum()
print(f'Terdapat {total_legend} pokemon Legendary')
print(f'Terdapat {len(data) - total_legend} pokemon non Legendary')

Terlihat bahwa hanya terdapat 65 pokemon Legendary dari 800 data pokemon, yang mana data tersebut telah mencakup kumpulan pokemon dari berbagai generasi. Selanjutnya kita akan coba melihat berapa banyak pokemon Legendary dari tiap generasi.

In [None]:
legend_gen = data[data['Legendary']]['Generation'].value_counts(sort = False) #Membuat series yang menampilkan banyaknya data Generation pada pokemon Legendary
legend_gen.plot(title = 'Jumlah Pokemon Legendary dari Berbagai Generasi',xlabel = 'Generation',
                        ylabel = 'Counts', color = 'purple')

Berdasarkan grafik di atas kita dapat lihat jumlah pokemon Legendary pada generasi awal (1 dan 2) sangatlah sedikit, dan mengalami peningkatan yang signifikan pada generasi 3 dengan jumlah pokemon Legendary terbanyak yaitu 18.

Selanjutnya kita akan coba melihat perbedaan stat antara pokemon Legendary dan non Legendary. Apakah memang benar pokemon Legendary itu lebih kuat dibandingkan pokemon non Legendary?

In [None]:
poke_legend = data[data['Legendary']]['Total Stat']
poke_non_legend = data[~data['Legendary']]['Total Stat']
mean_legend = poke_legend.mean()
mean_non_legend = poke_non_legend.mean()
print(f'Mean "Total Stat" pokemon Legendary adalah {round(mean_legend,2)}')
print(f'Mean "Total Stat" pokemon non Legendary adalah {round(mean_non_legend,2)}')

Untuk membandingkan Total Stat antara pokemon Legendary dan non Legendary, kita akan coba membandingkan histogram dari data Total Stat untuk kedua jenis pokemon tersebut. Langkah awalnya kita akan membentuk DataFrame dengan kolom Total Stat Legendary dan Total Stat non Legendary, yang setelahnya akan dibuat histogram.

In [None]:
#Membuat DataFrame untuk Legendary dan non Legendary pokemon berdasarkan Total Stat
df_legend = pd.DataFrame({'Legendary Total Stat': poke_legend, 
                        'Non Legendary Total Stat': poke_non_legend })
df_legend

Missing value Nan pada DataFrame df_legend tidak berdampak pada histogram yang akan kita buat.

In [None]:
axarr = df_legend.hist(density = True, figsize=(12,6)) #Menggambarkan kedua histogram untuk masing-masing kolom Legendary dan non Legendary
for ax in axarr.flatten():     # Memberi label pada sumbu x dan y histogram
    ax.set_xlabel("Total Stat")
    ax.set_ylabel("Proportion")


Dari kedua histogram tersebut, terlihat minimal Total Stat pokemon legendary sekitar 580 yang jauh lebih besar dibanding Total Stat minimum non Legendary sekitar 180. Kebanyakan pokemon non Legendary memiliki Total Stat di kisaran 300-500, sedangkan kebanyakan pokemon Legendary sekitar 600. Hanya sedikit sekali pokemon non Legendary yang memiliki Total Stat serupa dengan pokemon Legendary.

## Conclusions, Assumptions, Overall Analysis

Berdasarkan analisis data dan pembahasan yang telah diuraikan sebelumnya, didapat kesimpulan sebagai berikut:
1. Terdapat perbedaan antara pokemon single type dan pokemon dual type. Jumlah pokemon dengan dual type lebih banyak daripada pokemon single type, dimana pokemon dengan single type sejumlah 386 sedangkan pokemon dengan dual type sebanyak 414. Pokemon single type terbanyak adalah tipe 'Normal' dan 'Water'. Sedangkan pokemon dual type terbanyak adalah pokemon dengan Type 1 'Water' dan 'Bug'.
2. Pokemon dengan dual type lebih kuat dibandingkan single type. Hal tersebut berdasarkan rata-rata Total Stat mean dual type = 456.63 > mean single type = 412.02, dan pokemon dual type memiliki rata-rata stat lainnya (Hp, Attack,dsbnya) yang lebih besar dari tiap rata-rata stat pada pokemon single type.
3. Pokemon dengan penyerangan terkuat adalah Mega Mewtwo X dan Mega Mewtwo Y. Mega Mewtwo X memiliki Atttack tertinggi, sedangkan Mega Mewtwo Y memiliki Sp. Atk tertinggi. Keduanya berasal dari generasi 1 dan memiliki total Attck dan Sp. Atk yang sama yaitu 344.
4. Tidak dapat ditentukan secara pasti pokemon dengan pertahanan terkuat. Dari analisis data didapat pokemon Shuckle memiliki stat tertinggi sebesar 230 dalam defense maupun sp.def, namun stat HP yang dimilikinya sangat kecil yaitu 20. Hal tersebut tidak membuat Shuckle dapat dikatakan memiliki pertahanan terkuat. Berdasarkan fitur Total Def, Shuckle masih menduduki peringkat pertama dikarenakan stat Defense dan Sp. Def yang sangat tinggi, sedangkan di posisi kedua Blissey memiliki HP tertinggi namun stat Defense sangat rendah sebesar 10. Kita tetap tidak bisa menentukan pokemon mana yang memiliki pertahanan terkuat berdasarkan Total Def, mereka memiliki keunggulan tersendiri. Namun kita dapat menyimpulkan bahwa pokemon dengan pertahanan terkuat berasal dari generasi 2.
5. Terdapat perbedaan yang signifikan antara jumlah pokemon Legendary dan non Legendary. Dari data yang ada didapat 65 pokemon Legendary dari 800 data pokemon, yang mana data tersebut telah mencakup kumpulan pokemon dari berbagai generasi. Berdasarkan https://pokemon.fandom.com/wiki/Legendary_Pok%C3%A9mon memang pokemon Legendary ini tergolong sangat langka dan pada umumnya memiliki kekuatan di atas pokemon pada umumnya.
6. Pokemon Legendary lebih kuat dibanding pokemon non Legendary.Hal tersebut didasarkan dari mean "Total Stat" pokemon Legendary adalah 637.38 yang mana lebih besar dari Mean "Total Stat" pokemon non Legendary yaitu 417.21. Kebanyakan pokemon non Legendary memiliki Total Stat di kisaran 300-500, sedangkan kebanyakan pokemon Legendary sekitar 600. Hanya sedikit sekali pokemon non Legendary yang memiliki Total Stat serupa dengan pokemon Legendary.