# Analisis Deskriptif

Statistika deskriptif adalah metode-metode yang berkaitan dengan pengumpulan dan penyajian suatu gugus data sehingga memberikan informasi yang berguna. Pengklasifikasian menjadi statistika deskriptif dan statistika inferensi dilakukan berdasarkan aktivitas yang dilakukan. Statistika deskriptif hanya memberikan informasi mengenai data yang dipunyai dan sama sekali tidak menarik inferensia atau kesimpulan apapun tentang gugus induknya yang lebih besar. Contoh statistika deskriptif yang sering muncul adalah, tabel, diagram, grafik, dan besaran-besaran lain di majalah dan koran-koran. Dengan Statistika deskriptif, kumpulan data yang diperoleh akan tersaji dengan ringkas dan rapi serta dapat memberikan informasi inti dari kumpulan data yang ada. Informasi yang dapat diperoleh dari statistika deskriptif ini antara lain ukuran pemusatan data, ukuran penyebaran data, serta kecenderungan suatu gugus data.

Sumber: [wikipedia](https://id.wikipedia.org/wiki/Statistika_deskriptif)

In [None]:
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

## Loading data

In [None]:
fifa = pd.read_csv("fifa19.csv")
fifa.head()

## Sneakpeak Data

In [None]:
fifa.info()

In [None]:
# Kolom di data frame fifa
fifa.columns

In [None]:
# Contoh menghitung pemain berdasarkan Nationality
fifa.Nationality.value_counts()

## Data Fifa untuk Argentina

In [None]:
fifa_argentina = fifa[fifa.Nationality == "Argentina"]
fifa_argentina.head()

In [None]:
fifa_argentina["Work Rate"].value_counts()

In [None]:
# Menampilkan jumlah pemain berdaasrkan Club 
fifa_argentina.Club.value_counts()

## Plot Data

In [None]:
# Membuat plot Age vs Wage, dengan pembatasan Age >=30
sns.catplot(x="Age", y="Wage", data=fifa_argentina.query("Age >= 30"))

Berdasarkan catplot:
1. Dalam rentang umur 30-40 tahun, pemain Argentina yang memiliki gaji tinggi ada di rentang umur 30-34. 
2. Semakin tua seorang pemain bola, semakin menurun gaji yang diterimanya

In [None]:
# Membuat plot Age vs Potential
# untuk kind dapat diganti sesuai keinginan, contoh box, boxen
plt.figure(figsize=(70,60))
sns.catplot(x="Age", y="Potential", data=fifa_argentina, kind="box")

In [None]:
# Membuat chart untuk work rate vs potential dengan pengelompokkan berdasar kategori preferred foot
# set_xticklabels untuk memutar label sumbu-X
chart = sns.catplot(x="Work Rate", y="Potential", hue="Preferred Foot", data=fifa_argentina, kind="swarm")
chart.set_xticklabels(rotation=90)

Work rate=menyerang/bertahan

Berdasarkan catplot:
1. Lebih banyak pemain Argentina yang preferred foot-nya kaki kanan, dibanding kaki kiri
2. Potential pemain baik preferred foot kanan maupun kiri cenderung sama. Namun, terdapat pencilan 2 pemain preferred foot kiri memiliki potential lebih tinggi.

In [None]:
# Membuat histogram 
# bins = 10 
sns.distplot(fifa_argentina.Age, kde = True, bins=10)



In [None]:
sns.jointplot(x="Potential", y="Composure", data=fifa_argentina, kind="reg");

In [None]:
with sns.axes_style("white"):
    sns.jointplot(x="Potential", y="Composure", data=fifa_argentina, kind="hex", color="blue");

In [None]:
import statistics as stat

In [None]:
# Menghitung pusat data

a = stat.mean(fifa_argentina.Age)
b = stat.median(fifa_argentina.Age)

In [None]:
a, b

In [None]:
# Menghitung ukuran penyebaran data

c = stat.stdev(fifa_argentina.Age)
d = stat.variance(fifa_argentina.Age)

In [None]:
c, d

## Groupby aggregat

In [None]:
fifa19_=fifa.groupby(["Nationality"]).mean()

In [None]:
fifa19_.head()

In [None]:
fifa19_.index

In [None]:
fifa19_.Age.min()

In [None]:
fifa19_[fifa19_.Age==17]

In [None]:
sns.lmplot(x="Composure", y="Potential", data=fifa19_, lowess=True)

In [None]:
fifa.Club.value_counts()

In [None]:
fifa_club = fifa[fifa.Club.isin(["Wolverhampton Wanderers", "AS Monaco", "Cardiff City", "Borussia Dortmund"])]

In [None]:
fifa_club.head()

In [None]:
fifa[fifa.Nationality == "Indonesia"]