# Measuring Central Tendency
Measuring central tendency merupakan sekumpulan parameter statistik untuk menggambarkan nilai khas atau sentral yang mewakili keseluruhan observasi atau data. Nilai khas atau sentral tersebut direpresentasikan menggunakan tiga parameter statistik yaitu mean, median, dan mode

![image-2.png](attachment:image-2.png)

## 1. Mean
Mean atau sering juga disebut sebagai expected value merupakan salah satu parameter yang paling sering digunakan untuk menggambarkan nilai khas atau sentral dari suatu data. Ia diperoleh dari menghitung jumlah keseluruhan data dan dibagi dengan banyaknya data yang dimiliki.

<img src="https://dicoding-web-img.sgp1.cdn.digitaloceanspaces.com/original/academy/dos:d427545fe9a529b85ddca264815ce7c020230126161858.jpeg" width="300">

Sebagai contoh, kita bisa menggunakan parameter ini untuk mengetahui berapa rata-rata jumlah kucing yang dimiliki oleh pegawai Dicoding. Pertama, kita perlu menghitung keseluruhan jumlah kucing yang dimiliki pegawai Dicoding. Selanjutnya, kita membagi keseluruhan jumlah kucing tersebut dengan total pegawai dicoding.

<img src="https://dicoding-web-img.sgp1.cdn.digitaloceanspaces.com/original/academy/dos:292549aa69f52162b77117659b78784820230309132259.png" width="300">

Selain menghitung secara manual, tentunya kita bisa menghitung nilai mean menggunakan bahasa pemrograman Python dengan bantuan library NumPy. Berikut merupakan contoh kode untuk menghitung nilai mean menggunakan NumPy.

In [1]:
import numpy as np
 
jumlah_kucing = np.array([3, 2, 1, 1, 2, 3, 2, 1, 0, 2])
jumlah_kucing.mean()

1.7

## 2. Median
Median merupakan parameter yang merepresentasikan nilai tengah atau persentil ke-50 dari keseluruhan observasi atau data. Parameter ini diperoleh dengan mengambil nilai persentil ke-50 dari data yang telah diurutkan.

Untuk data yang berjumlah ganjil, nilai median diperoleh dengan mengambil langsung nilai tengah dari data yang telah diurutkan. Namun, hal ini berbeda jika data yang dimiliki berjumlah genap. Pada kasus seperti ini, kita perlu mengurutkan dan menghitung nilai rata-rata dari dua data yang berada di tengah.

kucing peliharaan pegawai Dicoding. Karena pada contoh kali ini jumlah data yang digunakan adalah 10, kita perlu mengurutkan data tersebut terlebih dahulu. Selanjutnya, kita dapat mencari data yang berada di posisi tengah dengan menghitung nilai rata-rata dari dua data yang berada di tengah.

<img src="https://dicoding-web-img.sgp1.cdn.digitaloceanspaces.com/original/academy/dos:6f1469c7d4f27b88169bb4505d1a6c9020230309132311.png" width="300">

Fun fact, kita juga bisa menggunakan NumPy untuk memperoleh nilai median dari suatu data. Berikut merupakan contoh kodenya.

In [2]:
import numpy as np

jumlah_kucing = np.array([3, 2, 1, 1, 2, 3, 2, 1, 0, 2])
np.median(jumlah_kucing)

2.0

Jika Anda perhatikan, nilai median yang diperoleh dari contoh di atas berupa bilangan bulat dan cukup masuk akal untuk merepresentasikan nilai khas dari data tersebut. Selain itu, median juga dikenal sebagai salah satu parameter yang sangat toleran terhadap outlier. Apabila Anda mengubah salah satu nilai dari data tersebut, parameter median yang diperoleh tidak akan berubah secara signifikan.

Sekadar informasi tambahan, pada proses analisis data terkadang kita juga perlu melihat nilai data pada persentil ke-25 dan persentil ke-75. Kedua nilai ini dikenal juga sebagai kuartil pertama (Q1) dan kuartil ketiga (Q3).

<img src="https://dicoding-web-img.sgp1.cdn.digitaloceanspaces.com/original/academy/dos:7ec3154b29acd810a125252feb7a96c820230309132327.png" width="300">

## 3. Mode
Parameter ketiga dalam measuring central tendency ialah mode. Parameter ini akan memberikan kita gambaran atau informasi terkait nilai yang paling sering muncul dalam suatu data. 

Untuk menghitung parameter mode, kita perlu mengurutkan nilai dari suatu data terlebih dahulu. Selanjutnya memilih nilai yang paling sering muncul. Sebagai contoh, pada data jumlah kucing peliharaan yang dimiliki pegawai Dicoding, nilai yang paling sering muncul adalah 2. Nilai ini merupakan mode dari data tersebut.

<img src="https://dicoding-web-img.sgp1.cdn.digitaloceanspaces.com/original/academy/dos:94899ab1e4c5cd9d257da6934cee43da20230309132337.png" width="300">

Sama halnya dengan parameter yang lain, kita bisa menghitung nilai mode dari suatu data menggunakan library SciPy. Berikut merupakan contoh kodenya

In [3]:
import numpy as np
from scipy import stats
 
jumlah_kucing = np.array([3, 2, 1, 1, 2, 3, 2, 1, 0, 2])
mode_jumlah_kucing = stats.mode(jumlah_kucing)[0]
 
print(mode_jumlah_kucing)

2


Ketika menggunakan mode, Anda perlu memahami bahwa parameter ini akan mencari nilai yang paling sering muncul. Oleh karena itu, jika suatu data memiliki nilai yang unik, data tersebut tidak memiliki mode. Selain itu, apabila data memiliki lebih dari satu nilai yang paling sering muncul, itu artinya data tersebut memiliki lebih dari satu mode.