# **Penolakan Data Berdasarkan Kriteria Chauvenet**

**Rio Agustian Gilang Fernando, Fisika**

**Fakultas Matematika dan Ilmu Pengetahuan Alam**

**Universitas Negeri Semarang**


## **Kriteria Chauvenet**

Kriteria Chauvenet menyatakan bahawa data akan ditolak, jika

\begin{align}
P(\mu < z \, \text{dan} \, \mu > z) < \frac{1}{2k} \\
\end{align}
atau
\begin{align}
P(\mu > \mu_0) < \frac{1}{4k}
\end{align}

dengan

> k = banyak data

> $z = \frac{x_i - \bar{x}}{\sigma}$

In [90]:
from numpy import array, exp, inf, sqrt, pi
from scipy.integrate import quad
import matplotlib.pyplot as plt

## **Distribusi Z**
Distribusi normal sebagai fungsi z didefinisikan sebagai berikut.

\begin{align}
f(z)=  \frac{1}{\sqrt{2\pi}} e^{-\frac{1}{2}z^2}\
\end{align}

Nilai yang tertera pada tabel distribusi z adalah hasil integral fungsi $f(z).$

In [91]:
def dstb_z(z, des=4):
  """
  Menghitung luas di bawah kurva distribusi Gauss dari negatif tak hingga 
  sampai dengan titik z.

  Parameters
  ----------
  z : (x - mu) / sigma
  des : banyak digit di belakang koma yang diinginkan. Default-nya adalah 4 
  """
  f = lambda x: 1/sqrt(2*pi) * exp(-1/2 * x**2)
  dens = quad(f, -inf, z)[0]
  return round(dens, des)

## **Uji Validitas Data dengan Kriteria Chauvenet**

In [92]:
def chauv(x):
  """
  Menguji validitas data dengan menggunakan kriteria Chauvenet.

  Parameters
  ----------
  x : numpy array berisi data yang ingin diuji validitasnya
  """
  n = len(x)
  xbar = x.mean()
  std = x.std()
  k = len(x)

  for i in range(k):
    z = (x[i] - xbar) / std
    prob = dstb_z(z)
    limit = 1/(4*k) 

    if prob < limit:
      print("{0:d}. Data {1:.2f} ditolak".format(i+1, data[i]))
    else:
      print("{0:d}. Data {1:.2f} diterima".format(i+1, data[i]))

## **Contoh Persoalan**

In [93]:
data = array([3.8, 3.5, 3.9, 3.4, 3.9, 1.8])
chauv(data)

1. Data 3.80 diterima
2. Data 3.50 diterima
3. Data 3.90 diterima
4. Data 3.40 diterima
5. Data 3.90 diterima
6. Data 1.80 ditolak
