In [9]:
from statsmodels.stats import weightstats as stests
from statsmodels.stats.proportion import proportions_ztest
from scipy import stats
import numpy as np
import pandas as pd
import seaborn as sns

# Load dataset
df = pd.read_csv('anggur.csv')

# Find Z test from normal distribution
def find_z (x_bar, mu, s, data_length):
    z = (x_bar - mu) / (s / np.sqrt(data_length))
    return z

# Tes Hipotesis Sample

## Nilai rata-rata pH di atas 3.29

1. Tentukan Hipotesis nol 

    -> H0: μ = 3.29

2. Pilih hipotesis alternatif H1

    -> H1: μ > 3.29

3. Tentukan tingkat signifikan α.

    -> α = 0.05

4. Tentukan uji statistik yang sesuai dan tentukan daerah kritis

    -> Uji statistik yang digunakan : Z-test
    
    -> Daerah Kritis                : z > -1.64

5. Hitung nilai uji statistik dari data sample.

In [10]:
data = df["pH"].values
μ = 3.29

# Find mean & std
x_bar = np.mean(data)
s = np.std(data, ddof=1)

# Find Z-test
z = find_z(x_bar, μ, s, len(data))

# Find critical values according to alpha
alpha = 0.05
z_critical = stats.norm.ppf(alpha)

# Result
print(f'z-score: {z:.2f}')
print(f'Critical value: {z_critical:.2f}')

# Z-test comparison
if z > -z_critical:
    print("Tolak H0, rata-rata pH di atas 3.29")
else:
    print("Gagal menolak H0, rata-rata pH tidak berada di atas 3.29")

z-score: 4.10
Critical value: -1.64
Tolak H0, rata-rata pH di atas 3.29


6. Ambil keputusan

    -> Berdasarkan langkah no 5 didapat bahwa nilai z > -z_critical maka tolak H0 (μ pH di atas 3.29)


## Nilai rata-rata Residual Sugar tidak sama dengan 2.50

1. Tentukan Hipotesis nol 

    -> H0: μ = 2.50

2. Pilih hipotesis alternatif H1

    -> H1: μ ≠ 2.50

3. Tentukan tingkat signifikan α.

    -> α = 0.05

4. Tentukan uji statistik yang sesuai dan tentukan daerah kritis

    -> Uji statistik yang digunakan : Z-test
    
    -> Daerah Kritis                : z < -1.96 or z > 1.96

5. Hitung nilai uji statistik dari data sample.

In [11]:
data = df["residual sugar"].values
mu = 2.50

# Find mean & std
x_bar = np.mean(data)
s = np.std(data, ddof=1)

# Find Z-test
z = find_z(x_bar, mu, s, len(data))

# Find critical values according to alpha
alpha = 0.05
z_critical = stats.norm.ppf(1- alpha/2)

# Result
print(f'z-score: {z:.2f}')
print(f'Critical value: {z_critical:.2f}')

if z < -z_critical or z > z_critical:
    print("Tolak H0, rata-rata residual sugar tidak sama dengan 2.50")
else:
    print("Gagal menolak H0, rata-rata residual sugar sama dengan 2.50")

z-score: 2.15
Critical value: 1.96
Tolak H0, rata-rata residual sugar tidak sama dengan 2.50


6. Ambil keputusan

    -> Berdasarkan langkah no 5 didapat bahwa nilai z berada di daerah kritis maka tolak H0 (μ residual sugar tidak sama dengan 2.50)


## Nilai rata-rata 150 baris pertama kolom sulphates bukan 0.65

1. Tentukan Hipotesis nol 

    -> H0: μ = 0.65

2. Pilih hipotesis alternatif H1

    -> H1: μ ≠ 0.65

3. Tentukan tingkat signifikan α.

    -> α = 0.05

4. Tentukan uji statistik yang sesuai dan tentukan daerah kritis

    -> Uji statistik yang digunakan : Z-test
    
    -> Daerah Kritis                : z < -1.96 or z > 1.96

5. Hitung nilai uji statistik dari data sample.

In [12]:
data = df["sulphates"].loc[0:149].values
mu = 0.65

# Find mean & std
x_bar = np.mean(data)
s = np.std(data, ddof=1)

# Find Z-test
z = find_z(x_bar, mu, s, len(data))

# Find critical values according to alpha
alpha = 0.05
z_critical = stats.norm.ppf(1- alpha/2)

# Result
print(f'z-score: {z:.2f}')
print(f'Critical value: {z_critical:.2f}')

if z < -z_critical or z > z_critical:
    print("Tolak H0, rata-rata 150 baris pertama kolom sulphates bukan 0.65")
else:
    print("Gagal menolak H0, rata-rata 150 baris pertama kolom sulphates adalah 0.65")

z-score: -4.96
Critical value: 1.96
Tolak H0, rata-rata 150 baris pertama kolom sulphates bukan 0.65


6. Ambil keputusan

    -> Berdasarkan langkah no 5 didapat bahwa nilai z tidak berada di daerah kritis maka tolak H0 (μ 150 baris pertama kolom sulphates bukan 0.65)

## Nilai rata-rata total sulfur dioxide di bawah 35?

1. Tentukan Hipotesis nol 

    -> H0: μ = 35

2. Pilih hipotesis alternatif H1

    -> H1: μ < 35

3. Tentukan tingkat signifikan α.

    -> α = 0.05

4. Tentukan uji statistik yang sesuai dan tentukan daerah kritis

    -> Uji statistik yang digunakan : Z-test
    
    -> Daerah Kritis                : z < -1.64

5. Hitung nilai uji statistik dari data sample.

In [13]:
data = df["total sulfur dioxide"].values
μ = 35

# Find mean & std
x_bar = np.mean(data)
s = np.std(data, ddof=1)

# Find Z-test
z = find_z(x_bar, μ, s, len(data))

# Find critical values according to alpha
alpha = 0.05
z_critical = stats.norm.ppf(alpha)

# Result
print(f'z-score: {z:.2f}')
print(f'Critical value: {z_critical:.2f}')

# Z-test comparison
if z < z_critical:
    print("Tolak H0, rata-rata total sulfur dioxide di bawah 35")
else:
    print("Gagal menolak H0, rata-rata total sulfur dioxide tidak di bawah 35")

z-score: 16.79
Critical value: -1.64
Gagal menolak H0, rata-rata total sulfur dioxide tidak di bawah 35


6. Ambil keputusan

    -> Berdasarkan langkah no 5 didapat bahwa nilai z < z_critical maka gagal menolak H0 (μ total sulfur dioxide tidak berada di bawah 35)

## Proporsi nilai total Sulfat Dioxide yang lebih dari 40, adalah tidak sama dengan 50% ?

1. Tentukan Hipotesis nol 

    -> H0: p = 0.5

2. Pilih hipotesis alternatif H1

    -> H1: p ≠ 0.5

3. Tentukan tingkat signifikan α.

    -> α = 0.05

4. Tentukan uji statistik yang sesuai dan tentukan daerah kritis

    -> Uji statistik yang digunakan : Z-test untuk proporsi 1 sampel
    
    -> Daerah Kritis                : z < -1.96 or z > 1.96

5. Hitung nilai uji statistik dari data sample.

In [14]:
from scipy.stats import norm

alpha = 0.05
# Total sample with total sulfur dioxide > 40
n_sampel = df['total sulfur dioxide'].loc[df['total sulfur dioxide'] > 40].size

# Total observation
n = df['total sulfur dioxide'].size

# H0 success proportion
p0 = 0.5
q0 = 1 - p0

# Sample proportion
p1 = n_sampel / n

# Z-score
z = (p1 - p0) / np.sqrt(p0 * q0 / n)

# Critical value
z_critical = norm.ppf(1 - alpha/2)

# Result
print(f'z-score: {z:.2f}')
print(f'Critical value: {z_critical:.2f}')

# Decision
if z < -z_critical or z > z_critical:
    print('Tolak H0. Proporsi nilai total Sulfat Dioxide yang lebih dari 40, adalah tidak sama dengan 50%')
else:
    print('Gagal menolak H0. Proporsi nilai total Sulfat Dioxide yang lebih dari 40, adalah sama dengan 50%')

z-score: 0.76
Critical value: 1.96
Gagal menolak H0. Proporsi nilai total Sulfat Dioxide yang lebih dari 40, adalah sama dengan 50%


6. Ambil keputusan

    -> Berdasarkan langkah no 5 didapat bahwa nilai -z_critical < z < z_critical maka gagal menolak H0 (Proporsi nilai total Sulfat Dioxide yang lebih dari 40, adalah sama dengan 50%)