## Parametrik Olmayan Testler

#### 1) Mann-Whitney U testi 
- Normal dağılım özelliği göstermeyen bir dağılımda iki bağımsız grup ortalamalarını karşılaştırmak amacıyla kullanılan non-parametrik bir yöntemdir.

In [3]:
import pandas as pd
import numpy as np

In [5]:
df=pd.read_csv("insurance.csv")
df.head()

Unnamed: 0,age,sex,bmi,children,smoker,region,charges
0,19,female,27.9,0,yes,southwest,16884.924
1,18,male,33.77,1,no,southeast,1725.5523
2,28,male,33.0,3,no,southeast,4449.462
3,33,male,22.705,0,no,northwest,21984.47061
4,32,male,28.88,0,no,northwest,3866.8552


**Soru 1 :** Veri setinde, sigara içen ve içmeyen bireylerin sağlık harcamaları bulunmaktadır. Bu iki grubun sağlık harcamaları (charges) arasında anlamlı bir fark olup olmadığını inceleyiniz.
- **H0:** Sigara içen ve içmeyen bireylerin arasında ortalama sağlık harcamaları açısından anlamlı bir fark yoktur.
- **H1:** Sigara içen ve içmeyen bireylerin arasında ortalama sağlık harcamaları açısından anlamlı bir fark vardır.

In [12]:
smokers = df[df['smoker'] == 'yes']['charges']
non_smokers = df[df['smoker'] == 'no']['charges']

In [14]:
from scipy.stats import mannwhitneyu

In [16]:
# Mann-Whitney U testini uygulayın
u_statistic, p_value = mannwhitneyu(smokers, non_smokers)

# Sonuçları yazdırın
print(f'U İstatistiği: {u_statistic}')
print(f'P-Değeri: {p_value}')

U İstatistiği: 284133.0
P-Değeri: 5.270233444503571e-130


In [20]:
# Hipotez testi sonucu
if p_value > 0.05:
    print("H0 kabul edilir.Sigara içenler ve içmeyenler arasında sağlık harcamaları açısından anlamlı bir fark yoktur.")
else:
    print("H1 kabul edilir.Sigara içenler ve içmeyenler arasında sağlık harcamaları açısından anlamlı bir fark vardır.")

H1 kabul edilir.Sigara içenler ve içmeyenler arasında sağlık harcamaları açısından anlamlı bir fark vardır.


**Soru 2:** Aşağıda N=23 olan bir grubun sözel yetenek testinden elde edilen puanlarla cinsiyet değişkenine ilişkin dağılımlar sunulmuştur. Sözel yetenek puanlarının cinsiyet değişkenine göre istatistiksel açıdan anlamlı bir farklılık gösterip göstermediğini test ediniz.

- **H0:** Kız ve erkek grupları arasında sözel yetenek puanları açısından anlamlı bir fark yoktur.
- **H1:** Kız ve erkek grupları arasında sözel yetenek puanları açısından anlamlı bir fark vardır.

In [2]:
import numpy as np
from scipy.stats import mannwhitneyu

In [4]:
# Veriler
kiz_sira = [19, 11, 14.5, 5, 6, 11, 21, 23, 22, 20, 17]
erkek_sira = [11, 18, 16, 4, 8, 11, 2.5, 3, 2.5, 11, 14.5, 7]

In [6]:
# Mann-Whitney U Testi
stat, p_value = mannwhitneyu(kiz_sira, erkek_sira, alternative='two-sided')

# Test İstatistiği ve p-değeri
print('Test İstatistiği (U değeri):', stat)
print('p-değeri:', p_value)

Test İstatistiği (U değeri): 103.5
p-değeri: 0.02204042799083198


In [8]:
alpha = 0.05  # Anlamlılık seviyesi

if p_value < alpha:
    print('Sonuç: p-değeri', p_value, ' olduğundan H0 hipotezi reddedilir.')
    print('Kız ve erkek grupları arasında sözel yetenek puanları açısından anlamlı bir fark vardır.')
else:
    print('Sonuç: p-değeri', p_value, ' olduğundan H0 hipotezi kabul edilir.')
    print('Kız ve erkek grupları arasında sözel yetenek puanları açısından anlamlı bir fark yoktur.')

Sonuç: p-değeri 0.02204042799083198  olduğundan H0 hipotezi reddedilir.
Kız ve erkek grupları arasında sözel yetenek puanları açısından anlamlı bir fark vardır.


#### 2) Kruskal Wallis-H Testi

- Normal dağılım göstermeyen gruplarda üç veya daha fazla sayıda grubun ortalamaları arasındaki farklılığın anlamlılığını test amacıyla kullanılan bir tekniktir. One-Way ANOVA’nın non-parametrik karşılığıdır.

**Soru 4:** Sigorta ücretlerinin farklı bölgeler arasında anlamlı bir şekilde değişip değişmediğini inceleyiniz.
- **H0:** Region değişkenine göre charges değişkeninin medyanları arasında istatistiksel olarak anlamlı bir fark yoktur.
- **H1:** Region değişkenine göre charges değişkeninin medyanları arasında istatistiksel olarak anlamlı bir fark vardır.

In [70]:
# Bölgelere göre sigorta ücretlerini gruplandır
groups = [df[df['region'] == region]['charges'] for region in df['region'].unique()]

In [65]:
# Kruskal-Wallis Testi uygulayın
statistic, p_value = kruskal(*groups)

# Sonuçları yazdırın
print(f'Kruskal-Wallis İstatistiği: {statistic}')
print(f'P-Değeri: {p_value}')


Kruskal-Wallis İstatistiği: 4.734181215658743
P-Değeri: 0.19232908072121002


In [73]:
# Hipotez testi sonucu
if p_value < 0.05:
    print("H0 reddedilir.Sigorta ücretleri, bölgeler arasında anlamlı bir şekilde farklıdır.")
else:
    print("H0 kabul edilir.Sigorta ücretleri, bölgeler arasında anlamlı bir fark göstermemektedir.")

H0 kabul edilir.Sigorta ücretleri, bölgeler arasında anlamlı bir fark göstermemektedir.


#### 3)Wilcoxon İşaret Sıralaması Testi
- Wilcoxon İşaret Sıralaması Testi, özellikle küçük örneklem büyüklükleri veya veri dağılımlarının normal olmadığı durumlarda kullanılır. Bu test, iki eşleştirilmiş örneğin (örneğin, aynı grubun iki farklı zaman noktasındaki ölçümleri) medyanlarının arasında anlamlı bir fark olup olmadığını belirlemek için tasarlanmıştır.

In [26]:
#Veri seti kurgusaldır ve müdahaleden önce ve sonra kan basıncı ölçümlerini içerir. Bunlar “bp_before” ve “bp_after” değişkenleridir.

In [32]:
data = pd.read_csv("gfg_data.csv")

In [34]:
data.head()

Unnamed: 0,bp_before,bp_after
0,143,153
1,163,170
2,153,168
3,153,142
4,146,141


**Soru 3:** Bir tedavi ya da müdahale sonrasında bireylerin kan basıncında anlamlı bir değişiklik olup olmadığını belirleyiniz.
- **H0:** Tedavi öncesi ve sonrası kan basıncı değerleri arasında anlamlı bir fark yoktur (medyanlar eşittir).
- **H1:** Tedavi öncesi ve sonrası kan basıncı değerleri arasında anlamlı bir fark vardır (medyanlar eşit değildir).

In [39]:
import pandas as pd
from scipy.stats import wilcoxon

In [41]:
test_statistic, p_value = wilcoxon(data["bp_before"], data["bp_after"])
# Sonuçları yazdırın
print(f'Test İstatistiği: {test_statistic}')
print(f'P-Değeri: {p_value}')

Test İstatistiği: 2234.5
P-Değeri: 0.0014107333565442858


In [45]:
# Hipotez testi sonucu
if p_value < 0.05:
    print("H0 reddedilir.Tedavi öncesi ve sonrası kan basıncı değerleri arasında anlamlı bir fark vardır.")
else:
    print("H0 kabul edilir.Tedavi öncesi ve sonrası kan basıncı değerleri arasında anlamlı bir fark yoktur.")

H0 reddedilir.Tedavi öncesi ve sonrası kan basıncı değerleri arasında anlamlı bir fark vardır.


#### 4)FRIEDMAN TESTİ

**Soru 5:** Bir araştırmacı, hastaların üç farklı ilaç üzerindeki tepki sürelerinin eşit olup olmadığını bilmek istiyor. Bunu test etmek için, 10 farklı hastanın üç ilacın her birinde tepki süresini (saniye cinsinden) ölçüyor.İlaçlar arasında ortalama reaksiyon süresinin farklı olup olmadığını belirlemek için Friedman Testi'ni gerçekleştirin.

- **H0:**  Her popülasyonun ortalaması eşittir.

- **H1:**  En az bir popülasyon ortalaması diğerlerinden farklıdır.

In [79]:
group1 = [4, 6, 3, 4, 3, 2, 2, 7, 6, 5]
group2 = [5, 6, 8, 7, 7, 8, 4, 6, 4, 5]
group3 = [2, 4, 4, 3, 2, 2, 1, 4, 3, 2]

In [81]:
from scipy import stats

#perform Friedman Test
stat,p_value = stats.friedmanchisquare(group1, group2, group3)


In [83]:
# Hipotez testi sonucu
if p_value < 0.05:
    print("H0 reddedilir.En az bir popülasyon ortalaması diğerlerinden farklıdır.")
else:
    print("H0 kabul edilir.Her popülasyonun ortalaması eşittir.")

H0 reddedilir.En az bir popülasyon ortalaması diğerlerinden farklıdır.


- Bu örnekte, test istatistiği  13.3514'tür  ve buna karşılık gelen p değeri p =  0.00126'dır . Bu p değeri 0.05'ten küçük olduğundan, ortalama yanıt süresinin üç ilaç için de aynı olduğu şeklindeki sıfır hipotezini reddedebiliriz.