In [25]:
from scipy.stats import kruskal, f_oneway, levene
from tabulate import tabulate
import pandas as pd

In [26]:
# Read data
df = pd.read_csv("Datasets/iris.csv")

features = ["SepalLength", "SepalWidth", "PetalLength", "PetalWidth"]

In [None]:
# Check for equality of distributions of characteristics of flowers of different types
confidence = 0.95
alpha = 1 - confidence

classes = df["Class"].unique()
table = []

for feature in features:
    line = [feature]
    groups = [df[df["Class"] == cls][feature] for cls in classes]

    # Kruskal Wallis test
    stat, p_value = kruskal(*groups)

    line.append((stat, p_value))
    line.append("Same" if p_value > alpha else "Not same")

    table.append(line)

print(tabulate(table, headers=["Feature", "(Statistic, P_value)", "Conclusion"], tablefmt="fancy_grid"))

╒═════════════╤══════════════════════════════════════════════════════════════════════╤══════════════╕
│ Feature     │ (Statistic, P_value)                                                 │ Conclusion   │
╞═════════════╪══════════════════════════════════════════════════════════════════════╪══════════════╡
│ SepalLength │ (np.float64(96.93743600064833), np.float64(8.91873433246198e-22))    │ Not same     │
├─────────────┼──────────────────────────────────────────────────────────────────────┼──────────────┤
│ SepalWidth  │ (np.float64(62.49463010053111), np.float64(2.6882119006774528e-14))  │ Not same     │
├─────────────┼──────────────────────────────────────────────────────────────────────┼──────────────┤
│ PetalLength │ (np.float64(130.41406912893967), np.float64(4.7967237479455454e-29)) │ Not same     │
├─────────────┼──────────────────────────────────────────────────────────────────────┼──────────────┤
│ PetalWidth  │ (np.float64(131.09335318823713), np.float64(3.415387999117524e-29)

In [None]:
# Check for equal math distribution of characteristics of flowers of different types
confidence = 0.95
alpha = 1 - confidence

classes = df["Class"].unique()
table = []

for feature in features:
    line = [feature]
    groups = [df[df["Class"] == cls][feature] for cls in classes]

    # Kruskal Wallis test
    stat, p_value = f_oneway(*groups)

    line.append((stat, p_value))
    line.append("Same" if p_value > alpha else "Not same")

    table.append(line)

print(tabulate(table, headers=["Feature", "(Statistic, P_value)", "Conclusion"], tablefmt="fancy_grid"))

╒═════════════╤══════════════════════════════════════════════════════════════════════╤══════════════╕
│ Feature     │ (Statistic, P_value)                                                 │ Conclusion   │
╞═════════════╪══════════════════════════════════════════════════════════════════════╪══════════════╡
│ SepalLength │ (np.float64(119.26450218450468), np.float64(1.6696691907693826e-31)) │ Not same     │
├─────────────┼──────────────────────────────────────────────────────────────────────┼──────────────┤
│ SepalWidth  │ (np.float64(47.36446140299382), np.float64(1.3279165184572242e-16))  │ Not same     │
├─────────────┼──────────────────────────────────────────────────────────────────────┼──────────────┤
│ PetalLength │ (np.float64(1179.0343277002194), np.float64(3.0519758018278374e-91)) │ Not same     │
├─────────────┼──────────────────────────────────────────────────────────────────────┼──────────────┤
│ PetalWidth  │ (np.float64(959.3244057257613), np.float64(4.376956957488959e-85))

In [None]:
# Check for equal variance of characteristics of flowers of different types
confidence = 0.95
alpha = 1 - confidence

classes = df["Class"].unique()
table = []

for feature in features:
    line = [feature]
    groups = [df[df["Class"] == cls][feature] for cls in classes]

    # Kruskal Wallis test
    stat, p_value = levene(*groups)

    line.append((stat, p_value))
    line.append("Same" if p_value > alpha else "Not same")

    table.append(line)

print(tabulate(table, headers=["Feature", "(Statistic, P_value)", "Conclusion"], tablefmt="fancy_grid"))

╒═════════════╤═════════════════════════════════════════════════════════════════════╤══════════════╕
│ Feature     │ (Statistic, P_value)                                                │ Conclusion   │
╞═════════════╪═════════════════════════════════════════════════════════════════════╪══════════════╡
│ SepalLength │ (np.float64(6.35272002048269), np.float64(0.0022585277836218586))   │ Not same     │
├─────────────┼─────────────────────────────────────────────────────────────────────┼──────────────┤
│ SepalWidth  │ (np.float64(0.6475222363405327), np.float64(0.5248269975064537))    │ Same         │
├─────────────┼─────────────────────────────────────────────────────────────────────┼──────────────┤
│ PetalLength │ (np.float64(19.72005532503458), np.float64(2.5892961840828553e-08)) │ Not same     │
├─────────────┼─────────────────────────────────────────────────────────────────────┼──────────────┤
│ PetalWidth  │ (np.float64(19.412206652034453), np.float64(3.301949958497502e-08)) │ Not s