# EXERCISE 
1) Write a Python function that determines if the distribution of a pandas Series is symmetric, right-skewed or left-skewed.

2) A disease affects 2% of a population. The population is divided into three age groups:
	•	Young (50%): False positive rate 3%, sensitivity 95%.
	•	Middle-aged (30%): False positive rate 4%, sensitivity 90%.
	•	Elderly (20%): False positive rate 5%, sensitivity 85%.

N.B.
False positive rate: probability of a person testing positive when they do not have the disease.
Sensitivity/True positive rate: probability of a person testing positive when they have the disease.

If a random person from the population tests positive, what is the probability they actually have the disease?

# 1

In [1]:
import numpy as np
import pandas as pd
from scipy.stats import skew


In [2]:
def check_symmetry(series):
    skewness = skew(series)
    if abs(skewness) < 0.05:
        return "Distribuzione simmetrica"
    elif skewness > 0:
        return "Distribuzione asimmetrica a destra (right-skewed)"
    else:
        return "Distribuzione asimmetrica a sinistra (left-skewed)"


In [3]:
# Esempio di utilizzo
n = 1000
np.random.seed(42)
data = pd.Series(np.random.normal(0, 1, n))  # Distribuzione normale
check_symmetry(data)


'Distribuzione asimmetrica a destra (right-skewed)'

# 2

In [4]:
# Dati del problema
p_disease = 0.02  # 2% della popolazione ha la malattia


In [5]:
groups = {
    "YOUNG": {"pop": 0.5, "sens": 0.95, "fals_pos": 0.03},
    "MIDDLE_AGE": {"pop": 0.3, "sens": 0.90, "fals_pos": 0.04},
    "ELDERLY": {"pop": 0.2, "sens": 0.85, "fals_pos": 0.05},
}

# Calcolo della probabilità totale di ottenere un test positivo
p_positive = 0
for group, values in groups.items():
    p_group = values["pop"]  # Probabilità di appartenere al gruppo
    p_pos_given_disease = values["sens"]  # Sensibilità (vero positivo)
    p_pos_given_no_disease = values["fals_pos"]  # Falso positivo
    
    # P(test positivo | gruppo) = P(test positivo | malato) * P(malato) + P(test positivo | sano) * P(sano)
    p_positive_group = (p_pos_given_disease * p_disease) + (p_pos_given_no_disease * (1 - p_disease))
    
    # P(test positivo) = somma pesata per ogni gruppo
    p_positive += p_positive_group * p_group


In [6]:
# Calcolo della probabilità condizionata di avere la malattia dato un test positivo (Teorema di Bayes)
p_disease_given_positive = 0
for group, values in groups.items():
    p_group = values["pop"]
    p_pos_given_disease = values["sens"]
    
    # P(malato | test positivo) per il gruppo
    p_disease_given_positive_group = (p_pos_given_disease * p_disease) / p_positive
    
    # Pesiamo per la probabilità di appartenere al gruppo
    p_disease_given_positive += p_disease_given_positive_group * p_group

# Stampa il risultato
print(f"La probabilità che una persona abbia effettivamente la malattia dato che è risultata positiva al test è: {p_disease_given_positive:.4f}")

La probabilità che una persona abbia effettivamente la malattia dato che è risultata positiva al test è: 0.3354
