In [1]:
import numpy as np
import pandas as pd
import warnings

warnings.filterwarnings("ignore")

In [2]:
# Definizione delle condizioni
condizioni = [
    {"n": 100, "media": 0, "dev_std": 1, "condizione": "Condizione_1"},
    {"n": 150, "media": 5, "dev_std": 2, "condizione": "Condizione_2"},
    {"n": 200, "media": 10, "dev_std": 3, "condizione": "Condizione_3"},
]

# Creazione di una lista per raccogliere tutti i dati
dati_totali = []

# Generazione dei dati
for cond in condizioni:
    campione = np.random.normal(
        loc=cond["media"], scale=cond["dev_std"], size=cond["n"]
    )
    # Creiamo un DataFrame temporaneo per ogni campione
    df_temp = pd.DataFrame({"Valore": campione, "Condizione": cond["condizione"]})
    # Appendiamo il DataFrame temporaneo alla lista dei dati totali
    dati_totali.append(df_temp)

# Concateniamo tutti i DataFrame temporanei in un unico DataFrame in formato long
df_dati_simulati = pd.concat(dati_totali, ignore_index=True)

# Verifica dei nomi delle colonne
print("Colonne nel DataFrame:", df_dati_simulati.columns)

Colonne nel DataFrame: Index(['Valore', 'Condizione'], dtype='object')


In [3]:
# Calcolo della media, della deviazione standard e del conteggio per ogni condizione
statistiche = (
    df_dati_simulati.groupby("Condizione")
    .agg({"Valore": ["mean", "std", "count"]})
    .rename(
        columns={"mean": "Media", "std": "Deviazione Standard", "count": "Conteggio"}
    )
)

# Stampa delle statistiche
print(statistiche)

                 Valore                              
                  Media Deviazione Standard Conteggio
Condizione                                           
Condizione_1  -0.105990            0.973584       100
Condizione_2   5.062508            1.956944       150
Condizione_3  10.007982            3.153502       200


In [4]:
# Numero di prove
n = 100
# Probabilità di successo per ogni prova
p = 0.4

# Simulazione di n prove Bernoulliane
y1 = np.random.binomial(1, p, n)

# Calcolo della media e della deviazione standard
media_calcolata = np.mean(y1)
dev_std_calcolata = np.std(y1)

print("Media calcolata:", media_calcolata)
print("Deviazione standard calcolata:", dev_std_calcolata)

Media calcolata: 0.45
Deviazione standard calcolata: 0.49749371855331004


In [5]:
y1

array([1, 1, 0, 0, 1, 0, 1, 0, 1, 1, 1, 0, 0, 1, 0, 1, 0, 0, 1, 1, 1, 0,
       0, 0, 1, 0, 0, 0, 0, 1, 1, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 1, 1,
       0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 1, 1, 1, 1, 0, 1,
       0, 1, 0, 0, 1, 0, 1, 0, 0, 0, 1, 1, 1, 1, 1, 0, 1, 0, 0, 0, 1, 1,
       0, 0, 0, 1, 1, 1, 0, 1, 1, 0, 1, 0])