## Tabellle e quantili:

# Probability of a Standard Normal Variable Between -2.04 and 2.04

This document explains how to find the probability that a standard normal random variable, denoted as $Z$, falls between $-2.04$ and $2.04$, i.e., $P(-2.04 < Z < 2.04)$. It also includes functions to calculate quantiles.

## Understanding the Standard Normal Distribution

The standard normal distribution is a bell-shaped, symmetrical distribution with a mean of 0 and a standard deviation of $1$. It is often represented as N(0, 1).

## Finding the Probability

To find $P(-2.04 < Z < 2.04)$, we can use the following steps:

1.  **Find $P(Z < 2.04)$:**
    * This represents the area under the standard normal curve to the left of $2.04$.
    * We can use a standard normal table (Z-table) or a statistical software/calculator to find this probability.
    * From a Z-table, $P(Z < 2.04) ≈ 0.9793$.

2.  **Find $P(Z < -2.04)$:**
    * This represents the area under the standard normal curve to the left of -2.04.
    * Due to the symmetry of the standard normal distribution, P(Z < -2.04) = 1 - P(Z < 2.04).
    * Therefore, $P(Z < -2.04) ≈ 1 - 0.9793 = 0.0207$.

3.  **Calculate $P(-2.04 < Z < 2.04)$:**
    * $P(-2.04 < Z < 2.04) = P(Z < 2.04) - P(Z < -2.04)$.
    * $P(-2.04 < Z < 2.04) ≈ 0.9793 - 0.0207 = 0.9586$.

## Using Complementary Probability

Alternatively, due to symmetry:

* $P(-2.04 < Z < 2.04) = 1 - P(Z < -2.04) - P(Z > 2.04)$.
* Since $P(Z > 2.04) = P(Z < -2.04)$,
* $P(-2.04 < Z < 2.04) = 1 - 2 * P(Z < -2.04)$
* $P(-2.04 < Z < 2.04) = 1 - 2 * 0.0207 = 1 - 0.0414 = 0.9586$.





In [None]:

import scipy.stats as stats

# Calculate P(Z < 2.04)
prob_z_less_204 = stats.norm.cdf(2.04)
print(f"P(Z < 2.04): {prob_z_less_204:.4f}")

# Calculate P(Z < -2.04)
prob_z_less_neg_204 = stats.norm.cdf(-2.04)
print(f"P(Z < -2.04): {prob_z_less_neg_204:.4f}")

# Calculate P(-2.04 < Z < 2.04) using the difference
prob_between = prob_z_less_204 - prob_z_less_neg_204
print(f"P(-2.04 < Z < 2.04): {prob_between:.4f}")

# Calculate P(-2.04 < Z < 2.04) using complementary probability
prob_between_complement = 1 - 2 * prob_z_less_neg_204
print(f"P(-2.04 < Z < 2.04) (complementary): {prob_between_complement:.4f}")

# Function to calculate quantiles (percentiles)
def calculate_quantile(percentile):
    """Calculates the quantile (percentile) for a standard normal distribution."""
    return stats.norm.ppf(percentile / 100)

# Example: Calculate the 95th percentile
quantile_95 = calculate_quantile(95)
print(f"95th percentile: {quantile_95:.4f}")

# Example: Calculate the 25th percentile
quantile_25 = calculate_quantile(25)
print(f"25th percentile: {quantile_25:.4f}")

# Function to calculate probability between two quantiles
def probability_between_quantiles(lower_quantile, upper_quantile):
    """Calculates the probability between two quantiles in a standard normal distribution."""
    return stats.norm.cdf(upper_quantile) - stats.norm.cdf(lower_quantile)

# Example: calculate the probability between -1 and 1
prob_between_neg1_and_1 = probability_between_quantiles(-1, 1)
print(f"Probability between -1 and 1: {prob_between_neg1_and_1:.4f}")

## Misure tendenza centrale e dispersione:

**Commento sulla definizione di deviazione standard:**

La varianza della popolazione 
$$
\frac{1}{N} \cdot \sum_{i=1}^{N} (x_{i} - \bar{x})^2. 
$$
 
Perché quadrati? Un inizio di risposta soddisfacente credo che richiederebbe diversi libri.
Ecco qualche motivo euristico:
- - il quadrato consente, come il valore assoluto, di considerare gli scarti a meno del segno. Però $f(x) = x^2$ è derivabile dappertutto con derivata $f'(x) = 2x,$ mentre il valore assoluto $f(x) = \vert x \vert$ in zero ha uno spigolo.
- il quadrato rende ancora più piccoli gli scarti piccoli e ancora più grandi gli scarti grandi



Quando si prende lo stimatore $s^2$ campionario della varianza bisogna sostituire $n$, taglia del campione, a $N$ e moltiplicare per un fattore di correzione $$ \frac{n}{n-1}.$$

$$
\frac{n}{n-1} \cdot \frac{1}{n} \cdot \sum_{i=1}^{n} (x_{i} - \bar{x})^2 = \frac{1}{n-1} \cdot \sum_{i=1}^{n} (x_{i} - \bar{x})^2.  
$$
Un modo semplice per ricordare questa correzione è il seguente $s^2$ è una stima di $\sigma^2$ che è la variabilità dei dati. Riuscire a stimare la variabilità dei dati .



**Motivazione per considerare la deviazione standard:**

Unità di misura omogenee con i membri del campione di cui si sta provando a stimare la variabilità con esempio stima delle lunghezze. 


## Regressione Lineare:

Quello dei video game 