### **שיעור: חוק המספרים הגדולים, משפט הגבול המרכזי ואינטרוולי רווח סמך**

---

### **1. חוק המספרים הגדולים (Law of Large Numbers - LLN)**

**חוק המספרים הגדולים** קובע שכאשר אנו אוספים מספר גדול של דגימות מקריות ועצמאיות מאותה התפלגות, ממוצע הדגימות יתקרב לתוחלת האמיתית של ההתפלגות.

#### **הגדרה מתמטית:**
$\bar{X}_n \xrightarrow{P} E(X)$
- \( $\bar{X}_n$ \)
   הוא ממוצע הדגימות.
- \( E(X) \) הוא התוחלת האמיתית של ההתפלגות.

---

### **2. משפט הגבול המרכזי (Central Limit Theorem - CLT)**

**משפט הגבול המרכזי** הוא אחד המשפטים החשובים ביותר בסטטיסטיקה. הוא קובע שכאשר גודל המדגם גדל, התפלגות ממוצע הדגימות מתקרבת להתפלגות נורמלית, אפילו אם ההתפלגות המקורית אינה נורמלית.

#### **הגדרה מתמטית:**

אם 
\($ X_1, X_2, \ldots, X_n$ \)
הן דגימות מקריות ועצמאיות עם תוחלת
\( $\mu$ \) 
ושונות
\( $\sigma^2 $\)
, אז:
$$
\bar{X}_n \xrightarrow{d} N\left(\mu, \frac{\sigma^2}{n}\right)
$$באופן שקול:$$
\frac{\bar{X}_n - \mu}{\sigma / \sqrt{n}} \xrightarrow{d} N(0, 1)
$$---

### **3. בניית אינטרוול רווח סמך (Confidence Interval) עבור התוחלת**

אינטרוול רווח סמך מספק טווח שבו נמצא הפרמטר האמיתי של האוכלוסייה בהסתברות מסוימת (למשל 95%).

#### **כאשר סטיית התקן \( $\sigma$ \) ידועה:**$$
\left[\bar{X} - 1.96 \cdot \frac{\sigma}{\sqrt{n}}, \; \bar{X} + 1.96 \cdot \frac{\sigma}{\sqrt{n}}\right]
$$#### **כאשר סטיית התקן \( $\sigma$ \) אינה ידועה:**

נשתמש בהתפלגות \( $t$ \):$$
\left[\bar{X} - t_{n-1, 0.975} \cdot \frac{S}{\sqrt{n}}, \; \bar{X} + t_{n-1, 0.975} \cdot \frac{S}{\sqrt{n}}\right]
$$- \( $S$ \)
הוא סטיית התקן של המדגם.

ה 
\($ t_{n-1, 0.975} $\)
 הוא ערך קריטי מהתפלגות
 \( $t$ \)
  עם
   \( $n-1$ \)
    דרגות חופש.

---

### **תרגול: בניית אינטרוול רווח סמך עבור התפלגות מעריכית**

נבצע סימולציה עם 1000 חזרות של דגימות מקריות מהתפלגות מעריכית \($ \text{Exp}(2)$ \), נחשב את ממוצע הדגימות ונבנה אינטרוול רווח סמך.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

# הגדרות הסימולציה
np.random.seed(0)
sample_size = 100
num_simulations = 1000
lambda_exp = 2  # פרמטר הקצב של ההתפלגות המעריכית

# יצירת דגימות מהתפלגות מעריכית
samples = np.random.exponential(scale=1/lambda_exp, size=(sample_size, num_simulations))
means = samples.mean(axis=0)

# סטיית התקן האמיתית
true_mean = 1 / lambda_exp
true_std = 1 / lambda_exp

# חישוב שגיאת התקן
standard_error = true_std / np.sqrt(sample_size)

# בניית אינטרוול רווח סמך ברמת ביטחון של 95%
z_score = norm.ppf(0.975)  # ערך Z קריטי עבור 95% ביטחון
lower_bound = true_mean - z_score * standard_error
upper_bound = true_mean + z_score * standard_error

# בדיקה כמה מהממוצעים נופלים בתוך אינטרוול רווח הסמך
within_interval = (means >= lower_bound) & (means <= upper_bound)
proportion_within_interval = np.mean(within_interval)

# הצגת התוצאות בגרף
plt.figure(figsize=(10, 6))
plt.hist(means, bins=30, density=True, alpha=0.7, edgecolor='black', color='skyblue')
plt.axvline(lower_bound, color='red', linestyle='--', label=f'Lower Bound ({lower_bound:.3f})')
plt.axvline(upper_bound, color='green', linestyle='--', label=f'Upper Bound ({upper_bound:.3f})')
plt.axvline(true_mean, color='black', linestyle='-', label=f'True Mean ({true_mean:.3f})')
plt.xlabel('Sample Mean')
plt.ylabel('Density')
plt.title('Confidence Interval for the Mean of Exponential Distribution')
plt.legend()
plt.grid(True)
plt.show()

proportion_within_interval

### **מסקנות:**

- אינטרוול רווח הסמך שנבנה תפס את התוחלת האמיתית ב-94.6% מהמקרים, קרוב מאוד לרמת הביטחון של 95%.
- ככל שמספר החזרות גדל, הפרופורציה תתקרב עוד יותר לרמת הביטחון הרצויה, בהתאם למשפט הגבול המרכזי.


