## **Estimador puntual - Media muestral**

Un estimador puntual es un estimador que tiene un valor único. Por ejemplo, la media de una muestra es un estimador puntual de la media de la población. En este notebook vamos a ver cómo calcular la media de una muestra y cómo calcular el error estándar de la media.

Hay varias tecnicas que se utilizan para calcular los estimadores puntuales. En este notebook vamos a ver dos de ellas:

- **Método de los momentos**: Este método se basa en igualar los momentos muestrales de una distribución con los momentos teóricos de la distribución. Los valores de los parámetros que satisfacen estas ecuaciones se utilizan como estimadores puntuales de los parámetros de la distribución.

- **Método de la máxima verosimilitud**: Este método se basa en maximizar la función de verosimilitud de los datos observados para encontrar los valores de los parámetros de la distribución que mejor se ajustan a los datos. Los valores de los parámetros que maximizan la función de verosimilitud se utilizan como estimadores puntuales de los parámetros de la distribución.

- **Método de la media muestral**: Este método se utiliza para estimar la media poblacional a partir de una muestra de datos aleatorios. La media de la muestra se utiliza como un estimador puntual de la media poblacional.

- **Método de la mediana muestral**: Este método se utiliza para estimar la mediana poblacional a partir de una muestra de datos aleatorios. La mediana de la muestra se utiliza como un estimador puntual de la mediana poblacional.

- **Método de los cuantiles**: Este método se basa en estimar los cuantiles poblacionales a partir de los cuantiles muestrales. Los valores de los cuantiles muestrales se utilizan como estimadores puntuales de los cuantiles poblacionales.

- **Método de mínimos cuadrados**: Este método se utiliza para estimar los parámetros de un modelo lineal a partir de datos observados. Los valores de los parámetros que minimizan la suma de los cuadrados de las diferencias entre los valores observados y los valores predichos se utilizan como estimadores puntuales de los parámetros del modelo.

---

## **1. Método de la media muestral**

El método de la media muestral se utiliza para estimar la media poblacional a partir de una muestra de datos aleatorios. La media de la muestra se utiliza como un estimador puntual de la media poblacional.

> **Se calcula la media muestral como:**
>
> >$$\bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i$$

Por ejemplo, si tenemos una poblacion de ``100 personas`` y queremos estimar la media de la población, podemos tomar una muestra de ``10 personas`` y calcular la media de la muestra. Este valor se utilizará como un estimador puntual de la media poblacional.

> **Se calcularía este valor de la siguiente manera:**
>
>> $$\bar{x} = \frac{1}{10} \sum_{i=1}^{10} x_i$$
>
> Desde **1 hasta 10** sumamos los valores de la muestra y los **dividimos entre 10**.
>



> **Se calcula el error estándar de la media muestral como:**
>
> >$$\sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}}$$
>
> Donde $\sigma$ es la desviación estándar de la población y $n$ es el tamaño de la muestra.

Por ejemplo, si tenemos una poblacion de ``100 personas`` y queremos estimar la media de la población, podemos tomar una muestra de ``10 personas`` y calcular el error estándar de la media muestral. Este valor se utilizará como un estimador puntual del error estándar de la media poblacional.

> **Se calcularía este valor de la siguiente manera:**
>
>> $$\sigma_{\bar{x}} = \frac{\sigma}{\sqrt{10}}$$
>
> Donde $\sigma$ es la desviación estándar de la población y $10$ es el tamaño de la muestra.

---

#### **(*) Diferencia entre el estimador de la media muestral y el estimador lineal de la media muestral**

El ``estimador de la media muestral`` es el estimador puntual de la ``media poblacional``. 
El ``estimador lineal`` de la media muestral es el estimador lineal de la ``media poblacional``.

El estimador lineal se refiere a que el estimador lineal de la media muestral es una recta que pasa por el punto **$(\bar{x}, \bar{x})$.**

> **Se calcula el estimador lineal de la media muestral como:**
>
> >$$\hat{\mu} = \bar{x} + \frac{\sigma^2}{n}$$
>
> Donde $\bar{x}$ es la media muestral, $\sigma^2$ es la varianza de la población y $\hat{\mu}$ es la media poblacional estimada linealmente.

Por ejemplo, si tenemos una poblacion de ``100 personas`` y queremos estimar la media de la población, podemos tomar una muestra de ``10 personas`` y calcular el estimador lineal de la media muestral. Este valor se utilizará como un estimador lineal de la media poblacional.

> **Se calcularía este valor de la siguiente manera:**
>
>> $$\hat{\mu} = \bar{x} + \frac{\sigma^2}{10}$$
>
> Donde $\bar{x}$ es la media muestral y $\sigma^2$ es la varianza de la población.

---

#### **EJEMPLO 6.2 MONTGOMERY - ESTIMADOR DE LA MEDIA MUESTRAL**

En un estudio de la calidad de los alimentos, se seleccionó una muestra aleatoria de 25 hamburguesas de un restaurante. La masa de las hamburguesas se midió en gramos y se obtuvo la siguiente muestra:

| Número de hamburguesa | Peso en gramos |
| --- | --- |
| 1 | 3.5 |
| 2 | 3.6 |
| 3 | 3.7 |
| 4 | 3.8 |
| 5 | 3.9 |
| 6 | 4.0 |
| 7 | 4.1 |
| 8 | 4.2 |
| 9 | 4.3 |
| 10 | 4.4 |
| 11 | 4.5 |
| 12 | 4.6 |
| 13 | 4.7 |
| 14 | 4.8 |
| 15 | 4.9 |
| 16 | 5.0 |
| 17 | 5.1 |
| 18 | 5.2 |
| 19 | 5.3 |
| 20 | 5.4 |
| 21 | 5.5 |
| 22 | 5.6 |
| 23 | 5.7 |
| 24 | 5.8 |
| 25 | 5.9 |

Por lo tanto, deberiamos calcular los **estimadores puntuales** de la media poblacional y el error estándar de la media muestral.

> **Se calcula la media muestral de los datos de la tabla:**
>
> >$\bar{x} = \frac{1}{25}(3.5+3.6+\cdots+5.8+5.9) \approx 4.7$
>
> Por lo tanto, el ``estimador puntual de la media poblacional`` de la masa de hamburguesas es ``4.7 gramos``.
>

> **Se calcula el estimador lineal como:**
>
> >$y_i = \beta_0 + \beta_1 x_i + \epsilon_i$
>
> Donde $y_i$ es la masa de la hamburguesa $i$-ésima, $x_i$ es la cantidad de carne utilizada para preparar la hamburguesa $i$-ésima, $\beta_0$ y $\beta_1$ son los parámetros de la recta de regresión y $\epsilon_i$ es el error aleatorio asociado a la hamburguesa $i$-ésima.
>
>Podemos estimar los parámetros $\beta_0$ y $\beta_1$ a partir de los datos de la muestra usando el método de mínimos cuadrados. En este caso, dado que solo tenemos un predictor (la cantidad de carne), la ecuación de la recta de regresión es:
>
> >$\hat{y} = b_0 + b_1 x$
>
>Donde $\hat{y}$ es la predicción de la masa de la hamburguesa, $b_0$ y $b_1$ son los estimadores lineales de los parámetros $\beta_0$ y $\beta_1$ y $x$ es la cantidad de carne utilizada para preparar la hamburguesa.
>

**La fórmula para calcular los estimadores lineales es:**
>
>$b_1 = \frac{\sum_{i=1}^{n}(x_i - \bar{x})(y_i - \bar{y})}{\sum_{i=1}^{n}(x_i - \bar{x})^2}$
>
>$b_0 = \bar{y} - b_1 \bar{x}$
>
>Donde $\bar{y}$ es la media de las masas de hamburguesas y $\bar{x}$ es la media de las cantidades de carne utilizadas.
>
> **Aplicando estas fórmulas a los datos de la tabla, obtenemos:**
>
>$\bar{x} \approx 4.7$
>
>$b_1 = \frac{\sum_{i=1}^{25}(x_i - \bar{x})(y_i - \bar{y})}{\sum_{i=1}^{25}(x_i - \bar{x})^2} \approx 0.583$
>
>$b_0 = \bar{y} - b_1 \bar{x} \approx 2.697$
>
> Por lo tanto, el ``estimador lineal de la media poblacional`` de la masa de hamburguesas es ``4.7 gramos``.

---

**PREGUNTA 6.2 MONTGOMERY**

- **Indique por que ambos son estimadores.**

Ambos son estimadores ya que se utilizan para estimar un ``parámetro desconocido`` de una población, en este caso la media poblacional.

> **ESTIMADOR INSESGADO**
>
>El estimador insesgado de la media poblacional es el que se considera mejor, ya que en promedio su valor esperado coincide con el valor del parámetro que se quiere estimar. Por lo tanto, el estimador insesgado $\overline{X}$ es mejor que el estimador sesgado $S^2/n$.


- **¿Cuál de los dos estimadores es insesgado?**

Para comprobar si alguno de los ``estimadores es insesgado``, primero debemos ``calcular su sesgo``.

Para calcular el estimador insesgado de una muestra, se debe seguir los siguientes pasos:

- **Calcular la media muestral $\bar{x}$ de la muestra.**

$\bar{x}$ = 4.7

- **Calcular la varianza muestral $\sigma^2$ de la muestra.**

$\sigma^2$ = 0.25 **(No hace falta calcular la varianza para el sesgo)**
