# Técnicas de muestreo

En muchos casos, el muestreo resulta más accesible que el estudio de toda la población. En esta sección se explican las razones principales para muestrear
y, en seguida, diversos métodos para elegir una muestra.

**Razones para muestrear**

Cuando se estudian las características de una población, existen diversas razones prácticas
para preferir algunas partes o muestras de ella para observar y medir. He aquí algunas razones para muestrear:

1. Establecer contacto con toda la población requeriría mucho tiempo. 
2. El costo de estudiar todos los elementos de una población resultaría prohibitivo. 
3. Algunas pruebas son de naturaleza destructiva. 
4. Los resultados de la muestra son adecuados. 




## Muestreo Aleatorio Simple

El tipo de muestreo más común es el muestreo aleatorio simple.

Se obtiene una muestra  seleccionada de manera que cada elemento o individuo de la población tenga las mismas posibilidades de que se le incluya.

Pasos:

1. Determinar el tamaño de la muestra 

| Parámetro  | Tamaño de la población conocida                                                                   | Tamaño de la población no conocida               |
|------------|---------------------------------------------------------------------------------------------------|--------------------------------------------------|
| $\mu$      | $n\geq \frac{N\times Z_{1-\alpha/2\times \sigma^2}}{e^2\times(N-1)+Z_{1-\alpha/2}\times\sigma^2}  $  |$n\geq \frac{Z_{1-\alpha/2}\times\sigma^2}{e^2} $  |
| $\pi$      | $n\geq \frac{N\times Z_{1-\alpha/2\times\pi(1-\pi)}}{e^2\times(N-1)+Z_{1-\alpha/2}\times\pi(1-\pi)} $| $n\geq \frac{Z_{1-\alpha/2}\times\pi(1-\pi)}{e^2}$ |

donde, 

$\alpha:$ significancia.\
$1-\alpha:$ confianza.\
$Z_{1-\alpha/2}:$ Cuantil de la normal.\
$e:$ error máximo permitido.\




2. Numerar los individuos de 1 a N (Identificar el marco muestral)
3. Generar unidades al azar con probabilidad igual (selección por números aleatorios)
4. Seleccionar la muestra y obtener la información de la muestra.

### Ejemplo 

La siguiente lista incluye las tiendas de Marco’s Pizza en el condado de Lucas

| identificación| Dirección                       |
|-------------------------------------------------------------|---|
| 2607                  | Starr Av   |   
| 309                |W Alexis Rd    |   
| 2652                   | W Central Av      |   
| 630                        |Dixie Hwy    |   
|3510                     | Dorr St    |   
| 5055                 |Glendale Av     |   
| 3382                        | Lagrange St   |   
| 2525                  | W Laskey Rd    |   
| 303                    | Louisiana Av    |   
| 149                             |Main    |   
| 835 S                  | McCord Rd     |   
| 3501                    |  Monroe St   |   
| 2040| Ottawa River Rd  |
| 2116 |N Reynolds Rd   |
| 3678| Rugby Dr|
| 1419| South Av   |
| 1234| W Sylvania Av  |
| 4624| Woodville Rd  |
| 5155| S Main |
| 106| E Airport Hwy |
| 6725 |W Central  |
| 4252| Monroe  |
| 2036| Woodville Rd |
| 1316| Michigan Av  |


- Cree un documento en excel y guarde el archivo.
- Cargue el archivo en R con el nombre datos.
- Calcule el tamaño de muestra con la formula de arriba, asuma que $\sigma^2=10$ y $e=2.1$ y use una confianza del $90\%$.
- Seleccione la muestra usando la función.

```r
muestra=sample(x=1:24,size=n)
muestra
datos.muestra=datos[muestra,]
datos.muestra
```


### Ejercicio 

1. Escriba en R el siguiente comando, el cual genera un salario aleatorio para cada uno de los estudiantes.
```r
salario=round(runif(1,min=1.2,max=6.5),3)
salario
```
2. Calcule el tamaño de muestra adecuado para una confianza del $95\%$ y un error que usted defina, el valor de $\sigma$ obténgalo usando una prueba piloto de mínimo 5 compañeros.

3. Seleccioné la muestra y obtenga el valor de $\bar{X}$.

ingrese la información en el  [formulario](https://forms.gle/orPFVv1XQVTWwnUYA)



## Muestreo estratificado 

El muestreo estratificado es un diseño de muestreo probabilístico en el que
dividimos a la población en subgrupos o estratos. La estratificación puede basarse en una amplia variedad de atributos o características de la población como
edad, género, nivel socioeconómico, ocupación, etc.

![](https://navarrof.orgfree.com/Docencia/QuimicaAnalitica/Muestreo/muestr3.jpg)


Suponemos que hay k estratos de tamaños $N_1, N_2,…, N_k$, de forma que:
$$N=N_1+N:2+\cdots+N_k$$
En cada estrato se toman $n_1, n_2,…, n_k$ elementos para la muestra, de manera que se toman en total n individuos, es decir:

$$n=n_1 +n_2+\cdots+n_k$$


**Elección proporcional al tamaño del estrato:** El tamaño de la muestra en cada grupo es proporcional a los elementos de dicho grupo. En cada estrato se tomarán 𝒏_𝒊 elementos, calculados mediante la formula:

$$n_i=n\frac{N_i}{N}$$

el tamaño de muestra $n$ se calcula como:


| Parámetro | Tamaño de la población conocida                                                                     | Tamaño de la población no conocida                              |
|-----------|-----------------------------------------------------------------------------------------------------|-----------------------------------------------------------------|
| $\mu$     | $n\geq \frac{\sum_{i=1}^k W_i\sigma_i^2}{e^2/Z_{1-\alpha/2}+\frac{\sum_{i=1}^k W_i\sigma_i^2}{N}}  $ | $n\geq \frac{Z_{1-\alpha/2}^2 \sum_{i=1}^kW_i\sigma^2_i}{e^2} $ |
| $\pi$     | $n\geq \frac{1}{N(e/Z_{1-\alpha/2})^2}\sum_{i=1}^k N_i\pi_i(1-\pi_i)$                               | $n\geq \frac{Z_{1-\alpha/2}^2\sum_{i=1}^k\pi_i(1-\pi_i)}{e^2}$  |


Por el procedimiento de muestreo elegido obtenemos una muestra de 750 sujetos. Para asignar el número de componentes a los tres estratos de edad, aplicaremos la fórmula anterior:


### Ejemplo 

suponemos que se está haciendo un estudio sobre la toma de pastillas para dormir en una ciudad de 50.000 habitantes. La variable edad se considera adecuada para obtener resultados en esta investigación. Se incluyen solamente los mayores de 40 años en el estudio. Se distribuyen en tres grupos o estratos, resultando una agrupación, según el censo:

|     Estrato    |     Rango de Edad      |     Censo (Población)    |     Muestra    |
|----------------|------------------------|--------------------------|----------------|
|     1          |     De 40 a 55 años    |     25.000               |     375        |
|     2          |     De 56 a 70 Años    |     18.000               |     270        |
|     3          |     Mayor a 70 Años    |     7.000                |     105        |
|      Total     |                        |     50.000               |     750        |

Por el procedimiento de muestreo elegido obtenemos una muestra de 750 sujetos. Para asignar el número de componentes a los tres estratos de edad, aplicaremos la fórmula anterior:

![](https://raw.githubusercontent.com/jazaineam1/UCE1/master/Cuadernos/Images/i1.png)