<a href="https://colab.research.google.com/github/DechiWords/Mathematic_and_Statistics/blob/main/Muestreo_Aleatorio_Simple.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Muestreo Aleatorio Simple «M.A.S»

##Definición

El **muestreo aleatorio simple**, «M.A.S», o muestreo irrestricto es la forma más sencilla de muestreo probabilístico y proporciona la base teórica para forma de muestreo más complejas.




## Maneras de llevar a cabo el «M.A.S»

Existen dos manera de llevar a cabo «M.A.S».

* Con reemplazo : Podemos seleccionar varias veces la misma unidad de muestreo

* Sin reemplazo : Solo podemos seleccionar una vez cada unidad de muestreo

Un «M.A.S» ***con reemplazo*** tiene la característica de que ***las probabilidades de selección se mantienen constantes*** durante todo el tiempo. Además ***sus variables son independientes***.

Un «M.A.S» ***sin reemplazo*** tiene la característica de que ***las probabilidades de selección van variando con el tiempo***. Además ***sus variables son dependientes***.

## Estimador de una media poblacional $\mu $ a partir de una «M.A.S»

Sean $y_1,\ldots ,y_n \thicksim D \left(\mu , \sigma^2 \right)$. 

Donde $N$ es el tamaño total de la población y $n$ el tamaño de la muestra.

Considere

$$\hat{\mu} = \bar{y} = \frac{\sum_{i=1}^ny_i}{n}$$

Se tiene que

$$E\left[\hat{\mu}\right] = \mu$$

|Nombre                                       |Sí $\sigma^2$ es conocida|Sí $\sigma^2$ es desconocido|
|:--------------------------------------------|--|--:|
|Factor de corrección para poblaciones finitas|$$V\left(\hat{\mu}\right) = \sigma^2 \cdot \frac{N-n}{n\cdot \left(N-1\right)}$$|$$\hat{V}\left(\hat{\mu}\right)=S^2\cdot \frac{N-n}{n\cdot N}$$|
|Cota de error de estimación                  |$$B = 2\sqrt{V\left(\hat{\mu} \right)}$$|$$\hat{B} = 2\sqrt{\hat{V}\left(\hat{\mu} \right)}$$|
|Límite inferior del error de estimación      |$$\hat{\mu}-B $$|$$\hat{\mu}-\hat{B}$$|
|Límite superior del error de estimación      |$$\hat{\mu}+B$$|$$\hat{\mu}+\hat{B}$$|
|Error de muestra (%)                            |$$M.E = \frac{B}{\hat{\mu}}\cdot 100$$|$$M.E = \frac{\hat{B}}{\hat{\mu}}\cdot 100$$|

## Estimar un total poblacional $t$ a partir de una «M.A.S»

Considere $t = \sum_i y_i, y_i\in P$

Podemos reescribir a $t$ como

$$t = N\mu, \text{ donde $N$ es el tamaño total de la población},\text{donde $n$ es el tamaño muestral}$$

Considere el estimador

$$\hat{t} = N\hat{\mu} = N\bar{y}$$

Donde

$$\bar{y} = \frac{\sum_{i=1}^ny_i}{n}$$

Se tiene que

$$E\left[\hat{t} \right] = t = N\mu$$

|Nombre|Sí $\sigma^2$ es conocida|Sí $\sigma^2$ es desconocida|
|:-----|--|--:|
|Varianza|$$V\left(\hat{t}\right) = \sigma^2 \cdot \left(\frac{N^2}{n} \right)\cdot \left(\frac{N-n}{N-1} \right)$$|$$\hat{V}\left(\hat{t} \right) = S^2\cdot \left(\frac{N(N-n)}{n} \right)$$|
|Cota de error de estimación|$$B = 2N\sigma \cdot \sqrt{\frac{N-n}{n\cdot \left(N-1\right)}}$$|$$\hat{B} = 2S\cdot \sqrt{\frac{N(N-n)}{n}}$$|
|Límite inferior del error de estimación|$$\hat{t}-B$$|$$\hat{t}-\hat{B}$$|
|Límite superior del error de estimación|$$\hat{t}+B$$|$$\hat{t}-\hat{B}$$|
|Error de muestra (%)|$$M.E = \frac{B}{\hat{t}}\cdot 100$$|$$M.E = \frac{\hat{B}}{\hat{t}}\cdot 100$$|

## Estimar una proporción poblacional $p$ mediante una «M.A.S»

Considere $y_i\in P$ tal que

$$y_i\thicksim B\left(nP,nP(1-P)\right)$$

Propongamos como estimador de $p$ a $\hat{p}$.

$$\hat{p} = \bar{y} = \frac{\sum_{i=1}^ny_i}{n}=\frac{x}{n},\hat{p}:\text{ proporción muestral},x : \text{ número de éxitos en toda la muestra}$$

Donde $y_i\in \{0,1\}$ con $1$ siendo «éxito» y $0$ como «fracaso».

Tenemos que

$$E\left[\hat{p} \right] = p,p : \text{ proporción poblacional}$$

|Nombre|Sí $\sigma^2$ es conocida|Sí $\sigma^2$ es desconocida|
|:--|--|--:|
|Varianza|$$V\left(\hat{p}\right) = \frac{pq}{n}\cdot \frac{N-n}{N-1},q = 1-p$$|$$\hat{V}\left(\hat{p} \right)=\frac{\hat{p}\hat{q}}{n-1}\cdot \frac{N-n}{N},\hat{q}=1-\hat{p}$$|
|Cota de error de estimación|$$B = 2\sqrt{V\left(\hat{p}\right)}$$|$$\hat{B} = 2\sqrt{\hat{V}\left(\hat{p} \right)}$$|
|Límite inferior del error de estimación|$$\hat{p}-B$$|$$\hat{p}-\hat{B}$$|
|Límite superior del error de estimación|$$\hat{p}+B$$|$$\hat{p}-\hat{B}$$|
|Error de muestra (%)|$$M.E = \frac{B}{\hat{p}}\cdot 100$$|$$M.E = \frac{\hat{B}}{\hat{p}}\cdot 100$$|

In [None]:
#IMPORTAMOS LA VARIANZA MUESTRAL

from statistics import variance as V_M

#FUNCIONES PARA ESTIMAR LA MEDIA POBLACIONAL

def MP_Varianza_Poblacional_Conocida_Datos_Conocidos (Estimador, Varianza_Poblacional, N, n):
  from math import sqrt
  V = (Varianza_Poblacional/n)*((N-n)/(N-1))
  B = 2*(sqrt(V))
  INF = Estimador - B
  SUP = Estimador + B
  Limites = [int(INF),int(SUP)+1]
  ME = (B/Estimador)*100
  return [V,B,Limites,ME]

def MP_Varianza_Poblacional_Desconocida_Datos_Conocidos (Estimador, Varianza_Muestral, N, n):
  from math import sqrt
  V = (Varianza_Muestral/n)*((N-n)/N)
  B = 2*(sqrt(V))
  INF = Estimador - B
  SUP = Estimador + B
  Limites = [int(INF),int(SUP)+1]
  ME = (B/Estimador)*100
  return [V,B,Limites,ME]

def MP_Varianza_Poblacional_Conocida_Datos_Desconocidos (Lista_x, Varianza_Poblacional, N, n):
  from statistics import mean
  Estimador = mean(Lista_x)
  from math import sqrt
  V = (Varianza_Poblacional/n)*((N-n)/(N-1))
  B = 2*(sqrt(V))
  INF = Estimador - B
  SUP = Estimador + B
  Limites = [int(INF),int(SUP)+1]
  ME = (B/Estimador)*100
  return [Estimador,V,B,Limites,ME]

def MP_Varianza_Poblacional_Desconocida_Datos_Desconocidos (Lista_x, N, n):
  from statistics import mean
  Estimador = mean(Lista_x)
  Varianza_Muestral = V_M(Lista_x)
  from math import sqrt
  V = (Varianza_Muestral/n)*((N-n)/N)
  B = 2*(sqrt(V))
  INF = Estimador - B
  SUP = Estimador + B
  Limites = [int(INF),int(SUP)+1]
  ME = (B/Estimador)*100
  return [Estimador,V,B,Limites,ME]

#FUNCIONES PARA EL TOTAL POBLACIONAL

def TP_Varianza_Poblacional_Conocida_Datos_Conocidos (Estimador, Varianza_Poblacional, N, n):
  from math import sqrt
  V = Varianza_Poblacional*((N**2)/n)*((N-n)/(N-1))
  B = 2*sqrt(V)
  INF = Estimador - B
  SUP = Estimador + B
  Limites = [int(INF),int(SUP)+1]
  ME = (B/Estimador)*100
  return [V,B,Limites,ME]

def TP_Varianza_Poblacional_Desconocida_Datos_Conocidos (Estimador, Varianza_Muestral, N, n):
  from math import sqrt
  V = Varianza_Muestral * ( (N*(N-n))/n )
  B = 2*sqrt(V)
  INF = Estimador - B
  SUP = Estimador + B
  Limites = [int(INF),int(SUP)+1]
  ME = (B/Estimador)*100
  return [V,B,Limites,ME]

def TP_Varianza_Poblacional_Conocida_Datos_Desconocidos (Lista_x,Varianza_Poblacional, N,n):
  from statistics import mean
  Estimador = N*mean(Lista_x)
  from math import sqrt
  V = Varianza_Poblacional*((N**2)/n)*((N-n)/(N-1))
  B = 2*sqrt(V)
  INF = Estimador - B
  SUP = Estimador + B
  Limites = [int(INF),int(SUP)+1]
  ME = (B/Estimador)*100
  return [Estimador,V,B,Limites,ME]

def TP_Varianza_Poblacional_Desconocida_Datos_Desconocidos (Lista_x, N, n):
  from statistics import mean
  Estimador = N*mean(Lista_x)
  Varianza_Muestral = V_M(Lista_x)
  from math import sqrt
  V = Varianza_Muestral * ( (N*(N-n))/n )
  B = 2*sqrt(V)
  INF = Estimador - B
  SUP = Estimador + B
  Limites = [int(INF),int(SUP)+1]
  ME = (B/Estimador)*100
  return [Estimador,V,B,Limites,ME]

#FUNCIONES PARA PROPORCION POBLACIONAL

def PP_Varianza_Poblacional_Conocida_Datos_Conocidos (Estimador, P, N, n):
  from math import sqrt
  Q = 1 - P
  V = ((P*Q)/n)*((N-n)/(N-1))
  B = 2*sqrt(V)
  INF = Estimador - B
  SUP = Estimador + B
  Limites = [INF,SUP]
  ME = (B/Estimador)*100
  return [V,B,Limites,ME]

def PP_Varianza_Poblacional_Desconocida_Datos_Conocidos (Estimador, N, n):
  from math import sqrt
  P = Estimador
  Q = 1 - P
  V = ((P*Q)/(n-1))*((N-n)/N)
  B = 2*sqrt(V)
  INF = P - B
  SUP = P + B
  Limites = [INF,SUP]
  ME = (B/P)*100
  return [V,B,Limites,ME]

##Calcular el tamaño de una muestra $n$

### Para una media poblacional $\mu$

Sea $n$ el tamaño de la muestra.

$$\implies n = \frac{N\sigma^2}{(N-1)D+\sigma^2}$$

Donde $N$ es el tamaño de la población, $B$ la cota de error de estimación

$$D = \frac{B^2}{4}$$

Sí $R$ es el rango entonces

$$\sigma = \frac{R}{4}$$

### Para un total poblacional $t$

Sea $n$ el tamaño de la muestra.

$$\implies n = \frac{N\sigma^2}{(N-1)D+\sigma^2}$$

Donde $N$ es el tamaño de la población, $B$ la cota de error de estimación

$$D = \frac{B^2}{4N^2}$$

Sí $R$ es el rango entonces

$$\sigma = \frac{R}{4}$$

### Para una proporción poblacion $p$

Sea $n$ el tamaño de la muestra.

$$\implies n = \frac{N\sigma^2}{(N-1)D+\sigma^2}$$

Donde $N$ es el tamaño de la población, $B$ la cota de error de estimación

$$D = \frac{B^2}{4}$$

Pero, además, tenemos que

$$\sigma^2 = p(1-p)$$

In [None]:
#FUNCIONES PARA CALCULAR LA CANTIDAD DE LA MUESTRA

def n_MP (N,B,R):
  if R == True:
    r = float(input('Ingresa el rando de variacion : '))
    Varianza = (r/4)**2
  else:
    Varianza = float(input('Ingresa el valor de la varianza :'))
  Numerador = N*Varianza
  D = (B**2)/4
  Denominador = ((N-1)*D)+Varianza
  return int(Numerador/Denominador)+1

def n_TP (N,B,R):
  if R == True:
    r = float(input('Ingresa el rando de variacion : '))
    Varianza = (r/4)**2
  else:
    Varianza = float(input('Ingresa el valor de la varianza :'))
  Numerador = N*Varianza
  D = (B**2)/(4*(N**2))
  Denominador = ((N-1)*D)+Varianza
  return int(Numerador/Denominador)+1

def n_PP (P,N,B):
  Varianza = P*(1-P)
  Numerador = N*Varianza
  D = (B**2)/4
  Denominador = ((N-1)*D)+Varianza
  return int(Numerador/Denominador)+1