![imagenes](logo.png)

# Definición de estimaciones para muestreo probabilístico

Dado el esquema de muestreo y las características de la muestra, se definen las bases técnicas para el cálculo de las estimaciones, lo cual implica considerar los ponderadores y las medidas de precisión.

## Cálculo de ponderadores

El ponderador o factor de expansión es un concepto relacionado con la probabilidad de selección y se interpreta como la cantidad de unidades en la población objeto de estudio que representa una unidad en la muestra, llámese personas, viviendas, unidades económicas, entre otras. Dicho ponderador permite dar conclusiones sobre la población objeto de estudio.

El hecho de que a partir de una muestra se infieran estimaciones sobre indicadores objetivo para la población objeto de estudio, implica la expansión de la muestra de acuerdo con los llamados ponderadores, que técnicamente se definen como el inverso de la probabilidad de selección. Esto se aplica en dos actividades básicas: el cálculo de los ponderadores y el análisis de los ajustes que se deban considerar en estos; por ejemplo, ajuste por no respuesta, ajuste por estimación del tamaño de la población objeto de estudio, otro tipo de ajuste por característica particular del ponderador y de la encuesta.

En una primera etapa, dada su definición, los ponderadores se calculan con la información del marco de muestreo, dado que solo se requiere conocer la probabilidad de selección de cada unidad de observación acorde con el esquema de muestreo elegido. A este concepto se le denominará ponderador de diseño, ya que es el resultado del inverso de la probabilidad de selección de la muestra inicial. 

Los diseños muestrales sistemático y MAS sin reemplazo producen muestras autoponderadas. El muestreo estratificado con distribución proporcional de la muestra también es otro ejemplo de diseño autoponderado; su ponderador es 

$$\frac{N_h}{n_h}$$

Usando el hecho de que la distribución es proporcional se verifica que el ponderador es igual para cada elemento en la población objeto de estudio

$$\frac{N_h}{n_h}=\frac{N}{n}$$

**Muestreo Aleatorio Simple.** Supongamos una población de tamaño $N$ y una muestra de tamaño $n$. Entonces cada elemento de la población tiene probabilidad $n/N$ de ser elegido. Por lo tanto, el ponderador de cada elemento de la muestra es $N/n$.

Note que la suma de todos los ponderadores en la muestra es $$\underbrace{\frac{N}{n}+\frac{N}{n}+...+\frac{N}{n}}_n=n\cdot\frac{N}{n}=N$$

## Ajuste de los ponderadores

Esta actividad se realiza hasta que culmina la Fase de Captación, sin embargo, en el subproceso del Diseño de la Muestra se definen los ajustes que se realizarán a los ponderadores. Uno de los ajustes implica evaluar el nivel de la no respuesta, procediéndose a los ajustes necesarios considerando lo siguiente:

* Que las unidades con respuesta tendrán pesos mayores a los planeados en la estimación, para compensar a los valores que se perdieron debido a la no respuesta (ajuste por no respuesta).

* Que en cada dominio de estudio se obtenga la misma población a la determinada por una estimación de la población objeto de estudio confiable y referida a la misma fecha del levantamiento de la encuesta (ajuste por estimación de la población objeto de estudio).

El ajuste por no respuesta y por estimación de la población objeto de estudio pueden incluirse en un marco teórico más general denominado calibración. Supóngase un diseño muestral con los ponderadores $d_k$ y se cuenta con un conjunto de información auxiliar $\textbf{x}$ relacionada con la población objeto de estudio, el estimador de un Indicador Objetivo es el total $\hat{t}$ calculado como

$$\hat{t}=\sum_{i=1}^n d_ky_k$$

siendo $y_k$ la característica medida en la unidad $k$.

Los ponderadores calibrados reemplazan este estimador por

$$\hat{t}_W=\sum_{i=1}^n w_ky_k$$

donde el **ponderador calibrado** $w_k$ se define como $w_k=g_k\cdot d_k$, siendo $g_k$ *el peso de la corrección*. Se deben cumplir dos condiciones:

1. Los ponderadores calibrados $g_k$ tienen que ser muy cercanos a 1.
2. La distribución muestral calibrada de la información auxiliar debe coincidir con la distribución poblacional

% $$\overline{\textbf{x}}_w=\frac{1}{n}\sum_{k=1}^nw_kx_k=\overline{X}$$

La primera condición garantiza que los estimadores obtenidos serán insesgados o aproximadamente insesgados y la segunda condición garantiza que la muestra ponderada por los ponderadores calibrados $w_k$ es representativa de la información auxiliar usada.

La función de distancia entre $g_k$ y 1, denotada como $D(g_k, 1)$ se utiliza para minimizar la expresión 

$$\sum_{k=1}^nD(g_k,1)$$

sujeta a la condición de calibración 2. Este problema de optimización se puede resolver utilizando el método de multiplicadores de Lagrange. La función de distancia $D(g_k, 1)$ no es única, por ejemplo:

* $D(g_k, 1)=(g_k-1)^2$ define una calibración lineal (regresión lineal).
* $D(g_k, 1)=g_k\log(g_k)-g_k+1$.

En https://github.com/scidatmath2020/Diseno_de_encuestas_23/blob/main/calibrate.pdf se encuentra un documento basado en las ideas originales de Deville y Sarndall sobre la calibración.

En la figura siguiente se presenta un ejemplo de calibración multiplicativa. Se tienen los datos de la muestra y los totales
marginales para la población objeto de estudio. La calibración se hace por edad y grupo de edad. En el primer paso los pesos de calibración $w_k^{(1)}=$total grupo edad poblacional$/$total grupo edad muestra paso inicial; en el segundo paso los pesos son $w_k^{(2)}=w_k^{(1)}\times$total grupo sexo poblacional$/$total grupo edad muestra paso 1.

Por ejemplo, el peso de calibración de una joven mujer en el paso 2 es $1.035\times 11.45$. El procedimiento concluye cuando totales por edad y sexo de las estimaciones ajustadas por calibración son iguales a los totales poblacionales o las diferencias son muy pequeñas.

![imagenes](im16.png)


Los ponderadores calibrados $w_k$ obtenidos después de aplicar cualquier método de calibración pueden tener las siguientes desventajas:

i. Ponderadores extremadamente grandes pueden generar estimaciones altamente inestables.

ii. La calibración lineal puede producir ponderadores negativos.

No obstante, otros métodos de calibración permiten mantener los ponderadores calibrados dentro de límites preestablecidos y obtener inferencias válidas. En el caso de encuestas con diseños complejos como el muestreo por conglomerados, se obtiene información para hacer inferencias para dos poblaciones: la población de viviendas y la población de personas habitantes de las viviendas. Los métodos de calibración pueden aplicarse en ambos casos lo cual resulta en dos conjuntos de ponderadores calibrados asignadas a cada registro, lo cual complica el análisis de la información. 

En **Benthlehem, J., Cobben, F., and Schouten, B. (2011): Handbook of Nonresponse in Household Surveys, Nueva York: Wiley**, cap. 8, 2011, describen un procedimiento para obtener ponderadores calibrados únicos tanto para las viviendas como para personas en la muestra.

Posterior a estos posibles ajustes y antes de declarar como liberados los ponderadores “definitivos”, debe verificarse que en cada dominio para el que se pretende obtener estimaciones, la expansión obtenida para los indicadores objetivo sea congruente con el total obtenido con el marco. Los ponderadores definitivos son aplicados durante la Fase de Procesamiento para la explotación de resultados.



## La no respuesta en encuestas probabilísticas

La no respuesta ocurre cuando un informante seleccionado en la encuesta no proporciona la información solicitada. Existen dos tipos de no respuesta:

* Por unidad o total: un elemento seleccionado no proporciona ninguna información.
* Por variable: el informante seleccionado responde algunas preguntas, pero no todas.

La no respuesta es un problema debido a que el tamaño de la muestra se reduce, lo cual afecta la precisión planeada de los estimadores de la encuesta, y además se genera un sesgo por la no respuesta selectiva en algunos subgrupos de la población objeto de estudio o subconjuntos de preguntas en el cuestionario de la encuesta. De forma general, la no respuesta por unidad o total y por ítem son tratados con métodos de ajuste de los ponderadores muestrales y métodos de imputación, respectivamente (Bethlehem et al., cap. 12 y 14, 2011). La imputación múltiple (**Schafer, 1997, Analysis of Incomplete Multivariate Data. Chapman & Hall, London**) puede emplearse para el tratamiento de la no respuesta por unidad; los métodos de ajuste de los ponderadores muestrales son aplicables para tratar la no respuesta por ítem cuando se requiere estimar totales, medias o proporciones de un Indicador Objetivo.

Una medida de la calidad de la información es la tasa de no respuesta. Este indicador de tasa de no respuesta para un ciclo del programa se calcula a nivel muestral conforme a los códigos de no respuesta obtenidos en campo; así como ponderado, de acuerdo con el inverso de la probabilidad de selección de las unidades en muestra:

**a.** La tasa de no respuesta sin ponderar, usando los conteos simples de la muestra, ofrecen una descripción útil del éxito operativo de la encuesta, es decir, se puede monitorear el éxito de la encuesta para obtener respuestas en la encuesta.

**b.** La tasa de no respuesta ponderada se calcula como el cociente de la suma de los pesos de las unidades que responden y la suma de los pesos de todas las unidades en la muestra. Las tasas de no respuesta ponderadas ofrecen una mejor descripción del éxito de la encuesta con respecto a la población objeto de estudio. Son útiles cuando se trata de encuestas con probabilidades distintas de inclusión; en el caso de muestreo aleatorio simple las tasas de no respuesta ponderadas y sin ponderar son iguales.

El Comité del Aseguramiento de la Calidad del INEGI aprobó los indicadores de calidad relacionados con la no respuesta:

1. Tasa de no respuesta antes de imputación a nivel unidad de observación (TNR_AI).
2. Tasa de no respuesta después de imputación a nivel unidad de observación (TNR_DI).
3. Tasa de imputación a nivel unidad de observación (TI).

En el caso de muestreo probabilístico o de un muestreo no probabilístico basado en el tamaño de alguna variable de diseño también se deberá calcular la versión ponderada de estos indicadores.

## Cálculo de las estimaciones y precisiones estadísticas

Liberada la base de datos definitiva y disponiéndose de los ponderadores, una actividad más que se considera en la Fase de Análisis de la Producción y en el Diseño de la Muestra, se refiere al cálculo de estimaciones y las precisiones estadísticas correspondientes.

###  Cálculo de las estimaciones

Disponiéndose de la información captada, los ponderadores y la expresión matemática para cada estimador, el cálculo de las estimaciones se realiza por sustitución. Así, para estimar el total de un Indicador Objetivo, se suman los productos generados a partir de multiplicar el valor obtenido para determinada variable de cada unidad de observación por el ponderador correspondiente. De manera similar y respetando la expresión del estimador, se construyen las estimaciones para promedios, proporciones y razones.

Idealmente, el estimador elegido debe satisfacer las siguientes características:

* Ser insesgado; en promedio las estimaciones deben ser iguales al valor poblacional.
* Consistente; cuando se incrementa el tamaño de la muestra la estimación se acerca al valor poblacional.
* Eficiente; las variaciones de los resultados de las posibles muestras deben ser pequeñas (precisión).
* Ser fácil de obtener y calcular (una combinación lineal de valores observados).

Sin embargo, las propiedades de esta lista no pueden obtenerse para la mayoría de los estimadores. En la realidad, el tamaño de muestra $n$ es finito y podría considerarse “grande”. El sesgo de un estimador es la diferencia entre el valor esperado, promedio de la distribución muestral, de un estimador y el valor verdadero de un estadístico poblacional. Formalmente, si $\theta$ es el estadístico poblacional y $\hat{\theta}$ es el estimador de dicho estadístico, el sesgo se define como

$$Sesgo(\hat{\theta})=E[\hat{\theta}]-\theta$$

Si $Sesgo(\hat{\theta})=0$, entonces $\hat{\theta}$ es un estimador insesgado del valor poblacional del estadístico $\theta$. Si el estimador es asintóticamente insesgado (teóricamente cuando $n$ se va incrementando infinitamente), entonces puede considerarse como aproximadamente insesgado cuando $n$ es suficientemente grande. De esta manera la consistencia del estimador se cumple, y entonces la distribución muestral del estimador puede considerarse que se encuentra alrededor del valor poblacional.

Existen dos situaciones en las cuales no es posible usar estimadores exactamente insesgados: (i) para varios parámetros es difícil encontrar un estimador insesgado, (ii) un estimador con sesgo puede tener un error cuadrático medio menor (derivado de tener una varianza más pequeña) que cualquier estimador insesgado. 

Para varios estimadores se cuenta con fórmulas específicas para el cálculo de varianza de los estimadores. Frecuentemente se requiere estimar otras cantidades que no son funciones de totales a partir de datos de una encuesta para las cuales no se cuenta con fórmulas exactas de varianza. Por ejemplo, para un estimador de razón 

$$\hat{R}=\frac{\hat{\theta}_y}{\hat{\theta}_x}$$

la varianza del estimador $\hat{R}$ no es igual al cociente de las varianzas de los estimadores $\hat{\theta}_y$ y $\hat{\theta}_x$. Para este ejemplo se emplea una técnica de linearización para obtener un estimador aproximado de la varianza de $\hat{R}$.

Además de técnicas de linearizacion para obtener estimaciones de varianzas, también se utilizan técnicas de remuestreo como jackknife y bootstrap. Una descripción de las técnicas para estimación de varianzas de estimadores para encuestas se encuentra en **Introduction to variance estimation. Springer Science & Business Media** de Wolter (2007).

### Cálculo de las precisiones estadísticas

Como parte de la evaluación de la calidad de la información captada por la encuesta, en particular para conocer si se cumplieron las expectativas de confiabilidad de los estimadores, se calculan las precisiones de estos. Esta actividad consiste en obtener para todos los indicadores objetivo:

* El error estándar es una medida de la dispersión esperada de las estimaciones muestrales alrededor del parámetro poblacional; el cual se obtiene a partir del cálculo de la estimación de la varianza $Var(\hat{\theta})$ para el estimador $\hat{\theta}$ del esquema de muestreo empleado; de esta manera, el error estándar $EE(\hat{\theta})$ se define como $EE(\hat{\theta})=\sqrt{Var(\hat{\theta})}$. Un error estándar grande sugiere menos confianza en el estimador muestral.

* El factor de corrección por población finita (fpc) se usa para ajustar la varianza estimada del estimador $\hat{\theta}$, debido a que se obtiene con datos de la muestra, es decir, la población finita no es completamente observada o medida. La variabilidad del estimador se debe a los datos que no están en la muestra. Si el fpc se ignora, la consecuencia es la sobreestimación del error estándar de $\hat{\theta}$. La varianza estimada debe ajustarse hacia la baja a medida que el tamaño de la muestra $n$ se incrementa, ya que los datos observados en la muestra son completamente conocidos y la contribución a la varianza de $\theta$ proviene de los $N-n$ casos que no se incluyen en la muestra. Para el muestreo aleatorio sin reemplazo $fpc=\frac{N-n}{N}=1-f$ donde $f=n/N$ es la fracción de muestreo. La cantidad $1-f$ se aplica a la varianza estimada de $\hat{\theta}$. Dicha varianza se reduce a cero cuando $n=N$ y se acerca al valor completo cuando el tamaño de muestra $n$ se reduce. Esto se reduce a lo siguiente

$$fpc=\left\{\begin{array}{c}0\mbox{ si }n\to N\\1\mbox{ si }n\to0\end{array}\right.$$

El fpc se puede ignorar si la fracción de muestreo $f$ no es mayor al 5% o incluso puede ser tan alto como 10%. Cuando una muestra se diseña con estratificación y los fpc apropiados se aplican en cada estrato, uno o más de los estratos tendrán fracciones de muestreo 𝑓 altas lo que generará una reducción considerable de los errores estándares de las estimaciones, por ejemplo, en encuestas donde hay estratos en los que todas sus unidades son seleccionadas en la muestra, la contribución a los errores estándares de las estimaciones será nula. En muestreos multiétapicos habrá fracciones de muestreo $f$ distintas en cada etapa que se verán involucradas en la estimación de la varianza de $\hat{\theta}$. El efecto de los fpc en la estimación de la varianza depende de cómo varían los indicadores objetivo analizadas dentro de las unidades primarias de muestreo (UPM) o entre ellas. No obstante, la fracción de muestreo en la primera etapa, la muestra de UPM, puede ser ignorada si es lo suficientemente pequeña. Si esta condición se cumple entonces las variaciones de la medias o totales de las UPM incorporará automáticamente cualquier fpc aplicable al submuestreo dentro de las UPM.

Como consecuencia, si la fracción de muestreo de la primera etapa es pequeña, entonces la contribución a la varianza $\hat{\theta}$ del submuestreo en las siguientes etapas no será considerable; está es una ventaja del método del “ultimo conglomerado”. El único caso donde se tiene que poner atención especial en los diseños biétapicos sucede cuando las fracciones de muestreo de las UPM y de las unidades en la segunda etapa son grandes. El efecto en la estimación del error estándar de $\hat{\theta}$ será mayor cuando los indicadores objetivo medidos tengan una alta variabilidad entre las UPM. En este caso la inclusión de la fpc puede hacer una gran diferencia en la estimación de la varianza de $\hat{\theta}$.

* Los intervalos de confianza se determinan de acuerdo con el nivel de confianza establecido para el cálculo del tamaño de muestra y empleando la varianza del estimador. La fórmula general de un intervalo de confianza de $100(1-\alpha)$% para $\hat{\theta}$ asumiendo que $\hat{\theta}$ tiene distribución normal es 

$$\hat{\theta}\pm z_{1-\alpha/2}\sqrt{Var(\hat{\theta})}$$

Los intervalos de confianza son los valores en los que se espera esté contenido el valor del parámetro con cierta probabilidad.

* El $DEFF_p(\hat{\theta})$ para el estimador $\hat{\theta}$ bajo el diseño muestral $p$, con tamaño de muestra fijo, se define como $$DEFF_p(\hat{\theta})=\frac{Var_p(\hat{\theta})}{Var_{MAS}(\hat{\theta})}$$

En la determinación del intervalo de confianza, en casos de un diseño muestral complejo, debe considerarse el efecto del diseño, multiplicando los límites de éste por la raíz cuadrada del DEFF_p:

$$\hat{\theta}\pm z_{1-\alpha/2}\sqrt{Var(\hat{\theta})}\cdot\sqrt{DEFF_p(\hat{\theta})}$$

* El coeficiente de variación $CV(\hat{\theta})$ se define como $$CV(\hat{\theta})=\frac{\sqrt{Var(\hat{\theta})}}{\hat{\theta}}$$

El coeficiente de variación es una medida relativa de su precisión; conforme sus valores son más próximos a cero, la estimación es más precisa. El coeficiente de variación no tiene medidas de unidad y por lo tanto la precisión relativa de dos o más indicadores objetivo puede compararse. Para que la interpretación del coeficiente de variación sea útil, el estimador $\hat{\theta}$ debe ser positivo, ya que si es muy cercano a cero, el coeficiente de variación puede ser muy inestable.