![imagenes](logo.png)

# Definici√≥n de estimaciones para muestreo probabil√≠stico

Dado el esquema de muestreo y las caracter√≠sticas de la muestra, se definen las bases t√©cnicas para el c√°lculo de las estimaciones, lo cual implica considerar los ponderadores y las medidas de precisi√≥n.

## C√°lculo de ponderadores

El ponderador o factor de expansi√≥n es un concepto relacionado con la probabilidad de selecci√≥n y se interpreta como la cantidad de unidades en la poblaci√≥n objeto de estudio que representa una unidad en la muestra, ll√°mese personas, viviendas, unidades econ√≥micas, entre otras. Dicho ponderador permite dar conclusiones sobre la poblaci√≥n objeto de estudio.

El hecho de que a partir de una muestra se infieran estimaciones sobre indicadores objetivo para la poblaci√≥n objeto de estudio, implica la expansi√≥n de la muestra de acuerdo con los llamados ponderadores, que t√©cnicamente se definen como el inverso de la probabilidad de selecci√≥n. Esto se aplica en dos actividades b√°sicas: el c√°lculo de los ponderadores y el an√°lisis de los ajustes que se deban considerar en estos; por ejemplo, ajuste por no respuesta, ajuste por estimaci√≥n del tama√±o de la poblaci√≥n objeto de estudio, otro tipo de ajuste por caracter√≠stica particular del ponderador y de la encuesta.

En una primera etapa, dada su definici√≥n, los ponderadores se calculan con la informaci√≥n del marco de muestreo, dado que solo se requiere conocer la probabilidad de selecci√≥n de cada unidad de observaci√≥n acorde con el esquema de muestreo elegido. A este concepto se le denominar√° ponderador de dise√±o, ya que es el resultado del inverso de la probabilidad de selecci√≥n de la muestra inicial. 

Los dise√±os muestrales sistem√°tico y MAS sin reemplazo producen muestras autoponderadas. El muestreo estratificado con distribuci√≥n proporcional de la muestra tambi√©n es otro ejemplo de dise√±o autoponderado; su ponderador es 

$$\frac{N_h}{n_h}$$

Usando el hecho de que la distribuci√≥n es proporcional se verifica que el ponderador es igual para cada elemento en la poblaci√≥n objeto de estudio

$$\frac{N_h}{n_h}=\frac{N}{n}$$

**Muestreo Aleatorio Simple.** Supongamos una poblaci√≥n de tama√±o $N$ y una muestra de tama√±o $n$. Entonces cada elemento de la poblaci√≥n tiene probabilidad $n/N$ de ser elegido. Por lo tanto, el ponderador de cada elemento de la muestra es $N/n$.

Note que la suma de todos los ponderadores en la muestra es $$\underbrace{\frac{N}{n}+\frac{N}{n}+...+\frac{N}{n}}_n=n\cdot\frac{N}{n}=N$$

## Ajuste de los ponderadores

Esta actividad se realiza hasta que culmina la Fase de Captaci√≥n, sin embargo, en el subproceso del Dise√±o de la Muestra se definen los ajustes que se realizar√°n a los ponderadores. Uno de los ajustes implica evaluar el nivel de la no respuesta, procedi√©ndose a los ajustes necesarios considerando lo siguiente:

* Que las unidades con respuesta tendr√°n pesos mayores a los planeados en la estimaci√≥n, para compensar a los valores que se perdieron debido a la no respuesta (ajuste por no respuesta).

* Que en cada dominio de estudio se obtenga la misma poblaci√≥n a la determinada por una estimaci√≥n de la poblaci√≥n objeto de estudio confiable y referida a la misma fecha del levantamiento de la encuesta (ajuste por estimaci√≥n de la poblaci√≥n objeto de estudio).

El ajuste por no respuesta y por estimaci√≥n de la poblaci√≥n objeto de estudio pueden incluirse en un marco te√≥rico m√°s general denominado calibraci√≥n. Sup√≥ngase un dise√±o muestral con los ponderadores $d_k$ y se cuenta con un conjunto de informaci√≥n auxiliar $\textbf{x}$ relacionada con la poblaci√≥n objeto de estudio, el estimador de un Indicador Objetivo es el total $\hat{t}$ calculado como

$$\hat{t}=\sum_{i=1}^n d_ky_k$$

siendo $y_k$ la caracter√≠stica medida en la unidad $k$.

Los ponderadores calibrados reemplazan este estimador por

$$\hat{t}_W=\sum_{i=1}^n w_ky_k$$

donde el **ponderador calibrado** $w_k$ se define como $w_k=g_k\cdot d_k$, siendo $g_k$ *el peso de la correcci√≥n*. Se deben cumplir dos condiciones:

1. Los ponderadores calibrados $g_k$ tienen que ser muy cercanos a 1.
2. La distribuci√≥n muestral calibrada de la informaci√≥n auxiliar debe coincidir con la distribuci√≥n poblacional

% $$\overline{\textbf{x}}_w=\frac{1}{n}\sum_{k=1}^nw_kx_k=\overline{X}$$

La primera condici√≥n garantiza que los estimadores obtenidos ser√°n insesgados o aproximadamente insesgados y la segunda condici√≥n garantiza que la muestra ponderada por los ponderadores calibrados $w_k$ es representativa de la informaci√≥n auxiliar usada.

La funci√≥n de distancia entre $g_k$ y 1, denotada como $D(g_k, 1)$ se utiliza para minimizar la expresi√≥n 

$$\sum_{k=1}^nD(g_k,1)$$

sujeta a la condici√≥n de calibraci√≥n 2. Este problema de optimizaci√≥n se puede resolver utilizando el m√©todo de multiplicadores de Lagrange. La funci√≥n de distancia $D(g_k, 1)$ no es √∫nica, por ejemplo:

* $D(g_k, 1)=(g_k-1)^2$ define una calibraci√≥n lineal (regresi√≥n lineal).
* $D(g_k, 1)=g_k\log(g_k)-g_k+1$.

En https://github.com/scidatmath2020/Diseno_de_encuestas_23/blob/main/calibrate.pdf se encuentra un documento basado en las ideas originales de Deville y Sarndall sobre la calibraci√≥n.

En la figura siguiente se presenta un ejemplo de calibraci√≥n multiplicativa. Se tienen los datos de la muestra y los totales
marginales para la poblaci√≥n objeto de estudio. La calibraci√≥n se hace por edad y grupo de edad. En el primer paso los pesos de calibraci√≥n $w_k^{(1)}=$total grupo edad poblacional$/$total grupo edad muestra paso inicial; en el segundo paso los pesos son $w_k^{(2)}=w_k^{(1)}\times$total grupo sexo poblacional$/$total grupo edad muestra paso 1.

Por ejemplo, el peso de calibraci√≥n de una joven mujer en el paso 2 es $1.035\times 11.45$. El procedimiento concluye cuando totales por edad y sexo de las estimaciones ajustadas por calibraci√≥n son iguales a los totales poblacionales o las diferencias son muy peque√±as.

![imagenes](im16.png)


Los ponderadores calibrados $w_k$ obtenidos despu√©s de aplicar cualquier m√©todo de calibraci√≥n pueden tener las siguientes desventajas:

i. Ponderadores extremadamente grandes pueden generar estimaciones altamente inestables.

ii. La calibraci√≥n lineal puede producir ponderadores negativos.

No obstante, otros m√©todos de calibraci√≥n permiten mantener los ponderadores calibrados dentro de l√≠mites preestablecidos y obtener inferencias v√°lidas. En el caso de encuestas con dise√±os complejos como el muestreo por conglomerados, se obtiene informaci√≥n para hacer inferencias para dos poblaciones: la poblaci√≥n de viviendas y la poblaci√≥n de personas habitantes de las viviendas. Los m√©todos de calibraci√≥n pueden aplicarse en ambos casos lo cual resulta en dos conjuntos de ponderadores calibrados asignadas a cada registro, lo cual complica el an√°lisis de la informaci√≥n. 

En **Benthlehem, J., Cobben, F., and Schouten, B. (2011): Handbook of Nonresponse in Household Surveys, Nueva York: Wiley**, cap. 8, 2011, describen un procedimiento para obtener ponderadores calibrados √∫nicos tanto para las viviendas como para personas en la muestra.

Posterior a estos posibles ajustes y antes de declarar como liberados los ponderadores ‚Äúdefinitivos‚Äù, debe verificarse que en cada dominio para el que se pretende obtener estimaciones, la expansi√≥n obtenida para los indicadores objetivo sea congruente con el total obtenido con el marco. Los ponderadores definitivos son aplicados durante la Fase de Procesamiento para la explotaci√≥n de resultados.



## La no respuesta en encuestas probabil√≠sticas

La no respuesta ocurre cuando un informante seleccionado en la encuesta no proporciona la informaci√≥n solicitada. Existen dos tipos de no respuesta:

* Por unidad o total: un elemento seleccionado no proporciona ninguna informaci√≥n.
* Por variable: el informante seleccionado responde algunas preguntas, pero no todas.

La no respuesta es un problema debido a que el tama√±o de la muestra se reduce, lo cual afecta la precisi√≥n planeada de los estimadores de la encuesta, y adem√°s se genera un sesgo por la no respuesta selectiva en algunos subgrupos de la poblaci√≥n objeto de estudio o subconjuntos de preguntas en el cuestionario de la encuesta. De forma general, la no respuesta por unidad o total y por √≠tem son tratados con m√©todos de ajuste de los ponderadores muestrales y m√©todos de imputaci√≥n, respectivamente (Bethlehem et al., cap. 12 y 14, 2011). La imputaci√≥n m√∫ltiple (**Schafer, 1997, Analysis of Incomplete Multivariate Data. Chapman & Hall, London**) puede emplearse para el tratamiento de la no respuesta por unidad; los m√©todos de ajuste de los ponderadores muestrales son aplicables para tratar la no respuesta por √≠tem cuando se requiere estimar totales, medias o proporciones de un Indicador Objetivo.

Una medida de la calidad de la informaci√≥n es la tasa de no respuesta. Este indicador de tasa de no respuesta para un ciclo del programa se calcula a nivel muestral conforme a los c√≥digos de no respuesta obtenidos en campo; as√≠ como ponderado, de acuerdo con el inverso de la probabilidad de selecci√≥n de las unidades en muestra:

**a.** La tasa de no respuesta sin ponderar, usando los conteos simples de la muestra, ofrecen una descripci√≥n √∫til del √©xito operativo de la encuesta, es decir, se puede monitorear el √©xito de la encuesta para obtener respuestas en la encuesta.

**b.** La tasa de no respuesta ponderada se calcula como el cociente de la suma de los pesos de las unidades que responden y la suma de los pesos de todas las unidades en la muestra. Las tasas de no respuesta ponderadas ofrecen una mejor descripci√≥n del √©xito de la encuesta con respecto a la poblaci√≥n objeto de estudio. Son √∫tiles cuando se trata de encuestas con probabilidades distintas de inclusi√≥n; en el caso de muestreo aleatorio simple las tasas de no respuesta ponderadas y sin ponderar son iguales.

El Comit√© del Aseguramiento de la Calidad del INEGI aprob√≥ los indicadores de calidad relacionados con la no respuesta:

1. Tasa de no respuesta antes de imputaci√≥n a nivel unidad de observaci√≥n (TNR_AI).
2. Tasa de no respuesta despu√©s de imputaci√≥n a nivel unidad de observaci√≥n (TNR_DI).
3. Tasa de imputaci√≥n a nivel unidad de observaci√≥n (TI).

En el caso de muestreo probabil√≠stico o de un muestreo no probabil√≠stico basado en el tama√±o de alguna variable de dise√±o tambi√©n se deber√° calcular la versi√≥n ponderada de estos indicadores.

## C√°lculo de las estimaciones y precisiones estad√≠sticas

Liberada la base de datos definitiva y disponi√©ndose de los ponderadores, una actividad m√°s que se considera en la Fase de An√°lisis de la Producci√≥n y en el Dise√±o de la Muestra, se refiere al c√°lculo de estimaciones y las precisiones estad√≠sticas correspondientes.

###  C√°lculo de las estimaciones

Disponi√©ndose de la informaci√≥n captada, los ponderadores y la expresi√≥n matem√°tica para cada estimador, el c√°lculo de las estimaciones se realiza por sustituci√≥n. As√≠, para estimar el total de un Indicador Objetivo, se suman los productos generados a partir de multiplicar el valor obtenido para determinada variable de cada unidad de observaci√≥n por el ponderador correspondiente. De manera similar y respetando la expresi√≥n del estimador, se construyen las estimaciones para promedios, proporciones y razones.

Idealmente, el estimador elegido debe satisfacer las siguientes caracter√≠sticas:

* Ser insesgado; en promedio las estimaciones deben ser iguales al valor poblacional.
* Consistente; cuando se incrementa el tama√±o de la muestra la estimaci√≥n se acerca al valor poblacional.
* Eficiente; las variaciones de los resultados de las posibles muestras deben ser peque√±as (precisi√≥n).
* Ser f√°cil de obtener y calcular (una combinaci√≥n lineal de valores observados).

Sin embargo, las propiedades de esta lista no pueden obtenerse para la mayor√≠a de los estimadores. En la realidad, el tama√±o de muestra $n$ es finito y podr√≠a considerarse ‚Äúgrande‚Äù. El sesgo de un estimador es la diferencia entre el valor esperado, promedio de la distribuci√≥n muestral, de un estimador y el valor verdadero de un estad√≠stico poblacional. Formalmente, si $\theta$ es el estad√≠stico poblacional y $\hat{\theta}$ es el estimador de dicho estad√≠stico, el sesgo se define como

$$Sesgo(\hat{\theta})=E[\hat{\theta}]-\theta$$

Si $Sesgo(\hat{\theta})=0$, entonces $\hat{\theta}$ es un estimador insesgado del valor poblacional del estad√≠stico $\theta$. Si el estimador es asint√≥ticamente insesgado (te√≥ricamente cuando $n$ se va incrementando infinitamente), entonces puede considerarse como aproximadamente insesgado cuando $n$ es suficientemente grande. De esta manera la consistencia del estimador se cumple, y entonces la distribuci√≥n muestral del estimador puede considerarse que se encuentra alrededor del valor poblacional.

Existen dos situaciones en las cuales no es posible usar estimadores exactamente insesgados: (i) para varios par√°metros es dif√≠cil encontrar un estimador insesgado, (ii) un estimador con sesgo puede tener un error cuadr√°tico medio menor (derivado de tener una varianza m√°s peque√±a) que cualquier estimador insesgado. 

Para varios estimadores se cuenta con f√≥rmulas espec√≠ficas para el c√°lculo de varianza de los estimadores. Frecuentemente se requiere estimar otras cantidades que no son funciones de totales a partir de datos de una encuesta para las cuales no se cuenta con f√≥rmulas exactas de varianza. Por ejemplo, para un estimador de raz√≥n 

$$\hat{R}=\frac{\hat{\theta}_y}{\hat{\theta}_x}$$

la varianza del estimador $\hat{R}$ no es igual al cociente de las varianzas de los estimadores $\hat{\theta}_y$ y $\hat{\theta}_x$. Para este ejemplo se emplea una t√©cnica de linearizaci√≥n para obtener un estimador aproximado de la varianza de $\hat{R}$.

Adem√°s de t√©cnicas de linearizacion para obtener estimaciones de varianzas, tambi√©n se utilizan t√©cnicas de remuestreo como jackknife y bootstrap. Una descripci√≥n de las t√©cnicas para estimaci√≥n de varianzas de estimadores para encuestas se encuentra en **Introduction to variance estimation. Springer Science & Business Media** de Wolter (2007).

### C√°lculo de las precisiones estad√≠sticas

Como parte de la evaluaci√≥n de la calidad de la informaci√≥n captada por la encuesta, en particular para conocer si se cumplieron las expectativas de confiabilidad de los estimadores, se calculan las precisiones de estos. Esta actividad consiste en obtener para todos los indicadores objetivo:

* El error est√°ndar es una medida de la dispersi√≥n esperada de las estimaciones muestrales alrededor del par√°metro poblacional; el cual se obtiene a partir del c√°lculo de la estimaci√≥n de la varianza $Var(\hat{\theta})$ para el estimador $\hat{\theta}$ del esquema de muestreo empleado; de esta manera, el error est√°ndar $EE(\hat{\theta})$ se define como $EE(\hat{\theta})=\sqrt{Var(\hat{\theta})}$. Un error est√°ndar grande sugiere menos confianza en el estimador muestral.

* El factor de correcci√≥n por poblaci√≥n finita (fpc) se usa para ajustar la varianza estimada del estimador $\hat{\theta}$, debido a que se obtiene con datos de la muestra, es decir, la poblaci√≥n finita no es completamente observada o medida. La variabilidad del estimador se debe a los datos que no est√°n en la muestra. Si el fpc se ignora, la consecuencia es la sobreestimaci√≥n del error est√°ndar de $\hat{\theta}$. La varianza estimada debe ajustarse hacia la baja a medida que el tama√±o de la muestra $n$ se incrementa, ya que los datos observados en la muestra son completamente conocidos y la contribuci√≥n a la varianza de $\theta$ proviene de los $N-n$ casos que no se incluyen en la muestra. Para el muestreo aleatorio sin reemplazo $fpc=\frac{N-n}{N}=1-f$ donde $f=n/N$ es la fracci√≥n de muestreo. La cantidad $1-f$ se aplica a la varianza estimada de $\hat{\theta}$. Dicha varianza se reduce a cero cuando $n=N$ y se acerca al valor completo cuando el tama√±o de muestra $n$ se reduce. Esto se reduce a lo siguiente

$$fpc=\left\{\begin{array}{c}0\mbox{ si }n\to N\\1\mbox{ si }n\to0\end{array}\right.$$

El fpc se puede ignorar si la fracci√≥n de muestreo $f$ no es mayor al 5% o incluso puede ser tan alto como 10%. Cuando una muestra se dise√±a con estratificaci√≥n y los fpc apropiados se aplican en cada estrato, uno o m√°s de los estratos tendr√°n fracciones de muestreo ùëì altas lo que generar√° una reducci√≥n considerable de los errores est√°ndares de las estimaciones, por ejemplo, en encuestas donde hay estratos en los que todas sus unidades son seleccionadas en la muestra, la contribuci√≥n a los errores est√°ndares de las estimaciones ser√° nula. En muestreos multi√©tapicos habr√° fracciones de muestreo $f$ distintas en cada etapa que se ver√°n involucradas en la estimaci√≥n de la varianza de $\hat{\theta}$. El efecto de los fpc en la estimaci√≥n de la varianza depende de c√≥mo var√≠an los indicadores objetivo analizadas dentro de las unidades primarias de muestreo (UPM) o entre ellas. No obstante, la fracci√≥n de muestreo en la primera etapa, la muestra de UPM, puede ser ignorada si es lo suficientemente peque√±a. Si esta condici√≥n se cumple entonces las variaciones de la medias o totales de las UPM incorporar√° autom√°ticamente cualquier fpc aplicable al submuestreo dentro de las UPM.

Como consecuencia, si la fracci√≥n de muestreo de la primera etapa es peque√±a, entonces la contribuci√≥n a la varianza $\hat{\theta}$ del submuestreo en las siguientes etapas no ser√° considerable; est√° es una ventaja del m√©todo del ‚Äúultimo conglomerado‚Äù. El √∫nico caso donde se tiene que poner atenci√≥n especial en los dise√±os bi√©tapicos sucede cuando las fracciones de muestreo de las UPM y de las unidades en la segunda etapa son grandes. El efecto en la estimaci√≥n del error est√°ndar de $\hat{\theta}$ ser√° mayor cuando los indicadores objetivo medidos tengan una alta variabilidad entre las UPM. En este caso la inclusi√≥n de la fpc puede hacer una gran diferencia en la estimaci√≥n de la varianza de $\hat{\theta}$.

* Los intervalos de confianza se determinan de acuerdo con el nivel de confianza establecido para el c√°lculo del tama√±o de muestra y empleando la varianza del estimador. La f√≥rmula general de un intervalo de confianza de $100(1-\alpha)$% para $\hat{\theta}$ asumiendo que $\hat{\theta}$ tiene distribuci√≥n normal es 

$$\hat{\theta}\pm z_{1-\alpha/2}\sqrt{Var(\hat{\theta})}$$

Los intervalos de confianza son los valores en los que se espera est√© contenido el valor del par√°metro con cierta probabilidad.

* El $DEFF_p(\hat{\theta})$ para el estimador $\hat{\theta}$ bajo el dise√±o muestral $p$, con tama√±o de muestra fijo, se define como $$DEFF_p(\hat{\theta})=\frac{Var_p(\hat{\theta})}{Var_{MAS}(\hat{\theta})}$$

En la determinaci√≥n del intervalo de confianza, en casos de un dise√±o muestral complejo, debe considerarse el efecto del dise√±o, multiplicando los l√≠mites de √©ste por la ra√≠z cuadrada del DEFF_p:

$$\hat{\theta}\pm z_{1-\alpha/2}\sqrt{Var(\hat{\theta})}\cdot\sqrt{DEFF_p(\hat{\theta})}$$

* El coeficiente de variaci√≥n $CV(\hat{\theta})$ se define como $$CV(\hat{\theta})=\frac{\sqrt{Var(\hat{\theta})}}{\hat{\theta}}$$

El coeficiente de variaci√≥n es una medida relativa de su precisi√≥n; conforme sus valores son m√°s pr√≥ximos a cero, la estimaci√≥n es m√°s precisa. El coeficiente de variaci√≥n no tiene medidas de unidad y por lo tanto la precisi√≥n relativa de dos o m√°s indicadores objetivo puede compararse. Para que la interpretaci√≥n del coeficiente de variaci√≥n sea √∫til, el estimador $\hat{\theta}$ debe ser positivo, ya que si es muy cercano a cero, el coeficiente de variaci√≥n puede ser muy inestable.