### 3.6 Pruebas de Hipótesis Estadísticas

Las pruebas de hipótesis (o pruebas de significancia) son procedimientos que permiten decidir si se aceptan o rechazan hipótesis o determinar si las muestras observadas difieren significativamente de los resultados esperados. Durante estas pruebas, se toman decisiones estadísticas sobre las poblaciones basadas en datos de muestras. Antes de llegar a una decisión estadística, primero se hacen suposiciones o conjeturas (hipótesis estadísticas) sobre las poblaciones.

Es importante notar que el tipo de pruebas de hipótesis discutidas en esta sección se basa en la distribución de probabilidad de la hipótesis nula ($H_0$) en la cual se asume que $H_0$ es verdadera (con un error de juicio de $\alpha$); la prueba no incluye la evaluación de si una distribución basada en la hipótesis alternativa es verdadera (por lo que la probabilidad $\beta$ no se considera). Dependiendo del tipo de prueba, se pueden hacer diferentes suposiciones sobre la distribución de variables aleatorias que se están muestreando. Sin embargo, cualquiera que sea la suposición que se haga, debe ser coherente con la prueba elegida y también adecuada al interpretar los resultados de la prueba.

Los pasos generales para la prueba de hipótesis estadísticas se pueden describir como sigue:

1. **Formular las hipótesis apropiadas**, proporcionando $H_0$ y $H_A$. $H_0$ especificará el valor del parámetro de la población, mientras que $H_A$ es la teoría que el investigador cree correcta. Algunos libros estadísticos expresan la hipótesis nula como una igualdad estricta y especifican un valor único para el parámetro en la hipótesis nula. Este libro reconoce que $H_0$ y $H_A$ deben ser todo incluido, pero adoptará la igualdad estricta para simplificar todas las hipótesis nulas. Sin embargo, las hipótesis nulas pueden modificarse adecuadamente para hacer todas las hipótesis todo incluidas si se desea.

2. **Seleccionar el nivel de significancia** (por ejemplo, $\alpha = 0.10$) y extraer los valores críticos basados en la distribución estadística asumida de la población de la cual se toman los datos de la muestra.

3. **Proporcionar la estadística de prueba** apropiada. La estadística de prueba debe elegirse según las condiciones satisfechas por los datos de la muestra.

4. **Tomar una decisión**. La decisión es "rechazar $H_0$ a favor de $H_A$" o "no rechazar $H_0$". La región de rechazo usualmente identifica los valores de la estadística de prueba que apoyan la hipótesis alternativa.

5. **Interpretar el resultado y proporcionar una conclusión apropiada**. Esto es necesario para que el resultado de la prueba se presente de una manera que sea fácilmente entendida por el cliente. Esto debería ir más allá de simplemente "rechazar" o "no rechazar" la hipótesis nula, y debería relacionar el resultado estadístico con el problema resuelto.

Al formular $H_0$ y $H_A$, se debe decidir si la prueba será de una cola o de dos colas. Las colas de una distribución son las áreas que se alejan de la media de la distribución desde los puntos críticos hasta los infinitos; son las regiones críticas de la distribución con sus áreas siendo iguales al nivel de significancia ($\alpha$). Después de seleccionar el nivel $\alpha$ para una prueba, la prueba de dos colas asigna $\alpha/2$ para probar la hipótesis en una dirección y la otra $\alpha/2$ para probar la hipótesis en la otra dirección, de modo que la significancia total de la prueba sea $\alpha$. Este tipo de prueba se debe hacer si existe una posible relación en ambas direcciones, especialmente si el efecto en una dirección no puede ser descuidado o considerado irrelevante. En el caso de una prueba de una cola, todo el $\alpha$ elegido para la prueba será asignado para probar la hipótesis en solo una de las direcciones de interés. Este tipo de prueba es para probar la relación en una dirección mientras se descarta la posibilidad de una relación en la otra dirección. Esta prueba debe hacerse si el efecto de una prueba en la otra dirección es insignificante o irrelevante. La prueba de una cola, sin embargo, es más poderosa para detectar un efecto en una dirección al ignorar el efecto en la otra dirección.

### 3.6.1 Prueba de Hipótesis sobre la Media de una Población Única

Probar una hipótesis sobre la media de una población ($\mu$) es un caso donde uno debe decidir si la media de la población es igual a un valor conocido ($\delta$). En esta prueba, se requiere encontrar si la media de la muestra ($\bar{x}$) es consistente con la media de la población, es decir, si $\mu = \delta$, entonces $\bar{x}$ es consistente con $\mu$. El concepto de pruebas de hipótesis discutido en la Sección 3.6 puede aplicarse a probar hipótesis sobre la media de una población única de la siguiente manera:

1. **Formular las hipótesis apropiadas** para la prueba de una cola o de dos colas, dependiendo de lo que sea de interés, como se muestra en la Tabla 3.2. Una prueba de una cola será apropiada si uno está interesado en probar si la media de la población es significativamente mayor o significativamente menor que la media de la muestra, pero no ambas. Una prueba de dos colas debe hacerse si uno está interesado en saber si la media de la población es significativamente mayor o significativamente menor que la media de la muestra en la misma prueba única. En una prueba, sin embargo, usualmente es más fácil identificar primero la hipótesis alternativa. Como se puede ver en la Tabla 3.2, al formular las hipótesis, la hipótesis alternativa se usa para identificar si la prueba es de una cola y cuál cola está involucrada. El $H_0$ para la prueba de una cola en la tabla se puede hacer todo incluido modificándolo a $H_0$: $\mu \geq \delta$ o $H_0$: $\mu \leq \delta$, lo que sea apropiado.

2. **Seleccionar el nivel de significancia** (por ejemplo, $\alpha = 0.10$) y extraer los valores críticos de las funciones de distribución estadística apropiadas. Este paso asume que los datos muestreados se extraen independientemente de una distribución normal, de modo que las distribuciones comúnmente usadas son la normal estándar y las distribuciones t de Student. Dado que estas distribuciones son simétricas alrededor de cero, sus valores en una cola son los mismos (pero con signo opuesto) que los correspondientes en la otra cola.

**Tabla 3.2: Hipótesis sobre la media de una población única.**

|                              | Prueba de una cola               | Prueba de dos colas                |
|------------------------------|----------------------------------|------------------------------------|
| Hipótesis nula ($H_0$)     | $H_0: \mu = \delta$            | $H_0: \mu = \delta$              |
| Hipótesis alternativa ($H_A$) | $H_A: \mu < \delta$ o $H_A: \mu > \delta$ | $H_A: \mu \neq \delta$           |

### Hipótesis sobre la media de una población única

iii) Proporcione la estadística de prueba apropiada. Las estadísticas de prueba comúnmente usadas para probar las medias de la población son las estadísticas z y t, llevando a pruebas z y t, respectivamente. La prueba z o la prueba t pueden realizarse dependiendo de las condiciones satisfechas por los datos de la muestra. Por ejemplo, para tamaños de muestra $n \leq 30$ con la desviación estándar de la población ($\sigma$) desconocida, la prueba t debe realizarse usando la siguiente estadística:

$$
t = \frac{\bar{x} - \mu}{SE}
$$

donde $SE = \frac{s}{\sqrt{n}}$ es la desviación estándar de la media calculada a partir de la desviación estándar de la muestra $s$ (donde $\bar{x}$ y $s$ son de muestras independientes (Vanicek y Krakisky 1986)) con la estadística t teniendo la distribución t de Student con el número de grados de libertad como $n - 1$. Si $\bar{x}$ y $s$ se calculan de la misma muestra, la distribución tau de Pope (1976) debe usarse en lugar de la distribución t (se proporciona una muestra de distribución tau en el Apéndice C). Para $n > 30$ o en el caso de que la desviación estándar de la población ($\sigma$) sea conocida, debe usarse la siguiente estadística z:

$$
z = \frac{\bar{x} - \mu}{SE}
$$

donde $SE = \frac{\sigma}{\sqrt{n}}$ con la estadística z teniendo distribución normal estándar con la media de la población de cero y la desviación estándar de la población de 1.

iv) Tomar una decisión. Generalmente, la prueba de dos colas se realiza comúnmente para los medios de las mediciones. La decisión es "rechazar $H_0$ a favor de $H_A$" o "no rechazar $H_0$". Las decisiones típicas que se pueden tomar con respecto a la prueba de hipótesis para una única media poblacional se dan en la Tabla 3.3, donde $t_{1-\alpha, df}$ y $t_{1-\alpha/2, df}$ son valores críticos de la distribución t de Student y $z_{1-\alpha}$ y $z_{1-\alpha/2}$ son valores críticos de la distribución normal estándar. En la tabla, la hipótesis nula $H_0: \mu_1 - \mu_2 = 0$ debe ser rechazada bajo las condiciones establecidas para diferentes hipótesis alternativas. Las regiones de una cola y dos colas de las distribuciones normales estándar se ilustran en la Figura 3.12.

Por ejemplo, en la Tabla 3.3, si $z$ (o $t$) es menor que el valor crítico dado cuando $H_A: \mu < \delta$ (en una prueba de una cola), entonces $H_0: \mu = \delta$ debe ser rechazado.

### Ejemplo 3.1

Una línea de base calibrada de longitud ($\mu$) 1153.00 m se mide 5 veces. Cada medición es independiente y se realiza con la misma precisión. La media muestral ($\bar{x}$) y la desviación estándar muestral ($s$) se calculan a partir de las mediciones como $\bar{x} = 1153.39$ m y $s = 0.06$ m, respectivamente. Pruebe al nivel de significancia del 10% si la distancia medida es significativamente diferente de la distancia calibrada y también si la distancia medida es significativamente mayor que el valor calibrado.

**Solución (Parte 1):**

$$ n = 5, \quad \bar{x} = 1153.39 \text{ m} \quad s = 0.06 \text{ m} \quad \mu = 1153.00 \text{ m} $$

i) Establezca las hipótesis $ H_0 $ y $ H_A $. El término "significativamente diferente" sugiere que se deben evaluar ambas direcciones de la prueba como se indica en la hipótesis alternativa, es decir, prueba de dos colas:

$$ H_0: \mu = 1153.00 \quad \text{vs.} \quad H_A: \mu \neq 1153.00 $$

ii) Seleccione el nivel de significancia $\alpha = 0.10$ y los valores críticos. Dado que el tamaño de la muestra ($n = 5$) es menor a 30 y no se proporciona la desviación estándar de la población ($\sigma$), se debe utilizar la distribución $ t $ de Student para extraer los valores críticos. Para obtener los valores $ t $ de Student, se puede utilizar la función T.INV en Microsoft Excel 2013 con la probabilidad acumulada de $1 - 0.05$ o $0.95$ (para $\alpha = 0.10/2$ siendo el nivel de significancia deseado para una cola) y los grados de libertad como 4; los valores calculados son $ t_{1-\alpha/2, \text{df} = 5-1} = 2.132 $ y $ t_{0.10/2, \text{df} = 5-1} = -2.132 $.

iii) Proporcione el estadístico de prueba de la Ecuación (3.20) para $\sigma$ desconocido o $ n \leq 30 $:

$$ t = \frac{\bar{x} - \mu}{SE} $$

donde $ SE $ es la desviación estándar de la media:

$$ SE = \frac{s}{\sqrt{n}} \quad \Rightarrow \quad SE = \frac{0.06}{\sqrt{5}} = 0.0268 $$

Entonces,

$$ t = \frac{1153.39 - 1153.00}{0.0268} = 14.552 $$

iv) La decisión para la prueba de dos colas es rechazar $ H_0: \mu = 1153.00 $ si uno o ambas de las siguientes condiciones se satisfacen:

$$ t > t_{1-\alpha/2} \quad \text{o} \quad t < t_{\alpha/2} \quad \Rightarrow \quad 14.552 > 2.132? $$

Dado que una de las condiciones (14.552 > 2.132) se satisface, se rechaza $ H_0: \mu = 1153.00 $ al nivel de significancia del 10% y se acepta la hipótesis alternativa que dice que $ H_A: \mu \neq 1153.00 $.

v) Basado en el resultado de esta prueba, la distancia medida es significativamente diferente de la distancia calibrada al nivel de significancia del 10%.

**Solución (Parte 2):**

Prueba si la distancia medida es significativamente mayor que el valor calibrado.

$$ n = 5, \quad \bar{x} = 1153.39 \text{ m} \quad s = 0.06 \text{ m} \quad \mu = 1153.00 \text{ m} $$

i) Establezca las hipótesis $ H_0 $ y $ H_A $:

$$ H_0: \mu = 1153.00 \quad \text{vs.} \quad H_A: \mu > 1153.00 $$

ii) Seleccione el nivel de significancia, $\alpha = 0.10$ para una prueba de una cola y determine el valor crítico correspondiente usando la función T.INV en Microsoft Excel 2013 con la probabilidad acumulada de $\alpha = 0.10$ siendo el nivel de significancia deseado para la cola superior y los grados de libertad como 4; el valor calculado debe ser 1.533.

iii) Proporcione el estadístico de prueba del paso 1 para $\sigma$ desconocido o $ n \leq 31 $: $ t = 14.552 $.

iv) La decisión para la prueba de una cola es la siguiente: Rechazar $ H_0 $ si $ t > t_{1-\alpha, \text{df} = 4} $ $\Rightarrow 14.552 > 1.533$? Dado que 14.552 es mayor que 1.533, se rechaza $ H_0: \mu = 1153.00 $ al nivel de significancia del 10%.

v) Basado en el resultado de esta prueba, la distancia medida es significativamente mayor que la distancia calibrada al nivel de significancia del 10%.

### Solución (Parte 2):

**Prueba si la distancia medida es significativamente mayor que el valor calibrado:**

$$ n = 5, \quad \bar{x} = 1153.39 \, \text{m}, \quad s = 0.06 \, \text{m}, \quad \mu = 1153.00 \, \text{m} $$

i) Plantee las hipótesis $ H_0 $ y $ H_A $ para probar si la medición es significativamente mayor; si la medición es significativamente mayor, significa que la media de la población correspondiente debe ser mayor que el valor dado (la hipótesis $ H_A $):

$$ H_0: \mu = 1153.00 \quad \text{vs.} \quad H_A: \mu > 1153.00 $$

ii) Seleccione el nivel de significancia, $\alpha = 0.10$ para la prueba de una cola y determine el valor crítico correspondiente usando la rutina de software Microsoft Excel 2013 T.INV con la probabilidad acumulativa para $\alpha = 0.10$ siendo el nivel de significancia deseado para la cola superior y los grados de libertad como 4; el valor calculado debe ser 1.533.

iii) Proporcione la estadística de prueba de la parte 1 para $\sigma$ desconocido o $n \leq 31$: $ t = 14.552 $.

iv) La decisión para la prueba de una cola es la siguiente: Rechace $ H_0 $ si $ t > t_{1-\alpha, \, \text{df}} \rightarrow 14.552 > 1.533 $? Dado que 14.552 es mayor que 1.533, se rechaza $ H_0: \mu = 1153.00 $ al nivel de significancia del 10%.

v) Basado en el resultado de esta prueba, la distancia medida es significativamente mayor que la distancia calibrada al nivel de significancia del 10%.

### 3.6.2 Prueba de Hipótesis sobre la Diferencia de Medias de Dos Poblaciones

Este es un caso donde uno está tratando de decidir si dos medias de poblaciones ($\mu_1$ y $\mu_2$) son iguales o si las dos medias de poblaciones no son estadísticamente diferentes. Por ejemplo, si dos equipos de encuesta determinaron independientemente dos medias de muestra como $\bar{x}_1$ y $\bar{x}_2$ con las desviaciones estándar correspondientes como $s_1$ y $s_2$, respectivamente, uno puede querer decidir si $\bar{x}_1$ y $\bar{x}_2$ son estadísticamente iguales. Las hipótesis pueden formularse de la siguiente manera:

**Hipótesis nula:** $ H_0 : \mu_1 - \mu_2 = 0 $ o $ H_0 : \mu_1 = \mu_2 $

**Posibles hipótesis alternativas:** $ H_A : \mu_1 - \mu_2 \neq 0 $ (o $ H_A : \mu_1 \neq \mu_2 $) o $ H_A : \mu_1 - \mu_2 < 0 $ o $ H_A : \mu_1 - \mu_2 > 0 $

La estadística t para este tipo de prueba para un caso donde los tamaños de muestra, $n_1$ o $n_2 \leq 30$ y la desviación estándar de la población ($\sigma$) desconocida, puede darse como:

$$ t = \frac{(\bar{x}_1 - \bar{x}_2) - (\mu_1 - \mu_2)}{SE} $$

donde para muestras pequeñas ($n_1, n_2 \leq 30$) que tienen varianzas de población iguales ($\sigma_1^2 = \sigma_2^2$), se utiliza la varianza agrupada para estimar $SE$ como:

$$ SE = \sqrt{\frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2}} $$

con los grados de libertad, df = $n_1 + n_2 - 2$. Para un caso donde los tamaños de muestra, $n_1, n_2 > 30$, se utiliza la siguiente estadística de prueba z:

$$ z = \frac{(\bar{x}_1 - \bar{x}_2) - (\mu_1 - \mu_2)}{SE} $$

donde

$$ SE = \sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}} $$

### Tabla 3.4 Decisiones de prueba sobre la diferencia entre medias de poblaciones.

| Hipótesis alternativa | Rechazar $ H_0: \mu_1 - \mu_2 = 0 $ (para z-estadístico) | Rechazar $ H_0: \mu_1 - \mu_2 = 0 $ (para t-estadístico) |
|------------------------|------------------------------------------------------------|------------------------------------------------------------|
| $ H_A: \mu_1 - \mu_2 < 0 $ | $ z < z_\alpha $ para $ n_1 $ o $ n_2 > 30 $ | $ t < t_\alpha $ para $ n_1 $ o $ n_2 \leq 30 $ |
| $ H_A: \mu_1 - \mu_2 > 0 $ | $ z > z_{1 - \alpha} $ para $ n_1 $ o $ n_2 > 30 $ | $ t > t_{1 - \alpha} $ para $ n_1 $ o $ n_2 \leq 30 $ |
| $ H_A: \mu_1 - \mu_2 \neq 0 $ (dos colas) | $ z > z_{1 - \alpha/2} $ o $ z < z_{\alpha/2} $ para $ n_1 $ o $ n_2 > 30 $ | $ t > t_{1 - \alpha/2} $ o $ t < t_{\alpha/2} $ para $ n_1 $ o $ n_2 \leq 30 $ |

O utilizando el error propagado para la diferencia ($ \bar{x}_1 - \bar{x}_2 $), donde $ \sigma_1^2 $ y $ \sigma_2^2 $ son las varianzas poblacionales para las dos muestras. Desde $ H_0: \mu_1 - \mu_2 = 0 $, las Ecuaciones (3.22) y (3.24) se reducirán a las siguientes, respectivamente:

$$ SE = \sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}} $$

$$ t = \frac{\bar{x}_1 - \bar{x}_2}{SE} $$

$$ z = \frac{\bar{x}_1 - \bar{x}_2}{SE} $$

La hipótesis nula $ H_0: \mu_1 - \mu_2 = 0 $ debe ser rechazada bajo las condiciones establecidas para las diferentes hipótesis alternativas en la Tabla 3.4.

### Ejemplo 3.2
Un ángulo se midió en seis conjuntos en una condición atmosférica particular utilizando un instrumento de topografía específico. Considerando el promedio de un conjunto como una medición única, el ángulo medio de los seis conjuntos se determinó como 115°45'37" con una desviación estándar de la medición determinada a partir de la muestra como 4". Este ángulo se midió nuevamente en cinco conjuntos con el mismo instrumento, pero con un observador diferente y en una condición atmosférica diferente con el promedio como 115°45'45" y la nueva desviación estándar determinada a partir de la muestra como 6". Determine al nivel de confianza del 95% si los dos promedios son estadísticamente iguales, asumiendo que las varianzas poblacionales de las dos muestras de mediciones son iguales.

**Solución:**

Dado:
$$ \bar{x}_1 = 115°45'37", \; s_1 = 4", \; n_1 = 6; \; \bar{x}_2 = 115°45'45", \; s_2 = 6", \; n_2 = 5 $$

**Hipótesis:**
$$ H_0: \mu_1 - \mu_2 = 0 \; \text{vs.} \; H_A: \mu_1 - \mu_2 \neq 0 $$

El t-estadístico para los tamaños de muestra $ n_1 $ o $ n_2 \leq 30 $ y la desviación estándar poblacional ($ \sigma $) desconocida usa la Ecuación (3.22) con SE dada por la Ecuación (3.23) como
$$ SE = \sqrt{\frac{(6-1)4^2 + (5-1)6^2}{6 + 5 - 2}} \; \text{o} \; 4.99 $$

$$ t = \frac{(115°45'37" - 115°45'37") - 0}{4.99} \; \text{o} \; -1.603 $$

El nivel de significancia es $\alpha = 0.05$; los grados de libertad son 9 (de $df = n_1 + n_2 - 2$); los valores críticos para pruebas de dos colas se obtienen utilizando Microsoft Excel 2013 con la rutina T.INV(0.025, 9) para que $ t_{\alpha/2} = -2.262 $ y el valor simétrico es $ t_{1-\alpha/2} = 2.262 $. De la Tabla 3.4, rechace $ H_0: \mu_1 - \mu_2 = 0 $ si se cumplen las siguientes condiciones: $ t > t_{1-\alpha/2} $ o $ t < t_{\alpha/2} $. Dado que -1.603 no es mayor que 2.262 y -1.603 no es menor que -2.262, $ H_0: \mu_1 - \mu_2 = 0 $ no es rechazado al nivel de confianza del 95%. Se puede concluir al 95% de nivel de confianza que los dos promedios son estadísticamente iguales.

### Ejemplo 3.3
Dos equipos de topografía determinaron independientemente la elevación de un solo punto de referencia como $ \bar{x}_1 = 105.254 \pm 0.007 $ m y $ \bar{x}_2 = 105.249 \pm 0.004 $ m basándose en sus corridas de nivelación desde diferentes puntos de partida y a lo largo de diferentes rutas. Si se consideran bien conocidas las desviaciones estándar de las elevaciones, determine si $ \bar{x}_1 $ es significativamente mayor que $ \bar{x}_2 $ al nivel de confianza del 90%.

**Solución:**

Dado:
$$ \bar{x}_1 = 105.254 \, m, \; s_{\bar{x}_1} = 0.007 \, m; \; \bar{x}_2 = 105.249 \, m, \; s_{\bar{x}_2} = 0.004 \, m $$

El término "significativamente mayor" forma la base para la hipótesis alternativa.

**Hipótesis:**
$$ H_0: \mu_1 - \mu_2 = 0 \; \text{vs.} \; H_A: \mu_1 - \mu_2 > 0 $$

El SE para $ \bar{x}_1 - \bar{x}_2 $ se propaga como:
$$ SE = \sqrt{s_{\bar{x}_1}^2 + s_{\bar{x}_2}^2} \; \text{dando} \; \pm 0.0081 \, m $$

Para desviaciones estándar de elevaciones bien conocidas, se puede usar la estadística en la Ecuación (3.28):
$$ z = \frac{(105.254 - 105.249)}{0.0081} = 1.111 $$

El valor crítico se basa en el nivel de significancia, $\alpha = 0.10$; usando Microsoft Excel 2013 con la rutina NORM.S.INV(0.90) se obtiene $ z_{1-\alpha} = 1.282 $. Según la Tabla 3.4, rechace $ H_0: \mu_1 - \mu_2 = 0 $ si $ z > z_{1-\alpha} $ se cumple. Dado que 1.111 no es mayor que 1.282, la hipótesis nula $ H_0 $ no es rechazada, y se puede concluir al nivel de confianza del 90% que $ \bar{x}_1 $ no es significativamente mayor que $ \bar{x}_2 $.

### 3.6.3 Prueba de Medidas Contra las Medias

Generalmente, en geomática se desea probar la medida individual en un conjunto de datos contra la media con el fin de determinar si la medida es consistente con el resto de las medidas en ese conjunto de datos. Si la medida no es consistente con el resto, se considera un valor atípico. La prueba puede realizarse fuera de contexto o en contexto, donde la prueba fuera de contexto ignora la influencia de las otras medidas en la elección del nivel de significancia, mientras que la prueba en contexto no lo hace. La diferencia radica en la elección del nivel de significancia ($ \alpha_0 $): Si $ \alpha_0 = \alpha $ se usa para la prueba fuera de contexto, entonces $ \alpha_0 = \alpha/n $ se usará para la prueba en contexto, donde $ n $ es el número de medidas en la muestra. De acuerdo con la desigualdad de Bonferroni, si el nivel de significancia para la probabilidad conjunta de $ n $ eventos igualmente probables es $ \alpha $, el nivel de significancia para el evento individual (con consideración de posibles dependencias de eventos) debe ser mayor o igual a $ \alpha/n $. En este caso, la probabilidad conjunta de los $ n $ eventos que ocurran debe ser mayor o igual a $ 1 - \alpha $. Las pruebas en contexto y fuera de contexto son típicamente de dos colas, y la hipótesis nula es como:

$$ H_0 : \text{The measurement has normal pdf (i.e. it is normally distributed).} $$

Considerando más la prueba de dos colas, se puede mostrar a partir de las Ecuaciones (3.27) y (3.28) que el valor crítico esperado de la diferencia entre las dos medias muestrales en el nivel de confianza de (1 - $ \alpha $) será:

$$ |\bar{x}_1 - \bar{x}_2| = (SE) k_p \tag{3.29}$$

$$ k_p = t_{p=1-\alpha_0/2, df} \; \text{o} \; k_p = z_{p=1-\alpha_0/2} \tag{3.30} $$

donde $ k_p $ puede considerarse como un factor para escalar la desviación estándar al nivel de probabilidad (p) dado. Siguiendo el procedimiento en las Ecuaciones (3.29) y (3.30), los valores marginales esperados que deben ser satisfechos por las diferencias entre las medidas y sus medias pueden ser dados como sigue:

1. Si la media poblacional ($ \mu $) y la desviación estándar poblacional (SE = $ \sigma $) son conocidas, la diferencia entre una medida $ \ell_i $ y su media será estadísticamente insignificante a un nivel de significancia $ \alpha $ si se satisface lo siguiente:

$$ |\ell_i - \mu| < \sigma \times k_p \tag{3.31} $$

donde $ k_p = z_{p=1-\alpha_0/2} $. Si se conoce la media poblacional ($ \mu $) pero la desviación estándar poblacional ($ \sigma $) es desconocida pero estimada como SE = $ s $ usando $ \mu $ y la misma muestra de datos (excluyendo la medida $ \ell_i $ que se está probando), la Ecuación (3.29) será modificada como sigue:

$$ |\ell_i - \mu| < s \times k_p \tag{3.32} $$

donde $ k_p = t_{p=1-\alpha_0/2, df} $ y $ n $ es el número total de mediciones en la muestra, incluyendo la que se está probando.

ii) Si la desviación estándar poblacional ($ \sigma $) es conocida y la media poblacional ($ \mu $) es desconocida pero estimada como $ \bar{\ell} $ y se utiliza para determinar la desviación estándar muestral ($ s $), la diferencia entre una medida $ \ell_i $ y su media será estadísticamente insignificante a un nivel de significancia $ \alpha $ si se satisface lo siguiente:

$$ |\ell_i - \bar{\ell}| < \left( \frac{n-1}{n} \right)^{1/2} \sigma \times k_p \tag{3.33} $$

donde SE = $\left( \frac{n-1}{n} \right)^{1/2} \times \sigma $, $ k_p = z_{p=1-\alpha_0/2} $ y $ n $ es el número de mediciones en la muestra incluyendo la que se está probando. Esto se relaciona con un caso donde un instrumento bien calibrado con una desviación estándar conocida ($ \sigma $) se está utilizando para recolectar las mediciones. Si la desviación estándar poblacional ($ \sigma $) y la media poblacional ($ \mu $) son ambas desconocidas y la desviación estándar muestral ($ s $) y la media muestral ($ \bar{\ell} $) se estiman de la misma muestra, lo siguiente debe ser satisfecho:

$$ |\ell_i - \bar{\ell}| < \left( \frac{n-1}{n} \right)^{1/2} s \times k_p \tag{3.34} $$

donde SE = $\left( \frac{n-1}{n} \right)^{1/2} \times s $, $ k_p = t_{p=1-\alpha_0/2, n-1} $ y $ \tau_{p=1-\alpha_0/2, n-1} $ es la densidad de probabilidad tau (Pope 1976) con $ n - 1 $ grados de libertad y $ n $ es el número de mediciones en la muestra incluyendo la que se está probando.

Las pruebas fuera de contexto o en contexto de las mediciones se realizarán como se indica reemplazando el nivel de significancia $ \alpha_0 = \alpha $ o $ \alpha_0 = \alpha/n $, respectivamente. Note que en las Ecuaciones (3.33) y (3.34) el error estándar del residual para la medición $ \ell_i $ es SE = $\left( \frac{n-1}{n} \right)^{1/2} \times \sigma $ o SE = $\left( \frac{n-1}{n} \right)^{1/2} \times s $ con la medición que se está probando incluida en la determinación de la media; si la medición $ \ell_i $ que se está probando no se incluye en la media (es decir, la media se basa en $ n - 1 $ mediciones previas con $ n $ como el número de mediciones incluyendo la que se excluyó), el error estándar del residual será SE = $ (n/(n-1))^{1/2} \times \sigma $ o SE = $ (n/(n-1))^{1/2} \times s $ con el número de grados de libertad como $ n - 2 $.

**Ejemplo 3.4**
Un ángulo debe medirse en seis conjuntos con la condición de que cada conjunto debe compararse con la media de los conjuntos de mediciones anteriores; si la media de los conjuntos anteriores es significativamente diferente de la media del conjunto actual, el conjunto actual de mediciones será rechazado y se deberá realizar un nuevo conjunto de mediciones. Si la media de cinco conjuntos de mediciones del ángulo es $106^\circ 55'33''$ con la desviación estándar de cada medición (considerada como la media de un conjunto) asumida como bien conocida y dada como 5'', determinar si la diferencia entre esta media y el valor medido actual de $106^\circ 55'40''$ es significativa al 95% de nivel de confianza. (Asumir que cada conjunto de mediciones constituye una sola medición.)

Solución:
$$ n = 6, \sigma = 5'', \alpha = 0.05 $$

La ecuación (3.33) debería usarse ya que la desviación estándar de las mediciones se considera bien conocida; la desviación estándar de la diferencia (o SE) se da entonces como

$$ \sigma_{\ell_i - \bar{\ell}} = \left( \frac{n}{n-1} \right)^{1/2} \sigma $$

Usando la ecuación (3.33) y $ z_{1-\alpha/2} = 1.96 $ (asumiendo pruebas fuera de contexto),

$$ |106^\circ 55'40'' - 106^\circ 55'33''| < \left( \frac{n}{n-1} \right)^{1/2} \sigma \times z_{1-\alpha/2} $$

$$ 7'' < \left( \frac{6}{5} \right)^{1/2} 5 \times 1.96 \rightarrow 7'' < 10.7''? $$

Dado que la condición $ 7'' < 10.7'' $ es verdadera, se puede concluir que al 95% de nivel de confianza, la diferencia entre la media y la medición dada no es significativa y la medición puede ser aceptada.

### 3.6.4 Prueba de Hipótesis sobre una Varianza Poblacional

Este es un caso en el que se debe decidir si la desviación estándar de la muestra ($s$) se compara con la precisión publicada (o desviación estándar poblacional), $\sigma = \sigma_0$. Las hipótesis se pueden formular de la siguiente manera:

Hipótesis nula: $ H_0: \sigma^2 = \sigma_0^2 $  
Posibles hipótesis alternativas: $ H_A: \sigma^2 > \sigma_0^2 $ o $ H_A: \sigma^2 < \sigma_0^2 $ o $ H_A: \sigma^2 \neq \sigma_0^2 $

La estadística de prueba para este tipo de prueba es la estadística $\chi^2$ (o estadística de chi-cuadrado) dada como
$$ \chi^2 = \frac{(df) s^2}{\sigma^2} $$

El número de grados de libertad (df) depende de cómo se calcula la desviación estándar de la muestra (s); si la desviación estándar de la muestra se calcula utilizando la media poblacional ($\mu$), $df = n$, donde $n$ es el tamaño de la muestra; si la desviación estándar de la muestra se calcula utilizando la media de la muestra ($\bar{x}$), $df = n - 1$. Si $\chi^2_{p, df}$ y $\chi^2_{p, df}$ son los valores críticos para pruebas de una cola y de dos colas, respectivamente, de la curva de distribución de chi-cuadrado, el $H_0: \sigma^2 = \sigma_0^2$ debería ser rechazado si se cumplen las condiciones establecidas bajo las diferentes hipótesis alternativas en la Tabla 3.5. Las regiones de una cola y de dos colas de las distribuciones de chi-cuadrado

Tabla 3.5 Decisiones de prueba sobre una varianza poblacional.

| Hipótesis alternativa  | Rechazar $ H_0: \sigma^2 = \sigma_0^2 $ |
| --- | --- |
| $ H_A: \sigma^2 < \sigma_0^2 $ | $\chi^2 < \chi^2_{p1 = \alpha, df}$ (para $\alpha$ en la cola inferior) |
| $ H_A: \sigma^2 > \sigma_0^2 $ | $\chi^2 > \chi^2_{p1 = 1-\alpha, df}$ (para $\alpha$ en la cola superior) |
| $ H_A: \sigma^2 \neq \sigma_0^2 $ (dos colas) | $\chi^2 < \chi^2_{p2 = \alpha/2, df}$ (para $\alpha/2$ en la cola inferior) o $\chi^2 > \chi^2_{p2 = 1-\alpha/2, df}$ (para $\alpha/2$ en la cola superior) |

En la Tabla 3.5, $p1 = \alpha$ para $\alpha$ en la cola inferior o $p1 = 1-\alpha$ para $\alpha$ en la cola superior en el caso de una prueba de una cola, y $p2 = \alpha/2$ para $\alpha/2$ en la cola inferior o $p2 = 1-\alpha/2$ para $\alpha/2$ en la cola superior en el caso de una prueba de dos colas.

Considerando la prueba de una cola más a fondo, se puede mostrar a partir de la Ecuación (3.35) para el caso de $H_A: \sigma^2 > \sigma_0^2$ (para $\alpha$ en el área de la cola superior) que el valor esperado de la desviación estándar de la muestra en el nivel de confianza $(1 - \alpha)$ será
$$ s_{1-\alpha} = \sqrt{\frac{\chi^2_{p1 = 1-\alpha, df} \sigma^2}{df}} $$

donde $s_{1-\alpha}$ es la desviación estándar marginal (o la desviación estándar que se está probando) contra el valor estándar dado $\sigma$. Usualmente, la desviación estándar de la muestra $s$ debe ser menor o igual a esta desviación estándar marginal para aceptar que la desviación estándar de la muestra $s$ se compara con el valor publicado $\sigma$ de acuerdo con la prueba de hipótesis de una cola formulada anteriormente. Esto se puede formular a partir de la Ecuación (3.36), para una prueba de una cola, que $H_0: \sigma^2 = \sigma_0^2$ debe ser aceptado si se cumple la siguiente condición:
$$ s \leq \sqrt{\frac{\chi^2_{p1 = 1-\alpha, df} \sigma^2}{df}} $$

Si la Ecuación (3.37) no se cumple, entonces $H_A: \sigma^2 > \sigma_0^2$ debe ser aceptado, lo que significa que la desviación estándar poblacional es realmente mayor que el valor dado o que la desviación estándar de la muestra es mayor que la desviación estándar poblacional. Estrictamente hablando, la prueba de una cola debe realizarse al probar una desviación estándar de la muestra, ya que uno puede no estar interesado en si la desviación estándar de la muestra es menor (o más precisa) que la desviación estándar poblacional.

Ejemplo 3.5: Si la desviación estándar de una medición de dirección horizontal con un teodolito es proporcionada por el fabricante como $\sigma = 2''$, verifique si la desviación estándar experimental (observada en ambas posiciones de cara izquierda y cara derecha) $s = 2.3''$ es consistente con (no significativamente mayor que) el valor del fabricante al nivel de confianza del 95%. Suponga que el número de grados de libertad para la determinación de $s$ es 32.

Solución:
Dado $\sigma = 2''$ y $s = 2.3''$, $\alpha = 0.05$, y $n = 32$; la declaración "no significativamente mayor" sugiere cuál debería ser la hipótesis alternativa, es decir, prueba de una cola.
Prueba de una cola: $H_0: \sigma^2 = (2'')^2$ vs. $H_A: \sigma^2 > (2'')^2$

La estadística de prueba es
$$ s \leq \sqrt{\frac{\chi^2_{p1 = 1-\alpha, df} \sigma^2}{df}} $$

Usando la rutina de software Microsoft Excel 2013 CHISQ.INV(0.95,32) para $\alpha$ en el área de la cola superior da el valor 46.19.
$$ s \leq \sqrt{\frac{46.19 \times 2^2}{32}} = \sqrt{\frac{46.19 \times 4}{32}} $$
$$ 2.3'' \leq 2.4'' $$

Dado que se cumple la condición anterior, la hipótesis nula que establece que la desviación estándar empíricamente determinada, $s = 2.3''$, es igual al valor del fabricante, $\sigma = 2''$, no se rechaza al nivel de confianza del 95%.

Tabla 3.5 Decisiones de prueba sobre una varianza poblacional.

| Hipótesis alternativa  | Rechazar $ H_0: \sigma^2 = \sigma_0^2 $ |
| --- | --- |
| $ H_A: \sigma^2 < \sigma_0^2 $ | $\chi^2 < \chi^2_{p1 = \alpha, df}$ (para $\alpha$ en la cola inferior) |
| $ H_A: \sigma^2 > \sigma_0^2 $ | $\chi^2 > \chi^2_{p1 = 1-\alpha, df}$ (para $\alpha$ en la cola superior) |
| $ H_A: \sigma^2 \neq \sigma_0^2 $ (dos colas) | $\chi^2 < \chi^2_{p2 = \alpha/2, df}$ (para $\alpha/2$ en la cola inferior) o $\chi^2 > \chi^2_{p2 = 1-\alpha/2, df}$ (para $\alpha/2$ en la cola superior) |

En la Tabla 3.5, $p1 = \alpha$ para $\alpha$ en la cola inferior o $p1 = 1-\alpha$ para $\alpha$ en la cola superior en el caso de una prueba de una cola, y $p2 = \alpha/2$ para $\alpha/2$ en la cola inferior o $p2 = 1-\alpha/2$ para $\alpha/2$ en la cola superior en el caso de una prueba de dos colas.

Considerando la prueba de una cola más a fondo, se puede mostrar a partir de la Ecuación (3.35) para el caso de $H_A: \sigma^2 > \sigma_0^2$ (para $\alpha$ en el área de la cola superior) que el valor esperado de la desviación estándar de la muestra en el nivel de confianza $(1 - \alpha)$ será
$$ s_{1-\alpha} = \sqrt{\frac{\chi^2_{p1 = 1-\alpha, df} \sigma^2}{df}} $$

donde $s_{1-\alpha}$ es la desviación estándar marginal (o la desviación estándar que se está probando) contra el valor estándar dado $\sigma$. Usualmente, la desviación estándar de la muestra $s$ debe ser menor o igual a esta desviación estándar marginal para aceptar que la desviación estándar de la muestra $s$ se compara con el valor publicado $\sigma$ de acuerdo con la prueba de hipótesis de una cola formulada anteriormente. Esto se puede formular a partir de la Ecuación (3.36), para una prueba de una cola, que $H_0: \sigma^2 = \sigma_0^2$ debe ser aceptado si se cumple la siguiente condición:
$$ s \leq \sqrt{\frac{\chi^2_{p1 = 1-\alpha, df} \sigma^2}{df}} $$

Si la Ecuación (3.37) no se cumple, entonces $H_A: \sigma^2 > \sigma_0^2$ debe ser aceptado, lo que significa que la desviación estándar poblacional es realmente mayor que el valor dado o que la desviación estándar de la muestra es mayor que la desviación estándar poblacional. Estrictamente hablando, la prueba de una cola debe realizarse al probar una desviación estándar de la muestra, ya que uno puede no estar interesado en si la desviación estándar de la muestra es menor (o más precisa) que la desviación estándar poblacional.

Ejemplo 3.5: Si la desviación estándar de una medición de dirección horizontal con un teodolito es proporcionada por el fabricante como $\sigma = 2''$, verifique si la desviación estándar experimental (observada en ambas posiciones de cara izquierda y cara derecha) $s = 2.3''$ es consistente con (no significativamente mayor que) el valor del fabricante al nivel de confianza del 95%. Suponga que el número de grados de libertad para la determinación de $s$ es 32.

Solución:
Dado $\sigma = 2''$ y $s = 2.3''$, $\alpha = 0.05$, y $n = 32$; la declaración "no significativamente mayor" sugiere cuál debería ser la hipótesis alternativa, es decir, prueba de una cola.
Prueba de una cola: $H_0: \sigma^2 = (2'')^2$ vs. $H_A: \sigma^2 > (2'')^2$

La estadística de prueba es
$$ s \leq \sqrt{\frac{\chi^2_{p1 = 1-\alpha, df} \sigma^2}{df}} $$

Usando la rutina de software Microsoft Excel 2013 CHISQ.INV(0.95,32) para $\alpha$ en el área de la cola superior da el valor 46.19.
$$ s \leq \sqrt{\frac{46.19 \times 2^2}{32}} = \sqrt{\frac{46.19 \times 4}{32}} $$
$$ 2.3'' \leq 2.4'' $$

Dado que se cumple la condición anterior, la hipótesis nula que establece que la desviación estándar empíricamente determinada, $s = 2.3''$, es igual al valor del fabricante, $\sigma = 2''$, no se rechaza al nivel de confianza del 95%.

### 3.6.5 Prueba de hipótesis sobre dos varianzas poblacionales

Esta sección trata de probar si dos desviaciones estándar experimentales, $ s_1 $ y $ s_2 $, según lo determinado por dos muestras diferentes de mediciones, pertenecen a la misma población ($ \sigma_1 = \sigma_2 $) en el nivel de confianza $ 1 - \alpha $. Las dos muestras pueden considerarse diferentes si (a) las muestras se recopilan utilizando el mismo instrumento pero diferentes observadores, (b) las muestras se recopilan utilizando diferentes instrumentos con el mismo observador, o (c) las muestras se recopilan en diferentes momentos utilizando el mismo instrumento con el mismo observador. Las pruebas estadísticas se pueden expresar de la siguiente manera:

Hipótesis nula: $ H_0: \sigma_1^2 = \sigma_2^2 $  
Hipótesis alternativa posible: $ H_A: \sigma_1^2 < \sigma_2^2 $ o $ H_A: \sigma_1^2 > \sigma_2^2 $ o $ H_A: \sigma_1^2 \neq \sigma_2^2 $

La estadística de prueba se puede dar como:
$$ F = \frac{s_1^2}{s_2^2} $$

que se distribuye como la distribución F. Si $ F_{p1, df_1, df_2} $ y $ F_{p2, df_1, df_2} $ (con $ df_1 $ y $ df_2 $ como los números de grados de libertad en la determinación de $ s_1^2 $ y $ s_2^2 $, respectivamente) son los valores críticos de la curva de distribución F, la $ H_0: \sigma_1^2 = \sigma_2^2 $ debería ser rechazada si se cumplen las condiciones establecidas bajo las diferentes hipótesis alternativas en la Tabla 3.6. Las regiones de una cola y de dos colas de las distribuciones F se ilustran en la Figura 3.14. En la Tabla 3.6, $ p_1 = \alpha $ para $\alpha$ estar en el área de la cola inferior o $ p_1 = 1-\alpha $ para $\alpha$ estar en el área de la cola superior en el caso de prueba de una cola, y $ p_2 = \alpha/2 $ para $\alpha/2$ estar en el área de la cola inferior o $ p_2 = 1-\alpha/2 $ para $\alpha/2$ estar en el área de la cola superior en el caso de prueba de dos colas.

Por ejemplo, para una prueba de dos colas, $ H_0: \sigma_1^2 = \sigma_2^2 $ no se rechaza si se cumple la siguiente condición:
$$ \frac{1}{F_{p2 = 1-\alpha/2, df_1, df_2}} \leq \frac{s_1^2}{s_2^2} \leq F_{p2 = 1-\alpha/2, df_1, df_2} $$

### Tabla 3.6 Decisiones sobre la prueba de dos varianzas poblacionales.

| Hipótesis alternativa               | Rechazar $H_0: \sigma_1^2 = \sigma_2^2$ |
|-------------------------------------|-------------------------------------------|
| $H_A: \sigma_1^2 < \sigma_2^2$    | $F < F_{p1 = \alpha, df_1, df_2}$ (para $\alpha$ en la cola inferior) |
| $H_A: \sigma_1^2 > \sigma_2^2$    | $F > F_{p1 = 1 - \alpha, df_1, df_2}$ (para $\alpha$ en la cola superior) |
| $H_A: \sigma_1^2 \neq \sigma_2^2$ | $F < F_{p2 = \alpha/2, df_1, df_2}$ (para $\alpha/2$ en la cola inferior) o $F > F_{p2 = 1 - \alpha/2, df_1, df_2}$ (para $\alpha/2$ en la cola superior) |

donde $ F_{p2 = \alpha/2, df_1, df_2} $ es el valor de la distribución de Fisher que puede extraerse de la curva de la distribución F para $\alpha/2$ en el área de la cola superior de la curva de distribución F (teniendo en cuenta el volteo de los grados de libertad en el denominador). En este caso,

$$ \frac{1}{F_{p2 = \alpha/2, df_1, df_2}} \leq \frac{s_1^2}{s_2^2} \leq F_{p2 = 1 - \alpha/2, df_1, df_2} $$

### Ejemplo 3.6
Para determinar si la precisión del equipo de nivelación es apropiada para la tarea de medición prevista, se llevaron a cabo dos pruebas de calibración con dos muestras de mediciones realizadas por el mismo instrumento pero diferentes observadores. Los resultados de las pruebas son los siguientes:

Prueba 1: Desviación estándar calculada del instrumento ($ s_1 $) = 2.5 mm, número de grados de libertad ($ df_1 $) = 25.  
Prueba 2: Desviación estándar calculada del instrumento ($ s_2 $) = 2.0 mm, número de grados de libertad ($ df_2 $) = 18.

¿Las dos desviaciones estándar calculadas, $ s_1 $ y $ s_2 $, determinadas a partir de las dos muestras diferentes de mediciones pertenecen a la misma población al nivel de confianza del 95%?

**Solución:**

Dado $ s_1 = 2.5 $ mm, $ s_2 = 2.0 $ mm, $ df_1 = 25 $ y $ df_2 = 18 $:

$$ H_0 : \sigma_1^2 = \sigma_2^2 $$
$$ H_A : \sigma_1^2 \neq \sigma_2^2 $$

Evaluar el siguiente intervalo de confianza a $ \alpha = 0.05 $ (usando la Ecuación (3.39)):

$$ \frac{1}{F_{p2 = 1 - \alpha/2, df_1, df_2}} \leq \frac{s_1^2}{s_2^2} \leq F_{p2 = 1 - \alpha/2, df_1, df_2} $$

$$ \frac{1}{F_{0.975, 18, 25}} \leq \frac{2.5^2}{2.0^2} \leq F_{0.975, 25, 18} $$

$$ \frac{1}{2.338} \leq \frac{6.25}{4.0} \leq 2.491 $$

$$ 0.43 \leq 1.56 \leq 2.49 $$

Dado que la condición se cumple, la hipótesis nula que establece que las desviaciones estándar calculadas $ s_1 = 2.5 $ mm y $ s_2 = 2.0 $ mm pertenecen a la misma población no se rechaza al nivel de confianza del 95%. La Ecuación (3.40) también se puede usar para resolver este problema de la siguiente manera:

$$ F_{p2 = \alpha/2, df_1, df_2} \leq \frac{s_1^2}{s_2^2} \leq F_{p2 = 1 - \alpha/2, df_1, df_2} $$

$$ F_{0.025, 25, 18} \leq \frac{2.5^2}{2.0^2} \leq F_{0.975, 25, 18} $$

$$ 0.43 \leq 1.56 \leq 2.49 $$

Usando Microsoft Excel, $ F.INV(0.975, 25, 18) $ da 2.491 como se indicó anteriormente, y $ F.INV(0.025, 25, 18) $ da 0.43, por lo que el mismo resultado se obtiene como:

$$ 0.43 \leq 1.56 \leq 2.49 $$