# El empleo de las pruebas de decisión estadística en la investigación social. Distribuciones muestrales.

## Introducción
Los métodos de la estadística inferencial nos señalan los procedimientos que hemos de seguir para poder extraer conclusiones válidas y fiables, a partir de la evidencia que suministran las muestras. La lógica de tales procedimientos indica las condiciones bajo las que se han de obtener la evidencia buscada, y las pruebas estadísticas determinan cuál ha de ser el tamaño de las diferencias reales en la población de la que hemos obtenido la muestra.

Dos son los problemas que trata de resolver la estadística inferencial en torno a las pruebas estadísticas:
- Determinar en términos de probabilidad, si las **diferencias observadas entre dos muestras** significan que las **poblaciones** de las que se han obtenido las muestras **son realmente diferentes**.
- Determinar si es probable que un **valor obtenido** a partir de una muestra **pertenece realmente a una población**. 

Estas dos pruebas de comparación sirven de base para desarrollar los fundamentos de las ***pruebas de decisión estadística*** (*test of hypotheses*).

En el desarrollo de las técnicas estadísticas modernas, las primeras que aparecieron fueron aquellas que establecieron un buen número de restricciones sobre la naturaleza de la población de la que se obtenían los valores. Tales técnicas se denominaron: **paramétricas**:
> *Si los supuestos acerca de la forma de la población son ciertos, entonces se puede concluir que...*

Más recientemente se han desarrollado otras técnicas de inferencia que no exigen tantas restricciones. Tales técnicas **aparamétricas**, o de "libre distribución", permiten obtener conclusiones con menos condiciones.
> *Con independencia de la forma de la población, se puede concluir que...*


## El uso de las pruebas de decisión estadística en la investigación
Los procedimientos que se siguen en las pruebas de decisión estadística están completamente estandarizados y son los siguientes:

1. Formulación de las hipótesis estadísticas, esto es, la de la hipótesis nula ($H_0$) y de la hipótesis alternativa ($H_1$).
2. Elección de una prueba estadística (con su modelo estadístico asociado) para contrastar $H_0$.
3. Especificación de un nivel de significación ($\alpha$) y un tamaño de muestra (n).
4. Encontrar (o asumir) la distribución muestral de la prueba estadística en el supuesto de $H_0$.
5. En base a los puntos anteriores, definiciónde la región de rechazo de la hipótesis nula.
6. Cálculo del valor de la prueba estadística, utilizando los datos obtenidos a partir de la muestra. Si dicho valor se encuentra dentro de la región de rechazo, la decisión que se toma es la de rechazar $H_0$; si por el contrario, dicho valor se encuentra fuera de la región de rechazo, la decisión que se toma es que no se puede rechazar $H_0$ al nivel de significación elegido.

### El nivel de significación
De manera esquemática, el procedimiento de selección del nivel de significación ($\alpha$) (y el tamaño de muestra (n)) es como sigue: antes de obtener los datos se especifica el conjunto de todas las muestras posibles que pueden ocurrir cuando la hipótesis nula ($H_0$) es verdadera. A partir de dicho conjunto especificamos un subconjunto de muestras que son tan extremas que, si $H_0$ es verdadera, la probabilidad de que la muestra que observamos se encuentre entre ellas es muy pequeña. Si en la investigación que se lleva a cabo observamos una muestra que esté incluida en dicho subconjunto, rechazamos la hipótesis nula ($H_0$).

El procedimiento consiste en rechazar $H_0$ en favor de $H_1$ cuando la prueba estadística dé lugar a un valor cuya probabilidad de que ocurra bajo $H_0$ es igual o menor que una probabilidad muy pequeña que denominamos $\alpha$ o *nivel de significación*.

La decisión de elegir uno de los dos tipos de hipótesis estadísticas, comporta siempre un cierto riesgo de equivocarse, esto es, de no seleccionar la hipótesis verdadera:
- *error Tipo I*: rechazar la hipótesis nula cuando de hecho era verdadera.
- *error Tipo II*: aceptar la hipótesis nula cuando de hecho era falsa.

La probabilidad de cometer un error Tipo I se llama *riesgo $\alpha$*. Cuánto mayor sea $\alpha$, más probable resultará rechazar una $H_0$ que es verdadera. El riesgo es conocido y se fija *a priori*.

El error Tipo II se suele representar por $\beta$. Es siempre desconocido y varía en relación inversa al valor de $\alpha$.

De una forma ideal, los valores concretos de $\alpha$ y $\beta$ deben ser establecidos por el investigador y servirán para determinar el tamaño *n* de la muestra que se ha de elegir para calcular la prueba estadística seleccionada.

La potencia (*power*) de una prueba de decisión estadística se define como la probabilidad de rechazar la $H_0$ cuando de hecho es falsa. La potencia caracteriza la capacidad que tiene una prueba de decisión estadística de no equivocarse al rechazar la hipótesis nula.
$$Potencia = 1 - \beta$$

<img src="https://upload.wikimedia.org/wikipedia/commons/9/93/Beta-Fehler.png" alt="Error Tipo I / II"	title="Error Tipo I / II" style="background-color:white" />

Representación de los valores posibles de la probabilidad de un error tipo II (rojo) en el ejemplo de un test de significancia estadística para el parámetro μ. El error tipo II depende del parámetro μ. Cuanto más cerca se encuentre este del valor supuesto bajo la hipótesis nula, mayor es la probabilidad de ocurrencia del error tipo II. Debido a que el verdadero valor de μ es desconocido al hacer la presunción de la hipótesis alternativa, la probabilidad del error tipo II, en contraste con el error tipo I (azul), no se puede calcular.

En resumen:
1. El nivel de significación **$\alpha$** es la probabilidad de que una prueba estadística producirá un valor bajo el cual **se rechazará la hipótesis nula, cuando de hecho es verdadera** (Error Tipo I).
2. La probabilidad de que una prueba estadística produzca un valor bajo el cual **se acepte la hipótesis nula cuando en realidad es falsa** viene dada por **$\beta$**.
3. La **potencia** de una prueba estadística, **1 - $\beta$**, representa la **probabilidad de rechazar la hipótesis nula cuando es falsa** y, por lo tanto, debiera ser rechazada.
4. La potencia está relacionada con la naturaleza de la prueba estadística elegida y con la propia naturaleza de la hipótesis alternativa. **Cuando $H_1$ tiene dirección se emplea una prueba estadística unilateral que es más poderosa que una prueba bilateral**.
5. En términos generales, se puede afirmar que **la potencia de una prueba estadística aumenta cuando se incrementa el tamaño muestral de n**.

### La distribución muestral
Existen tres tipos diferentes de distribuciones de los datos:

1. la *distribución de la población*
2. la *distribución de la muestra*
3. la *distribución muestral*. Describe la conducta esperada de un gran número de muestras aleatorias simples extraídas de la misma población. Las unidades que se distribuyen en la distribución muestral son medidas resumen de muestras completas de valores, en lugar de valores individuales de características de casos únicos.

> **Una distribución muestral** es una distribución probabilistica teórica de estadísticos pertenencientes a muestras.

La distribución muestral de un estadístico pone de manifiesto las probabilidades bajo $H_0$ asociadas con diversos valores númericos posibles del estadístico.

Al basar nuestros razonamientos acerca de la naturaleza de la distribución muestral en teoremas matemáticos ya contrastados, tales teoremas implican una serie de supuestos o condiciones que deben de tenerse en cuenta al realizar nuestros cálculos.

#### El teorema del límite central
El teorema del límite central establece que si se extraen repetidas muestras aleatorias simples de tamaño $n$ a partir de una población distribuida normalmente, de media $ \mu $ y desviación típica $ \sigma $, las medias de tales muestras se distribuyen normalmente con media $ \mu $ y desviación típica $$ \frac{\sigma}{\sqrt{n} $$

Dado que $ n $ se encuentra en el denominador, cuánto mayor sea el tamaño de la muestra seleccionada más pequeña será la desviación típica de la distribución normal de las medias muestrales.

La segunda parte del teorema del límite central (*Ley de los Grandes Números*) establece que al extraer repetidas muestras aleatorias de tamaño $ n $ de una población de cualquier forma de media $ \mu $ y varianza $ \sigma^2 $, cuando $ n $ es suficientemente grande, la distribución muestral de las medias tiende a distribuirse normalmente con media $ \mu $ y varianza $ \frac{\sigma^2}{\sqrt{n} $

Nota: Cuando se calcula la desviación típica en una distribución muestral, se denomina *error típico* para distinguirlo de otras desviaciones típicas.

¿Cuánto es *suficientemente grande*? 100, 50, 30...

El conocimiento de la distribución muestral de un estadístico nos permite formular proposiciones probabilisticas acerca de la obtención de ciertos valores numéricos del referido estadístico.

#### Tendencia central, variabilidad

Dado que una distribución muestral es una distribución univariable, se puede caracterizar y describir en términos de su tendencia central, variabilidad y forma.

Valor esperado de un estadístico ($ E $): el valor promedio que toma un estadístico para su distribución muestral. Si el valor esperado de un estadístico es de hecho el parámetro que estima, entonces se dice que el estadístico es un estimador no sesgado del parámetro.

La información de que el valor promedio es un estimador no sesgado es útil, porque nos indica que cualquier diferencia que se produzca entre un estadístico concreto y su parámetro es atribuible más bien a un error aleatorio que a un sesgo sistemático del propio estadístico.

La variación del estadístico de la muestra alrededor de su parámetro se puede medir por medio de técnicas tales como recorridos, varianzas y desviaciones típicas. El valor que mide tal variabilidad se denomina **error típico**. Los errores típicos, en general, miden la variación aleatoria de los estadísticos alrededor de los parámetros que tratan de estimar, y su tamaño depende, en parte, del tamaño de la muestra de la que se calcula el estadístico.

### La región de rechazo. Pruebas unilaterales y pruebas bilaterales
La región de rechazo es una región de la distribución muestral que se define de tal modo que la probabilidad, bajo $ h_0 $ de que ocurra un estadístico de prueba teniendo un valor que se encuentre en dicha región es $ \alfa $. En otras palabras, la región de rechazo es un conjunto de valores posibles que son tan extremos que, cuando $ H_0 $ es verdadera, la probabilidad de que la muestra que observamos dé lugar a un valor que se encuentre entre ellos es muy pequeña ($\alfa$). Así, pues la probabilidad asociada con la obtención de cualquier valor que se encuentre en la región de rechazo es igual o menor que $\alfa$.

La localización de la región de rechazo viene afectada por la propia naturaleza de $ H_1 $:
- *Prueba estadística unilateral*
- *Prueba estadística bilateral*

Y el tamaño de la región de rechazo viene dado por el nivel de significación de $\alfa$.

Finalmente se debe tomar una decisión. Si la prueba estadística da lugar aun valor que se encuentra en la región de rechazo: 
- o bien la hipótesis nula es falsa; 
- o ha ocurrido un suceso extraño y poco probable.

Cuando se obtiene un valor significativo de la prueba estadística, se rechaza la hipótesis nula ($H_0$), por ser la probabilidad asociada de dicho valor, bajo $H_0, igual o menor que $\alfa$

## Elección de una prueba de decisión estadística apropiada

Varios son los criterios lógicos para basar la elección de una prueba estadística:
- Potencia de la prueba
- la forma de obtener las puntuaciones de la muestra
- la naturaleza de la población
- el tipo de medición en las definiciones operacionales de las variables estudiadas

Los **supuestos de las pruebas**: asociados con cada prueba estadística aparecen un modelo estadístico y unas necesidades de medición. La prueba sólo será válida bajo determinadas condiciones que vienen especificadas por estos elementos.

A continuación un cruado resumen en el que se ordenan las pruebas estadísticas más conocidas con los niveles de medición de las variables que exige su uso:
<style type="text/css">
.tg  {border-collapse:collapse;border-spacing:0;}
.tg td{border-color:black;border-style:solid;border-width:1px;font-family:Arial, sans-serif;font-size:14px;
  overflow:hidden;padding:10px 5px;word-break:normal;}
.tg th{border-color:black;border-style:solid;border-width:1px;font-family:Arial, sans-serif;font-size:14px;
  font-weight:normal;overflow:hidden;padding:10px 5px;word-break:normal;}
.tg .tg-8bgf{border-color:inherit;font-style:italic;text-align:center;vertical-align:top}
.tg .tg-baqh{text-align:center;vertical-align:top}
.tg .tg-c3ow{border-color:inherit;text-align:center;vertical-align:top}
.tg .tg-0pky{border-color:inherit;text-align:left;vertical-align:top}
.tg .tg-0lax{text-align:left;vertical-align:top}
</style>
<table class="tg">
<thead>
  <tr>
    <th class="tg-8bgf">Escala</th>
    <th class="tg-8bgf">Ejemplos de estadísticos <br>más apropiados</th>
    <th class="tg-8bgf">Pruebas estadísticas <br>más apropiadas</th>
  </tr>
</thead>
<tbody>
  <tr>
    <td class="tg-c3ow">Nominal</td>
    <td class="tg-0pky">- Moda<br>- Frecuencia<br>- Coeficiente de Contingencia</td>
    <td class="tg-c3ow">Pruebas aparamétricas</td>
  </tr>
  <tr>
    <td class="tg-c3ow">Ordinal</td>
    <td class="tg-0pky">- Mediana<br>- Percentil<br>- r de Spearman<br>- r de Kendall<br>- W de Kendall</td>
    <td class="tg-c3ow">Pruebas aparamétricas</td>
  </tr>
  <tr>
    <td class="tg-c3ow">Intervalo</td>
    <td class="tg-0pky">- Media<br>- Desviación típica<br>- Coeficiente de correlación de Pearson<br>- Coeficiente de correlación múltiple</td>
    <td class="tg-c3ow">Pruebas paramétricas</td>
  </tr>
  <tr>
    <td class="tg-baqh">Cociente o ratio</td>
    <td class="tg-0lax">- Media geométrica<br>- Coeficiente de variación</td>
    <td class="tg-baqh">Pruebas paramétricas</td>
  </tr>
</tbody>
</table>