<a href="https://colab.research.google.com/github/rpizarrog/probabilidad-y-estad-stica/blob/master/Python%202023/Caso_23_Distribuci%C3%B3n_t_student.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Distribución T Student

# Objetivo

Utilizar funciones de una distribución *T Student* para idengificar valores de $t$, calcular función de densidad y estimar probabilidades visualizando áreas bajo la curva.

# Descripción

- Cargar librerías o bibliotecas de Python
- Cargar funciones previmente codificadas para propósito de este caso
- Calcular valores de t
- Visualizar densidad
- Visualizar probabilidades
- Interpretar el caso
...

En el sustento teórico, se da a conocer un panorama de la importancia de la distribución *t student* comparando la campana de gauss de una distribución normal estándar y distribuciones t; se identifica la fórmula de densidad *t* y se mencionan las funciones de *Python* para procesar datos con comportaiento de una distribucuón *t student*

En el desarrollo, se resuelven e interpretan algunos ejercicios con datos bajo la distribución *T Student,*.

# Fundamento teórico

## Características de T Student

La distribución *t student* tiene estas características:

-   Tiene forma de montículo o campana de gauss y es simétrica alrededor de $t = 0$, igual que $z$ la normal estándar.

-   Es más variable que $z$, con "colas más pesadas"; esto es, la curva $t$ no aproxima al eje horizontal con la misma rapidez que $z$. Esto es porque el estadístico $t$ abarca dos cantidades aleatorias, $\bar{x}$ y $s$, en tanto que el estadístico $z$ tiene sólo la media muestral, $\bar{x}$. Ver curvas de *t Student* y Normal Estándar $z$.

-   La forma de la distribución $t$ depende del tamaño muestral $n$. A medida que $n$ aumenta, la variabilidad de $t$ disminuye porque la estimación $s$ de $\sigma$ está basada en más y más información.

-   Cuando $n$ sea infinitamente grande, las distribuciones $t$ y $z$ son idénticas. [@mendenhall2010].


El divisor $(n-1)$ en la fórmula para la varianza muestral $s^2 = \sum(\frac{x_i-\bar{x}}{n-1})$ se denomina número de grados de libertad **(df)** asociado con $s^2$ determina la forma de la distribución $t$. El origen del término grados de libertad es teórico y se refiere al número de desviaciones independientes elevadas al cuadrado en $s^2$ existentes para estimar $\sigma^2$.

Estos grados de libertad pueden cambiar para diferentes aplicaciones y como especifican la distribución *t* correcta a usar, es necesario recordar que hay que calcular los grados de libertad correctos para cada aplicación. [@mendenhall2010].

Si la muestra tiene un valor de $t$ en el rango del nivel de confianza entonces se acepta la hipótesis de lo contrario de rechaza.

## Funciones en Python para *T Student*

Se puede utiliar funciones de la biblioteca la biblioteca scipy.stats proporciona funciones para trabajar con la distribución t de Student:

Para toda función de la distribcuón *t student* se incorpora el argumeno de grados de libertad $gl = n-1$
- Para generar números aleatorios se utiliza la función *t.rvs(df=grados_libertad, size=)*

## ¿Para qué utilizar t student?

La distribución *t de Student* se utiliza principalmente en inferencia estadística cuando se trabaja con muestras pequeñas (o muestras de las cuales no conocemos la desviación estándar de la población).

- Sirve para etimar intervalos de confianza para la media: Cuando se desea calcualr el intervalo de confianza para la media de una población y la muestra es pequeña, se utiliza la distribución *t student* en lugar de la distribución normal. Esto es especialmente importante cuando la desviación estándar de la población es desconocida.

- Para prueba de hipótesis para la media: Al realizar pruebas de hipótesis sobre la media de una población con una muestra pequeña y desconociendo la desviación estándar de la población, se utiliza la distribución *t student*.

- Para regresión lineal: En el contexto de la regresión lineal, la distribución *t student* se utiliza para realizar pruebas sobre los coeficientes de la regresión y para construir intervalos de confianza para estos coeficientes.

- Comparación de medias de dos Muestras: Cuando se comparan las medias de dos muestras independientes y ambas muestras son pequeñas, se utiliza la distribución *t student* en lugar de la distribución normal.

La distribución t tiene colas más pesadas en comparación con la distribución normal, lo que refleja la mayor incertidumbre asociada con la estimación de la desviación estándar de la población a partir de una muestra pequeña. Conforme el tamaño de la muestra aumenta, la distribución t converge hacia la distribución normal estándar.

# Desarrollo



## Cargar librerías


In [2]:
import numpy as np
from scipy.stats import t

## Cargar funciones

In [None]:
# Pendiente

## Generar números aleatorios

Sembrar semilla con valor de 2023


In [6]:
# Sembrar semilla
np.random.seed(2023)

Se generan 100 números aleatorios a 10 grados de libertad; $n=100$; $gl = 10$

In [9]:
# Especifica los grados de libertad
gl = 10

# Genera números aleatorios bajo la distribución t de Student
num_aleatorios = t.rvs(df=gl, size=100)

# Imprime los primeros 10 números generados
print(np.round(num_aleatorios, 6))

[-0.817885 -0.668134  0.569894 -0.123859  0.535984 -1.240426  1.576878
 -1.144743  2.331027  1.104901 -1.115909  1.25917  -0.732498  2.709147
 -0.116583 -1.105729 -1.03137  -0.119734  1.497269 -0.954765  0.770519
  0.544829 -1.634327  0.860514  1.254074  0.813566 -1.40843  -0.02912
 -1.650177 -0.304422 -0.353859  0.411917  2.119491 -0.38653  -1.094562
  1.206457  0.811182 -0.800193  0.690389 -0.65458   0.584924  0.031188
 -2.318644 -1.168195  0.021571  0.392619 -0.366675  4.046902  0.080044
  0.85265  -0.757486 -2.417448 -0.236649  0.850227 -0.812312 -0.10748
  1.566483 -2.474857  0.859232  0.654735  2.277925  1.751329 -0.477218
 -0.962651 -0.328608 -0.305513  0.789306 -0.685914 -0.178422  0.568867
 -1.006828 -1.677149 -1.341386  0.893072  2.215867  1.379286  0.965138
  0.982585 -0.580799  3.563238 -0.846845 -0.766233  1.123967 -1.043607
  0.678963 -1.233512  0.1676   -0.45286  -0.643695 -0.304604 -2.031803
  0.887716  0.413647 -0.728834 -1.87936   0.03917   1.015754  0.825268
 -0.2858

# Interpretación del caso

# Bibliografía

- Anderson, David R., Dennis J. Sweeney, and Thomas A. Williams. 2008. Estadística Para Administración y Economía. 10th ed. Australia • Brasil • Corea • España • Estados Unidos • Japón • México • Reino Unido • Singapur: Cengage Learning,.

- Lind, Douglas, William Marchal, and Samuel Wathen. 2015. Estadística Aplicada a Los Negocios y La Economía. Decimo Sexta. México, D.F.: McGraw-Hill.

- Mendenhall, William, Robert J. Beaver, and Barbara M. Beaver. 2006. Introducción a La Probabilidad y Estadística. 13a Edición.

- Walpole, Ronald E., Raymond H. Myers, and Sharon L. Myers. 2012. Probabilidad y Estadística Para Ingeniería y Ciencias. Novena Edición. México: Pearson.

- https://chat.openai.com