# Modelos de Regresion Generalizados

Los Modelos de Regresión Generalizada (Generalized Linear Models o GLMs) son una extensión de los modelos de regresión lineal que permiten modelar relaciones entre una variable dependiente y una o más variables independientes cuando la variable dependiente sigue una distribución diferente a la normal. Los GLMs son flexibles y permiten ajustar modelos para una variedad de distribuciones de probabilidad y relaciones no lineales mediante el uso de funciones de enlace (link functions).

## Componentes de los Modelos de Regresión Generalizada

1. **Función de Enlace (Link Function):** Establece una relación entre la variable dependiente $y$ y la combinación lineal de las variables independientes. La función de enlace es denotada por $g(\mu)$, donde $\mu$ es la media de la distribución de la variable dependiente. La función de enlace es necesaria porque, en muchos casos, la relación entre la media de la variable dependiente y las variables independientes no es lineal, o la variable dependiente no sigue una distribución normal. Al usar una función de enlace, se puede transformar la media esperada $\mu$ para que esté relacionada de manera lineal con las variables independientes.

2. **Distribución de la Familia Exponencial:** La variable dependiente $y$ se asume que sigue una distribución que pertenece a la familia exponencial (ej., normal, binomial, Poisson, etc.).

3. **Función Lineal Predictora:** $ \eta = \beta_0 + \beta_1x_1 + \beta_2x_2 + \cdots + \beta_p x_p $, donde $ \eta $ es la combinación lineal de las variables independientes.

## Tipos de Modelos de Regresión Generalizada

Cada GLM tiene una función de enlace y una distribución asociada, que se elige según la naturaleza de los datos y el tipo de variable dependiente:

1. **Regresión Lineal:**
   - **Distribución:** Normal (Gaussian)
   - **Función de Enlace:** Identidad $ g(\mu) = \mu $
   - **Aplicación:** Modela una variable dependiente continua.

2. **Regresión Logística:**
   - **Distribución:** Binomial
   - **Función de Enlace:** Logit $ g(\mu) = \log\left(\frac{\mu}{1 - \mu}\right) $
   - **Aplicación:** Modela probabilidades de un evento binario (clasificación binaria).

3. **Regresión Poisson:**
   - **Distribución:** Poisson
   - **Función de Enlace:** Logarítmica $ g(\mu) = \log(\mu) $
   - **Aplicación:** Modela conteos de eventos que ocurren en un intervalo de tiempo o espacio.

4. **Regresión Gamma:**
   - **Distribución:** Gamma
   - **Función de Enlace:** Inversa $ g(\mu) = \frac{1}{\mu} $
   - **Aplicación:** Modela variables dependientes continuas positivas, especialmente cuando la varianza aumenta con la media.

5. **Regresión Inversa Gaussiana (Inverse Gaussian):**
   - **Distribución:** Inversa Gaussiana
   - **Función de Enlace:** Inversa cuadrada $ g(\mu) = \frac{1}{\mu^2} $
   - **Aplicación:** Modela tiempos de espera hasta el evento o variables continuas positivas.

6. **Regresión Binomial Negativa:**
   - **Distribución:** Binomial Negativa
   - **Función de Enlace:** Logarítmica $ g(\mu) = \log(\mu) $
   - **Aplicación:** Similar a la regresión de Poisson, pero permite sobre-dispersión (varianza mayor que la media).

7. **Regresión Cuasi-Poisson:**
   - **Distribución:** Cuasi-Poisson (no es de la familia exponencial, pero se usa para modelar datos de conteo con sobre-dispersión)
   - **Función de Enlace:** Logarítmica $ g(\mu) = \log(\mu) $
   - **Aplicación:** Modela conteos con varianza mayor que la media.

## Resumen

| Modelo                | Distribución    | Función de Enlace       | Aplicación                                     |
|-----------------------|-----------------|-------------------------|------------------------------------------------|
| Regresión Lineal      | Normal          | Identidad $g(\mu) = \mu$ | Variables dependientes continuas               |
| Regresión Logística   | Binomial        | Logit $g(\mu) = \log\left(\frac{\mu}{1-\mu}\right)$ | Clasificación binaria                        |
| Regresión Poisson     | Poisson         | Logarítmica $g(\mu) = \log(\mu)$ | Conteo de eventos                             |
| Regresión Gamma       | Gamma           | Inversa $g(\mu) = \frac{1}{\mu}$ | Variables continuas positivas                 |
| Regresión Inversa Gaussiana | Inversa Gaussiana | Inversa cuadrada $g(\mu) = \frac{1}{\mu^2}$ | Tiempos de espera, variables continuas positivas |
| Regresión Binomial Negativa | Binomial Negativa | Logarítmica $g(\mu) = \log(\mu)$ | Conteo de eventos con sobre-dispersión        |
| Regresión Cuasi-Poisson | Cuasi-Poisson | Logarítmica $g(\mu) = \log(\mu)$ | Conteo de eventos con sobre-dispersión        |

Cada tipo de modelo en los GLMs está diseñado para ajustarse a diferentes tipos de datos y relaciones entre las variables, permitiendo una mayor flexibilidad en el análisis de datos complejos.