# Modelos Lineales Generalizados en Python
# Regresión Poisson

<img src="https://raw.githubusercontent.com/fhernanb/fhernanb.github.io/master/docs/logo_unal_color.png" alt="drawing" width="200"/>

Aquí se muestran varios ejemplos de como usar Python para ajustar un modelo lineal generalizado. 

Las explicaciones mostradas aquí están basadas en un video de YouTube https://www.youtube.com/watch?v=__oC5IRCFKI

Las librerías necesarias son las siguientes:

In [1]:
import statsmodels.api as sm
import statsmodels.formula.api as smf
from statsmodels.formula.api import glm

Otras librerías que se usarán en los ejemplos son:

In [2]:
import pandas as pd

## Ejemplo

En esta actividad vamos a utilizar los datos de los cangrejos presentados en el capítulo 1 de Agresti (2015). El objetivo es ajustar el siguiente modelo:

\begin{align}
Y_i &\sim Poisson(\mu_i), \\ 
\log(\mu_i) &= \beta_0 + \beta_1 Weight_i
\end{align}

Los datos del ejemplo se refieren al número $Y$ de cangrejos machos pegados al caparazón de las cangrejas hembras. Abajo una figura ilustrativa.

<img src="cangreja.jpg" alt="drawing" width="300"/>

Lo primero que usted debe hacer es leer la base de datos.

In [3]:
file = 'http://users.stat.ufl.edu/~aa/glm/data/Crabs.dat'
datos = pd.read_csv(file, sep='\s+', header=0)
datos.head()

Unnamed: 0,crab,y,weight,width,color,spine
0,1,8,3.05,28.3,2,3
1,2,0,1.55,22.5,3,3
2,3,9,2.3,26.0,1,1
3,4,0,2.1,24.8,3,3
4,5,4,2.6,26.0,3,3


Para ver el tamaño de la base de datos

In [4]:
datos.shape

(173, 6)

Para ajustar el modelo:

In [5]:
mod1 = smf.glm(formula='y ~ weight', data=datos, family=sm.families.Poisson(link=sm.families.links.log()))
mod1 = mod1.fit()
mod1.summary()

0,1,2,3
Dep. Variable:,y,No. Observations:,173.0
Model:,GLM,Df Residuals:,171.0
Model Family:,Poisson,Df Model:,1.0
Link Function:,log,Scale:,1.0
Method:,IRLS,Log-Likelihood:,-458.08
Date:,"Thu, 29 Apr 2021",Deviance:,560.87
Time:,20:09:33,Pearson chi2:,536.0
No. Iterations:,5,,
Covariance Type:,nonrobust,,

0,1,2,3,4,5,6
,coef,std err,z,P>|z|,[0.025,0.975]
Intercept,-0.4284,0.179,-2.394,0.017,-0.779,-0.078
weight,0.5893,0.065,9.064,0.000,0.462,0.717


Usando los resultados de la tabla anterior podemos escribir el modelo

\begin{align}
Y_i &\sim Poisson(\hat{\mu}_i), \\ 
\log(\hat{\mu}_i) &= -0.4284 + 0.5893 Weight_i
\end{align}

## Funciones de enlace disponibles

Para conocer otras posibles funciones de enlace se puede utilizar la siguiente instrucción:

In [6]:
sm.families.family.Poisson.links

[statsmodels.genmod.families.links.log,
 statsmodels.genmod.families.links.identity,
 statsmodels.genmod.families.links.sqrt]