# Modelos  de tópicos dinámicos

El objetivo de los modelos de tópicos dinámicos  es estudiar la deriva de los conceptos al interior de los tópicos.
En <a href="https://mimno.infosci.cornell.edu/info6150/readings/dynamic_topic_models.pdf"> Blei y Lafferty (2006)</a> se estudia el caso de las publicaciones científicas en la revista Science. Se consideraron 30,000 articulos, 250 en cada uno de los 120 años desde 1881 y 1999. Y se busca predecir los tópicos (la variación al interior de cada uno) en el año siguiente (2000).

El tipo de resultados que obtienen es el siguiente:

#### Tópico Física Atómica

<img src="topicos1.png" width=1000 height=500>
<img src="topicos2.png" width=1000 height=500>


#### Tópico Neurociencia

<img src="topicos3.png" width=1000 height=500>
<img src="topicos4.png" width=1000 height=500>


Para modelar la evolución temporal en la distribución de tópicos $k, k=1,\cdots K$ se definen franjas (slices) de tiempo t y se reemplazan las distribuciones a priori Dirichlet  por **Logistic Normal**  en dos pasos:

$$\beta_{t,k} \mid \beta_{t-1,k} \sim {\cal{N}}(\beta_{t-1,k}, \sigma^2 I_{VxV}), \qquad k=1,\cdots K$$

que se mapea en el simplex mediante la transformación logística:

$$\pi(\beta_{t,k})_w = \frac{exp(\beta_{t,k,w})}{\sum_{w \in W} exp(\beta_{t,k,w})}\qquad k=1,\cdots K$$


donde $|W| =V$.


De esta manera se propone el siguiente proceso generativo secuencial:

1. Generar tópicos $\beta_{t,k} \mid \beta_{t-1,k} \sim {\cal{N}}(\beta_{t-1}, \sigma^2 I_{VxV}$$

y las respectivas funciones logísticas: 

$$\phi_{t,k} = \pi(\beta_{t,k})_w = \frac{exp(\beta_{t,k,w})}{\sum_{w \in W} exp(\beta_{t,k,w})}\qquad k=1,\cdots K$$

2. Por cada documento:

    (a) Generar $\theta \sim {\cal{D}}irichlet(\alpha)$
    
    (b) Por cada palabra en el documento $d$, generar
        
$$z \sim Mult(\theta) \qquad \text{y} \qquad w_{t,d,n} \sim Mult(\phi(t,z))$$


<img src="dtm.png" width=500 height=500>         


En este caso, la expresión de la distribución a posteriori 
$$p(\phi_{1:T},\theta_{1:D},z_{1:N}\mid w_{1:N}) = \frac{p(\phi_{1:T},\theta_{1:D},z_{1:N}, w_{1:N}) }{p(w_{1:N})}$$

no es fácilmente calculable, incluso el numerador, debido a que la Normal Logistic no es natural conjugada de la distribución Multinomial.

Es por ello que se recurre a métodos variacionales para aproximar la distribución a posteriori por una distribución cuyos parámetros se ajustan para que tenga mínima distancia de KL con la distribución a posteriori.



De la formulación teórica, los parámetros que se requiere definir al realizar las aproximaciones son:

- $\sigma^2$ variance chain: es el parámetro que define la magnitud del ruido gaussiano que modela la variación temporal de los tópicos

- $\alpha =(\alpha_1,\cdots ,\alpha_K)$ es el vector de parámetros de la distribución Dirichlet, que modela la variabilidad de tópicos en cada documento. Valores menores que uno y cercanos a 0 representan poca variabilidad entre tópicos.

## Limitaciones del Modelo de Tópicos Dinámicos

- el número de tópicos no cambia en el tiempo
- no interpreta automáticamente el significado de los tópicos (asiste la interpretación del humano, no elimina subjetividad)
- modela tópicos según nuestros a priori (Número de tópicos, variance chain)
