<!--HEADER-->
[*Notas sobre modelagem da epidemia de Covid-19*](https://github.com/rmsrosa/modcovid19) / [*IM-UFRJ*](https://www.im.ufrj.br).

<!--BADGES-->
<a href="../slides/09.00.Aula-Modelos_individuais_multiplas_estruturas_2.slides.html"><img align="left" src="https://img.shields.io/badge/local-slides-darkgreen" alt="localslides" title="Local Slides"></a>
&nbsp;

<!--NAVIGATOR-->
[<- Modelos individuais estocásticos com múltiplas estruturas de conexão - parte I](08.00.Aula-Modelos_individuais_multiplas_estruturas.ipynb) | [Página Inicial](00.00-Pagina_Inicial.ipynb) | [Modelos individuais estocásticos com múltiplas estruturas de conexão - parte III ->](10.00.Aula-Modelos_individuais_multiplas_estruturas_3.ipynb)

---


# Modelos individuais estocásticos com múltiplas estruturas de conexão - parte II

## Objetivos

- Continuar o estudo de **modelos estocásticos individuais espacialmente estruturados e com evolução temporal discreta.**

- Destrinchar melhor as **estruturas dos modelos** do tipo usado pelo **Imperial College**

- Também vamos **analisar o código desenvolvido até agora.**

In [1]:
import datetime as dt # date and time tools
dt_string = dt.datetime.now().strftime("%d/%b/%Y")
print(f"Atualização mais recente do kernel: {dt_string}")

Atualização mais recente do kernel: 28/Apr/2020


## Fontes

### Fontes mencionadas

- O modelo usado pelo Imperial College na análise da epidemia do Covid-19 é mencionado sem muitos detalhes no relatório:

    - [Relatório de 16 de março do Imperial College](#Referências);

- As principais referências sobre a modelagem que aparecem no relatório são

    - o artigo [Ferguson et al (2006)](#Referências) e o seu [material suplementar](https://www.nature.com/articles/nature04795#Sec2);
    
    - o artigo [Ferguson et al. (2005)](#Referências) e as suas [notas suplementares](https://static-content.springer.com/esm/art%3A10.1038%2Fnature04017/MediaObjects/41586_2005_BFnature04017_MOESM1_ESM.pdf); e

    - o artigo [Halloran et al (2008)](#Referências) e o seu [suplemento](https://www.pnas.org/content/suppl/2008/02/28/0706849105.DC1).

### Alinhavando as fontes

- O artigo do [Halloran et al (2008)](#Referências) combina resultados de três modelos semelhantes mas de grupos diferentes:

    - **UW/ LANL:** University of Washington and Fred Hutchinson Cancer Research Center in Seattle and the Los Alamos National Laboratories.

    - **Imperial/Pitt:** Imperial College and the University of Pittsburgh.
    
    - **VBI:** Virginia Bioinformatics Institute of the Virginia Polytechnical Institute and State University.

- O artigo [Halloran et al (2008)](#Referências) detalha brevemente o modelo em seu [suplemento](https://www.pnas.org/content/suppl/2008/02/28/0706849105.DC1).

- Menciona que mais detalhes podem ser encontrados no [material suplementar](https://www.nature.com/articles/nature04795#Sec2) do artigo [Ferguson et al. (2006)](#Referências).

- Este é mais detalhado, mas ainda deixa outros detalhes para as [notas suplementares](https://static-content.springer.com/esm/art%3A10.1038%2Fnature04017/MediaObjects/41586_2005_BFnature04017_MOESM1_ESM.pdf) do artigo [Ferguson et al (2005)](#Referências).


- Todos consideram **modelos individuais, estocásticos, estruturados espacialmente e com evolução temporal discreta**.

- As diferenças estão nas estruturas espaciais (i.e. nas redes de conexões).

### Em resumo

- Vamos focar nas seguintes descrições da modelagem:

    - Seção **Methods: Transmission Model** do [Relatório de 16 de março do Imperial College](#Referências).
    
    - O [suplemento](https://www.pnas.org/content/suppl/2008/02/28/0706849105.DC1) do artigo [Halloran et al (2008)](#Referências).
    
    - O [material suplementar](https://www.nature.com/articles/nature04795#Sec2) do artigo [Ferguson et al. (2006)](#Referências).
    
    - As [notas suplementares](https://static-content.springer.com/esm/art%3A10.1038%2Fnature04017/MediaObjects/41586_2005_BFnature04017_MOESM1_ESM.pdf) do artigo [Ferguson et al (2005)](#Referências).

### Modelo do relatório

- A seguir, uma leitura da breve descrição do modelo no [Relatório de 16 de março do Imperial College](#Referências).

- São quatro partes:

    - Distribuição dos indivíduos e das suas redes de contatos.
    
    - Processo de transmissão.
    
    - Parâmetros.
    
    - Inicialização.

#### Sobre a distribuição dos indivíduos e das suas redes de contatos.

- **Indivíduos** residem em áreas **de acordo com** dados de **densidade populacional** de alta-resolução.

- **Contatos** com outros indivíduos são separados em vários tipos:

    - entre os moradores de uma mesma residência;

    - nas escolas;

    - nos locais de trabalho; e

    - aleatoriamente na comunidade em geral.

- Dados de **censo** usados para definir a distribuição dos **indivíduos por idade** (dividido por décadas).

- Dados de **censo** usados para definir a distribuição do **tamanho das residências**.

- Dados de **número médio do tamanho de salas de aula** e de **proporção de alunos/funcionários** foram usados para gerar dados sintético de escolas distribuídas proporcionalmente à densidade local da população.

- Dados da **distribuição do tamanho (número de funcionários) dos locais de trabalho** foram usados para gerar os locais de trabalho e os dados de mobilidade foram usados para alocar esses locais de trabalho entre a população.

- Os indivíduos foram designidados a cada um desses locais no ínicio das simulações.

#### Sobre o processo de transmissão

- O **contágio** se dá através de contatos entre suscetíveis e infectados:

    - entre os moradores de uma mesma residência;

    - nas escolas;

    - nos locais de trabalho; e

    - aleatoriamente na comunidade em geral e dependendo da distância entre os indivíduos.

- O **número de contatos por indivíduo na escola** é assumido como sendo o **dobro do número** de contatos em **outros locais**, para refletir as taxas de incidência em crianças observadas em pandemias anteriores de *influenza.*

- Com a parametrização acima, aproximadamente um terço das transmissões ocorre dentro das residências, um terço ocorre nas escolas e no local de trabalho e o um terço restante, na comunidade em geral.

- Esse padrão de contatos reproduz aqueles mencionados em pesquisas de misturas sociais.

#### Sobre os parâmetros

- **Período de incubação** de 5,1 dias.

- **Início do período de contágio:**

    - a partir de 12h antes do desenvolvimento dos sintomas, no caso dos sintomáticos
    
    - a partir de 4,6 dias após a infecção, no caso dos assintomáticos, com um perfil temporal de infecção que resulta em uma média de 6,5 dias de tempo de geração médio (no caso dos assintomáticos, é assumido que a taxa de infecção decai com o tempo).

- É assumido que os **sintomáticos são 50% mais infecciosos que os assintomáticos.**

- Com base nos dados iniciais da epidemia em Wuhan, é assumido que $R_0 = 2.4$, mas valores entre $2.2$ e $2.6$ também são examinados.
    
- A **taxa de infecção individual** $\tau$ é assumida variável, descrita por uma distribuição gamma com média 1 e um parâmetro de forma $\alpha = 0.25$ (logo $k=\alpha$, média $\theta k = \theta\alpha = 1$ e parâmetro de escala inversa $\beta = 1/\theta = k = 0.25$).    

#### Infectados iniciais

- Inicialmente, é assumido um crescimento exponencial de infectados, a partir do início de janeiro de 2020.

- É assumido um **tempo de duplicação** de 5 dias.

- O dado inicial é **calibrado segundo os dados de óbitos** até o dia 14 de março de 2020.

### Modelos mencionados no artigo Halloran et al (2008)

- O artigo menciona **três grupos de pesquisa.**

- As **diferenças** estão nos tipos de **redes de contato** considerados:

| rede | Imperial | UW | VBI |
| --- | --- | --- | --- |
| Home | + | + | + |
| Work | + | + | + |
| School | + | + | + |
| Day care |  | + |  |
| Play group |  | + |  |
| College |  |  | + |
| Shopping |  |  | + |
| Neighborhood |  | + |  |
| Neighborhood clusters |  | + |  |
| Other/Community | + |  | + |

- Vamos continuar focando no modelo do Imperial College

### Descrição dos contatos no artigo Ferguson et al (2006)

- O [material suplementar](https://www.nature.com/articles/nature04795#Sec2) é bastante extenso.

- A essência foi descrita na análise do relatório do Imperial College.

- Fora isso, vale ressaltar:

     - A densidade populacional é proveniente de dados do [Landscan](https://landscan.ornl.gov/), com resolução inferior da ordem de $1\,\texttt{km}^2$.
        
    - Um modelo heurístico (investigar!) foi usado para gerar as idades dos indivíduos de cada residência, de forma a manter 'gaps' típicos de geração nas residências, ao mesmo tempo em que segue a distribuição de faixa etária de acordo com o tamanho da residência.

    - Dados da localização, tamanho e nível escolar de cada escola, assim como os dados de densidade populacional, foram usados para alocar as escolas.
    
    - Cada aluno foi selecionado aleatoriamente para uma das três escolas mais próximas (*primary*) ou seis mais próximas (*secondary*)
    
    - Trabalhadores foram selecionados de acordo com distribuição do número de trabalhadores em relação ao tamanho (?) do local de trabalho.
    
    - A alocação dos trabalhadores se deu de acordo com uma distribuição da forma $f(d) = 1/(1+(d/a)^b)$, onde $a=4\,\texttt{km}$ e $b=3$ (parâmetros ajustados aos dados). (Nos EUA e na Tailândia, a distribuição foi outra.)

    - Estou ignorando dados de viagens aérea no caso da cidade do Rio.

### Descrição do modelo no artigo Ferguson et al (2006)

- Passos temporais de $\Delta t = 0.25 \,\texttt{dias} = 6\,\texttt{horas}$.

- A cada passo de tempo, um indivíduo suscetível tem probabilidade $1 - e^{-\lambda_i \Delta t}$ de ser infectado, onde $\lambda_i$ é a taxa de risco instantâneo de infecção.

- $\lambda_i$ vem de três fontes: residência, local de trabalho e encontros aleatórios (mais detalhes nas [notas suplementares](https://static-content.springer.com/esm/art%3A10.1038%2Fnature04017/MediaObjects/41586_2005_BFnature04017_MOESM1_ESM.pdf) do artigo [Ferguson et al (2005)](#Referências)

- O contatos aleatórios dependem da distância através do uso de "modelos de gravidade" (?), representando contatos aleatórios associados a deslocamentos e viagens.
    
- O *kernel* de decaimento espacial tem a mesma forma que a função de alocação de trabalhadores: $f(d) = 1/(1+(d/a)^b)$, onde $a=4\,\texttt{km}$ e $b=3$.
    

### Descrição do modelo no artigo Ferguson et al (2005)

- As [notas suplementares](https://static-content.springer.com/esm/art%3A10.1038%2Fnature04017/MediaObjects/41586_2005_BFnature04017_MOESM1_ESM.pdf) do [Ferguson et al (2005)](#Referências) são as mais detalhadas.

- A **região geográfica** é um domínio $\Omega\subset \mathbb{R}^2$.

- A **população total** é um inteiro $N$.

- Há um determinado número de **residências**.

- Há quatro tipos de **lugares** (*places*), $n_p = 1, 2, 3, 4$, com os três primeiros representando tipos de **escola**, segundo a escolarização, e o último, o **local de trabalho**.

- Um **indivíduo** $i\in \{1, \ldots, N\}$ é representado por

    - sua **idade** $a_i$;
    
    - sua **residência** $h_i$ (determinada pela função de densidade populacional e dados de censo da pirâmide etária);

    - seu **local de estudo/trabalho** $l_i^j$;
    
    - o seu **estado** $I_i$, de acordo com $I_i = 1$, se infectado (ou contagioso?), ou $I_i=0$, caso contrário.
    
    - o **grau da infecção** $C_i$, de acordo com $C_i=1$, se severa, ou $C_i=0$, caso contrário. A cada nova infecção, o indivíduo recém-infectado é aleatoriamente selecionado se $C_i=0$ ou $1$, com 50% de chance para cada grau.
    
    - o **instante de infecção** $\tau_i$, indicando o instante em que o indivíduo $i$ se tornou infectado (contagioso?)
    
    - a **força de infecção** $\lambda_i$, detalhada mais abaixo.
    
- Quantidades derivadas:

    - $n_i$ é o **número de pessoas na residência** do indivíduo $i$;
    
    - $m_i^j$ é o **número de pessoas no mesmo local** do indivíduo $i$.

### Força de infecção

A **força de infecção** $\lambda_i$ de cada indivíduo é dada por

$$ 
  \begin{align*}
    \lambda_i & = \frac{1}{n_i^\alpha}\sum_{k; h_k = h_i}  I_k \beta_h\kappa(t-\tau_k)\rho_k(1 + C_k (\omega-1)) \quad \textrm{(na residência)} \\
    & \quad + \sum_{j, k; l_k^j = l_i^j} \frac{I_k \beta_p^j\kappa(t-\tau_k)\rho_k(1 + C_k(\omega\psi_p^j(t-\tau_\kappa)-1)}{m_i^j} \quad \textrm{(na local de escola/trabalho)} \\
    & \quad + \frac{\sum_k I_k\zeta(a_i)\beta_c\kappa(t-\tau_k)f(d_{i,k})\rho_k(1 + C_k (\omega-1))}{\sum_k f(d_{i,k})} \quad \textrm{(aleatoriamente na comunidade)},
  \end{align*}
$$

onde

- $i, k$ são índices de indivíduos;

- $j$ é um índice de local;

- $\beta_k$, $\beta_p^j$ e $\beta_c$ são coeficientes de transmissão em **residências**, **locais de trabalho/escola** e na **comunidade**;

- $\alpha=0.8$ é uma potência para escalonar em função do tamanho da residência;

- $\omega=2$ é um fator de contágio para infecções severas, em relação a não-severas.

- $\psi_p^j = 0.1, 0.2, 0.25, 0.5$, para $j=1,2,3,4$ e $s>0.25 \;\texttt{dias}$, e $\psi_p^j=0$, caso contrário, são os fatores de taxa de contato, em cada tipo de local, para infecções severas, como função do tempo $s=t-\tau$ desde o início do contágio.

- $f(d_{i,k})$ é o núcleo de distância e $d_{i,k}$ é a distância euclidiana entre os indivíduos $i$ e $k$.

- $\zeta(a_i)$ é a taxa relativa de contato em relação à mobilidade de um indivíduo com idade $a_i$.

- $\rho_k = 1$ é a taxa relativa de infecção do indivíduo $k$. (Mais geralmente $\rho_k$ pode ser dado por uma distribuição $\gamma$ com média $1$ e fator de forma $\alpha=0.2$.)

### Parâmetros

- Almejando $R_0 = 1.8$ total.

- $\beta_h = 0.4/\texttt{dia}$, correspondendo a $R_0 = 0.6$ (nas residências);

- Particiona os coeficientes de transmissão fora das residências em partes iguais em relação aos valores correspodentes de $R_0$:

    - $\beta_p^j = 0.94/\texttt{dia}$ (nas escolas - $j=1,2,3$);
    
    - $\beta_4^j= 0.47/\texttt{dia}$ (no trabalho);
    
    - $\beta_c = 0.075/\texttt{dia}$ (na comunidade em geral).

## Dados

- [LandScan: ](Landscan.ornl.gov)
    - estimativa de população a cada quilômetro quadrado.
    - aberto livremente apenas para instituições educacionais (professores, alunos ou funcionários);
    - precisa de e-mail institucional;
    - após a inscrição online, demora entre 2 e 3 dias para a liberação (ou não);
    - coloquei como "sim" na pergunta sobre se desejo publicar artigo com os dados (não que eu tenha isso em mente, mas pode ser que aconteça);
    - justifiquei escrevendo "*for constructing a population network for individual-based modeling of the covid-19 epidemics in Brazil, in particular in the city and in the sate of Rio de Janeiro.*"
- [IBGE - Rio de Janeiro: ](https://cidades.ibge.gov.br/brasil/rj/rio-de-janeiro/panorama) 
    - densidade demográfica por município;
    - pirâmide etária;
    - alunos por nível escolar;
    - emprego.

# Referências

- [Imperial College COVID-19 Response Team (16/mar/2020), Impact of non-pharmaceutical interventions (NPIs) to reduce COVID- 19 mortality and healthcare demand, 16 de março de 2020 (Free Download).](https://www.imperial.ac.uk/media/imperial-college/medicine/sph/ide/gida-fellowships/Imperial-College-COVID19-NPI-modelling-16-03-2020.pdf)

- [Ferguson, N. M. et al. (2005), Strategies for containing an emerging influenza pandemic
in Southeast Asia, Nature 437, 209-214.](https://pubmed.ncbi.nlm.nih.gov/16079797/) (Link para download [aqui](http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.452.235&rep=rep1&type=pdf) disponibilizado por [CiteSeerX](http://citeseerx.ist.psu.edu/); veja, também, as [notas suplementares](https://static-content.springer.com/esm/art%3A10.1038%2Fnature04017/MediaObjects/41586_2005_BFnature04017_MOESM1_ESM.pdf).)


- [Ferguson NM, Cummings DAT, Fraser C, Cajka JC, Cooley PC, Burke DS (2006). Strategies for mitigating an influenza pandemic. Nature 442 (7101), 448–52 (Free Download)](https://pubmed.ncbi.nlm.nih.gov/16642006/); veja, também, as [notas suplementares](https://www.nature.com/articles/nature04795#Sec2). 

- [Halloran ME, Ferguson NM, Eubank S, et al (2008), Modeling targeted layered containment of an influenza pandemic in the United States. Proc Natl Acad Sci U S A 105 (12), 4639–44 (Free Download)](https://pubmed.ncbi.nlm.nih.gov/18332436/); veja, também, o [suplemento do artigo](https://www.pnas.org/content/suppl/2008/02/28/0706849105.DC1).

- [Landscan data](https://landscan.ornl.gov/): dados da distribuição global da população, com resolução da ordem de $1\,km^2$ ($30''\times 30''$).

- [M. J. Keeling & P. Rohani (2007), Modeling Infectious Diseases in Humans and Animals, Princeton University Press.](https://press.princeton.edu/books/hardcover/9780691116174/modeling-infectious-diseases-in-humans-and-animals)

- [I. Z. Kiss, J. Miller & P. L. Simon (2017), Mathematics of Epidemics on Networks: From Exact to Approximate Models, Springer-Verlag.](https://www.springer.com/br/book/9783319508047)

Veja a página [Imperial College - Covid 19](https://www.imperial.ac.uk/mrc-global-infectious-disease-analysis/covid-19/) para mais relatórios, publicações e outras informações do Imperial College.

<!--NAVIGATOR-->

---
[<- Modelos individuais estocásticos com múltiplas estruturas de conexão - parte I](08.00.Aula-Modelos_individuais_multiplas_estruturas.ipynb) | [Página Inicial](00.00-Pagina_Inicial.ipynb) | [Modelos individuais estocásticos com múltiplas estruturas de conexão - parte III ->](10.00.Aula-Modelos_individuais_multiplas_estruturas_3.ipynb)