# Comparação com a capital - Rio de Janeiro

Como dito anteriormente, desejamos analisar o fluxo da criminalidade entre os municípios do estado do Rio de Janeiro. A capital do estado, Rio de Janeiro, não é conhecida somente por sua beleza, mas também por ser uma cidade bastante perigosa. Dado isso, vamos analisar como as outras três regiões (Interior, Baixada Fluminense, Grande Niterói) se relacionam com o município do Rio de Janeiro utilizando os índices criados no notebook 3 (Índices de criminalidade): o índice de criminalidade, roubos, furtos, lesões e letalidades, e outros.

Antes de continuar, observe a distribuição geográfica das quatro regiões. A seguinte função se encontra no módulo [Sazonalidades](Sazonalidades.py).

In [None]:
import Sazonalidades as s
s.plot_regioes()

Criamos um [módulo](Taxas_de_crescimento.py) para organizar os cálculos necessários. Tal módulo possui duas funções:

* taxa_de_crescimento(): recebe como parâmetro o tipo de índice e retorna um DataFrame contendo uma coluna especificando a data (ano/mês), uma coluna especificando a região e uma coluna contendo as taxas de crescimento do índice, ordenado de acordo com a data e a região.

* taxa_de_crescimento_relativo(): semelhante à função acima, mas retornando a diferença entre a taxa de crescimento de uma determinada região e o município Rio de Janeiro.

Veja os seguintes exemplos:

In [None]:
import Taxas_de_crescimento as tc
import altair as alt
alt.renderers.enable('notebook')
import Correlação as corr
import Plots as pl
import Índice as ind

tc.taxa_de_crescimento('Furtos').head(16)

In [None]:
tc.taxa_de_crescimento_relativo('Índice de criminalidade').head(16)

## Análise compartiva entre as regiões

Vamos verificar se existe algum período relativamente longo no qual os índices de criminalidade das diferentes regiões crescem (ou decrescem) mais que os índices de criminalidade da capital Rio de Janeiro. Nosso critério é o seguinte: se há algum fluxo de criminalidade da capital em direção a certa região (ou o movimento contrário) em algum período razoável, então haverá um período considerável no qual a taxa de crescimento relativo dessa região permaneceu positiva. Resolvemos então analisar graficamente a situação das taxas de crescimento e das taxas de crescimento relativo de cada índice.

Para tal criamos as seguintes funções no módulo [Plots](Plots.py):

* plot_taxa_de_crescimento(): recebe como parâmetro o tipo de índice e retorna quatro gráficos de linha, cada um representando a evolução da taxa de crescimento do índice ao longo do tempo. Observe abaixo a aplicação dessa função para os cinco índices.

* plot_taxa_de_crescimento_relativo(): semelhante à função acima, mas retornando a evolução das taxas de crescimento relativo. Observe abaixo a aplicação dessa função para os cinco índices. (Obs. a taxa de crescimento relativo do Rio de Janeiro é igual a 0, obviamente).

In [None]:
pl.plot_taxa_de_crescimento('Índice de criminalidade') & pl.plot_taxa_de_crescimento('Roubos') & pl.plot_taxa_de_crescimento('Furtos') & pl.plot_taxa_de_crescimento('Lesões e Letalidades') & pl.plot_taxa_de_crescimento('Outros')

In [None]:
pl.plot_taxa_de_crescimento_relativo('Índice de criminalidade') & pl.plot_taxa_de_crescimento_relativo('Roubos') & pl.plot_taxa_de_crescimento_relativo('Furtos') & pl.plot_taxa_de_crescimento_relativo('Lesões e Letalidades') & pl.plot_taxa_de_crescimento_relativo('Outros')

É observado que não há nenhum período razoavelmente longo no qual a taxa de crescimento ou a taxa de crescimento relativo se situa somente acima ou somente abaixo de 0. Isto é, além de permanecerem estáveis, os índices evidenciam (através da segunda plotagem) que não há um fluxo claro de criminalidade entre a capital, Rio de Janeiro, e as outras regiões.

Entretanto, existe uma relação interessante entre as regiões: muitas vezes, as curvas seguem a mesma trajetória, podendo indicar que existe homogeneidade (entre as regiões) das taxas de crescimento. Calculamos a correlação entre os dados das séries temporais das taxas de crescimento dos índices das quatro regiões. Criamos o módulo [Correlação](Correlação.py), que contém a funcão correlação(). Para cada índice desejado, ela retorna um DataFrame com a correlação entre as taxas de crescimento das quatro regiões.

In [None]:
corr.correlação('Índice de criminalidade')

In [None]:
corr.correlação('Roubos')

In [None]:
corr.correlação('Furtos')

In [None]:
corr.correlação('Lesões e Letalidades')

In [None]:
corr.correlação('Outros')

Ou seja, além de de estarem estáveis em torno de 0, as taxas de crescimento das quatro regiões possuem alta correlação positiva. Podemos observar maiores correlações para o índice Outros e menores correlações para o índice Roubos (com correlações ainda assim altas). Portanto, embora não foi observado o fluxo da criminalidade entre as regiões, encontramos certa homogeneidade entre o crescimento e decrescimento dos índices das diferentes regiões.