# COMPLEXIDADE ECONÔMICA E COVID-19: UMA BREVE ANÁLISE DA CAPACIDADE DE RESPOSTA DOS MUNICÍPIOS DO ESPÍRITO SANTO

# 1.Importação da base de dados

In [None]:
import pandas as pd
import numpy as np

In [None]:
!pip install kaleido

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting kaleido
  Downloading kaleido-0.2.1-py2.py3-none-manylinux1_x86_64.whl (79.9 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m79.9/79.9 MB[0m [31m8.3 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: kaleido
Successfully installed kaleido-0.2.1


In [None]:
import kaleido
import pandas as pd

In [None]:
import plotly.express as px

In [None]:
from google.colab import drive
drive.mount('/content/drive/')

Mounted at /content/drive/


In [None]:
df = pd.read_excel('/content/drive/My Drive/TRABALHO/BaseOficial.xlsx')

In [None]:
df

Unnamed: 0,CODMUN,SH4,ANO,MUNICIPIO,PRODUTOSH4,PRODUTOSH2,CLASSIFICACAO,EXP,ECI,VCR,...,OBITO,ISOLAMENTO,MONITORAMENTO,BARREIRAS,SANCOES,TENDAS,SOBRECARGA,AMPLIACAOLEITE,HOSPITALCAMPANHA,FAIXA_POP_2020
0,3200102,901,2015,AFONSO CLAUDIO,"Café, mesmo torrado ou descafeinado; cascas e ...","Café, chá, mate e especiarias",Produtos Primários,2983651,-0.289533,1,...,3,1,0,1,1,1,0,1,0,4 - 20001 até 50000
1,3200102,1507,2017,AFONSO CLAUDIO,"Óleo de soja e respectivas fracções, mesmo ref...",Gorduras e óleos animais ou vegetais; produtos...,Baseados em Recursos,465320,0.021937,1,...,3,1,0,1,1,1,0,1,0,4 - 20001 até 50000
2,3200102,901,2018,AFONSO CLAUDIO,"Café, mesmo torrado ou descafeinado; cascas e ...","Café, chá, mate e especiarias",Produtos Primários,11500,-0.021426,1,...,3,1,0,1,1,1,0,1,0,4 - 20001 até 50000
3,3200102,1201,2018,AFONSO CLAUDIO,"Soja, mesmo triturada","Sementes e frutos oleaginosos; grãos, sementes...",Produtos Primários,435598,-0.021426,1,...,3,1,0,1,1,1,0,1,0,4 - 20001 até 50000
4,3200102,901,2019,AFONSO CLAUDIO,"Café, mesmo torrado ou descafeinado; cascas e ...","Café, chá, mate e especiarias",Produtos Primários,250621,-0.511772,1,...,3,1,0,1,1,1,0,1,0,4 - 20001 até 50000
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
10464,3205309,9617,2022,VITORIA,Garrafas térmicas e outros recipientes isotérm...,Obras diversas,Baixa Tecnologia,248,0.020391,0,...,722,1,1,1,1,0,0,0,0,6 - 100001 até 500000
10465,3205309,9618,2022,VITORIA,Manequins e artigos semelhantes; autômatos e c...,Obras diversas,Baixa Tecnologia,295,0.020391,0,...,722,1,1,1,1,0,0,0,0,6 - 100001 até 500000
10466,3205309,9701,2022,VITORIA,"Quadros, pinturas e desenhos, feitos inteirame...","Objetos de arte, de coleção e antiguidades",Outros,12530,0.020391,0,...,722,1,1,1,1,0,0,0,0,6 - 100001 até 500000
10467,3205309,9702,2022,VITORIA,"Gravuras, estampas e litografias, originais","Objetos de arte, de coleção e antiguidades",Outros,7,0.020391,0,...,722,1,1,1,1,0,0,0,0,6 - 100001 até 500000


# 2.Análise inicial do dataframe

## 2.1.Tipo das variáveis

Estamos trabalhando com um dataframe composto por 21 variáveis:
- CODMUN: código munícipio no IBGE.
- SH4: código de 4 dígitos do produto no Sistema Harmonizado.
- ANO: ano da exportação.
- MUNICÍPIO: nome do município brasileiro.
- PRODUTOSH4: descrição da classificação de 4 dígitos do produto.
- PRODUTOSH2: descrição do grupo (classificação de 2 dígitos) do produto.
- CLASSIFICAÇÃO: categoria de intensidade tecnológica do produto (produto primário, baseado em recurso, baixa tecnologia, média tecnologia, alta tecnologia e outros), de acordo com Lall (2000).
- EXP: valor exportado em reais (valores correntes).
- ECI: índice de complexidade econômica do município.
- VCR: variável binária indicando se o município é exportador competitivo do bem (1) ou não (0).
- PIBpc: PIB per capita em reais (valores correntes).
- CresPIBpc: crescimento do PIB per capita em reais (valores correntes).
- ISOLAMENTO: variável binária indicando se o munícipio adotou alguma medida de isolamento social (1, caso positivo; 0, caso contrário).
- OBITOS: número de mortes por COVID-19 entre março/20 e dezembro/20.
- MONITORAMENTO: variável binária indicando se o munícipio adotou um sistema de monitoramento para avaliar a eficácia do isolamento social (1, caso positivo; 0, caso contrário).
- BARREIRAS: variável binária indicando se o munícipio adotou alguma barreira sanitária nas entradas da cidade (1, caso positivo; 0, caso contrário).
- SANCOES: variável binária indicando se o munícipio adotou alguma medida para regulamentar sanções (1, caso positivo; 0, caso contrário).
- TENDAS: variável binária indicando se houve instalação de tendas de triagem (1, caso positivo; 0, caso contrário).
- SOBRECARGA: variável binária indicando se o número de internações ultrapassou a capacidade de leitos e de unidades de tratamento intensivo (UTI) públicos ou privados conveniados ao SUS (1, caso positivo; 0, caso contrário).
- AMPLIACAOLEITOS: variável binária indicando se o número de leitos foi ampliado para atender à demanda por internação no município (1, caso positivo; 0, caso contrário).
- HOSPITALCAMPANHA: variável binária indicando se foi instalado hospital de campanha durante a pandemia da COVID-19 no município (1, caso positivo; 0, caso contrário).

In [None]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 10469 entries, 0 to 10468
Data columns (total 22 columns):
 #   Column            Non-Null Count  Dtype  
---  ------            --------------  -----  
 0   CODMUN            10469 non-null  int64  
 1   SH4               10469 non-null  int64  
 2   ANO               10469 non-null  int64  
 3   MUNICIPIO         10469 non-null  object 
 4   PRODUTOSH4        10469 non-null  object 
 5   PRODUTOSH2        10469 non-null  object 
 6   CLASSIFICACAO     10469 non-null  object 
 7   EXP               10469 non-null  int64  
 8   ECI               10469 non-null  float64
 9   VCR               10469 non-null  int64  
 10  PIBpc             10469 non-null  object 
 11  CresPIBpc         9854 non-null   object 
 12  OBITO             10469 non-null  int64  
 13  ISOLAMENTO        10469 non-null  int64  
 14  MONITORAMENTO     10469 non-null  object 
 15  BARREIRAS         10469 non-null  int64  
 16  SANCOES           10469 non-null  int64 

## 2.2.Transformação das variáveis

Temos que transformar algumas variáveis em *string*, sejam elas códigos ou descrição de alguma informação.

In [None]:
df['CODMUN'] = df['CODMUN'].astype(str)
df['SH4'] = df['SH4'].astype(str)
df['MUNICIPIO'] = df['MUNICIPIO'].astype(str)
df['PRODUTOSH4'] = df['PRODUTOSH4'].astype(str)
df['PRODUTOSH2'] = df['PRODUTOSH2'].astype(str)
df['CLASSIFICACAO'] = df['CLASSIFICACAO'].astype(str)

df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 10469 entries, 0 to 10468
Data columns (total 22 columns):
 #   Column            Non-Null Count  Dtype  
---  ------            --------------  -----  
 0   CODMUN            10469 non-null  object 
 1   SH4               10469 non-null  object 
 2   ANO               10469 non-null  int64  
 3   MUNICIPIO         10469 non-null  object 
 4   PRODUTOSH4        10469 non-null  object 
 5   PRODUTOSH2        10469 non-null  object 
 6   CLASSIFICACAO     10469 non-null  object 
 7   EXP               10469 non-null  int64  
 8   ECI               10469 non-null  float64
 9   VCR               10469 non-null  int64  
 10  PIBpc             10469 non-null  object 
 11  CresPIBpc         9854 non-null   object 
 12  OBITO             10469 non-null  int64  
 13  ISOLAMENTO        10469 non-null  int64  
 14  MONITORAMENTO     10469 non-null  object 
 15  BARREIRAS         10469 non-null  int64  
 16  SANCOES           10469 non-null  int64 

# 3.Limpeza dataframe inicial e organização dados análise

## 3.1.Limpeza dados PIB per capita, crescimento PIB per capita e dummy de monitoramento

Precisamos tratar as informações de PIB per capita, Crescimento Anual do PIB per capita e da Dummy de Monitoramento, pois, em tese, deveriam ser variáveis inteiras ou decimais, mas retornaram como *string*. Provavelmente, existem valores nulos que foram substituídos por texto para indicar a ausência de dados.

## 3.1.1.PIB per capita

In [None]:
df_analise_missing_pibpc = df[(df['PIBpc'] == 'NÃO DISPONÍVEL')].copy()
df_analise_missing_pibpc.groupby(by=['ANO']).count()

Unnamed: 0_level_0,CODMUN,SH4,MUNICIPIO,PRODUTOSH4,PRODUTOSH2,CLASSIFICACAO,EXP,ECI,VCR,PIBpc,...,OBITO,ISOLAMENTO,MONITORAMENTO,BARREIRAS,SANCOES,TENDAS,SOBRECARGA,AMPLIACAOLEITE,HOSPITALCAMPANHA,FAIXA_POP_2020
ANO,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
2021,1817,1817,1817,1817,1817,1817,1817,1817,1817,1817,...,1817,1817,1817,1817,1817,1817,1817,1817,1817,1817
2022,1872,1872,1872,1872,1872,1872,1872,1872,1872,1872,...,1872,1872,1872,1872,1872,1872,1872,1872,1872,1872


Vemos que a variável de PIBpc não possui dados para os anos de 2021 e 2022. Isto ocorre pois o IBGE ainda não estruturou os dados para esses anos, sendo que, na nossa análise, tanto o número de óbitos, quanto a exportação e a complexidade são informações que se estendem até 2022. Dessa forma, criaremos um dataframe separado para a análise do PIB per capita.

In [None]:
df_analise_pibpc = df[(df['PIBpc'] != 'NÃO DISPONÍVEL')].copy()
df_analise_pibpc['PIBpc'] = df_analise_pibpc['PIBpc'].astype(float)
df_analise_pibpc['CresPIBpc'] = df_analise_pibpc['CresPIBpc'].astype(float)
df_analise_pibpc

Unnamed: 0,CODMUN,SH4,ANO,MUNICIPIO,PRODUTOSH4,PRODUTOSH2,CLASSIFICACAO,EXP,ECI,VCR,...,OBITO,ISOLAMENTO,MONITORAMENTO,BARREIRAS,SANCOES,TENDAS,SOBRECARGA,AMPLIACAOLEITE,HOSPITALCAMPANHA,FAIXA_POP_2020
0,3200102,901,2015,AFONSO CLAUDIO,"Café, mesmo torrado ou descafeinado; cascas e ...","Café, chá, mate e especiarias",Produtos Primários,2983651,-0.289533,1,...,3,1,0,1,1,1,0,1,0,4 - 20001 até 50000
1,3200102,1507,2017,AFONSO CLAUDIO,"Óleo de soja e respectivas fracções, mesmo ref...",Gorduras e óleos animais ou vegetais; produtos...,Baseados em Recursos,465320,0.021937,1,...,3,1,0,1,1,1,0,1,0,4 - 20001 até 50000
2,3200102,901,2018,AFONSO CLAUDIO,"Café, mesmo torrado ou descafeinado; cascas e ...","Café, chá, mate e especiarias",Produtos Primários,11500,-0.021426,1,...,3,1,0,1,1,1,0,1,0,4 - 20001 até 50000
3,3200102,1201,2018,AFONSO CLAUDIO,"Soja, mesmo triturada","Sementes e frutos oleaginosos; grãos, sementes...",Produtos Primários,435598,-0.021426,1,...,3,1,0,1,1,1,0,1,0,4 - 20001 até 50000
4,3200102,901,2019,AFONSO CLAUDIO,"Café, mesmo torrado ou descafeinado; cascas e ...","Café, chá, mate e especiarias",Produtos Primários,250621,-0.511772,1,...,3,1,0,1,1,1,0,1,0,4 - 20001 até 50000
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
9441,3205309,9613,2020,VITORIA,Isqueiros e outros acendedores (exceto os da p...,Obras diversas,Baixa Tecnologia,332,0.020993,0,...,722,1,1,1,1,0,0,0,0,6 - 100001 até 500000
9442,3205309,9614,2020,VITORIA,"Cachimbos (incluindo os seus fornilhos), pitei...",Obras diversas,Baixa Tecnologia,45,0.020993,0,...,722,1,1,1,1,0,0,0,0,6 - 100001 até 500000
9443,3205309,9616,2020,VITORIA,"Vaporizadores de toucador, suas armações e cab...",Obras diversas,Baixa Tecnologia,230,0.020993,0,...,722,1,1,1,1,0,0,0,0,6 - 100001 até 500000
9444,3205309,9617,2020,VITORIA,Garrafas térmicas e outros recipientes isotérm...,Obras diversas,Baixa Tecnologia,95,0.020993,0,...,722,1,1,1,1,0,0,0,0,6 - 100001 até 500000


## 3.1.2.Crescimento do PIB per capita

Vemos abaixo que o ano de 2015 concentra todas as observações nulas de crescimento do PIB per capita da base. Para o primeiro registro de cada município (primeiro ano disponível é 2015) não existe comparação do ano anterior na base. Dessa forma, criaremos um dataframe separado para a análise do Crescimento do PIB per capita.

Como PIB per capita e Crescimento do PIB per capita caminham juntos, iremos excluir os anos de 2015, 2021 e 2022. O objetivo é trabalhar com uma base mais balanceada.

In [None]:
df.CresPIBpc.isnull().groupby([df['ANO']]).sum().astype(int).reset_index(name='count')

Unnamed: 0,ANO,count
0,2015,615
1,2016,0
2,2017,0
3,2018,0
4,2019,0
5,2020,0
6,2021,0
7,2022,0


In [None]:
df_analise = df_analise_pibpc[(df_analise_pibpc['ANO'] != 2015)].copy()
df_analise

Unnamed: 0,CODMUN,SH4,ANO,MUNICIPIO,PRODUTOSH4,PRODUTOSH2,CLASSIFICACAO,EXP,ECI,VCR,...,OBITO,ISOLAMENTO,MONITORAMENTO,BARREIRAS,SANCOES,TENDAS,SOBRECARGA,AMPLIACAOLEITE,HOSPITALCAMPANHA,FAIXA_POP_2020
1,3200102,1507,2017,AFONSO CLAUDIO,"Óleo de soja e respectivas fracções, mesmo ref...",Gorduras e óleos animais ou vegetais; produtos...,Baseados em Recursos,465320,0.021937,1,...,3,1,0,1,1,1,0,1,0,4 - 20001 até 50000
2,3200102,901,2018,AFONSO CLAUDIO,"Café, mesmo torrado ou descafeinado; cascas e ...","Café, chá, mate e especiarias",Produtos Primários,11500,-0.021426,1,...,3,1,0,1,1,1,0,1,0,4 - 20001 até 50000
3,3200102,1201,2018,AFONSO CLAUDIO,"Soja, mesmo triturada","Sementes e frutos oleaginosos; grãos, sementes...",Produtos Primários,435598,-0.021426,1,...,3,1,0,1,1,1,0,1,0,4 - 20001 até 50000
4,3200102,901,2019,AFONSO CLAUDIO,"Café, mesmo torrado ou descafeinado; cascas e ...","Café, chá, mate e especiarias",Produtos Primários,250621,-0.511772,1,...,3,1,0,1,1,1,0,1,0,4 - 20001 até 50000
5,3200102,901,2020,AFONSO CLAUDIO,"Café, mesmo torrado ou descafeinado; cascas e ...","Café, chá, mate e especiarias",Produtos Primários,4351923,0.020993,1,...,3,1,0,1,1,1,0,1,0,4 - 20001 até 50000
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
9441,3205309,9613,2020,VITORIA,Isqueiros e outros acendedores (exceto os da p...,Obras diversas,Baixa Tecnologia,332,0.020993,0,...,722,1,1,1,1,0,0,0,0,6 - 100001 até 500000
9442,3205309,9614,2020,VITORIA,"Cachimbos (incluindo os seus fornilhos), pitei...",Obras diversas,Baixa Tecnologia,45,0.020993,0,...,722,1,1,1,1,0,0,0,0,6 - 100001 até 500000
9443,3205309,9616,2020,VITORIA,"Vaporizadores de toucador, suas armações e cab...",Obras diversas,Baixa Tecnologia,230,0.020993,0,...,722,1,1,1,1,0,0,0,0,6 - 100001 até 500000
9444,3205309,9617,2020,VITORIA,Garrafas térmicas e outros recipientes isotérm...,Obras diversas,Baixa Tecnologia,95,0.020993,0,...,722,1,1,1,1,0,0,0,0,6 - 100001 até 500000


## 3.1.2.Dummy de monitoramento

Precisamos investigar quais municípios não tiveram informações que indicam presença (ou não) de monitoramento do isolamento social. Vale ressaltar que isto não significa que o município não teve monitoramento (o que é indicado pelo valor 0 na dummy), mas sim que não podemos afirmar se houve ou não monitoramento. Logo, para a análise desta política e seu impacto sobre número de mortes, temos que desconsiderar tais municípios.

In [None]:
df_analise_missing_monitoramento = df[(df['MONITORAMENTO'] == 'NÃO DISPONÍVEL')].copy()
df_analise_missing_monitoramento.groupby(by=['MUNICIPIO']).count()

Unnamed: 0_level_0,CODMUN,SH4,ANO,PRODUTOSH4,PRODUTOSH2,CLASSIFICACAO,EXP,ECI,VCR,PIBpc,...,OBITO,ISOLAMENTO,MONITORAMENTO,BARREIRAS,SANCOES,TENDAS,SOBRECARGA,AMPLIACAOLEITE,HOSPITALCAMPANHA,FAIXA_POP_2020
MUNICIPIO,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
BOM JESUS DO NORTE,3,3,3,3,3,3,3,3,3,3,...,3,3,3,3,3,3,3,3,3,3


Vemos que só o município de Bom Jesus do Norte não disponibilizou tal informação. Logo, este município não irá agregar, no geral, informações para o nosso estudo.

In [None]:
df_analise = df_analise[(df_analise['MONITORAMENTO'] != 'NÃO DISPONÍVEL')].copy()
df_analise

Unnamed: 0,CODMUN,SH4,ANO,MUNICIPIO,PRODUTOSH4,PRODUTOSH2,CLASSIFICACAO,EXP,ECI,VCR,...,OBITO,ISOLAMENTO,MONITORAMENTO,BARREIRAS,SANCOES,TENDAS,SOBRECARGA,AMPLIACAOLEITE,HOSPITALCAMPANHA,FAIXA_POP_2020
1,3200102,1507,2017,AFONSO CLAUDIO,"Óleo de soja e respectivas fracções, mesmo ref...",Gorduras e óleos animais ou vegetais; produtos...,Baseados em Recursos,465320,0.021937,1,...,3,1,0,1,1,1,0,1,0,4 - 20001 até 50000
2,3200102,901,2018,AFONSO CLAUDIO,"Café, mesmo torrado ou descafeinado; cascas e ...","Café, chá, mate e especiarias",Produtos Primários,11500,-0.021426,1,...,3,1,0,1,1,1,0,1,0,4 - 20001 até 50000
3,3200102,1201,2018,AFONSO CLAUDIO,"Soja, mesmo triturada","Sementes e frutos oleaginosos; grãos, sementes...",Produtos Primários,435598,-0.021426,1,...,3,1,0,1,1,1,0,1,0,4 - 20001 até 50000
4,3200102,901,2019,AFONSO CLAUDIO,"Café, mesmo torrado ou descafeinado; cascas e ...","Café, chá, mate e especiarias",Produtos Primários,250621,-0.511772,1,...,3,1,0,1,1,1,0,1,0,4 - 20001 até 50000
5,3200102,901,2020,AFONSO CLAUDIO,"Café, mesmo torrado ou descafeinado; cascas e ...","Café, chá, mate e especiarias",Produtos Primários,4351923,0.020993,1,...,3,1,0,1,1,1,0,1,0,4 - 20001 até 50000
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
9441,3205309,9613,2020,VITORIA,Isqueiros e outros acendedores (exceto os da p...,Obras diversas,Baixa Tecnologia,332,0.020993,0,...,722,1,1,1,1,0,0,0,0,6 - 100001 até 500000
9442,3205309,9614,2020,VITORIA,"Cachimbos (incluindo os seus fornilhos), pitei...",Obras diversas,Baixa Tecnologia,45,0.020993,0,...,722,1,1,1,1,0,0,0,0,6 - 100001 até 500000
9443,3205309,9616,2020,VITORIA,"Vaporizadores de toucador, suas armações e cab...",Obras diversas,Baixa Tecnologia,230,0.020993,0,...,722,1,1,1,1,0,0,0,0,6 - 100001 até 500000
9444,3205309,9617,2020,VITORIA,Garrafas térmicas e outros recipientes isotérm...,Obras diversas,Baixa Tecnologia,95,0.020993,0,...,722,1,1,1,1,0,0,0,0,6 - 100001 até 500000


In [None]:
df_analise.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 6163 entries, 1 to 9445
Data columns (total 22 columns):
 #   Column            Non-Null Count  Dtype  
---  ------            --------------  -----  
 0   CODMUN            6163 non-null   object 
 1   SH4               6163 non-null   object 
 2   ANO               6163 non-null   int64  
 3   MUNICIPIO         6163 non-null   object 
 4   PRODUTOSH4        6163 non-null   object 
 5   PRODUTOSH2        6163 non-null   object 
 6   CLASSIFICACAO     6163 non-null   object 
 7   EXP               6163 non-null   int64  
 8   ECI               6163 non-null   float64
 9   VCR               6163 non-null   int64  
 10  PIBpc             6163 non-null   float64
 11  CresPIBpc         6163 non-null   float64
 12  OBITO             6163 non-null   int64  
 13  ISOLAMENTO        6163 non-null   int64  
 14  MONITORAMENTO     6163 non-null   object 
 15  BARREIRAS         6163 non-null   int64  
 16  SANCOES           6163 non-null   int64  


In [None]:
df_analise['MONITORAMENTO'] = df_analise['MONITORAMENTO'].astype(int)
df_analise.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 6163 entries, 1 to 9445
Data columns (total 22 columns):
 #   Column            Non-Null Count  Dtype  
---  ------            --------------  -----  
 0   CODMUN            6163 non-null   object 
 1   SH4               6163 non-null   object 
 2   ANO               6163 non-null   int64  
 3   MUNICIPIO         6163 non-null   object 
 4   PRODUTOSH4        6163 non-null   object 
 5   PRODUTOSH2        6163 non-null   object 
 6   CLASSIFICACAO     6163 non-null   object 
 7   EXP               6163 non-null   int64  
 8   ECI               6163 non-null   float64
 9   VCR               6163 non-null   int64  
 10  PIBpc             6163 non-null   float64
 11  CresPIBpc         6163 non-null   float64
 12  OBITO             6163 non-null   int64  
 13  ISOLAMENTO        6163 non-null   int64  
 14  MONITORAMENTO     6163 non-null   int64  
 15  BARREIRAS         6163 non-null   int64  
 16  SANCOES           6163 non-null   int64  


## 3.2.Análise dataframe

### 3.2.1.PIB per capita (nível e crescimento) e nível exportado

Vemos, a partir da tabela abaixo, que:

(i) Os anos que, na média, o PIB per capita do Espírito Santo cresceu, em comparação com o ano anterior, foram 2018 e 2020. O caso de 2020, a priori, é curioso, pois, em tese e por hipótese, com a pandemia houve uma retração da atividade econômica. Todavia, também por hipótese, isso pode ser fruto das medidas fiscais expansionistas, tal qual o auxílio emergencial. Quando avaliamos a mediana, vemos que, em 2019, mais de 50% dos municípios do Espírito Santo tiveram crescimento do PIB per capita, o que indica para valores extremos no limite inferior da distribuição.

(ii) O patamar do PIB per capita aumentou entre 2017 e 2018, saindo de RS 31.000,00 para a casa dos RS 40.000,00. Porém, analisando a mediana, vemos que o valor diminui consideravelmente para todos os anos, exceto 2015, indicando para um número muito maior de municípios com PIB per capita abaixo de RS 30.000,00.

In [None]:
df_analise.pivot_table(index = 'ANO',
                values = ['PIBpc', 'CresPIBpc', 'EXP'],
                aggfunc = ['median', 'mean']).round(4)

Unnamed: 0_level_0,median,median,median,mean,mean,mean
Unnamed: 0_level_1,CresPIBpc,EXP,PIBpc,CresPIBpc,EXP,PIBpc
ANO,Unnamed: 1_level_2,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2
2016,-0.007,10150.0,27523.4,-0.022,7607059.0,33525.0506
2017,-0.0028,9787.5,26766.38,-0.0003,9660972.0,31503.5711
2018,0.2023,2339.5,28523.85,0.1883,6733046.0,41850.1695
2019,0.0091,2703.0,26129.3,-0.0092,4386488.0,40330.4733
2020,0.0193,2175.0,29612.66,0.0283,3121538.0,41648.7354


### 3.2.2.Complexidade econômica

Outra análise importante a ser feita neste momento é a classificação dos municípios por nível de complexidade. Iremos analisar a complexidade para o ano de 2019. Por que? O nível de complexidade da estrutura produtiva de 2019 é o que antecede a pandemia, ou seja, é o mais próximo que temos para relacionar o estado da estrutura produtiva dos municípios no momento da pandemia.

In [None]:
df_complexidade = df_analise[(df_analise['ANO'] == 2019)].copy()
df_complexidade

Unnamed: 0,CODMUN,SH4,ANO,MUNICIPIO,PRODUTOSH4,PRODUTOSH2,CLASSIFICACAO,EXP,ECI,VCR,...,OBITO,ISOLAMENTO,MONITORAMENTO,BARREIRAS,SANCOES,TENDAS,SOBRECARGA,AMPLIACAOLEITE,HOSPITALCAMPANHA,FAIXA_POP_2020
4,3200102,901,2019,AFONSO CLAUDIO,"Café, mesmo torrado ou descafeinado; cascas e ...","Café, chá, mate e especiarias",Produtos Primários,250621,-0.511772,1,...,3,1,0,1,1,1,0,1,0,4 - 20001 até 50000
21,3200136,901,2019,AGUIA BRANCA,"Café, mesmo torrado ou descafeinado; cascas e ...","Café, chá, mate e especiarias",Produtos Primários,1561570,-0.139122,1,...,4,1,1,1,1,1,0,1,0,2 - 5001 até 10000
22,3200136,2506,2019,AGUIA BRANCA,"Quartzo (exceto areias naturais); quartzites, ...","Sal; enxofre; terras e pedras; gesso, cal e ci...",Produtos Primários,10086,-0.139122,1,...,4,1,1,1,1,1,0,1,0,2 - 5001 até 10000
23,3200136,2516,2019,AGUIA BRANCA,"Granito, pórfiro, basalto, arenito e outras pe...","Sal; enxofre; terras e pedras; gesso, cal e ci...",Produtos Primários,1715668,-0.139122,1,...,4,1,1,1,1,1,0,1,0,2 - 5001 até 10000
24,3200136,6802,2019,AGUIA BRANCA,Pedras de cantaria ou de construção (exceto de...,"Obras de pedra, gesso, cimento, amianto, mica ...",Baseados em Recursos,1938129,-0.139122,1,...,4,1,1,1,1,1,0,1,0,2 - 5001 até 10000
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
8973,3205309,9609,2019,VITORIA,"Lápis (exceto os da posição 9608), minas, past...",Obras diversas,Baixa Tecnologia,27,-0.021706,0,...,722,1,1,1,1,0,0,0,0,6 - 100001 até 500000
8974,3205309,9613,2019,VITORIA,Isqueiros e outros acendedores (exceto os da p...,Obras diversas,Baixa Tecnologia,37,-0.021706,0,...,722,1,1,1,1,0,0,0,0,6 - 100001 até 500000
8975,3205309,9617,2019,VITORIA,Garrafas térmicas e outros recipientes isotérm...,Obras diversas,Baixa Tecnologia,146,-0.021706,0,...,722,1,1,1,1,0,0,0,0,6 - 100001 até 500000
8976,3205309,9705,2019,VITORIA,"Coleções e espécimes para coleções, de zoologi...","Objetos de arte, de coleção e antiguidades",Outros,5000,-0.021706,1,...,722,1,1,1,1,0,0,0,0,6 - 100001 até 500000


In [None]:
df_analisecomplex = df_complexidade.pivot_table(index = ['MUNICIPIO'],
                values = 'ECI',
                aggfunc = 'mean'
                ).round(4)

Abaixo, vemos os top 10 Municípios mais complexos do Espírito Santo, Por hipótese, estes municípios apresentam melhor capacidade de resposta à pandemia, pois, quanto maior o nível de conhecimento embutido na estrutura produtiva (medido pelo ECI), maior a capacidade de resposta ao choque exógeno de saúde.

In [None]:
df_analisecomplex.sort_values(['ECI'],ascending=False).head(10)

Unnamed: 0_level_0,ECI
MUNICIPIO,Unnamed: 1_level_1
COLATINA,0.3066
LINHARES,0.2643
GUARAPARI,0.25
SERRA,0.2011
CASTELO,0.1795
VILA VELHA,0.1549
ANCHIETA,0.1513
BARRA DE SAO FRANCISCO,0.1324
SAO ROQUE DO CANAA,0.1324
SANTA MARIA DE JETIBA,0.1321


### 3.2.3.Diversificação da estrutura produtiva

Primeiro, deixaremos uma base de dados somente com informações de diversificação por classificação tecnológica. Esta base terá a informação da competitividade do munícipio por ano em cada classificação tecnológica, isto é, quantos produtos ele exporta competitivamente em comparação com o restante do país.

In [None]:
df_diversificacao = df[['ANO', 'MUNICIPIO', 'CLASSIFICACAO', 'VCR', 'ECI']].copy()
df_diversificacao

Unnamed: 0,ANO,MUNICIPIO,CLASSIFICACAO,VCR,ECI
0,2015,AFONSO CLAUDIO,Produtos Primários,1,-0.289533
1,2017,AFONSO CLAUDIO,Baseados em Recursos,1,0.021937
2,2018,AFONSO CLAUDIO,Produtos Primários,1,-0.021426
3,2018,AFONSO CLAUDIO,Produtos Primários,1,-0.021426
4,2019,AFONSO CLAUDIO,Produtos Primários,1,-0.511772
...,...,...,...,...,...
10464,2022,VITORIA,Baixa Tecnologia,0,0.020391
10465,2022,VITORIA,Baixa Tecnologia,0,0.020391
10466,2022,VITORIA,Outros,0,0.020391
10467,2022,VITORIA,Outros,0,0.020391


In [None]:
df_diversificacao_analise = df_diversificacao.pivot_table(index = ['ANO', 'MUNICIPIO'],
                values = 'VCR',
                columns='CLASSIFICACAO',
                aggfunc = 'sum'
                ).round(2).copy()

In [None]:
df_diversificacao_analise.fillna(0)

Unnamed: 0_level_0,CLASSIFICACAO,Alta Tecnologia,Baixa Tecnologia,Baseados em Recursos,Média Tecnologia,Outros,Produtos Primários
ANO,MUNICIPIO,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
2015,AFONSO CLAUDIO,0.0,0.0,0.0,0.0,0.0,1.0
2015,AGUA DOCE DO NORTE,0.0,0.0,1.0,0.0,0.0,1.0
2015,AGUIA BRANCA,0.0,0.0,1.0,0.0,0.0,1.0
2015,ANCHIETA,0.0,0.0,1.0,1.0,0.0,0.0
2015,ARACRUZ,0.0,1.0,2.0,0.0,0.0,0.0
...,...,...,...,...,...,...,...
2022,VIANA,0.0,3.0,0.0,2.0,0.0,4.0
2022,VILA PAVAO,0.0,0.0,0.0,0.0,0.0,1.0
2022,VILA VALERIO,0.0,1.0,0.0,0.0,0.0,3.0
2022,VILA VELHA,1.0,14.0,28.0,9.0,1.0,30.0


No geral, vemos que o estado do Espírito Santo é competitivo, principalmente em produtos primários e de baixa tecnologia. Além disso, entre 2015 e 2021, o estado parece ter elevado sua competitividade de modo geral, aumentando o número de produtos que exportados com vantagem comparativa revelada nos setores de alta tecnologia (6 para 18), baixa tecnologia (47 para 107), produtos primários (103 para 201) e produtos baseados em recursos (44 para 93). No setor de média tecnologia, os valores cresceram de 35 para 52 entre 2015 e 2016, mas, posterior a esse fato, não há tendência específica, alternando entre crescimento e decrescimento.

In [None]:
df_diversificacao.pivot_table(index = 'ANO',
                values = 'VCR',
                columns='CLASSIFICACAO',
                aggfunc = 'sum'
                ).round(2)

CLASSIFICACAO,Alta Tecnologia,Baixa Tecnologia,Baseados em Recursos,Média Tecnologia,Outros,Produtos Primários
ANO,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2015,6,47,44,35,2,103
2016,8,56,44,52,3,112
2017,8,75,55,56,2,125
2018,2,63,63,41,4,180
2019,2,82,86,49,5,194
2020,13,87,95,52,5,184
2021,18,107,93,48,6,201
2022,9,100,93,47,5,210


### 3.2.4.Número de óbitos

O número de óbitos é medido exclusivamente para o ano de 2020 (entre março e dezembro). Abaixo, vemos os municípios que mais registraram óbitos por COVID-19. Os três municípios que registraram mais óbitos foram Serra, Vitoria e Vila Velha.

Este resultado levanta a questão: estes municípios registraram mais óbitos muito em função de sua maior população ou por que tiveram pior desempenho no combate ao COVID-19?

Vemos que Vila Velha e Guarapari adotaram as medidas de distanciamento social apenas. Assim, não tiveram ampliação dos leitos ou instalação de hospital de campanha, além de observarem sobrecarga do sistema de saúde. Porém, Vila Velha teve 5,5 vezes mais óbitos. Dessa forma, conclui-se que talvez existe algo relacionado tamanho do município.

Este resultado indica que, quando formos analisar a relação entre complexidade, capacidade de resposta à pandemia e número de óbitos, talvez tenhamos que controlar pelo tamanho da população. Isto é, entre o grupo de municípios do mesmo tamanho, os mais complexos se saíram melhor na pandemia?


In [None]:
df_obito = df_analise[(df_analise['ANO'] == 2020)].copy()
df_obito_2 = df_obito.pivot_table(index = 'MUNICIPIO',
                values = ['OBITO', 'ISOLAMENTO', 'MONITORAMENTO', 'BARREIRAS', 'SANCOES', 'TENDAS', 'SOBRECARGA', 'AMPLIACAOLEITE', 'HOSPITALCAMPANHA'],
                aggfunc = 'mean'
                ).sort_values('OBITO',ascending=False)
df_obito_2

Unnamed: 0_level_0,AMPLIACAOLEITE,BARREIRAS,HOSPITALCAMPANHA,ISOLAMENTO,MONITORAMENTO,OBITO,SANCOES,SOBRECARGA,TENDAS
MUNICIPIO,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1
SERRA,1,0,0,1,1,1616,1,0,0
VITORIA,0,1,0,1,1,722,1,0,0
VILA VELHA,0,1,0,1,1,388,1,1,1
LINHARES,1,0,0,1,1,173,1,0,1
CACHOEIRO DE ITAPEMIRIM,0,1,0,1,1,146,1,0,0
COLATINA,1,0,0,1,1,143,0,1,0
SAO MATEUS,1,1,0,1,1,126,1,1,1
CARIACICA,1,1,0,1,0,117,1,1,0
ARACRUZ,1,1,0,1,1,87,1,1,1
GUARAPARI,0,1,0,1,1,70,1,1,1


# 4.Visualização dos dados

## 4.1.Diversificação produtiva

### 4.1.1.Espírito Santo

Nessa seção, queremos verificar a evolução da diversificação produtiva do estado do Espírito Santo.

In [None]:
df_diversificacao_analise_2 = df_diversificacao.pivot_table(index = ['ANO', 'MUNICIPIO', 'CLASSIFICACAO'],
                values = 'VCR',
                aggfunc = 'sum'
                ).round(2)
df_diversificacao_analise_2.reset_index(inplace=True)

In [None]:
df_diversificacao_analise_3 = df_diversificacao.pivot_table(index = ['ANO', 'CLASSIFICACAO'],
                values = 'VCR',
                aggfunc = 'sum'
                ).round(2)
df_diversificacao_analise_3.reset_index(inplace=True)

O gráfico deixa claro que o Espírito Santo reforçou, no geral, uma tendência de reprimarização da estrutura produtiva. O crescimento de mais de 100% no número de produtos primários com vantagem comparativa revelada reflete esta tendência.

In [None]:
fig1 = px.line(df_diversificacao_analise_3, x='ANO', y='VCR', color='CLASSIFICACAO',
              markers=True)
fig1

### 4.1.2.Municípios

Além disso, como queremos relacionar complexidade econômica, capacidade de resposta dos municípios ao COVID-19 e número de mortes, vamos verificar a evolução da estrutura produtiva dos munícipios mais complexos, dos municípios que mais registraram óbitos e dos municípios que, em tese, tomaram mais medidas contra o COVID-19.

In [None]:
df_diversificacao_analise_4 = df_diversificacao_analise_2[(df_diversificacao_analise_2['MUNICIPIO'] == 'COLATINA') |
                                                          (df_diversificacao_analise_2['MUNICIPIO'] == 'LINHARES') |
                                                          (df_diversificacao_analise_2['MUNICIPIO'] == 'GUARAPARI') |
                                                          (df_diversificacao_analise_2['MUNICIPIO'] == 'SERRA') |
                                                          (df_diversificacao_analise_2['MUNICIPIO'] == 'CASTELO')].copy()

In [None]:
df_diversificacao_analise_5 = df_diversificacao_analise_4.pivot_table(index = ['ANO', 'CLASSIFICACAO', 'MUNICIPIO'],
                values = 'VCR',
                aggfunc = 'sum'
                ).round(2)
df_diversificacao_analise_5.reset_index(inplace=True)

In [None]:
df_analisecomplex.sort_values(['ECI'],ascending=False).head(5)

Unnamed: 0_level_0,ECI
MUNICIPIO,Unnamed: 1_level_1
COLATINA,0.3066
LINHARES,0.2643
GUARAPARI,0.25
SERRA,0.2011
CASTELO,0.1795


Algumas observações da análise de diversificação dos top 5 municípios em complexidade.

(i) Apesar de ser somente o quarto município na classificação por em complexidade, Serra é mais competitiva em produtos de média tecnologia, seguida por Guarapari, que é o segundo. Em termos de alta complexidade, comparativamente em relação aos demais municípios, Guarapari e Serra são os mais competitivos.

(ii) Colatina, que é o município mais complexo, é mais competitiva em produtos de baixa tecnologia.

(iii) Serra é, claramente, o município com competitividade em um maior número de setores. Isso nos leva a indagar: Por que o município é, então, somente o quarto em complexidade?

Talvez os produtos em que Serra é competitiva são exportados competitivamente por uma diversidade maior de municípios no Brasil e/ou estes municípios são menos complexos, no geral. Todavia, esta é uma análise geral para o período 2016 - 2020. Temos que analisar somente o ano de 2019 (que é a base para classificar os municípios).

In [None]:
fig2 = px.bar(df_diversificacao_analise_5, x = 'CLASSIFICACAO', y = 'VCR', color = 'MUNICIPIO',
              barmode='group')
fig2.update_traces(marker_line_width=1.5,
                  marker_line_color='black',
                  opacity=0.7)
fig2

In [None]:
df_diversificacao_analise_6 = df_diversificacao_analise_5[(df_diversificacao_analise_5['ANO'] == 2019)].copy()

Mesmo analisando somente 2019, Serra e Guarapari são mais competitivas em mais setores, principalmente nos setores de Baixa Tecnologia (Guarapari é top 1) e Média Tecnologia (Serra é top 1 com folga). Mas, conforme adiantamos, complexidade econômica é uma medida iterativa e leva em consideração o Brasil inteiro, não somente o cenário do Espírito Santo. Por isso, saber em quais produtos estes municípios são competitivos e qual o nível de complexidade dos municípios brasileiros que são competitivos no mesmo produto é importante.

In [None]:
fig3 = px.bar(df_diversificacao_analise_6, x = 'CLASSIFICACAO', y = 'VCR', color = 'MUNICIPIO',
             barmode='group')
fig3.update_traces(marker_line_width=1.5,
                  marker_line_color='black',
                  opacity=0.5)
fig3

Outro argumento que pode ir na direção contrária da lógica de "Serra é competitiva em mais bens de alta intensidade tecnológica, logo deveria ser mais complexa", é avaliar se existem municípios mais competitivos em produtos de média e baixa complexidade.

Vemos que Vila Velha é quase tão competitiva quanto Serra em produtos de média tecnologia, mas é somente sexta em complexidade. Cariacica aparece no top 5 de competitividade em produtos de alta, média e baixa complexidade, mas não é nem top 10 em complexidade. Ou seja, a análise não é tão direta.

In [None]:
df_diversificacao_analise_7 = df_diversificacao_analise_2[(df_diversificacao_analise_2['ANO'] == 2019)].copy()
df_diversificacao_analise_7.sort_values(['CLASSIFICACAO','VCR'],ascending=False).groupby('CLASSIFICACAO').head(5)

Unnamed: 0,ANO,MUNICIPIO,CLASSIFICACAO,VCR
655,2019,VILA VELHA,Produtos Primários,27
661,2019,VITORIA,Produtos Primários,20
632,2019,SERRA,Produtos Primários,11
541,2019,CACHOEIRO DE ITAPEMIRIM,Produtos Primários,8
589,2019,LINHARES,Produtos Primários,8
546,2019,CARIACICA,Outros,2
660,2019,VITORIA,Outros,2
631,2019,SERRA,Outros,1
540,2019,CACHOEIRO DE ITAPEMIRIM,Outros,0
556,2019,COLATINA,Outros,0


In [None]:
fig4 = px.bar(df_diversificacao_analise_7, x = 'MUNICIPIO', y='VCR', color='CLASSIFICACAO')
fig4

## 4.2.Óbitos e tamanho do município

Os municípios mais complexos estão, de 56 municípios, no top-13 em número de óbitos.

Colatina: sexto em número de óbitos.

Linhares: quarto em número de óbitos.

Guarapari: décimo em número de óbitos.

Serra: primeiro em número de mortes.

Castelo: décimo terceiro em número de mortes.

Abaixo, analisamos a relação entre tamanho da população, média de complexidade e média do número de óbitos. Fica claro que municípios mais populosos são os mais complexos e o que registraram, na média, mais óbitos por COVID-19. Ou seja, há de fato um viés na análise. Para mitigar este viés na modelagem da relação entre complexidade e número de óbitos, iremos realizá-la para cada grupo populacional.

In [None]:
df_obito_analise = df_analise[(df_analise['ANO'] == 2019)].copy()
df_obito_analise_2 = df_obito_analise.pivot_table(index = ['FAIXA_POP_2020'],
                values = ['OBITO','ECI'],
                aggfunc = 'mean'
                ).round(2)
df_obito_analise_2.reset_index(inplace=True)
df_obito_analise_2

Unnamed: 0,FAIXA_POP_2020,ECI,OBITO
0,2 - 5001 até 10000,-0.12,2.88
1,3 - 10001 até 20000,-0.08,6.84
2,4 - 20001 até 50000,0.02,10.74
3,5 - 50001 até 100000,0.1,5.32
4,6 - 100001 até 500000,0.01,501.4
5,7 - Maior que 500000,0.17,752.27


In [None]:
fig5 = px.scatter(df_obito_analise_2, x="ECI", y="OBITO", color="FAIXA_POP_2020")
fig5.update_traces(marker_size=7,
                  marker_line_width=1)
fig5

## 4.2.1.Capacidade de resposta

In [None]:
df_resposta = df_analise[['MUNICIPIO', 'FAIXA_POP_2020', 'OBITO', 'ISOLAMENTO', 'MONITORAMENTO', 'BARREIRAS', 'SANCOES', 'TENDAS', 'SOBRECARGA',
                                'AMPLIACAOLEITE', 'HOSPITALCAMPANHA']].copy()

In [None]:
df_resposta_2 = df_resposta.pivot_table(index = ['MUNICIPIO','FAIXA_POP_2020'],
                values = ['OBITO', 'ISOLAMENTO', 'MONITORAMENTO', 'BARREIRAS', 'SANCOES', 'TENDAS', 'SOBRECARGA', 'AMPLIACAOLEITE', 'HOSPITALCAMPANHA'],
                aggfunc = 'mean'
                ).round(2)
df_resposta_2.reset_index(inplace=True)

In [None]:
df_resposta_3 = df_resposta_2.pivot_table(index = ['FAIXA_POP_2020'],
                values = ['ISOLAMENTO'],
                aggfunc = 'sum'
                ).round(2)
df_resposta_3.rename(columns = {'ISOLAMENTO' : 'QUANTIDADE'},
          inplace = True)
df_resposta_3.reset_index(inplace=True)
df_resposta_4 = df_resposta_2.pivot_table(index = ['FAIXA_POP_2020'],
                values = ['OBITO', 'ISOLAMENTO', 'MONITORAMENTO', 'BARREIRAS', 'SANCOES', 'TENDAS', 'SOBRECARGA', 'AMPLIACAOLEITE', 'HOSPITALCAMPANHA'],
                aggfunc = 'sum'
                ).round(2)
df_resposta_4.reset_index(inplace=True)

In [None]:
df_merged = df_resposta_3.merge(df_resposta_4)
df_merged

Unnamed: 0,FAIXA_POP_2020,QUANTIDADE,AMPLIACAOLEITE,BARREIRAS,HOSPITALCAMPANHA,ISOLAMENTO,MONITORAMENTO,OBITO,SANCOES,SOBRECARGA,TENDAS
0,2 - 5001 até 10000,5,2,5,0,5,2,13,4,0,3
1,3 - 10001 até 20000,20,9,17,0,20,12,154,13,2,6
2,4 - 20001 até 50000,23,13,20,1,23,15,252,18,3,12
3,5 - 50001 até 100000,2,1,2,0,2,0,14,1,0,1
4,6 - 100001 até 500000,8,5,6,0,8,7,1584,7,5,4
5,7 - Maior que 500000,2,1,1,0,2,2,2004,2,1,1


A coluna QUANTIDADE indica o número de municípios em cada categoria de faixa populacional. Apesar de existirem somente 2 municípios nas categoria 'Maior que 500000' e '50001 até 100000', elas registraram, no total, mais óbitos do que as demais, indicando que, de fato, o nível de óbitos é muito superior nas grandes cidades.

In [None]:
df_merged["RAZAOAMPLIACAO"] = df_merged["AMPLIACAOLEITE"] / df_merged["QUANTIDADE"]
df_merged["RAZAOBARREIRAS"] = df_merged["BARREIRAS"] / df_merged["QUANTIDADE"]
df_merged["RAZAOHOSPITAL"] = df_merged["HOSPITALCAMPANHA"] / df_merged["QUANTIDADE"]
df_merged["RAZAOISOLAMENTO"] = df_merged["ISOLAMENTO"] / df_merged["QUANTIDADE"]
df_merged["RAZAOMONITORAMENTO"] = df_merged["MONITORAMENTO"] / df_merged["QUANTIDADE"]
df_merged["RAZAOSANCOES"] = df_merged["SANCOES"] / df_merged["QUANTIDADE"]
df_merged["RAZAOSOBRECARGA"] = df_merged["SOBRECARGA"] / df_merged["QUANTIDADE"]
df_merged["RAZAOTENDAS"] = df_merged["TENDAS"] / df_merged["QUANTIDADE"]
df_merged_2 = df_merged[['FAIXA_POP_2020', 'OBITO','RAZAOAMPLIACAO', 'RAZAOBARREIRAS', 'RAZAOHOSPITAL', 'RAZAOISOLAMENTO',
                         "RAZAOMONITORAMENTO", "RAZAOSANCOES", "RAZAOSOBRECARGA", "RAZAOTENDAS"]].head(5)
df_merged_2

Unnamed: 0,FAIXA_POP_2020,OBITO,RAZAOAMPLIACAO,RAZAOBARREIRAS,RAZAOHOSPITAL,RAZAOISOLAMENTO,RAZAOMONITORAMENTO,RAZAOSANCOES,RAZAOSOBRECARGA,RAZAOTENDAS
0,2 - 5001 até 10000,13,0.4,1.0,0.0,1.0,0.4,0.8,0.0,0.6
1,3 - 10001 até 20000,154,0.45,0.85,0.0,1.0,0.6,0.65,0.1,0.3
2,4 - 20001 até 50000,252,0.565217,0.869565,0.043478,1.0,0.652174,0.782609,0.130435,0.521739
3,5 - 50001 até 100000,14,0.5,1.0,0.0,1.0,0.0,0.5,0.0,0.5
4,6 - 100001 até 500000,1584,0.625,0.75,0.0,1.0,0.875,0.875,0.625,0.5


As faixas de população que registraram mais óbitos foram aquelas que também tiveram uma razão maior de municípios que ampliaram a quantidade de leitos.
Não se sabe a direção da causalidade, mas, por hipótese, pelo fato de estarem registrando mais óbitos, provavelmente também tiveram uma sobrecarga maior no sistema de saúde (o que é confirmado pela razão 0,625 para a faixa '100001 até 500000' e pela razão 0,130435 para a faixa '20001 até 50000'), logo, tiveram que ampliar os leitos.

O mesmo é observado para as variáveis que indicam a razão de municípios que realizaram monitoramento (razão 0,875 para a faixa '100001 até 500000' e pela razão 0,652174 para a faixa '20001 até 50000') e adotaram sanções (razão 0,875 para a faixa '100001 até 500000' e pela razão 0,782609 para a faixa '20001 até 50000'). Ou seja, em função das crescentes estatísticas, provavelmente os municípios tiveram que tomar atitudes para garantir o cumprimento das medidas de contenção do avanço do vírus.

# 5.Métodos Quantitativos

In [None]:
import statsmodels.formula.api as smf

# 5.1.Óbitos vs. Complexidade Econômica

In [None]:
df_analise_m1 = df_analise[(df_analise['ANO'] == 2019)].copy()
df_analise_m1 = df_analise_m1.pivot_table(index = ["MUNICIPIO", 'FAIXA_POP_2020'],
                values = ['OBITO','ECI','ISOLAMENTO', 'MONITORAMENTO', 'BARREIRAS', 'SANCOES', 'TENDAS', 'SOBRECARGA', 'AMPLIACAOLEITE', 'HOSPITALCAMPANHA'],
                aggfunc = 'mean'
                ).round(2)
df_analise_m1.reset_index(inplace=True)
df_analise_m1

Unnamed: 0,MUNICIPIO,FAIXA_POP_2020,AMPLIACAOLEITE,BARREIRAS,ECI,HOSPITALCAMPANHA,ISOLAMENTO,MONITORAMENTO,OBITO,SANCOES,SOBRECARGA,TENDAS
0,AFONSO CLAUDIO,4 - 20001 até 50000,1,1,-0.51,0,1,0,3,1,0,1
1,AGUA DOCE DO NORTE,3 - 10001 até 20000,0,1,-0.07,0,1,0,1,0,0,0
2,AGUIA BRANCA,2 - 5001 até 10000,1,1,-0.14,0,1,1,4,1,0,1
3,ALFREDO CHAVES,3 - 10001 até 20000,0,1,-0.03,0,1,0,2,0,0,0
4,ANCHIETA,4 - 20001 até 50000,1,1,0.15,0,1,1,6,0,0,0
5,ARACRUZ,6 - 100001 até 500000,1,1,0.12,0,1,1,87,1,1,1
6,ATILIO VIVACQUA,3 - 10001 até 20000,1,1,0.05,0,1,1,2,1,1,1
7,BAIXO GUANDU,4 - 20001 até 50000,1,1,-0.07,0,1,0,17,1,0,0
8,BARRA DE SAO FRANCISCO,4 - 20001 até 50000,1,1,0.13,0,1,1,30,1,0,0
9,BOA ESPERANCA,3 - 10001 até 20000,0,1,0.07,0,1,1,8,1,0,0


In [None]:
df_analise_m1['FAIXA_POP_2020'].unique()

array(['4 - 20001 até 50000', '3 - 10001 até 20000', '2 - 5001 até 10000',
       '6 - 100001 até 500000', '5 - 50001 até 100000',
       '7 - Maior que 500000'], dtype=object)

In [None]:
df_analise_m1["LOGOBITOS"] = np.log(df_analise_m1["OBITO"])

In [None]:
# Modelo que explica, no geral, número de óbitos por nível de complexidade não é significativo e possui baixo teor explicativo
reg1 = smf.ols(formula = 'LOGOBITOS ~ ECI', data = df_analise_m1)
results1 = reg1.fit()
print(results1.summary())

                            OLS Regression Results                            
Dep. Variable:              LOGOBITOS   R-squared:                       0.062
Model:                            OLS   Adj. R-squared:                  0.044
Method:                 Least Squares   F-statistic:                     3.554
Date:                Fri, 28 Apr 2023   Prob (F-statistic):             0.0648
Time:                        12:23:22   Log-Likelihood:                -108.74
No. Observations:                  56   AIC:                             221.5
Df Residuals:                      54   BIC:                             225.5
Df Model:                           1                                         
Covariance Type:            nonrobust                                         
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
Intercept      2.4208      0.234     10.327      0.0

Definir uam duumy para categoria populacional, na qual a categoria '4 - 20001 até 50000' é a referência, em função da maior quantidade de municípios.

In [None]:
df_analise_m1.loc[df_analise_m1['FAIXA_POP_2020'] == '2 - 5001 até 10000', 'Dummy_Faixa2'] = 1
df_analise_m1.loc[df_analise_m1['FAIXA_POP_2020'] != '2 - 5001 até 10000', 'Dummy_Faixa2'] = 0

df_analise_m1.loc[df_analise_m1['FAIXA_POP_2020'] == '3 - 10001 até 20000', 'Dummy_Faixa3'] = 1
df_analise_m1.loc[df_analise_m1['FAIXA_POP_2020'] != '3 - 10001 até 20000', 'Dummy_Faixa3'] = 0

df_analise_m1.loc[df_analise_m1['FAIXA_POP_2020'] == '5 - 50001 até 100000', 'Dummy_Faixa5'] = 1
df_analise_m1.loc[df_analise_m1['FAIXA_POP_2020'] != '5 - 50001 até 100000', 'Dummy_Faixa5'] = 0

df_analise_m1.loc[df_analise_m1['FAIXA_POP_2020'] == '6 - 100001 até 500000', 'Dummy_Faixa6'] = 1
df_analise_m1.loc[df_analise_m1['FAIXA_POP_2020'] != '6 - 100001 até 500000', 'Dummy_Faixa6'] = 0

df_analise_m1.loc[df_analise_m1['FAIXA_POP_2020'] == '7 - Maior que 500000', 'Dummy_Faixa7'] = 1
df_analise_m1.loc[df_analise_m1['FAIXA_POP_2020'] != '7 - Maior que 500000', 'Dummy_Faixa7'] = 0



In [None]:
# Modelo que explica, no geral, número de óbitos por nível de complexidade não é significativo e possui alto teor explicativo.
reg2 = smf.ols(formula = 'LOGOBITOS ~ ECI + Dummy_Faixa2 + Dummy_Faixa3 + Dummy_Faixa5 + Dummy_Faixa6 + Dummy_Faixa7', data = df_analise_m1)
results2 = reg2.fit()
print(results2.summary())

                            OLS Regression Results                            
Dep. Variable:              LOGOBITOS   R-squared:                       0.689
Model:                            OLS   Adj. R-squared:                  0.651
Method:                 Least Squares   F-statistic:                     18.09
Date:                Fri, 28 Apr 2023   Prob (F-statistic):           6.25e-11
Time:                        12:23:46   Log-Likelihood:                -77.833
No. Observations:                  56   AIC:                             169.7
Df Residuals:                      49   BIC:                             183.8
Df Model:                           6                                         
Covariance Type:            nonrobust                                         
                   coef    std err          t      P>|t|      [0.025      0.975]
--------------------------------------------------------------------------------
Intercept        1.7693      0.229      7.723   

# 5.2.Óbitos vs. Variáveis de Capacidade de Resposta

In [None]:
# Modelo que explica, no geral, número de óbitos por nível de capacidade de resposta não é significativo e possui baixo teor explicativo.
reg3 = smf.ols(formula = 'LOGOBITOS ~ ECI + AMPLIACAOLEITE + BARREIRAS + MONITORAMENTO + SANCOES + SOBRECARGA + TENDAS', data = df_analise_m1)
results3 = reg3.fit()
print(results3.summary())

                            OLS Regression Results                            
Dep. Variable:              LOGOBITOS   R-squared:                       0.206
Model:                            OLS   Adj. R-squared:                  0.090
Method:                 Least Squares   F-statistic:                     1.779
Date:                Fri, 28 Apr 2023   Prob (F-statistic):              0.113
Time:                        12:34:06   Log-Likelihood:                -104.07
No. Observations:                  56   AIC:                             224.1
Df Residuals:                      48   BIC:                             240.3
Df Model:                           7                                         
Covariance Type:            nonrobust                                         
                     coef    std err          t      P>|t|      [0.025      0.975]
----------------------------------------------------------------------------------
Intercept          2.0066      0.829      2.

# 6.Conclusões

(i) Nenhum dos modelos apresentou significância, indicando para um grande esforço de refinamento para análises futuras ou, de fato, uma ausência de significância na relação entre ECI, Número de Óbitos e Capacidade de Resposta da forma que medimos.

(ii) As análises descritivas reveleram que municípios mais complexos também são aqueles com maior número populacional.

(iii) Municípios com maior população foram aqueles que também registraram mais óbitos.