In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
import locale
from datetime import datetime

In [None]:
# format numbers to show two decimal places
pd.options.display.float_format = '{:.2f}'.format

# change the language to convert the columns para information
locale.setlocale(locale.LC_ALL , 'pt_BR.UTF-8')

# settings de cores
GRAY1, GRAY2, GRAY3 = '#231F20', '#414040', '#555655'
GRAY4, GRAY5, GRAY6 = '#646369', '#76787B', '#828282'
GRAY7, GRAY8, GRAY9 = '#929497', '#A6A6A5', '#BFBEBE'
BLUE1, BLUE2, BLUE3, BLUE4 = '#174A7E', '#4A81BF', '#94B2D7', '#94AFC5'
RED1, RED2 = '#C3514E', '#E6BAB7'
GREEN1, GREEN2 = '#0C8040', '#9ABB59'
ORANGE1 = '#F79747'

# settings of the font used in the graphs
plt.rcParams['font.family'] = 'Arial'
plt.rcParams['mathtext.fontset'] = 'custom'
plt.rcParams['mathtext.bf'] = 'Arial:bold'
plt.rcParams['mathtext.it'] = 'Arial:italic'

In [None]:
# import the file of the number of hospitalizations in Brazil
internacoes = pd.read_csv('../data/internacoes_brasil.csv', sep = ';', encoding = 'ISO-8859-1', skiprows = 3,
                            skipfooter = 12, thousands = '.', decimal = ',', engine = 'python')

In [None]:
internacoes.head(3)

In [None]:
internacoes.tail(3)

In [None]:
print("Here is the result: ", 'O dataframe \'internacoes\' possui {} linhas e {} colunas.'.format(internacoes.shape[0], internacoes.shape[1]))

In [None]:
print("Here is the result: ", 'A posição da coluna \'2008/Jan\' é a {}.'.format(internacoes.columns.get_loc('2008/Jan')))

In [None]:
# cópia do dataframe original
interns = internacoes.copy()

# colocando a UF como indíce
interns = interns.set_index('Unidade da Federação').rename_axis(None)

# removendo as colunas (até a 12, pois tiramos uma coluna, a da UF)
interns = interns.drop(interns.columns[:12], axis = 1)

In [None]:
interns.head(3)

In [None]:
print("Here is the result: ", 'Agora o dataframe \'aih\' possui {} linhas e {} colunas.'.format(interns.shape[0], interns.shape[1]))

In [None]:
interns.info()

In [None]:
# separar por regiões
norte = interns.index[:7].tolist()
nordeste = interns.index[7:16].tolist()
sudeste = interns.index[16:20].tolist()
sul = interns.index[20:23].tolist()
centro_oeste = interns.index[23:].tolist()

In [None]:
# criar um novo set of information para facilitar a plotagem dos dados
internas = interns.copy()
internas = internas.sort_values(by = 'Total', ascending = False)
internas = internas.drop('Total', axis = 1)
internas.columns = pd.to_datetime(internas.columns, format='%Y/%b')

In [None]:
fig, axes = plt.subplots(2, 3, sharey = True, figsize = (22, 15))

fig.text(0.085, 0.95, '$\\bf{Número\ de\ Internações\ por\ Região\ do\ Brasil\ de\ Jan/2008\ a\ Mar/2021}$',
         fontsize = 25, color = GRAY4)

axes[1, 2].set_visible(False)

internas.loc[norte].T.plot(ax = axes[0, 0], colormap = 'tab10')
axes[0, 0].set_title('Região North', loc = 'left', fontsize = 19, color = GRAY4)
axes[0, 0].yaxis.set_major_formatter(ticker.StrMethodFormatter('{x:,.2f}'))
axes[0, 0].spines['bottom'].set_color('darkgrey')
axes[0, 0].spines['left'].set_color('darkgrey')
axes[0, 0].spines['right'].set_visible(False)
axes[0, 0].spines['top'].set_visible(False)

internas.loc[nordeste].T.plot(ax = axes[0, 1], colormap = 'tab10')
axes[0, 1].set_title('Região Northeast', loc = 'left', fontsize = 19, color = GRAY4)
axes[0, 1].spines['bottom'].set_color('darkgrey')
axes[0, 1].spines['left'].set_color('darkgrey')
axes[0, 1].spines['right'].set_visible(False)
axes[0, 1].spines['top'].set_visible(False)

internas.loc[sudeste].T.plot(ax = axes[0, 2], colormap = 'tab10')
axes[0, 2].set_title('Região Southeast', loc = 'left', fontsize = 19, color = GRAY4)
axes[0, 2].spines['bottom'].set_color('darkgrey')
axes[0, 2].spines['left'].set_color('darkgrey')
axes[0, 2].spines['right'].set_visible(False)
axes[0, 2].spines['top'].set_visible(False)

internas.loc[sul].T.plot(ax = axes[1, 0], colormap = 'tab10')
axes[1, 0].set_title('Região South', loc = 'left', fontsize = 19, color = GRAY4)
axes[1, 0].spines['bottom'].set_color('darkgrey')
axes[1, 0].spines['left'].set_color('darkgrey')
axes[1, 0].spines['right'].set_visible(False)
axes[1, 0].spines['top'].set_visible(False)

internas.loc[centro_oeste].T.plot(ax = axes[1, 1], colormap = 'tab10')
axes[1, 1].set_title('Região Midwest', loc = 'left', fontsize = 19, color = GRAY4)
axes[1, 1].spines['bottom'].set_color('darkgrey')
axes[1, 1].spines['left'].set_color('darkgrey')
axes[1, 1].spines['right'].set_visible(False)
axes[1, 1].spines['top'].set_visible(False)

axes[1, 0].set_position([0.24, 0.125, 0.228, 0.343])
axes[1, 1].set_position([0.55, 0.125, 0.228, 0.343])

#plt.savefig('1.jpg')

plt.show()

In [None]:
# o set of information "internas" já está ordenado pelo valor total (somamos 1 pois a contagem se inicia no 0)
print("Here is the result: ", 'A posição do Ceará no número de internações no Brasil é: {}.'.format(internas.index.get_loc('23 Ceará') + 1))

In [None]:
internacoes_ord = internas.copy()
internacoes_ord['Total'] = internacoes_ord.sum(axis = 1)
internacoes_ord = internacoes_ord['Total']

In [None]:
cores = []
for value in internacoes_ord.keys():
    if '23 Ceará' == value:
        cores.append(ORANGE1)
    else:
        cores.append(BLUE4)
cores.reverse()

ax = internacoes_ord.sort_values(ascending = True).plot(kind = 'barh', figsize = (15, 10), color = cores)

ax.xaxis.set_major_formatter(ticker.StrMethodFormatter('{x:,.0f}'))
ax.tick_params(color = 'darkgrey', bottom = 'off')
ax.spines['bottom'].set_color('darkgrey')
ax.spines['left'].set_color('darkgrey')
ax.spines['right'].set_visible(False)
ax.spines['top'].set_visible(False)

for i in ax.get_yticklabels() + ax.get_xticklabels():
    i.set_fontsize(12)
    i.set_color(GRAY5)
    
# remover o número do nome dos Estados
ax.set_yticklabels([k[3:] for k in internacoes_ord.index.to_list()[::-1]])
    
plt.text(-7000000, 28.5, '$\\bf{Número\ Total\ de\ Internações\ por\ Estado\ do\ Brasil}$',
         fontsize = 20, color = GRAY4)
plt.text(-7000000, 27.3, 'Somatório do período de Jan/2008 a Mar/2021',
         fontsize = 18, color = GRAY6)

plt.text(-7000000, 23.7, 'Estado', fontsize = 18, rotation = 'vertical', color = GRAY6)
plt.text(455, -3, 'Número de Internações', fontsize = 18, color = GRAY6)

plt.show()

In [None]:
internas_total = internas.copy()
internas_total['Soma'] = internas_total.sum(axis = 1)
internas_total['Porcentagem'] = (internas_total['Soma'] / internas_total['Soma'].sum()) * 100

In [None]:
print('A quantidade de internações no Ceará corresponde a {:.2f}% do total do Brasil, \
       \nou seja, {} internações no período de Jan/2008 a  Mar/2021.'.format(internas_total['Porcentagem']['23 Ceará'], internas_total['Soma']['23 Ceará']))

In [None]:
# outro dataframe para auxiliar na plotagem
internas = internas.T

In [None]:
internas['Northeast'] = internas[nordeste].sum(axis = 1)
internas['North'] = internas[norte].sum(axis = 1)
internas['Southeast'] = internas[sudeste].sum(axis = 1)
internas['South'] = internas[sul].sum(axis = 1)
internas['Centro_Oeste'] = internas[centro_oeste].sum(axis = 1)

internas = internas[['Northeast', 'North', 'Southeast', 'South', 'Centro_Oeste']]

internas.head()

In [None]:
ax = internas.plot(figsize = (15, 10))

ax.tick_params(color = 'darkgrey', bottom = 'off')
ax.spines['bottom'].set_color('darkgrey')
ax.spines['left'].set_color('darkgrey')
ax.spines['right'].set_visible(False)
ax.spines['top'].set_visible(False)

for i in ax.get_yticklabels() + ax.get_xticklabels():
    i.set_fontsize(14)
    i.set_color(GRAY5)


plt.text(440, 490000, '$\\bf{Número\ de\ Internações\ por\ Região\ do\ Brasil}$',
         fontsize = 20, color = GRAY4)
plt.text(440, 470000, 'No período de Jan/2008 a Mar/2021',
         fontsize = 18, color = GRAY6)

plt.text(440, 250000, 'Quantidade de Internações', fontsize = 20, rotation = 'vertical', color = GRAY6)
plt.text(455, -35000, 'Period', fontsize = 20, color = GRAY6)

plt.text(615, 260000, 'Southeast', fontsize = 18, color = 'green')
plt.text(615, 170000, 'Northeast', fontsize = 18, color = 'blue')
plt.text(615, 90000, 'South', fontsize = 18, color = 'red')
plt.text(615, 45000, 'North', fontsize = 18, color = 'orange')
plt.text(615, 30000, 'Midwest', fontsize = 18, color = 'purple')

ax.get_legend().remove()

plt.show()

In [None]:
internas = internas.T

In [None]:
internas['Soma'] = internas.sum(axis = 1)
internas['Porcentagem'] = (internas['Soma'] / internas['Soma'].sum()) * 100
internas

In [None]:
print("Here is the result: ", 'A Região Northeast possui {:.2f}% do total de internações do país no período analisado.'.format(internas['Porcentagem']['Northeast']))

In [None]:
internacoes_nordeste = interns.loc[nordeste].sort_values(by = 'Total', ascending = False)
internacoes_nordeste = internacoes_nordeste.drop('Total', axis = 1)
internacoes_nordeste.columns = pd.to_datetime(internacoes_nordeste.columns, format='%Y/%b')

In [None]:
fig, axes = plt.subplots(3, 3, sharex = True, sharey = True, figsize = (25, 20))

palette = plt.get_cmap('tab10')

fig.text(0.085, 0.95, '$\\bf{Número\ de\ Internações\ por\ Estado\ da\ Região\ Northeast\ de\ Jan/2008\ a\ Mar/2021}$',
         fontsize = 25, color = GRAY4)
fig.text(0.085, 0.933, 'Estados Ordenados pelo Somatório Total de Internações no Period',
         fontsize = 20, color = GRAY6)

fig.text(0.085, 0.72, 'Quantidade de Internações', fontsize = 20, rotation = 'vertical', color = GRAY4)
fig.text(0.12, 0.09, 'Ano/Mês', fontsize = 20, color = GRAY4)

num = 0

for estado in internacoes_nordeste.index.tolist():
    num += 1
    plt.subplot(3, 3, num)
    ax = internacoes_nordeste.loc[estado].T.plot(color = palette(num))
    plt.ylim(0,85000)
    if num in range(7) :
        plt.tick_params(labelbottom = False)
    if num not in [1,4,7] :
        plt.tick_params(labelleft = False)
    plt.title(estado[3:], loc = 'left', fontsize = 19, color = GRAY4)
    
    for i in ax.get_yticklabels() + ax.get_xticklabels():
        i.set_fontsize(10)
        i.set_color(GRAY4)
    
    ax.tick_params(color = 'darkgrey')
    ax.spines['bottom'].set_color('darkgrey')
    ax.spines['left'].set_color('darkgrey')
    ax.spines['right'].set_visible(False)
    ax.spines['top'].set_visible(False)

plt.show()

In [None]:
# dataframe temporário
intern_nordeste = internacoes_nordeste.copy()
intern_nordeste['Soma'] = intern_nordeste.sum(axis = 1)
intern_nordeste['Porcentagem'] = (intern_nordeste['Soma'] / intern_nordeste['Soma'].sum()) * 100

In [None]:
print("Here is the result: ", 'O Estado do Ceará possui {:.2f}% das internações totais da Região Northeast no período analisado.'.format(intern_nordeste['Porcentagem']['23 Ceará']))

In [None]:
internacoes_ceara = internacoes_nordeste.loc['23 Ceará']

In [None]:
plt.figure(figsize = (12, 10))

for estado in internacoes_nordeste.index.tolist():
    ax = internacoes_nordeste.loc[estado].T.plot(color = 'lightgrey', linewidth = 1, alpha = 0.8)

ax = internacoes_nordeste.loc['23 Ceará'].T.plot(color = BLUE1, linewidth = 2.5, alpha = 0.8)

ax.tick_params(color = 'darkgrey')
ax.spines['bottom'].set_color('darkgrey')
ax.spines['left'].set_color('darkgrey')
ax.spines['right'].set_visible(False)
ax.spines['top'].set_visible(False)

for i in ax.get_yticklabels() + ax.get_xticklabels():
    i.set_fontsize(14)
    i.set_color(GRAY5)


plt.text(435, 90999, '$\\bf{Número\ de\ Internações\ no\ Ceará\ de\ Jan/2008\ a\ Mar/2021}$',
         fontsize = 25, color = GRAY4)
plt.text(435, 86999, 'Compared with other States of the Region',
         fontsize = 20, color = GRAY6)

plt.text(435, 47000, 'Quantidade de Internações', fontsize = 20, rotation = 'vertical', color = GRAY6)
plt.text(460, -9000, 'Period', fontsize = 20, color = GRAY6)

plt.show()

In [None]:
fig, axes = plt.subplots(1, 2, sharex = False, sharey = True, figsize = (20, 8))

fig.text(0, 1.06, '$\\bf{Número\ de\ Internações\ no\ Ceará\ de\ Jan/2008\ a\ Mar/2021}$',
         fontsize = 25, color = GRAY4)

fig.text(0, 1.02, 'Estados Ordenados pelo Total de Internações no Period Indicado',
         fontsize = 20, color = GRAY6)

internacoes_nordeste.loc['23 Ceará'].T.plot(ax = axes[0], color = BLUE1, linewidth = 2.5, alpha = 0.8)
internacoes_nordeste.loc['23 Ceará'].T.plot(ax = axes[1], color = BLUE1, linewidth = 2.5, alpha = 0.8)

plt.ylim(0, 50000)
axes[0].set_yticks(range(0, 50001, 5000))

for i in [0, 1]:
    axes[i].tick_params(color = 'darkgrey')
    axes[i].spines['bottom'].set_color('darkgrey')
    axes[i].spines['left'].set_color('darkgrey')
    axes[i].spines['right'].set_visible(False)
    axes[i].spines['top'].set_visible(False)
    for k in axes[i].get_yticklabels() + axes[i].get_xticklabels():
        k.set_fontsize(14)
        k.set_color(GRAY5)

anos = []
for valor in range(2008, 2022):
    anos.append(valor)

for ano in range(len(anos)):
    axes[0].axvspan(datetime(anos[ano],3,1), datetime(anos[ano],6,1), color = BLUE4, alpha = 0.2)
    axes[1].axvspan(datetime(anos[ano],10,1), datetime(anos[ano],12,1), color = ORANGE1, alpha = 0.2)
    

axes[0].set_title('Meses destacados: Mar, Abr, Mai, Jun', loc = 'left', fontsize = 15, color = GRAY4)
axes[1].set_title('Meses destacados: Out, Nov, Dez', loc = 'left', fontsize = 15, color = GRAY4)

fig.tight_layout()
    
plt.show()

In [None]:
# número de internações por município do Ceará por local de internação
intern_munic_local_raw = pd.read_csv('../data/intern_muni_ce_por_local_de_internacao.csv', sep = ';', encoding = 'ISO-8859-1', skiprows = 3,
                            skipfooter = 13, thousands = '.', decimal = ',', engine = 'python')

In [None]:
intern_munic_local_raw.head(3)

In [None]:
# cópia do dataframe original
intern_munic_local = intern_munic_local_raw.copy()

# remover os 6 números iniciais dos nomes dos municípios
intern_munic_local['Município'] = intern_munic_local['Município'].str[7:]

# coloca a coluna Município como índice
intern_munic_local = intern_munic_local.set_index('Município').rename_axis(None)

intern_munic_local.columns

In [None]:
intern_munic_local = intern_munic_local[intern_munic_local.columns[8:]]
intern_munic_local.head(3)

In [None]:
intern_munic_local.info()

In [None]:
intern_munic_local = intern_munic_local.replace('-', 0)

In [None]:
intern_munic_local.info()

In [None]:
intern_munic_local = intern_munic_local.apply(pd.to_numeric, errors = 'coerce')

In [None]:
intern_munic_local.info()

In [None]:
intern_munic_local.columns

In [None]:
intern_munic_local = intern_munic_local.drop('Total', axis = 1)

In [None]:
intern_munic_local.head()

In [None]:
# convertendo o "Ano/Mês" para datetime
intern_munic_local.columns = pd.to_datetime(intern_munic_local.columns, format='%Y/%b')

In [None]:
intern_munic_local = intern_munic_local.T

In [None]:
intern_munic_local['Soma'] = intern_munic_local.drop(['Fortaleza'], axis = 1).sum(axis = 1)

In [None]:
intern_munic_local = intern_munic_local[['Fortaleza', 'Soma']]

In [None]:
intern_munic_local.head()

In [None]:
color = [BLUE1, ORANGE1]

ax = intern_munic_local.plot(figsize = (15, 8), color = color, legend = None, linewidth = 2)

ax.set_yticks(range(0, 30001, 5000))

ax.tick_params(color = 'darkgrey')
ax.spines['bottom'].set_color('darkgrey')
ax.spines['left'].set_color('darkgrey')
ax.spines['right'].set_visible(False)
ax.spines['top'].set_visible(False)

for i in ax.get_yticklabels() + ax.get_xticklabels():
    i.set_fontsize(14)
    i.set_color(GRAY5)
    
# número de internações por município do Ceará por local de internação
    
plt.text(442, 35000, '$\\bf{Número\ de\ Internações\ por\ Município\ no\ Ceará\ de\ Jan/2008\ a\ Mar/2021}$',
         fontsize = 25, color = GRAY4)
plt.text(442, 33000, 'Internações contabilizadas por local de internação',
         fontsize = 20, color = GRAY6)

plt.text(442, 15000, 'Quantidade de Internações', fontsize = 20, rotation = 'vertical', color = GRAY6)
plt.text(455, -4300, 'Period', fontsize = 20, color = GRAY6)

plt.text(615, 5500, 'Fortaleza', fontsize = 20, color = BLUE1)
plt.text(615, 18000, 'Outros Municípios', fontsize = 20, color = ORANGE1)

plt.show()

In [None]:
intern_munic_local = intern_munic_local.T

In [None]:
intern_munic_local = intern_munic_local.astype('float64')

In [None]:
intern_munic_local['Soma'] = intern_munic_local.sum(axis = 1)

In [None]:
intern_munic_local['Porcentagem'] = (intern_munic_local['Soma'] / intern_munic_local['Soma'].sum()) * 100

In [None]:
print('O número de internações de Fortaleza corresponde a {:.2f}% do total do Estado do Ceará,\
        \ncontra todos os outros 183 municípios correspondendo a {:.2f}% do total.'.format(intern_munic_local['Porcentagem']['Fortaleza'],
                                                                                          intern_munic_local['Porcentagem']['Soma']))

In [None]:
# número de internações por município do Ceará por local de residência
intern_munic_resid_raw = pd.read_csv('../data/intern_muni_ce_por_local_de_residencia.csv', sep = ';', encoding = 'ISO-8859-1', skiprows = 3,
                            skipfooter = 13, thousands = '.', decimal = ',', engine = 'python')

In [None]:
intern_munic_resid_raw.head(3)

In [None]:
# cópia do dataframe original
intern_munic_resid = intern_munic_resid_raw.copy()

# remover os 6 números iniciais dos nomes dos municípios
intern_munic_resid['Município'] = intern_munic_resid['Município'].str[7:]

# coloca a coluna Município como índice
intern_munic_resid = intern_munic_resid.set_index('Município').rename_axis(None)

intern_munic_resid.columns

In [None]:
intern_munic_resid = intern_munic_resid[intern_munic_resid.columns[8:]]
intern_munic_resid.head(3)

In [None]:
intern_munic_resid.info()

In [None]:
intern_munic_resid.select_dtypes(object).head()

In [None]:
intern_munic_resid = intern_munic_resid.replace('-', 0)

In [None]:
intern_munic_resid['2021/Mar'] = intern_munic_resid['2021/Mar'].astype('int64')

In [None]:
intern_munic_resid.info()

In [None]:
intern_munic_resid.columns

In [None]:
intern_munic_resid = intern_munic_resid.drop('Total', axis = 1)

In [None]:
# convertendo o "Ano/Mês" para datetime
intern_munic_resid.columns = pd.to_datetime(intern_munic_resid.columns, format='%Y/%b')

In [None]:
intern_munic_resid = intern_munic_resid.T

In [None]:
intern_munic_resid['Soma'] = intern_munic_resid.drop(['Fortaleza'], axis = 1).sum(axis = 1)

In [None]:
intern_munic_resid = intern_munic_resid[['Fortaleza', 'Soma']]

In [None]:
intern_munic_resid.head()

In [None]:
color = [BLUE1, ORANGE1]

ax = intern_munic_resid.plot(figsize = (15, 8), color = color, legend = None, linewidth = 2)

ax.set_yticks(range(0, 35001, 5000))

ax.tick_params(color = 'darkgrey')
ax.spines['bottom'].set_color('darkgrey')
ax.spines['left'].set_color('darkgrey')
ax.spines['right'].set_visible(False)
ax.spines['top'].set_visible(False)

for i in ax.get_yticklabels() + ax.get_xticklabels():
    i.set_fontsize(14)
    i.set_color(GRAY5)
    
# número de internações por município do Ceará por local de internação
    
plt.text(442, 39000, '$\\bf{Número\ de\ Internações\ por\ Município\ no\ Ceará\ de\ Jan/2008\ a\ Mar/2021}$',
         fontsize = 25, color = GRAY4)
plt.text(442, 37000, 'Internações contabilizadas por local de residência',
         fontsize = 20, color = GRAY6)

plt.text(442, 15000, 'Quantidade de Internações', fontsize = 20, rotation = 'vertical', color = GRAY6)
plt.text(455, -4500, 'Period', fontsize = 20, color = GRAY6)

plt.text(615, 5500, 'Fortaleza', fontsize = 20, color = BLUE1)
plt.text(615, 18000, 'Outros Municípios', fontsize = 20, color = ORANGE1)

plt.show()

In [None]:
intern_munic_resid = intern_munic_resid.T

In [None]:
intern_munic_resid['Soma'] = intern_munic_resid.sum(axis = 1)

In [None]:
intern_munic_resid['Porcentagem'] = (intern_munic_resid['Soma'] / intern_munic_resid['Soma'].sum()) * 100

In [None]:
print('O número de internações de Fortaleza corresponde a {:.2f}% do total do Estado do Ceará,\
      \nconsiderando o local de residência, contra todos os outros 183 municípios correspondendo a {:.2f}% do total.'.format(intern_munic_resid['Porcentagem']['Fortaleza'],
                                                                                                                             intern_munic_resid['Porcentagem']['Soma']))

In [None]:
valor_total_br = pd.read_csv('../data/valor_total_brasil.csv', sep = ';', encoding = 'ISO-8859-1', skiprows = 3,
                            skipfooter = 13, thousands = '.', decimal = ',', engine = 'python')

In [None]:
valor_total_br.head(3)

In [None]:
# cópia do dataframe original
valortotalbr = valor_total_br.copy()

# remover os números dos nomes das UFs
# podemos fazer isso pois usamos outro método pra separar por regiões
valortotalbr['Unidade da Federação'] = valortotalbr['Unidade da Federação'].str[3:]

# colocando a coluna de UFs como índice
valortotalbr = valortotalbr.set_index('Unidade da Federação').rename_axis(None)

In [None]:
valortotalbr.columns.get_loc('2008/Jan')

In [None]:
# fazendo o slicing
valortotalbr = valortotalbr[valortotalbr.columns[126:]]

In [None]:
valortotalbr.head(3)

In [None]:
valortotalbr.info()

In [None]:
valortotalbr = valortotalbr.drop('Total', axis = 1)

In [None]:
valortotalbr.columns = pd.to_datetime(valortotalbr.columns, format = '%Y/%b')

In [None]:
valortotalbr.head(3)

In [None]:
# separar por regiões

norte = valortotalbr.index[:7].tolist()
nordeste = valortotalbr.index[7:16].tolist()
sudeste = valortotalbr.index[16:20].tolist()
sul = valortotalbr.index[20:23].tolist()
centro_oeste = valortotalbr.index[23:].tolist()

In [None]:
fig, axes = plt.subplots(2, 3, sharey = True, figsize = (25, 15))

fig.text(0.085, 0.95, '$\\bf{Valor\ Total\ de\ Gastos\ com\ Saúde\ por\ Região\ do\ Brasil\ de\ Jan/2008\ a\ Mar/2021}$',
         fontsize = 25, color = GRAY4)

# it was necessary to limit the y-axis because the expenses of the southeast
# have a very high peak at the beginning which was distorting the plot
plt.ylim(0, 400000000)

axes[1, 2].set_visible(False)

valortotalbr.loc[norte].T.plot(ax = axes[0, 0], colormap = 'tab10')
axes[0, 0].set_title('Região North', loc = 'left', fontsize = 19, color = GRAY4)
axes[0, 0].yaxis.set_major_formatter(ticker.StrMethodFormatter('{x:,.2f}'))
axes[0, 0].spines['bottom'].set_color('darkgrey')
axes[0, 0].spines['left'].set_color('darkgrey')
axes[0, 0].spines['right'].set_visible(False)
axes[0, 0].spines['top'].set_visible(False)

valortotalbr.loc[nordeste].T.plot(ax = axes[0, 1], colormap = 'tab10')
axes[0, 1].set_title('Região Northeast', loc = 'left', fontsize = 19, color = GRAY4)
axes[0, 1].spines['bottom'].set_color('darkgrey')
axes[0, 1].spines['left'].set_color('darkgrey')
axes[0, 1].spines['right'].set_visible(False)
axes[0, 1].spines['top'].set_visible(False)

valortotalbr.loc[sudeste].T.plot(ax = axes[0, 2], colormap = 'tab10')
axes[0, 2].set_title('Região Southeast', loc = 'left', fontsize = 19, color = GRAY4)
axes[0, 2].spines['bottom'].set_color('darkgrey')
axes[0, 2].spines['left'].set_color('darkgrey')
axes[0, 2].spines['right'].set_visible(False)
axes[0, 2].spines['top'].set_visible(False)

valortotalbr.loc[sul].T.plot(ax = axes[1, 0], colormap = 'tab10')
axes[1, 0].set_title('Região South', loc = 'left', fontsize = 19, color = GRAY4)
axes[1, 0].spines['bottom'].set_color('darkgrey')
axes[1, 0].spines['left'].set_color('darkgrey')
axes[1, 0].spines['right'].set_visible(False)
axes[1, 0].spines['top'].set_visible(False)

valortotalbr.loc[centro_oeste].T.plot(ax = axes[1, 1], colormap = 'tab10')
axes[1, 1].set_title('Região Midwest', loc = 'left', fontsize = 19, color = GRAY4)
axes[1, 1].spines['bottom'].set_color('darkgrey')
axes[1, 1].spines['left'].set_color('darkgrey')
axes[1, 1].spines['right'].set_visible(False)
axes[1, 1].spines['top'].set_visible(False)

axes[1][0].set_position([0.24, 0.125, 0.228, 0.343])
axes[1][1].set_position([0.55, 0.125, 0.228, 0.343])

plt.show()

In [None]:
valortotalord = valortotalbr.copy()
valortotalord['Soma'] = valortotalord.sum(axis = 1)
valortotalord['Porcentagem'] = (valortotalord['Soma'] / valortotalord['Soma'].sum()) * 100

In [None]:
print("Here is the result: ", 'A posição do Ceará no valor total de gastos no Brasil é: {}.'.format(valortotalord.index.get_loc('Ceará') + 1))

In [None]:
# dataframe auxiliar para plotagem
vto = valortotalord['Soma']
vto = vto.sort_values(ascending = False)

In [None]:
cores = []
for value in vto.keys():
    if 'Ceará' == value:
        cores.append(ORANGE1)
    else:
        cores.append(BLUE4)
cores.reverse()

ax = vto.sort_values(ascending = True).plot(kind = 'barh', figsize = (15, 10), color = cores)

ax.xaxis.set_major_formatter(ticker.StrMethodFormatter('{x:,.0f}'))
ax.tick_params(color = 'darkgrey', bottom = 'off')
ax.spines['bottom'].set_color('darkgrey')
ax.spines['left'].set_color('darkgrey')
ax.spines['right'].set_visible(False)
ax.spines['top'].set_visible(False)

for i in ax.get_yticklabels() + ax.get_xticklabels():
    i.set_fontsize(12)
    i.set_color(GRAY5)
    
# remover o número do nome dos Estados
#ax.set_yticklabels([k[3:] for k in internacoes_ord.index.to_list()[::-1]])
    
plt.text(-7000000000, 27, '$\\bf{Valor\ Total\ de\ Gastos\ por\ Estado\ do\ Brasil}$',
         fontsize = 20, color = GRAY4)
plt.text(-7000000000, 26, 'Somatório do período de Jan/2008 a Mar/2021',
         fontsize = 18, color = GRAY6)

plt.text(-7000000000, 23, 'Estado', fontsize = 18, rotation = 'vertical', color = GRAY6)
plt.text(455, -3, 'Valores (em R$)', fontsize = 18, color = GRAY6)

plt.show()

In [None]:
print('O valor total do Ceará corresponde a {:.2f}% do total do Brasil, \
       \nou seja, {} bilhões no período de Jan/2008 a  Mar/2021.'.format(valortotalord['Porcentagem']['Ceará'],
                                                                         locale.currency(valortotalord['Soma']['Ceará'], grouping = True)))

In [None]:
# dataframe auxiliar para a plotagem gráfica
valor_total_regioes = valortotalbr.copy()
valor_total_regioes = valor_total_regioes.T

valor_total_regioes['Northeast'] = valor_total_regioes[nordeste].sum(axis = 1)
valor_total_regioes['North'] = valor_total_regioes[norte].sum(axis = 1)
valor_total_regioes['Southeast'] = valor_total_regioes[sudeste].sum(axis = 1)
valor_total_regioes['South'] = valor_total_regioes[sul].sum(axis = 1)
valor_total_regioes['Centro_Oeste'] = valor_total_regioes[centro_oeste].sum(axis = 1)

valor_total_regioes = valor_total_regioes[['Northeast', 'North', 'Southeast', 'South', 'Centro_Oeste']]

valor_total_regioes.head()

In [None]:
ax = valor_total_regioes.plot(figsize = (15, 10))

# it was necessary to limit the y-axis because the expenses of the southeast
# have a very high peak at the beginning which was distorting the plot
plt.ylim(0, 700000000)

ax.yaxis.set_major_formatter(ticker.StrMethodFormatter('{x:,.2f}'))
ax.tick_params(color = 'darkgrey')
ax.spines['bottom'].set_color('darkgrey')
ax.spines['left'].set_color('darkgrey')
ax.spines['right'].set_visible(False)
ax.spines['top'].set_visible(False)

for i in ax.get_yticklabels() + ax.get_xticklabels():
    i.set_fontsize(14)
    i.set_color(GRAY5)


plt.text(430, 750000000, '$\\bf{Valor\ Total\ de\ Gastos\ no\ Ceará\ de\ Jan/2008\ a\ Mar/2021}$',
         fontsize = 20, color = GRAY4)
plt.text(430, 730000000, 'Compared with other States of the Region',
         fontsize = 18, color = GRAY6)

plt.text(430, 400000000, 'Valor (em R$)', fontsize = 20, rotation = 'vertical', color = GRAY6)
plt.text(455, -50000000, 'Period', fontsize = 20, color = GRAY6)

plt.text(613, 600000000, 'Southeast', fontsize = 18, color = 'green')
plt.text(613, 270000000, 'Northeast', fontsize = 18, color = 'blue')
plt.text(615, 100000000, 'South', fontsize = 18, color = 'red')
plt.text(614, 55000000, 'North', fontsize = 18, color = 'orange')
plt.text(615, 29000000, 'Midwest', fontsize = 18, color = 'purple')

ax.get_legend().remove()

plt.show()

In [None]:
valor_total_regioes = valor_total_regioes.T
valor_total_regioes['Soma'] = valor_total_regioes.sum(axis = 1)
valor_total_regioes['Porcentagem'] = (valor_total_regioes['Soma'] / valor_total_regioes['Soma'].sum()) * 100

In [None]:
valor_total_regioes

In [None]:
print("Here is the result: ", 'A Região Northeast possui {:.2f}% do valor total gasto no país no período analisado.'.format(valor_total_regioes['Porcentagem']['Northeast']))

In [None]:
valor_total_nordeste = valortotalbr.copy()

valor_total_nordeste = valor_total_nordeste.loc[nordeste]

valor_total_nordeste['Soma'] = valor_total_nordeste.sum(axis = 1)

valor_total_nordeste = valor_total_nordeste.sort_values(by = 'Soma', ascending = False)

valor_total_nordeste = valor_total_nordeste.drop('Soma', axis = 1)

In [None]:
fig, axes = plt.subplots(3, 3, sharex = True, sharey = True, figsize = (25, 20))

palette = plt.get_cmap('tab10')

fig.text(0.070, 0.95, '$\\bf{Valor\ Total\ por\ Estado\ da\ Região\ Northeast\ de\ Jan/2008\ a\ Mar/2021}$',
         fontsize = 25, color = GRAY4)
fig.text(0.070, 0.933, 'Estados Ordenados pelo Total de Internações no Period',
         fontsize = 20, color = GRAY6)

fig.text(0.070, 0.72, 'Quantidade de Internações', fontsize = 20, rotation = 'vertical', color = GRAY4)
fig.text(0.12, 0.09, 'Period', fontsize = 20, color = GRAY4)

num = 0

for estado in valor_total_nordeste.index.tolist():
    num += 1
    plt.subplot(3, 3, num)
    ax = valor_total_nordeste.loc[estado].T.plot(color = palette(num))
    ax.yaxis.set_major_formatter(ticker.StrMethodFormatter('{x:,.2f}'))
    plt.ylim(0, 100000000)
    if num in range(7) :
        plt.tick_params(labelbottom = False)
    if num not in [1,4,7] :
        plt.tick_params(labelleft = False)
    plt.title(estado, loc = 'left', fontsize = 19, color = GRAY4)
    
    for i in ax.get_yticklabels() + ax.get_xticklabels():
        i.set_fontsize(10)
        i.set_color(GRAY4)
    
    ax.tick_params(color = 'darkgrey', bottom = True)
    ax.spines['bottom'].set_color('darkgrey')
    ax.spines['left'].set_color('darkgrey')
    ax.spines['right'].set_visible(False)
    ax.spines['top'].set_visible(False)
    
plt.show()

In [None]:
valor_total_nord = valor_total_nordeste.copy()
valor_total_nord['Soma'] = valor_total_nord.sum(axis = 1)
valor_total_nord['Porcentagem'] = (valor_total_nord['Soma'] / valor_total_nord['Soma'].sum()) * 100

In [None]:
valor_total_nord

In [None]:
print("Here is the result: ", 'O Estado do Ceará possui {:.2f}% dos gastos totais da Região Northeast no período analisado.'.format(valor_total_nord['Porcentagem']['Ceará']))

In [None]:
plt.figure(figsize = (12, 10))

for estado in valor_total_nordeste.index.tolist():
    ax = valor_total_nordeste.loc[estado].T.plot(color = 'lightgrey', linewidth = 1, alpha = 0.8)

ax = valor_total_nordeste.loc['Ceará'].T.plot(color = BLUE1, linewidth = 2.5, alpha = 0.8)

ax.yaxis.set_major_formatter(ticker.StrMethodFormatter('{x:,.2f}'))
ax.set_yticks(range(0, 90000001, 10000000))
ax.tick_params(color = 'darkgrey')
ax.spines['bottom'].set_color('darkgrey')
ax.spines['left'].set_color('darkgrey')
ax.spines['right'].set_visible(False)
ax.spines['top'].set_visible(False)

for i in ax.get_yticklabels() + ax.get_xticklabels():
    i.set_fontsize(14)
    i.set_color(GRAY5)


plt.text(425, 100000000, '$\\bf{Valor\ Total\ Por\ Internação\ no\ Ceará\ de\ Jan/2008\ a\ Mar/2021}$',
         fontsize = 25, color = GRAY4)
plt.text(425, 96000000, 'Compared with other States of the Region',
         fontsize = 20, color = GRAY6)

plt.text(425, 50000000, 'Quantidade de Internações', fontsize = 20, rotation = 'vertical', color = GRAY6)
plt.text(455, -10000000, 'Period', fontsize = 20, color = GRAY6)

plt.show()

In [None]:
valor_total_municipios_ceara = pd.read_csv('../data/valor_total_municipios_ceara.csv', sep = ';', encoding = 'ISO-8859-1', skiprows = 3,
                            skipfooter = 13, thousands = '.', decimal = ',', engine = 'python')

In [None]:
valor_total_municipios_ceara.head(3)

In [None]:
# cópia do dataframe original
valor_total_muni_ce = valor_total_municipios_ceara.copy()

# remover os 6 números iniciais dos nomes dos municípios
valor_total_muni_ce['Município'] = valor_total_muni_ce['Município'].str[7:]

# coloca a coluna Município como índice
valor_total_muni_ce = valor_total_muni_ce.set_index('Município').rename_axis(None)

valor_total_muni_ce.head(3)

In [None]:
# encontrar a posição da coluna '2008/Jan'
valor_total_muni_ce.columns.get_loc('2008/Jan')

In [None]:
# excluir as colunas anteriores a '2008/Jan'
valor_total_muni_ce = valor_total_muni_ce[valor_total_muni_ce.columns[12:]]
valor_total_muni_ce.head(3)

In [None]:
valor_total_muni_ce.info()

In [None]:
valor_total_muni_ce = valor_total_muni_ce.replace('-', 0)

In [None]:
valor_total_muni_ce.info()

In [None]:
valor_total_muni_ce = valor_total_muni_ce.apply(pd.to_numeric, errors = 'coerce')

In [None]:
valor_total_muni_ce.info()

In [None]:
valor_total_muni_ce.columns

In [None]:
# elimina a coluna 'Total'
valor_total_muni_ce = valor_total_muni_ce.drop('Total', axis = 1)

In [None]:
# muda as datas que estão em string pro tipo information
valor_total_muni_ce.columns = pd.to_datetime(valor_total_muni_ce.columns, format = '%Y/%b')

In [None]:
valor_total_muni_ce.head(3)

In [None]:
valor_total_muni_ce = valor_total_muni_ce.T

In [None]:
valor_total_muni_ce['Soma'] = valor_total_muni_ce.drop(['Fortaleza'], axis = 1).sum(axis = 1)

In [None]:
valor_total_muni_ce = valor_total_muni_ce[['Fortaleza', 'Soma']]

In [None]:
valor_total_muni_ce

In [None]:
color = [BLUE1, ORANGE1]

ax = valor_total_muni_ce.plot(alpha = 0.8, figsize = (15, 8), color = color, legend = None, linewidth = 2)

ax.yaxis.set_major_formatter(ticker.StrMethodFormatter('{x:,.2f}'))
ax.set_yticks(range(0, 40000001, 5000000))
ax.tick_params(color = 'darkgrey')
ax.spines['bottom'].set_color('darkgrey')
ax.spines['left'].set_color('darkgrey')
ax.spines['right'].set_visible(False)
ax.spines['top'].set_visible(False)

for i in ax.get_yticklabels() + ax.get_xticklabels():
    i.set_fontsize(14)
    i.set_color(GRAY5)
    
   
plt.text(433, 42000000, '$\\bf{Total\ de\ Gastos\ por\ Município\ no\ Ceará\ de\ Jan/2008\ a\ Mar/2021}$',
         fontsize = 25, color = GRAY4)

plt.text(433, 30000000, 'Valor (em R$)', fontsize = 20, rotation = 'vertical', color = GRAY6)
plt.text(455, -3500000, 'Period', fontsize = 20, color = GRAY6)

plt.text(613, 25000000, 'Fortaleza', fontsize = 20, color = BLUE1)
plt.text(614, 12000000, 'Outros Municípios', fontsize = 20, color = ORANGE1)

plt.show()

In [None]:
valor_total_muni_ce = valor_total_muni_ce.T

In [None]:
valor_total_muni_ce['Soma'] = valor_total_muni_ce.sum(axis = 1)

In [None]:
valor_total_muni_ce['Porcentagem'] = (valor_total_muni_ce['Soma'] / valor_total_muni_ce['Soma'].sum()) * 100

In [None]:
print('O valor total gasto por Fortaleza corresponde a {:.2f}% do total do Estado do Ceará,\
        \ncontra todos os outros 183 municípios correspondendo a {:.2f}% do total.'.format(valor_total_muni_ce['Porcentagem']['Fortaleza'],
                                                                                          valor_total_muni_ce['Porcentagem']['Soma']))

In [None]:
# importar o aquivo do valor médio das internações no Brasil
valor_medio_br_raw = pd.read_csv('../data/valor_medio_internacao_brasil.csv', sep = ';', encoding = 'ISO-8859-1', skiprows = 3,
                            skipfooter = 12, thousands = '.', decimal = ',', engine = 'python')

In [None]:
valor_medio_br_raw.head(3)

In [None]:
valor_medio_br_raw.tail(3)

In [None]:
print("Here is the result: ", 'A posição da coluna \'2008/Jan\' é a {}.'.format(valor_medio_br_raw.columns.get_loc('2008/Jan')))

In [None]:
# cópia do df original
valor_medio_br = valor_medio_br_raw.copy()

# UF como indíce
valor_medio_br = valor_medio_br.set_index('Unidade da Federação').rename_axis(None)

# removendo as colunas (até a 12, pois tiramos uma coluna, a da UF)
valor_medio_br = valor_medio_br.drop(valor_medio_br.columns[:12], axis = 1)

In [None]:
valor_medio_br.info()

In [None]:
valor_medio_br.isna().sum().sum()

In [None]:
# remover o número do nome dos Estado
valor_medio_br.index = valor_medio_br.index.str[3:]

In [None]:
valormediobr = valor_medio_br.copy()
valormediobr = valormediobr.sort_values(by = 'Total', ascending = False)
valormediobr = valormediobr.drop('Total', axis = 1)

# formatar a information
valormediobr.columns = pd.to_datetime(valormediobr.columns, format='%Y/%b')

In [None]:
fig, axes = plt.subplots(2, 3, sharey = True, figsize = (22, 15))

fig.text(0.085, 0.95, '$\\bf{Valor\ Médio\ por\ Internações\ em\ cada\ Região\ do\ Brasil\ de\ Jan/2008\ a\ Mar/2021}$',
         fontsize = 25, color = GRAY4)

# foi necessário dar um limite para o eixo y pois os valores médios do sudeste
# have a very high peak at the beginning which was distorting the plot
plt.ylim(0, 3000)

axes[1, 2].set_visible(False)

valormediobr.loc[norte].T.plot(ax = axes[0, 0], colormap = 'tab10')
axes[0, 0].set_title('Região North', loc = 'left', fontsize = 19, color = GRAY4)
#axes[0, 0].yaxis.set_major_formatter(ticker.StrMethodFormatter('{x:,.2f}'))
axes[0, 0].spines['bottom'].set_color('darkgrey')
axes[0, 0].spines['left'].set_color('darkgrey')
axes[0, 0].spines['right'].set_visible(False)
axes[0, 0].spines['top'].set_visible(False)

valormediobr.loc[nordeste].T.plot(ax = axes[0, 1], colormap = 'tab10')
axes[0, 1].set_title('Região Northeast', loc = 'left', fontsize = 19, color = GRAY4)
axes[0, 1].spines['bottom'].set_color('darkgrey')
axes[0, 1].spines['left'].set_color('darkgrey')
axes[0, 1].spines['right'].set_visible(False)
axes[0, 1].spines['top'].set_visible(False)

valormediobr.loc[sudeste].T.plot(ax = axes[0, 2], colormap = 'tab10')
axes[0, 2].set_title('Região Southeast', loc = 'left', fontsize = 19, color = GRAY4)
axes[0, 2].spines['bottom'].set_color('darkgrey')
axes[0, 2].spines['left'].set_color('darkgrey')
axes[0, 2].spines['right'].set_visible(False)
axes[0, 2].spines['top'].set_visible(False)

valormediobr.loc[sul].T.plot(ax = axes[1, 0], colormap = 'tab10')
axes[1, 0].set_title('Região South', loc = 'left', fontsize = 19, color = GRAY4)
axes[1, 0].spines['bottom'].set_color('darkgrey')
axes[1, 0].spines['left'].set_color('darkgrey')
axes[1, 0].spines['right'].set_visible(False)
axes[1, 0].spines['top'].set_visible(False)

valormediobr.loc[centro_oeste].T.plot(ax = axes[1, 1], colormap = 'tab10')
axes[1, 1].set_title('Região Midwest', loc = 'left', fontsize = 19, color = GRAY4)
axes[1, 1].spines['bottom'].set_color('darkgrey')
axes[1, 1].spines['left'].set_color('darkgrey')
axes[1, 1].spines['right'].set_visible(False)
axes[1, 1].spines['top'].set_visible(False)

axes[1, 0].set_position([0.24, 0.125, 0.228, 0.343])
axes[1, 1].set_position([0.55, 0.125, 0.228, 0.343])

plt.show()

In [None]:
# o set of information "valormediobr" já está ordenado pelo valor total (somamos 1 pois a contagem se inicia no 0)
print("Here is the result: ", 'A posição do Ceará em valor médio por internação no Brasil é: {}.'.format(valormediobr.index.get_loc('Ceará') + 1))

In [None]:
valormediobr2 = valormediobr.copy()
valormediobr2 = valormediobr2.T

In [None]:
valormediobr2['Northeast'] = (valormediobr2[nordeste].sum(axis = 1)) / len(nordeste)
valormediobr2['North'] = (valormediobr2[norte].sum(axis = 1)) / len(norte)
valormediobr2['Southeast'] = (valormediobr2[sudeste].sum(axis = 1)) / len(sudeste)
valormediobr2['South'] = (valormediobr2[sul].sum(axis = 1)) / len(sul)
valormediobr2['Centro_Oeste'] = (valormediobr2[centro_oeste].sum(axis = 1)) / len(centro_oeste)

valormediobr2 = valormediobr2[['Northeast', 'North', 'Southeast', 'South', 'Centro_Oeste']]

valormediobr2.head()

In [None]:
ax = valormediobr2.plot(figsize = (15, 10))

plt.ylim(0, 2500)

ax.tick_params(color = 'darkgrey', bottom = 'off')
ax.spines['bottom'].set_color('darkgrey')
ax.spines['left'].set_color('darkgrey')
ax.spines['right'].set_visible(False)
ax.spines['top'].set_visible(False)

for i in ax.get_yticklabels() + ax.get_xticklabels():
    i.set_fontsize(14)
    i.set_color(GRAY5)

plt.text(444, 2700, '$\\bf{Valor\ Médio\ por\ Internação\ por\ Região\ do\ Brasil}$',
         fontsize = 20, color = GRAY4)
plt.text(444, 2600, 'No período de Jan/2008 a Mar/2021',
         fontsize = 18, color = GRAY6)

plt.text(444, 2000, 'Valor (em R$)', fontsize = 20, rotation = 'vertical', color = GRAY6)
plt.text(455, -150, 'Period', fontsize = 20, color = GRAY6)

plt.text(615, 1600, 'Southeast', fontsize = 18, color = 'green')
plt.text(615, 1300, 'Northeast', fontsize = 18, color = 'blue')
plt.text(615, 1800, 'South', fontsize = 18, color = 'red')
plt.text(615, 1100, 'North', fontsize = 18, color = 'orange')
plt.text(615, 1500, 'Midwest', fontsize = 18, color = 'purple')

ax.get_legend().remove()

plt.show()

In [None]:
valormedione = valormediobr.loc[nordeste]

In [None]:
valormedione['Soma'] = valormedione.sum(axis = 1)
valormedione = valormedione.sort_values(by = 'Soma', ascending = False)
valormedione = valormedione.drop('Soma', axis = 1)

In [None]:
fig, axes = plt.subplots(3, 3, sharex = True, sharey = True, figsize = (25, 20))

palette = plt.get_cmap('tab10')

fig.text(0.085, 0.95, '$\\bf{Valor\ Médio\ por\ Internação\ por\ Estado\ da\ Região\ Northeast\ de\ Jan/2008\ a\ Mar/2021}$',
         fontsize = 25, color = GRAY4)
fig.text(0.085, 0.933, 'Estados Ordenados pelo Somatório do Valor Médio por Internação no Period',
         fontsize = 20, color = GRAY6)

fig.text(0.085, 0.72, 'Valor Médio por Internação', fontsize = 20, rotation = 'vertical', color = GRAY4)
fig.text(0.12, 0.09, 'Period', fontsize = 20, color = GRAY4)

num = 0

for estado in valormedione.index.tolist():
    num += 1
    plt.subplot(3, 3, num)
    ax = valormedione.loc[estado].T.plot(color = palette(num))
    if num in range(7) :
        plt.tick_params(labelbottom = False)
    if num not in [1,4,7] :
        plt.tick_params(labelleft = False)
    plt.title(estado, loc = 'left', fontsize = 19, color = GRAY4)
    
    for i in ax.get_yticklabels() + ax.get_xticklabels():
        i.set_fontsize(10)
        i.set_color(GRAY4)
    
    ax.tick_params(color = 'darkgrey')
    ax.spines['bottom'].set_color('darkgrey')
    ax.spines['left'].set_color('darkgrey')
    ax.spines['right'].set_visible(False)
    ax.spines['top'].set_visible(False)
    

plt.show()

In [None]:
plt.figure(figsize = (12, 10))

for estado in valormedione.index.tolist():
    ax = valormedione.loc[estado].T.plot(color = 'lightgrey', linewidth = 1, alpha = 0.8)

ax = valormedione.loc['Ceará'].T.plot(color = BLUE1, linewidth = 2.5, alpha = 0.8)

plt.ylim(0, 2200)
ax.tick_params(color = 'darkgrey')
ax.spines['bottom'].set_color('darkgrey')
ax.spines['left'].set_color('darkgrey')
ax.spines['right'].set_visible(False)
ax.spines['top'].set_visible(False)

for i in ax.get_yticklabels() + ax.get_xticklabels():
    i.set_fontsize(14)
    i.set_color(GRAY5)


plt.text(435, 2400, '$\\bf{Valor\ Médio\ por\ Internação\ no\ Ceará\ de\ Jan/2008\ a\ Mar/2021}$',
         fontsize = 25, color = GRAY4)
plt.text(435, 2300, 'Compared with other States of the Region',
         fontsize = 20, color = GRAY6)

plt.text(435, 1200, 'Valor Médio por Internação', fontsize = 20, rotation = 'vertical', color = GRAY6)
plt.text(460, -200, 'Period', fontsize = 20, color = GRAY6)

plt.show()

In [None]:
# importar o aquivo do valor médio das internações no Ceará
valor_medio_ce_raw = pd.read_csv('../data/valor_medio_internacao_municipio_ce.csv', sep = ';', encoding = 'ISO-8859-1', skiprows = 3,
                            skipfooter = 12, thousands = '.', decimal = ',', engine = 'python')

In [None]:
valor_medio_ce_raw.head()

In [None]:
valor_medio_ce = valor_medio_ce_raw.copy()

valor_medio_ce['Município'] = valor_medio_ce['Município'].str[7:]

valor_medio_ce = valor_medio_ce.set_index('Município').rename_axis(None)

In [None]:
valor_medio_ce.head(3)

In [None]:
valor_medio_ce.columns.get_loc('2008/Jan')

In [None]:
# excluir as colunas anteriores a '2008/Jan'
valor_medio_ce = valor_medio_ce[valor_medio_ce.columns[8:]]
valor_medio_ce.head(3)

In [None]:
valor_medio_ce.info()

In [None]:
valor_medio_ce.isna().sum().sum()

In [None]:
valor_medio_ce = valor_medio_ce.fillna(0)

In [None]:
valor_medio_ce.isna().sum().sum()

In [None]:
valor_medio_ce.columns[-1]

In [None]:
valor_medio_ce = valor_medio_ce.drop('Total', axis = 1)

In [None]:
valor_medio_ce.columns = pd.to_datetime(valor_medio_ce.columns, format = '%Y/%b')

In [None]:
valor_medio_ce = valor_medio_ce.T

In [None]:
valor_medio_ce['Soma'] = (valor_medio_ce.drop('Fortaleza', axis = 1).sum(axis = 1))/183

In [None]:
valor_medio_ce = valor_medio_ce[['Fortaleza', 'Soma']]

In [None]:
valor_medio_ce

In [None]:
color = [BLUE1, ORANGE1]

ax = valor_medio_ce.plot(alpha = 0.8, figsize = (15, 8), color = color, legend = None, linewidth = 2)

plt.ylim(0, 2500)
ax.tick_params(color = 'darkgrey')
ax.spines['bottom'].set_color('darkgrey')
ax.spines['left'].set_color('darkgrey')
ax.spines['right'].set_visible(False)
ax.spines['top'].set_visible(False)

for i in ax.get_yticklabels() + ax.get_xticklabels():
    i.set_fontsize(14)
    i.set_color(GRAY5)
    

plt.text(442, 2600, '$\\bf{Valor\ Médio\ por\ Internação\ por\ Município\ no\ Ceará\ de\ Jan/2008\ a\ Mar/2021}$',
         fontsize = 25, color = GRAY4)

plt.text(442, 1900, 'Valor Médio', fontsize = 20, rotation = 'vertical', color = GRAY6)
plt.text(455, -250, 'Period', fontsize = 20, color = GRAY6)

plt.text(615, 1500, 'Fortaleza', fontsize = 20, color = BLUE1)
plt.text(614, 400, 'Outros Municípios', fontsize = 20, color = ORANGE1)

plt.show()

In [None]:
valor_medio_ce = valor_medio_ce.T
valor_medio_ce.shape[1]

In [None]:
valor_medio_ce['Média'] = valor_medio_ce.sum(axis = 1) / 159

In [None]:
valor_medio_ce

In [None]:
print('A média do valor gasto com internações em Fortaleza foi de {:,.2f} reais, \
      \ncontra {:.2f} reais dos outros municípios.'.format(valor_medio_ce['Média']['Fortaleza'],
                                                           valor_medio_ce['Média']['Soma']))