## Concurso de Visualização de Dados da Data Science Academy

Fonte dos dados: sistema SIDRA do IBGE

Repositório deste notebook: https://github.com/jangelojr/dsavisualizacao

In [1]:
import pandas            as pd
import numpy             as np
import plotly.plotly     as py
import plotly.graph_objs as go
import plotly
from plotly import tools

In [2]:
# Tabela de saneamento
tabela1160 = pd.read_excel('Tabela1160.xlsx')
# Tabela de internações
tabela898  = pd.read_excel('Tabela898.xlsx')
# Tabela de renda
tabela3734 = pd.read_excel('Tabela3734.xlsx')

In [3]:
# Checar resultados
print(tabela1160.head())
print(tabela3734.head())
print(tabela898.head())

      Ano Unidade da Federação Tipo de esgotamento sanitário  \
0  2015.0             Rondônia                 Rede coletora   
1     NaN                  NaN                 Fossa séptica   
2     NaN                  NaN              Fossa rudimentar   
3     NaN                  NaN                          Vala   
4     NaN                  NaN  Direto para rio, lago ou mar   

   % moradores em domicílios particulares permanentes  
0                                               10.1   
1                                               45.2   
2                                               43.7   
3                                                0.1   
4                                                0.3   
      Ano Unidade da Federação  \
0  2015.0             Rondônia   
1     NaN                  NaN   
2     NaN                  NaN   
3     NaN                  NaN   
4     NaN                 Acre   

  Classes de rendimento mensal domiciliar per capita  \
0                 

In [4]:
# preencher valores vazios com o imediatamente anterior
saneamento  = tabela1160.fillna(method='ffill')
internacoes = tabela898.fillna(method='ffill')
renda       = tabela3734.fillna(method='ffill')

In [5]:
# Eliminar a variável ano (dados referem-se ao ano de 2015 em todos)
saneamento.drop(['Ano'],  axis = 1, inplace = True)
internacoes.drop(['Ano'], axis = 1, inplace = True)
renda.drop(['Ano'],       axis = 1, inplace = True)

In [6]:
# Checar resultados
print(saneamento.head())
print(renda.head())
print(internacoes.head())

  Unidade da Federação Tipo de esgotamento sanitário  \
0             Rondônia                 Rede coletora   
1             Rondônia                 Fossa séptica   
2             Rondônia              Fossa rudimentar   
3             Rondônia                          Vala   
4             Rondônia  Direto para rio, lago ou mar   

   % moradores em domicílios particulares permanentes  
0                                               10.1   
1                                               45.2   
2                                               43.7   
3                                                0.1   
4                                                0.3   
  Unidade da Federação Classes de rendimento mensal domiciliar per capita  \
0             Rondônia                             Até 1/2 salário mínimo   
1             Rondônia                     Mais de 1/2 a 1 salário mínimo   
2             Rondônia                     Mais de 1 a 2 salários mínimos   
3             Rondô

In [7]:
# fazer pivot_table dos valores e reiniciar os índices
saneamento  = pd.pivot_table(saneamento, values = '% moradores em domicílios particulares permanentes'
                           , index   = 'Unidade da Federação'
                           , columns = 'Tipo de esgotamento sanitário')

renda       = pd.pivot_table(renda, values = '% rendimento mensal domiciliar (salários mínimos)'
                           , index   = 'Unidade da Federação'
                           , columns = 'Classes de rendimento mensal domiciliar per capita')

internacoes = pd.pivot_table(internacoes, values = 'Internações relacionadas a saneamento inadequado (a cada 100 mil)'
                           , index   = 'Unidade da Federação'
                           , columns = 'Categorias de doenças')

saneamento.reset_index(level=0, inplace=True)
renda.reset_index(level=0, inplace=True)
internacoes.reset_index(level=0, inplace=True)

In [8]:
# Já que o índice não reinicia, salvar o df como csv e importá-lo novamente
saneamento.to_csv('saneamento.csv', index = False)
renda.to_csv('renda.csv', index = False)
internacoes.to_csv('internacoes.csv', index = False)

saneamento  = pd.read_csv('saneamento.csv')
renda       = pd.read_csv('renda.csv')
internacoes = pd.read_csv('internacoes.csv')

# Gráficos

1. Referente aos dados sobre saneamento

In [9]:
data_saneamento = [
    go.Bar(
        x = saneamento['Unidade da Federação'],
        y = saneamento['Direto para rio, lago ou mar'],
        name = 'Direto para rio, lago ou mar'
    ),
    go.Bar(
        x = saneamento['Unidade da Federação'],
        y = saneamento['Fossa rudimentar'],
        name = 'Fossa rudimentar'
    ),
    go.Bar(
        x = saneamento['Unidade da Federação'],
        y = saneamento['Fossa séptica'],
        name = 'Fossa séptica'
    ),
    go.Bar(
        x = saneamento['Unidade da Federação'],
        y = saneamento['Não tinham'],
        name = 'Não tinham'
    ),
    go.Bar(
        x = saneamento['Unidade da Federação'],
        y = saneamento['Outro tipo'],
        name = 'Outro tipo'
    ),
    go.Bar(
        x = saneamento['Unidade da Federação'],
        y = saneamento['Rede coletora'],
        name = 'Rede coletora'
    ),
    go.Bar(
        x = saneamento['Unidade da Federação'],
        y = saneamento['Vala'],
        name = 'Vala'
    )]

In [10]:
layout_saneamento = go.Layout(
    barmode = 'stack',
    title   = 'Acesso ao Saneamento')

fig = go.Figure(data = data_saneamento, layout = layout_saneamento)
py.iplot(fig, filename='pandas-bar-chart-layout')


Consider using IPython.display.IFrame instead



2. Referente aos dados sobre renda

In [11]:
data_renda = [
    go.Bar(
        x = renda['Unidade da Federação'],
        y = renda['Até 1/2 salário mínimo'],
        name = 'Até 1/2 salário mínimo'
    ),
    go.Bar(
        x = renda['Unidade da Federação'],
        y = renda['Mais de 1/2 a 1 salário mínimo'],
        name = 'Mais de 1/2 a 1 salário mínimo'
    ),
    go.Bar(
        x = renda['Unidade da Federação'],
        y = renda['Mais de 1 a 2 salários mínimos'],
        name = 'Mais de 1 a 2 salários mínimos'
    ),
    go.Bar(
        x = renda['Unidade da Federação'],
        y = renda['Mais de 2 salários mínimos'],
        name = 'Mais de 2 salários mínimos'
    )]

In [12]:
layout_renda = go.Layout(
    barmode  = 'stack',
    title    = 'Renda Domiciliar (em salários mínimos)')

fig = go.Figure(data = data_renda, layout = layout_renda)
py.iplot(fig, filename='pandas-bar-chart-layout')

3. Referente aos dados sobre internações

In [13]:
data_internacoes = [
    go.Bar(
        x = internacoes['Unidade da Federação'],
        y = internacoes['De transmissão feco-oral'],
        name = 'De transmissão feco-oral'
    ),
    go.Bar(
        x = internacoes['Unidade da Federação'],
        y = internacoes['Tansmitidas por inseto vetor'],
        name = 'Tansmitidas por inseto vetor'
    ),
    go.Bar(
        x = internacoes['Unidade da Federação'],
        y = internacoes['Transmitidas através do contato com a água'],
        name = 'Transmitidas através do contato com a água'
    ),
    go.Bar(
        x = internacoes['Unidade da Federação'],
        y = internacoes['Geo-helmintos e teníases'],
        name = 'Geo-helmintos e teníases'
    ),
    go.Bar(
        x = internacoes['Unidade da Federação'],
        y = internacoes['Relacionadas com a higiene'],
        name = 'Relacionadas com a higiene'
    )]

In [14]:
layout_internacoes = go.Layout(
    barmode = 'stack',
    title   = 'Internações por doenças relacioanadas ao saneamento inadequado (por cem mil hab)')

fig = go.Figure(data = data_internacoes, layout = layout_internacoes)
py.iplot(fig, filename='pandas-bar-chart-layout')