---
layout: post
title: API do IBGE
subtitle: Exercícios e Referências
tags: [python, pycharm, jupyter, package, ibge, api]
image: /img/posts/icon_pandas.png
bigimg: /img/posts/big_pandas.png
gh-repo: michelmetran/api_ibge
gh-badge: [follow, star, watch, fork]
comments: true

---

O <a title="Link do Pandas" href="https://pandas.pydata.org/" target="_blank">**_Pandas_**</a> é um pacote que possibilita o manejo dos dados.

{: .alert .alert-danger}
**Aviso:** Esse _post_ tem a finalidade de mostrar os comandos básicos e me deixar com uma "cola" rápida para meu uso cotidiano. Todas os códigos são exemplificativos e podem/devem ser alterados, indicando o nome dos arquivos e diretórios corretamente.

{: .box-note}
**Nota:** É possível acessar esse _post_ em formato <a title="Link do Folium" href="https://github.com/michelmetran/package_pandas/raw/master/docs/pandas.pdf" target="_blank">**_pdf_**</a>, diretamente por meio do <a title="Link do Repositório" href="https://github.com/michelmetran/package_pandas" target="_blank">**repositório do GitHub**</a> ou ainda, de maneira interativa, usando o [![Binder](https://mybinder.org/badge_logo.svg)](https://mybinder.org/v2/gh/michelmetran/package_pandas/master).

<br>

# Pandas

As bibliotecas básicas, ou _packages_, necessárias para criação do mapa são:
- O **_Pandas_**, que tem a missão de trabalhar com dados, criar _subsets_, selecionar e filtros dados e;
- O **_Geopandas_**, que é a biblioteca lê geojson!

In [4]:
import pandas as pd
import geopandas as gpd

In [5]:
# Lendo e filtrando dados
empresas = pd.read_csv('data/empresas.xz')
empresas = empresas[empresas['state'] == 'SP']
empresas = empresas[empresas['city'] == 'SANTOS']

empresas.dtypes

name                           object
situation                      object
neighborhood                   object
address                        object
number                         object
zip_code                       object
city                           object
state                          object
cnpj                           object
status                         object
additional_address_details     object
main_activity                  object
latitude                      float64
longitude                     float64
dtype: object

# GeoPandas

In [6]:
#https://rsandstroem.github.io/GeoMapsFoliumDemo.html

# OS
Ainda segue uns comandas básicos para 'andar' entre pastas e arquivos.

In [7]:
import os

# Pasta Atual
print(os.getcwd())

# Altera a pasta para um nível acima
os.chdir('/home/michel/Documents/SourceCode/michelmetran.github.io')
os.chdir('/home/michel/Documents/SourceCode/package_pandas')

# Confere a pasta
print(os.getcwd())

#from importlib import reload
#reload(os)

/home/michel/Documents/SourceCode/package_pandas
/home/michel/Documents/SourceCode/package_pandas


___
<br>

# Exportando o _Juptyter Notebook_ para outros formatos
O arquivo _.ipynb_ pode ser exportado em formatos diversos. Abaixo carrego uma função que escrevi para facilitar o processo de exportação do arquivo em diferentes locais do PC para, posteriormente, atualizar os repositórios contidos no <a title="Link do GitHub" href="https://github.com/michelmetran" target="_blank">_GitHub_</a>.

In [8]:
# %load '~/Documents/SourceCode/codes/files/export_jupyter.py'
def export_jupyter(path, extensions=['html', 'markdown', 'latex', 'pdf', 'python'], today=True):
    """
    Export .ipynb file to others formats
    :return: File in other formats
    """
    # Import Packages
    import os
    import datetime

    # Data
    timestamp = datetime.datetime.now()
    srt_today = (str(timestamp.year) + '-' +
                 str(f"{timestamp.month:02d}") + '-' +
                 str(f"{timestamp.day:02d}"))

    # Extensions
    for extension in extensions:
        if today==True:
            os.system('jupyter nbconvert --to {} {} --output {}'.
                      format(extension, get_jupyternotebook_name(),
                             os.path.join(path, srt_today+'-'+get_jupyternotebook_name().split('.')[0])))
            print('Arquivo {} exportado corretamente para o formato {} usando prefixo da data.'.
                  format(get_jupyternotebook_name(), extension))

        else:
            os.system('jupyter nbconvert --to {} {} --output {}'.
                      format(extension, get_jupyternotebook_name(),
                             os.path.join(path, get_jupyternotebook_name().split('.')[0])))
            print('Arquivo {} exportado corretamente para o formato {} sem usar prefixo da data.'.
                  format(get_jupyternotebook_name(), extension))


In [13]:
# %load '~/Documents/SourceCode/codes/files/get_jupyternotebook_name.py'
def get_jupyternotebook_name():
    """
    Returns the name of the current notebook as a string
    From https://mail.scipy.org/pipermail/ipython-dev/2014-June/014096.html
    :return: Returns the name of the current notebook as a string
    """
    # Import Packages
    from IPython.core.display import Javascript
    from IPython.display import display

    display(Javascript('IPython.notebook.kernel.execute("theNotebook = " + \
    "\'"+IPython.notebook.notebook_name+"\'");'))

    # Result
    return theNotebook


Com as funções para exportar o _Jupyter Notebook_ e para obter o nome do arquivo _.ipynb_ carregadas, basta exportar o arquivo, inicialmente para a pasta _docs_ dentro do projeto e também, visando atualizar os _posts_ do site, para a respectiva pasta.

In [14]:
export_jupyter('docs',['pdf'], False)
export_jupyter('/home/michel/Documents/SourceCode/michelmetran.github.io/_posts', ['markdown'], True)

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

Arquivo pandas.ipynb exportado corretamente para o formato pdf sem usar prefixo da data.


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

Arquivo pandas.ipynb exportado corretamente para o formato markdown usando prefixo da data.


<br>

# Atualizando Repositórios
Após as exportações dos arquivos nos formatos necessários, basta atualizar o repositório diretamente pelo  _Jupyter Notebook_.
Abaixo é atualizado o repositório desse projeto específico, bem como a derivação desse projeto no <a title="Link do Folium" href="https://michelmetran.github.io/" target="_blank">**_site_**</a>.

In [17]:
%run '~/Documents/SourceCode/codes/git/update_github.py'

In [18]:
git_full('/home/michel/Documents/SourceCode/package_pandas', '.', 'Atualizando')
git_full('/home/michel/Documents/SourceCode/michelmetran.github.io', '.', 'Atualizando')

b'' b''
b"On branch master\nYour branch is up to date with 'origin/master'.\n\nnothing to commit, working tree clean\n" b''
b'' b'Everything up-to-date\n'
Done!!
b'' b''
b'[master 1490947] Atualizando\n 1 file changed, 225 deletions(-)\n delete mode 100644 _posts/2019-08-22-pandas.md\n' b''
b'' b'To github.com:michelmetran/michelmetran.github.io.git\n   340a033..1490947  master -> master\n'
Done!!


# _Requirements_
Abaixo é criado o arquivo _requirements.txt_ na raiz do projeto para possibilitar o correto funcionamento do _Jupyter Notebook_ no <a title="Link do My Binder" href="https://mybinder.org/" target="_blank">**_My Binder_**</a>. Após a criação do arquivo, sugere-se a edição manual, visando manter apenas os _packages_ realmente essenciais, listados com o comando _import_ no início do _script_.

In [None]:
#pip freeze > requirements.txt