### Queries na base de dados Mongo


In [1]:
# Importando as Bibliotecas
import pandas as pd
import json
import pymongo
import yaml

from sqlalchemy import create_engine
import psycopg2

In [2]:
# Carrega Configurações do arquivo config
with open("../config.yaml", "r") as ymlfile:
    cfg = yaml.full_load(ymlfile)

user_mongo = cfg["mongodb"]["user"]
passwd_mongo = cfg["mongodb"]["passwd"]
host_mongo = cfg["mongodb"]["host"]
dbmongo = cfg["mongodb"]["db"]

# Carrega configurações postgres
user_posgres = cfg["postgres"]["user"]
passwd_posgres = cfg["postgres"]["passwd"]
host_posgres = cfg["postgres"]["host"]
dbposgres = cfg["postgres"]["db"]

In [3]:
# Cria Conexão com banco NoSQL
url_conexao = "mongodb+srv://" + user_mongo + ":" + passwd_mongo + "@" + host_mongo + "/?retryWrites=true&w=majority"
client = pymongo.MongoClient(url_conexao)
db_mongo = client[dbmongo]

# Coleções Mongo
col_processos = db_mongo['processo']
col_decisoes = db_mongo['decisoes']


In [4]:
# Quantidade Processos
col_processos.count_documents({})

55994

In [5]:
# Quantidade Processos
col_decisoes.count_documents({})

28090

### Carrega os processos 
1. Lê da base NoSQL 
2. Carrega no banco Postgres

In [6]:
#df = pd.DataFrame.from_records(processos,index=['nro_processo','link_processo','nome_parte'])
dados = pd.DataFrame(list(col_processos.find({})))
df_processos = pd.json_normalize(dados['processo'])
df_processos.shape

(55994, 8)

In [7]:
# Insere algumas infos adicionais
df_processos['tribunal'] = 'TJSP'
df_processos['justica'] = 'Justiça Estadual'

In [8]:
# Separa a data de distribuição do processo
df_processos['dt_distribuicao'] = df_processos['data_local_distribuicao'].str[:10]

In [9]:
# ‘postgres://user:password@host/database’
conn_string_postgres = "postgresql://" + user_posgres + ":" + passwd_posgres + "@" + host_posgres + "/" + dbposgres
  
db = create_engine(conn_string_postgres)
conn = db.connect()

In [10]:
df_processos.to_sql('dw_processos', schema="jud", con=conn, if_exists='replace',index=False)

994

# Decisões

In [11]:
# Carrega base de decisões total
dados_decisoes = pd.DataFrame(list(col_decisoes.find({})))
df_decisoes = pd.json_normalize(dados_decisoes['decisao'])

In [12]:
df_decisoes.shape

(28090, 11)

In [13]:
df_decisoes.to_sql('dw_decisoes',schema="jud", con=conn, if_exists='replace',index=False)

90