### Esse notebook irá mostrar como converter um  JSON em um DataFrame utilizando a biblioteca pandas.

#### 1. Importação das bibliotecas que serão utilizadas 

In [55]:
import pandas as pd
import json
from pandas import json_normalize

#### 2. Abrindo os arquivos somente para leitura 

In [56]:
arquivo_json_exemplo_1 = open('exemplo1.json','r') 
arquivo_json_exemplo_2 = open('exemplo2.json','r') 

#### 3. Objeto JSON carregado usando a  função json.loads()

In [57]:
dados_1 = json.loads(arquivo_json_exemplo_1.read())
dados_2 = json.loads(arquivo_json_exemplo_2.read())

In [58]:
dados_1

{'nome': 'Universidade de natal',
 'curso': 'Engenharia de Computacao',
 'infor': {'coordenador': 'Jose da Silva',
  'endereco': 'Avenida Senador Salgado Filho',
  'contato': {'email': 'jose@hotmail.com', 'tel': '123456789'}},
 'estudantes': [{'id': 'A001',
   'nome': 'Joao',
   'idade': 20,
   'email': 'joao@gmail.com',
   'notas': {'matematica': 79, 'fisica': 90, 'quimica': 78}},
  {'id': 'A002',
   'nome': 'Pedro',
   'idade': 24,
   'email': 'pedro@gmail.com',
   'notas': {'matematica': 75, 'fisica': 50, 'quimica': 25}},
  {'id': 'A003',
   'nome': 'Maira',
   'idade': 23,
   'email': 'Maira@gmail.com',
   'notas': {'matematica': 25, 'fisica': 55, 'quimica': 15}}]}

In [59]:
dados_2

{'nome': 'Universidade de natal',
 'curso': 'Engenharia Mecatronica',
 'infor': {'coordenador': 'Maria da Silva',
  'endereco': 'Avenida Bernado Vieira',
  'contato': {'email': 'maria@hotmail.com', 'tel': '987654321'}},
 'estudantes': [{'id': 'A004',
   'nome': 'Lais',
   'idade': 19,
   'email': 'lais@gmail.com',
   'notas': {'matematica': 10, 'fisica': 100, 'quimica': 100}},
  {'id': 'A005',
   'nome': 'thiago',
   'idade': 28,
   'email': 'thiago@gmail.com',
   'notas': {'matematica': 10, 'fisica': 88, 'quimica': 95}},
  {'id': 'A006',
   'nome': 'May',
   'idade': 18,
   'email': 'May@gmail.com',
   'notas': {'matematica': 100, 'fisica': 100, 'quimica': 100}}]}

#### 4. Ler a string JSON de forma aninhada e devolve um DataFrame

In [60]:
df_1 =  pd.json_normalize(dados_1, record_path =['estudantes'], meta=['curso', ['infor', 'coordenador'], 
        ['infor', 'contato', 'email'], ['infor', 'contato', 'tel']])

In [61]:
df_1

Unnamed: 0,id,nome,idade,email,notas.matematica,notas.fisica,notas.quimica,curso,infor.coordenador,infor.contato.email,infor.contato.tel
0,A001,Joao,20,joao@gmail.com,79,90,78,Engenharia de Computacao,Jose da Silva,jose@hotmail.com,123456789
1,A002,Pedro,24,pedro@gmail.com,75,50,25,Engenharia de Computacao,Jose da Silva,jose@hotmail.com,123456789
2,A003,Maira,23,Maira@gmail.com,25,55,15,Engenharia de Computacao,Jose da Silva,jose@hotmail.com,123456789


In [62]:
df_2 =  pd.json_normalize(dados_2, record_path =['estudantes'], meta=['curso', ['infor', 'coordenador'], 
        ['infor', 'contato', 'email'], ['infor', 'contato', 'tel']])

In [63]:
df_2

Unnamed: 0,id,nome,idade,email,notas.matematica,notas.fisica,notas.quimica,curso,infor.coordenador,infor.contato.email,infor.contato.tel
0,A004,Lais,19,lais@gmail.com,10,100,100,Engenharia Mecatronica,Maria da Silva,maria@hotmail.com,987654321
1,A005,thiago,28,thiago@gmail.com,10,88,95,Engenharia Mecatronica,Maria da Silva,maria@hotmail.com,987654321
2,A006,May,18,May@gmail.com,100,100,100,Engenharia Mecatronica,Maria da Silva,maria@hotmail.com,987654321


#### 5. Concatenando os dados dos dois Dataframes

In [64]:
df_concat = pd.concat([df_1, df_2], ignore_index=True, join='inner' )

In [65]:
df_concat


Unnamed: 0,id,nome,idade,email,notas.matematica,notas.fisica,notas.quimica,curso,infor.coordenador,infor.contato.email,infor.contato.tel
0,A001,Joao,20,joao@gmail.com,79,90,78,Engenharia de Computacao,Jose da Silva,jose@hotmail.com,123456789
1,A002,Pedro,24,pedro@gmail.com,75,50,25,Engenharia de Computacao,Jose da Silva,jose@hotmail.com,123456789
2,A003,Maira,23,Maira@gmail.com,25,55,15,Engenharia de Computacao,Jose da Silva,jose@hotmail.com,123456789
3,A004,Lais,19,lais@gmail.com,10,100,100,Engenharia Mecatronica,Maria da Silva,maria@hotmail.com,987654321
4,A005,thiago,28,thiago@gmail.com,10,88,95,Engenharia Mecatronica,Maria da Silva,maria@hotmail.com,987654321
5,A006,May,18,May@gmail.com,100,100,100,Engenharia Mecatronica,Maria da Silva,maria@hotmail.com,987654321


#### 6. Renomeando as colunas

In [66]:
df_concat.rename(columns={'notas.matematica': 'nota_matematica', 'notas.fisica': 'nota_fisica', 'notas.quimica': 'nota_quimica', 'infor.coordenador': 'coordenador_curso', 'infor.contato.email': 'coordenador_email','infor.contato.tel': 'coordenador_tel'} , inplace = True)

In [67]:
df_concat

Unnamed: 0,id,nome,idade,email,nota_matematica,nota_fisica,nota_quimica,curso,coordenador_curso,coordenador_email,coordenador_tel
0,A001,Joao,20,joao@gmail.com,79,90,78,Engenharia de Computacao,Jose da Silva,jose@hotmail.com,123456789
1,A002,Pedro,24,pedro@gmail.com,75,50,25,Engenharia de Computacao,Jose da Silva,jose@hotmail.com,123456789
2,A003,Maira,23,Maira@gmail.com,25,55,15,Engenharia de Computacao,Jose da Silva,jose@hotmail.com,123456789
3,A004,Lais,19,lais@gmail.com,10,100,100,Engenharia Mecatronica,Maria da Silva,maria@hotmail.com,987654321
4,A005,thiago,28,thiago@gmail.com,10,88,95,Engenharia Mecatronica,Maria da Silva,maria@hotmail.com,987654321
5,A006,May,18,May@gmail.com,100,100,100,Engenharia Mecatronica,Maria da Silva,maria@hotmail.com,987654321


### Referências

[1] - **Todos os Pandas json_normalize () que você deve saber para nivelar JSON.**
Disponível em: https://ichi.pro/pt/todos-os-pandas-json-normalize-que-voce-deve-saber-para-nivelar-json-21899532810205

[2] - **Converting nested JSON structures to Pandas DataFrames**. Disponível em: https://medium.com/swlh/converting-nested-json-structures-to-pandas-dataframes-e8106c59976e