<a href="https://colab.research.google.com/github/brodyandre/normalizacao_de_dados_json_e_criacao_de_dataframe/blob/main/normalizando_json_obtido_na_api.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Documenta√ß√£o do C√≥digo: Normaliza√ß√£o de Dados JSON e Cria√ß√£o de DataFrame**

## üìù **Objetivo**
O objetivo deste c√≥digo √© fazer a normaliza√ß√£o de dados JSON aninhados obtidos a partir de uma API externa e organiz√°-los em um DataFrame do pandas. Esse processo facilita a an√°lise e visualiza√ß√£o dos dados, separando colunas aninhadas e criando um formato tabular.

---

## ‚öôÔ∏è **Passo a Passo do C√≥digo**

# 1. **Importa√ß√£o das Bibliotecas**
O c√≥digo come√ßa importando as bibliotecas necess√°rias:

```python
import pandas as pd
import requests


*   pandas (pd): Biblioteca essencial para manipula√ß√£o e an√°lise de dados em Python. Utilizada para criar e manipular DataFrames.
*   requests: Biblioteca que permite fazer requisi√ß√µes HTTP, sendo usada para obter dados da API externa.





# 2. Obten√ß√£o dos Dados JSON
A seguir, a URL da API https://jsonplaceholder.typicode.com/users √© acessada, e os dados s√£o carregados em formato JSON.

In [14]:
import pandas as pd
import requests

url = 'https://jsonplaceholder.typicode.com/users'
response = requests.get(url)
data = response.json()

*   requests.get(url): Realiza uma requisi√ß√£o HTTP GET para obter os dados da API.
*   response.json(): Converte a resposta da requisi√ß√£o em formato JSON.



# 3. Cria√ß√£o do DataFrame Principal
O DataFrame principal √© criado a partir dos dados JSON obtidos.

In [15]:
df = pd.DataFrame(data)

*   pd.DataFrame(data): Converte os dados JSON em um DataFrame, que √© uma estrutura tabular com linhas e colunas.

# 4. Normaliza√ß√£o das Colunas Aninhadas
Aqui, as colunas que cont√™m dicion√°rios (como address e company) s√£o normalizadas para expandir as informa√ß√µes internas em colunas separadas.

In [16]:
address_df = pd.json_normalize(df['address'])
company_df = pd.json_normalize(df['company'])


*   pd.json_normalize(): Expande os dicion√°rios aninhados em colunas separadas.
*   df['address']: Seleciona a coluna address do DataFrame original, que √© um dicion√°rio.
*   df['company']: Seleciona a coluna company do DataFrame original, que tamb√©m √© um dicion√°rio.




# 5. Renomea√ß√£o das Colunas Normalizadas
Para evitar que as colunas se sobreponham ao mesclar os DataFrames, as colunas normalizadas s√£o renomeadas com prefixos.

In [17]:
address_df.columns = [f"address_{col}" for col in address_df.columns]
company_df.columns = [f"company_{col}" for col in company_df.columns]


*   f"address_{col}": Adiciona o prefixo address_ √†s colunas de address.

*   f"company_{col}": Adiciona o prefixo company_ √†s colunas de company.



6. Concatenando os DataFrames
Agora, os DataFrames normalizados s√£o concatenados ao DataFrame principal, df.#

In [18]:
df = pd.concat([df, address_df, company_df], axis=1)

* pd.concat(): Junta os DataFrames. O par√¢metro axis=1 especifica que a concatena√ß√£o ser√° feita nas colunas (lado a lado).

# 7. Remo√ß√£o das Colunas Aninhadas Originais
Ap√≥s a normaliza√ß√£o, as colunas originais address e company, que eram aninhadas, s√£o removidas do DataFrame principal.

In [19]:
df = df.drop(columns=['address', 'company'])

* df.drop(): Remove as colunas especificadas do DataFrame.

# 8. Exibi√ß√£o do DataFrame Final
Por fim, o DataFrame final, que agora cont√©m as informa√ß√µes normalizadas, √© exibido.

In [20]:
print(df.head())

   id              name   username                      email  \
0   1     Leanne Graham       Bret          Sincere@april.biz   
1   2      Ervin Howell  Antonette          Shanna@melissa.tv   
2   3  Clementine Bauch   Samantha         Nathan@yesenia.net   
3   4  Patricia Lebsack   Karianne  Julianne.OConner@kory.org   
4   5  Chelsey Dietrich     Kamren   Lucio_Hettinger@annie.ca   

                   phone        website     address_street address_suite  \
0  1-770-736-8031 x56442  hildegard.org        Kulas Light      Apt. 556   
1    010-692-6593 x09125  anastasia.net      Victor Plains     Suite 879   
2         1-463-123-4447    ramiro.info  Douglas Extension     Suite 847   
3      493-170-9623 x156       kale.biz        Hoeger Mall      Apt. 692   
4          (254)954-1289   demarco.info       Skiles Walks     Suite 351   

    address_city address_zipcode address_geo.lat address_geo.lng  \
0    Gwenborough      92998-3874        -37.3159         81.1496   
1    Wisokyburgh

* df.head(): Exibe as primeiras 5 linhas do DataFrame.

üìä Sa√≠da Esperada
Ap√≥s a execu√ß√£o do c√≥digo, a sa√≠da ser√° um DataFrame organizado, onde as colunas aninhadas (address e company) s√£o expandidas em m√∫ltiplas colunas, como mostrado abaixo:




| id  | name          | username | email                                         | phone                 | website       | address\_street | address\_suite | address\_city | address\_zipcode | address\_geo\_lat | address\_geo\_lng | company\_name   | company\_catchPhrase                   | company\_bs                 |
| --- | ------------- | -------- | --------------------------------------------- | --------------------- | ------------- | --------------- | -------------- | ------------- | ---------------- | ----------------- | ----------------- | --------------- | -------------------------------------- | --------------------------- |
| 1   | Leanne Graham | Bret     | [Sincere@april.biz](mailto:Sincere@april.biz) | 1-770-736-8031 x56442 | hildegard.org | Kulas Light     | Apt. 556       | Gwenborough   | 92998-3874       | -37.3159          | 81.1496           | Romaguera-Crona | Multi-layered client-server neural-net | harness real-time e-markets |
| ... | ...           | ...      | ...                                           | ...                   | ...           | ...             | ...            | ...           | ...              | ...               | ...               | ...             | ...                                    | ...                         |


# üóÇÔ∏è Conclus√£o
Este c√≥digo √© √∫til para lidar com dados JSON com estrutura aninhada, convertendo-os para um formato tabular adequado para an√°lise em Python usando pandas. Ap√≥s a normaliza√ß√£o, os dados podem ser facilmente manipulados, visualizados e analisados de forma mais eficaz.