<a href="https://colab.research.google.com/github/martinsadw/alura/blob/main/Pandas%20-%20transforma%C3%A7%C3%A3o%20e%20manipula%C3%A7%C3%A3o%20de%20dados/condos.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 0. Description

A administração de condomínios é uma tarefa que requer muita atenção e organização. Entre as diversas responsabilidades da gestão está o recebimento dos aluguéis dos locatários. Para garantir uma boa saúde financeira do empreendimento, é fundamental que esses pagamentos sejam feitos de forma regular e pontual. No entanto, sabemos que nem sempre isso acontece.

Pensando nisso, proponho um desafio de tratamento de dados com o objetivo de __analisar o atraso no pagamento de aluguéis no condomínio__ de alguns moradores. Disponibilizo a base de dados [dados_locacao_imoveis.json](https://cdn3.gnarususercontent.com.br/2928-transformacao-manipulacao-dados/dados_locacao_imoveis.json), que contém informações sobre o apartamento dos locatários, o dia acordado para o pagamento do aluguel, o dia da efetivação do pagamento de aluguel e o valor do aluguel.

In [1]:
!wget https://cdn3.gnarususercontent.com.br/2928-transformacao-manipulacao-dados/dados_locacao_imoveis.json

--2024-05-05 09:00:29--  https://cdn3.gnarususercontent.com.br/2928-transformacao-manipulacao-dados/dados_locacao_imoveis.json
Resolving cdn3.gnarususercontent.com.br (cdn3.gnarususercontent.com.br)... 104.26.15.179, 172.67.75.65, 104.26.14.179, ...
Connecting to cdn3.gnarususercontent.com.br (cdn3.gnarususercontent.com.br)|104.26.15.179|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 3049 (3.0K) [application/json]
Saving to: ‘dados_locacao_imoveis.json’


2024-05-05 09:00:29 (21.6 MB/s) - ‘dados_locacao_imoveis.json’ saved [3049/3049]



In [2]:
import pandas as pd

In [3]:
import json
from pprint import pprint
with open('dados_locacao_imoveis.json', 'r') as file:
    condos_json = json.load(file)

In [4]:
print(condos_json.keys())
pprint(condos_json['dados_locacao'][0])

dict_keys(['dados_locacao'])
{'apartamento': 'A101 (blocoAP)',
 'datas_combinadas_pagamento': ['01/06/2022', '01/07/2022'],
 'datas_de_pagamento': ['05/06/2022', '03/07/2022'],
 'valor_aluguel': ['$ 1000,0 reais', '$ 2500,0 reais']}


# 1. Importing

In [5]:
condos = pd.json_normalize(condos_json['dados_locacao'])
condos

Unnamed: 0,apartamento,datas_combinadas_pagamento,datas_de_pagamento,valor_aluguel
0,A101 (blocoAP),"[01/06/2022, 01/07/2022]","[05/06/2022, 03/07/2022]","[$ 1000,0 reais, $ 2500,0 reais]"
1,A102 (blocoAP),"[02/06/2022, 02/07/2022]","[02/06/2022, 06/07/2022]","[$ 1100,0 reais, $ 2600,0 reais]"
2,B201 (blocoAP),"[03/06/2022, 03/07/2022]","[07/06/2022, 03/07/2022]","[$ 1200,0 reais, $ 2700,0 reais]"
3,B202 (blocoAP),"[04/06/2022, 04/07/2022]","[07/06/2022, 05/07/2022]","[$ 1300,0 reais, $ 2800,0 reais]"
4,C301 (blocoAP),"[05/06/2022, 05/07/2022]","[10/06/2022, 09/07/2022]","[$ 1400,0 reais, $ 2900,0 reais]"
5,C302 (blocoAP),"[06/06/2022, 06/07/2022]","[08/06/2022, 12/07/2022]","[$ 1500,0 reais, $ 1200,0 reais]"
6,D401 (blocoAP),"[07/06/2022, 07/07/2022]","[07/06/2022, 09/07/2022]","[$ 1600,0 reais, $ 1300,0 reais]"
7,D402 (blocoAP),"[08/06/2022, 08/07/2022]","[10/06/2022, 14/07/2022]","[$ 1700,0 reais, $ 1400,0 reais]"
8,E501 (blocoAP),"[09/06/2022, 09/07/2022]","[10/06/2022, 09/07/2022]","[$ 1800,0 reais, $ 1500,0 reais]"
9,E502 (blocoAP),"[10/06/2022, 10/07/2022]","[16/06/2022, 12/07/2022]","[$ 1900,0 reais, $ 1600,0 reais]"


In [6]:
explode_column = ['datas_combinadas_pagamento', 'datas_de_pagamento', 'valor_aluguel']
exploded_condos = condos.explode(explode_column).reset_index(drop=True)
exploded_condos.head()

Unnamed: 0,apartamento,datas_combinadas_pagamento,datas_de_pagamento,valor_aluguel
0,A101 (blocoAP),01/06/2022,05/06/2022,"$ 1000,0 reais"
1,A101 (blocoAP),01/07/2022,03/07/2022,"$ 2500,0 reais"
2,A102 (blocoAP),02/06/2022,02/06/2022,"$ 1100,0 reais"
3,A102 (blocoAP),02/07/2022,06/07/2022,"$ 2600,0 reais"
4,B201 (blocoAP),03/06/2022,07/06/2022,"$ 1200,0 reais"


In [7]:
converted_condos = exploded_condos.copy()
converted_condos['valor_aluguel'] = exploded_condos['valor_aluguel'].str.replace('$', '').str.replace('reais', '').str.replace(',', '.').str.strip().astype(float)
converted_condos.head()

Unnamed: 0,apartamento,datas_combinadas_pagamento,datas_de_pagamento,valor_aluguel
0,A101 (blocoAP),01/06/2022,05/06/2022,1000.0
1,A101 (blocoAP),01/07/2022,03/07/2022,2500.0
2,A102 (blocoAP),02/06/2022,02/06/2022,1100.0
3,A102 (blocoAP),02/07/2022,06/07/2022,2600.0
4,B201 (blocoAP),03/06/2022,07/06/2022,1200.0


In [17]:
converted_condos['apartamento'] = exploded_condos['apartamento'].str.replace('\(\w+\)', '', regex=True).str.strip()
converted_condos.head()

Unnamed: 0,apartamento,datas_combinadas_pagamento,datas_de_pagamento,valor_aluguel
0,A101,01/06/2022,05/06/2022,1000.0
1,A101,01/07/2022,03/07/2022,2500.0
2,A102,02/06/2022,02/06/2022,1100.0
3,A102,02/07/2022,06/07/2022,2600.0
4,B201,03/06/2022,07/06/2022,1200.0
