### Desafio: trabalhando em outros contextos

#### Etapa 1

- Projeto desafio 2: administração de condomínios

A administração de condomínios é uma tarefa que requer muita atenção e organização. Entre as diversas responsabilidades da gestão está o recebimento dos aluguéis dos locatários. Para garantir uma boa saúde financeira do empreendimento, é fundamental que esses pagamentos sejam feitos de forma regular e pontual. No entanto, sabemos que nem sempre isso acontece.

Pensando nisso, proponho um desafio de tratamento de dados com o objetivo de ***analisar o atraso no pagamento de aluguéis no condomínio*** de alguns moradores. Disponibilizo a base de dados [dados_locacao_imoveis.json](https://cdn3.gnarususercontent.com.br/2928-transformacao-manipulacao-dados/dados_locacao_imoveis.json), que contém informações sobre o apartamento dos locatários, o dia acordado para o pagamento do aluguel, o dia da efetivação do pagamento de aluguel e o valor do aluguel.

Com essas informações, o desafio do projeto 2: administração de condomínios será similar ao desafio do projeto 1, abrir a base de dados com Pandas e aplicar o ```json_normalize``` no DataFrame.

In [None]:
import pandas as pd

In [None]:
url = 'pandas-dados/dados_locacao_imoveis.json'

In [None]:
dados_projeto2 = pd.read_json(url)
dados_projeto2.head()

In [None]:
dados_projeto2 = pd.json_normalize(dados_projeto2['dados_locacao'])
dados_projeto2

#### Etapa 2 

- Projeto desafio 2: administração de condomínios
Lemos a base de dados no desafio anterior, agora podemos avançar nas transformações desses dados. Então, da mesma forma que o projeto 1, o desafio do projeto 2 está listado em algumas metas:

- Remover os dados em listas dentro do DataFrame;
- Verificar os tipos de dados;
- Identificar colunas numéricas;
- Transformar a coluna numérica para o tipo numérico.

In [None]:
colunas_para_explodir = ['datas_combinadas_pagamento', 'datas_de_pagamento', 'valor_aluguel']

In [None]:
dados_projeto2 = dados_projeto2.explode(column=colunas_para_explodir, ignore_index=True)
dados_projeto2.head()

In [None]:
dados_projeto2.info()

In [None]:
import numpy as np

In [None]:
dados_projeto2['valor_aluguel'] = dados_projeto2['valor_aluguel'].apply(lambda x : x.replace('$', '').replace(',','.').replace(' reais', '')).astype(np.float64)
dados_projeto2.head()

In [None]:
dados_projeto2.info()

#### Etapa 3

- Projeto desafio 2: administração de condomínios

Na etapa 2, trabalhamos na transformação dos dados numéricos. Agora, podemos trabalhar com valores textuais.

Buscando explicar a organização da identificação dos apartamentos, durante a criação do conjunto de dados, foi adicionado o texto (blocoAP). Esse texto informa que os nomes dos apartamentos estão organizados com a letra do bloco seguida do número do apartamento. No entanto, isso não traz nenhuma informação para nossos dados, sendo interessante realizar a remoção desse texto no conjunto de dados.

Com isso, manipule os textos na coluna apartamento para remover o texto (blocoAP) do DataFrame.

In [None]:
dados_projeto2

In [None]:
dados_projeto2['apartamento'] = dados_projeto2['apartamento'].str.replace(r'\s*\(.*?\)', '', regex=True)

In [None]:
dados_projeto2

#### Etapa 4

Projeto desafio 2: administração de condomínios

Assim como no projeto desafio 1, trabalhamos com todas as colunas exceto as que envolvem datas.

Nas colunas ```datas_de_pagamento``` e ```datas_combinadas_pagamento```, temos datas em formato 'dia/mês/ano' (```dd/mm/AAAA```). Transforme esses dados para o tipo datetime e busque uma forma de visualização de subconjunto que possa contribuir no objetivo do contexto que os dados estão inseridos.

Se você não lembra o problema do projeto desafio 2, vou deixar abaixo o texto da situação para facilitar o encontro da informação:

```
A administração de condomínios é uma tarefa que requer muita atenção e organização. Entre as diversas responsabilidades da gestão está o recebimento dos aluguéis dos locatários. Para garantir uma boa saúde financeira do empreendimento, é fundamental que esses pagamentos sejam feitos de forma regular e pontual. No entanto, sabemos que nem sempre isso acontece. Pensando nisso, proponho um desafio de tratamento de dados com o objetivo de analisar o atraso no pagamento de aluguéis no condomínio fictício de alguns moradores.

```

In [None]:
dados_projeto2.info()

In [None]:
dados_projeto2['datas_combinadas_pagamento'] = pd.to_datetime(dados_projeto2['datas_combinadas_pagamento'], format='%d/%m/%Y')
dados_projeto2['datas_de_pagamento'] = pd.to_datetime(dados_projeto2['datas_de_pagamento'], format='%d/%m/%Y')

In [None]:
dados_projeto2.info()

In [None]:
dados_projeto2['atraso'] = (dados_projeto2['datas_de_pagamento'] - dados_projeto2['datas_combinadas_pagamento']).dt.days

In [None]:
dados_projeto2

In [None]:
media_atraso = dados_projeto2.groupby(['apartamento'])['atraso'].mean()

In [None]:
media_atraso.idxmax()