<a href="https://colab.research.google.com/github/francisco-gamez/learning_NumPy/blob/main/Ventas_Online.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Proyecto Desafío 1: Ventas online

Analizar los resultados de un evento con los clientes de una empresa de venta online. Se recopiló un conjunto de datos que contiene los clientes que más gastaron en productos durante los 5 días de ventas, que es la duración del evento. Este análisis identificará al cliente con la mayor compra esta semana, quien recibirá un premio de la tienda, y posteriormente, puede ayudar a la empresa a crear nuevas estrategias para atraer más clientes.

In [103]:
import pandas as pd
import numpy as np

In [104]:
ventas = pd.read_json('/content/datos_ventas_clientes.json')

In [105]:
ventas

Unnamed: 0,dados_vendas
0,"{'Data de venda': '06/06/2022', 'Cliente': ['@..."
1,"{'Data de venda': '07/06/2022', 'Cliente': ['I..."
2,"{'Data de venda': '08/06/2022', 'Cliente': ['I..."
3,"{'Data de venda': '09/06/2022', 'Cliente': ['J..."
4,"{'Data de venda': '10/06/2022', 'Cliente': ['M..."


In [106]:
ventas = pd.json_normalize(ventas['dados_vendas'])
ventas.head()

Unnamed: 0,Data de venda,Cliente,Valor da compra
0,06/06/2022,"[@ANA _LUCIA 321, DieGO ARMANDIU 210, DieGO AR...","[R$ 836,5, R$ 573,33, R$ 392,8, R$ 512,34]"
1,07/06/2022,"[Isabely JOanes 738, Isabely JOanes 738, Isabe...","[R$ 825,31, R$ 168,07, R$ 339,18, R$ 314,69]"
2,08/06/2022,"[Isabely JOanes 738, JOãO Gabriel 671, Julya m...","[R$ 682,05, R$ 386,34, R$ 622,65, R$ 630,79]"
3,09/06/2022,"[Julya meireles 914, MaRIA Julia 444, MaRIA Ju...","[R$ 390,3, R$ 759,16, R$ 334,47, R$ 678,78]"
4,10/06/2022,"[MaRIA Julia 444, PEDRO PASCO 812, Paulo castr...","[R$ 314,24, R$ 311,15, R$ 899,16, R$ 885,24]"


In [107]:
#Eliminar datos en listas dentro del DataFrame;
ventas = ventas.explode(['Cliente','Valor da compra'])
ventas.reset_index(inplace= True, drop=True)
#Verificar tipos de datos;
#ventas.info()
#Transformar la columna numérica a tipo numérico.
ventas['Valor da compra'] = ventas['Valor da compra'].apply(lambda x: x.replace('R$','').replace(',','').strip()).astype(np.float64)
ventas.info()



<class 'pandas.core.frame.DataFrame'>
RangeIndex: 20 entries, 0 to 19
Data columns (total 3 columns):
 #   Column           Non-Null Count  Dtype  
---  ------           --------------  -----  
 0   Data de venda    20 non-null     object 
 1   Cliente          20 non-null     object 
 2   Valor da compra  20 non-null     float64
dtypes: float64(1), object(2)
memory usage: 612.0+ bytes


In [141]:
ventas['Cliente'] = ventas['Cliente'].str.lower().replace('[^a-z]',' ',regex=True)
ventas

Unnamed: 0,Data de venda,Cliente,Valor da compra
0,06/06/2022,ana lucia,8365.0
1,06/06/2022,diego armandiu,57333.0
2,06/06/2022,diego armandiu,3928.0
3,06/06/2022,diego armandiu,51234.0
4,07/06/2022,isabely joanes,82531.0
5,07/06/2022,isabely joanes,16807.0
6,07/06/2022,isabely joanes,33918.0
7,07/06/2022,isabely joanes,31469.0
8,08/06/2022,isabely joanes,68205.0
9,08/06/2022,jo o gabriel,38634.0


In [146]:
ventas['Data de venda'] = pd.to_datetime(ventas['Data de venda'])
ventas.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 20 entries, 0 to 19
Data columns (total 3 columns):
 #   Column           Non-Null Count  Dtype         
---  ------           --------------  -----         
 0   Data de venda    20 non-null     datetime64[ns]
 1   Cliente          20 non-null     object        
 2   Valor da compra  20 non-null     float64       
dtypes: datetime64[ns](1), float64(1), object(1)
memory usage: 612.0+ bytes


In [147]:
total_compras = ventas.groupby(['Cliente'])['Valor da compra'].sum()
total_compras

Unnamed: 0_level_0,Valor da compra
Cliente,Unnamed: 1_level_1
ana lucia,8365.0
diego armandiu,112495.0
isabely joanes,232930.0
jo o gabriel,38634.0
julya meireles,129247.0
maria julia,208665.0
paulo castro,89916.0
pedro pasco,31115.0
thiago fritzz,88524.0


# Proyecto Desafío 2: Administración de *Condominios*

Administrar condominios es una tarea que requiere mucha atención y organización. Entre las diversas responsabilidades de gestión se encuentra el cobro del alquiler a los inquilinos. Para garantizar la buena salud financiera de la empresa, es fundamental que estos pagos se realicen de forma regular y puntual. Sin embargo, sabemos que esto no siempre sucede.

Teniendo esto en cuenta, propongo un desafío de procesamiento de datos con el objetivo de analizar el retraso en el pago del alquiler en el condominio de algunos residentes.

In [94]:
datos = pd.read_json('/content/dados_locacao.json')

In [95]:
datos = pd.json_normalize(datos['dados_locacao'])
datos.head()

Unnamed: 0,apartamento,datas_combinadas_pagamento,datas_de_pagamento,valor_aluguel
0,A101 (blocoAP),"[01/06/2022, 01/07/2022]","[05/06/2022, 03/07/2022]","[$ 1000,0 reais, $ 2500,0 reais]"
1,A102 (blocoAP),"[02/06/2022, 02/07/2022]","[02/06/2022, 06/07/2022]","[$ 1100,0 reais, $ 2600,0 reais]"
2,B201 (blocoAP),"[03/06/2022, 03/07/2022]","[07/06/2022, 03/07/2022]","[$ 1200,0 reais, $ 2700,0 reais]"
3,B202 (blocoAP),"[04/06/2022, 04/07/2022]","[07/06/2022, 05/07/2022]","[$ 1300,0 reais, $ 2800,0 reais]"
4,C301 (blocoAP),"[05/06/2022, 05/07/2022]","[10/06/2022, 09/07/2022]","[$ 1400,0 reais, $ 2900,0 reais]"


In [96]:
columnas = list(datos.columns)
datos = datos.explode(columnas[1:])
datos.reset_index(inplace=True, drop=True)
datos.head()


Unnamed: 0,apartamento,datas_combinadas_pagamento,datas_de_pagamento,valor_aluguel
0,A101 (blocoAP),01/06/2022,05/06/2022,"$ 1000,0 reais"
1,A101 (blocoAP),01/07/2022,03/07/2022,"$ 2500,0 reais"
2,A102 (blocoAP),02/06/2022,02/06/2022,"$ 1100,0 reais"
3,A102 (blocoAP),02/07/2022,06/07/2022,"$ 2600,0 reais"
4,B201 (blocoAP),03/06/2022,07/06/2022,"$ 1200,0 reais"


In [97]:
datos['valor_aluguel'] = datos['valor_aluguel'].apply(lambda x: x.replace('$','').replace('reais','').replace(',','').strip())
datos['valor_aluguel'] = datos['valor_aluguel'].astype(np.float64)
datos.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 30 entries, 0 to 29
Data columns (total 4 columns):
 #   Column                      Non-Null Count  Dtype  
---  ------                      --------------  -----  
 0   apartamento                 30 non-null     object 
 1   datas_combinadas_pagamento  30 non-null     object 
 2   datas_de_pagamento          30 non-null     object 
 3   valor_aluguel               30 non-null     float64
dtypes: float64(1), object(3)
memory usage: 1.1+ KB


In [144]:
datos['apartamento'] = datos['apartamento'].replace('\(blocoAP\)',' ',regex=True)

In [154]:
datos['datas_combinadas_pagamento'] = pd.to_datetime(datos['datas_combinadas_pagamento'], format='%d/%m/%Y')

In [160]:
datos['datas_de_pagamento'] = pd.to_datetime(datos['datas_de_pagamento'],format= '%d/%m/%Y')


In [162]:
datos['atraso'] = (datos['datas_de_pagamento'] - datos['datas_combinadas_pagamento']).dt.days

In [163]:
media_atraso = datos.groupby(['apartamento'])['atraso'].mean()
media_atraso

Unnamed: 0_level_0,atraso
apartamento,Unnamed: 1_level_1
A101,3.0
A102,2.0
B201,2.0
B202,2.0
C301,4.5
C302,4.0
D401,1.0
D402,4.0
E501,0.5
E502,4.0
