DataStalkers# 2020 2C 2da Oportunidad

(***) Una compañía de logística de insumos médicos es responsable de toda la cadena de abastecimiento de estos a hospitales. Esto se ha vuelto crítico en los últimos meses para asistir
al personal médico en su lucha contra la pandemia. La logística se realiza sobre categorías de productos que se preparan en lotes (en pallets) que son entregados a las instituciones médicas.
Es por ello que cuentan con información en los siguientes archivos csv:

```
lote.csv (id_lote, fecha_programada_entrega, id_destino, descripcion, id_categoria_insumo, cantidad_de_unidades_insumo)
```
```
destinos.csv  (id_destino, nombre, atencion_critica, region, latitud, longitud)
```
```
categorias_insumos.csv (id_categoria_insumo, nombre, uso_esencial)
```

El primer archivo cuenta con información de los lotes de insumos a entrega, indicando la fecha programada de entrega (en formato ```“YYYY-mm-dd”```), cual es el destino al que se va a realizar la entrega (id_destino), una descripción del contenido del lote y cantidad de unidades del insumo que se encuentran en el lote.
Además se aporta información de la categoría a la que corresponde el insumo.

Por otro lado se tiene información sobre los distintos destinos en los que se deben entregar los insumos, su nombre, a que región pertenece, latitud y longitud.
Se cuenta también con un indicador booleano que indica si ese destino es un centro de atencion crítica.

En el último archivo, contamos con la información de las distintas categorías de insumos, indicando el nombre de la categoría y la columna booleana "uso_esencial" que nos indica que el producto de esa categoría de insumo es de uso esencial.

Se desea:

a) Listar los nombres de 10 destinos de la región de “CABA” que durante el mes de septiembre recibieron la mayor cantidad de lotes de insumos de uso esencial.

b) Listar el resumen del plan de entregas para la transportadora del dia de hoy.

Este debe tener el siguiente formato 
```(fecha_programada_entrega, nombre_destino, cantidad_de_lotes_a_entregar).```

A su vez debe estar ordenado de tal forma que primero estén listados aquellos destinos que son de atención crítica.


In [1]:
# importacion general de librerias y de visualizacion (matplotlib y seaborn)
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

%matplotlib inline

plt.style.use('default') # haciendo los graficos un poco mas bonitos en matplotlib
#plt.rcParams['figure.figsize'] = (20, 10)

sns.set(style="whitegrid") # seteando tipo de grid en seaborn

pd.options.display.float_format = '{:20,.2f}'.format # suprimimos la notacion cientifica en los outputs

import warnings
warnings.filterwarnings('ignore')

In [2]:
# armamos el df de lote.csv
lote_data = {
        'id_lote': [1,2,3,4,5,6,7,8,9,10,11,12,13,14,15],
        'fecha_programada_entrega': ['2020-08-01','2020-09-01','2020-09-01','2020-08-01','2020-09-01','2020-10-01','2020-09-01','2020-09-01','2020-08-01','2020-08-01','2020-10-01','2020-09-01','2020-08-01','2020-08-01','2020-10-01'],
        'id_destino': [1,1,1,1,1,6,6,6,6,6,2,2,2,2,2],
        'descripcion': ['1','2','3','4','5','6','7','8','9','10','11','12','13','14','15'],
        'id_categoria_insumo': [1,1,1,1,1,2,2,2,2,2,2,3,3,3,3],
        'cantidad_de_unidades_insumo': [100,200,300,400,500,600,100,200,300,400,500,600,100,200,300],
}

df_lote = pd.DataFrame(lote_data, columns = lote_data.keys())

In [3]:
# armamos el df de destinos.csv
destinos_data = {
        'id_destino': [1,2,3,4,5,6,7,8,9,10,11,12,13,14,15],
        'nombre': ["Destino 1","Destino 2","Destino 3","Destino 4","Destino 5","Destino 6","Destino 7","Destino 8","Destino 9","Destino 10","Destino 11","Destino 12","Destino 13","Destino 14", "Destino 15"],
        'atencion_critica': [1,1,1,1,1,0,0,0,0,0,0,0,0,0,0],
        'region': ['CABA','CABA','CABA','CABA','CABA','PBA1','PBA1','PBA1','PBA1','PBA1','PBA1','PBA2','PBA2','PBA2','PBA2'],
        'latitud': [1,1,1,1,1,0,0,0,0,0,0,0,0,1,1],
        'longitud': [1,1,1,1,1,0,0,0,0,0,0,0,0,1,1],
}

df_destinos = pd.DataFrame(destinos_data, columns = destinos_data.keys())

In [4]:
# armamos el data frame de datos de productos
categorias_insumos_data = {
        'id_categoria_insumo': [1,2,3],
        'nombre': ['Categoria 1','Categoria 2','Categoria 3'],
        'uso_esencial': [1,0,1],
}

df_categorias = pd.DataFrame(categorias_insumos_data, columns = categorias_insumos_data.keys())

In [5]:
df_lote.head()

Unnamed: 0,id_lote,fecha_programada_entrega,id_destino,descripcion,id_categoria_insumo,cantidad_de_unidades_insumo
0,1,2020-08-01,1,1,1,100
1,2,2020-09-01,1,2,1,200
2,3,2020-09-01,1,3,1,300
3,4,2020-08-01,1,4,1,400
4,5,2020-09-01,1,5,1,500


In [9]:
df_destinos.head()

Unnamed: 0,id_destino,nombre,atencion_critica,region,latitud,longitud
0,1,Destino 1,1,CABA,1,1
1,2,Destino 2,1,CABA,1,1
2,3,Destino 3,1,CABA,1,1
3,4,Destino 4,1,CABA,1,1
4,5,Destino 5,1,CABA,1,1


In [7]:
df_categorias.head()

Unnamed: 0,id_categoria_insumo,nombre,uso_esencial
0,1,Categoria 1,1
1,2,Categoria 2,0
2,3,Categoria 3,1


a) Listar los nombres de 10 destinos de la región de “CABA” que durante el mes de septiembre recibieron la mayor cantidad de lotes de insumos de uso esencial.

In [10]:
df_destinos.loc[df_destinos['region']=='CABA']

Unnamed: 0,id_destino,nombre,atencion_critica,region,latitud,longitud
0,1,Destino 1,1,CABA,1,1
1,2,Destino 2,1,CABA,1,1
2,3,Destino 3,1,CABA,1,1
3,4,Destino 4,1,CABA,1,1
4,5,Destino 5,1,CABA,1,1


In [11]:
destinos_caba = df_destinos.loc[df_destinos['region']=='CABA',['id_destino','nombre']]

In [12]:
destinos_caba

Unnamed: 0,id_destino,nombre
0,1,Destino 1
1,2,Destino 2
2,3,Destino 3
3,4,Destino 4
4,5,Destino 5


In [13]:
categoria_esencial = df_categorias.loc[df_categorias['uso_esencial'] == 1, ['id_categoria_insumo']]

In [14]:
categoria_esencial

Unnamed: 0,id_categoria_insumo
0,1
2,3


In [15]:
df_lote['anio'] = pd.to_datetime(df_lote['fecha_programada_entrega']).dt.year

In [17]:
df_lote['mes'] = pd.to_datetime(df_lote['fecha_programada_entrega']).dt.month

In [18]:
df_lote_septiembre = df_lote.loc[(df_lote['mes'] == 9) & (df_lote['anio'] == 2020)]

In [19]:
df_lote_septiembre

Unnamed: 0,id_lote,fecha_programada_entrega,id_destino,descripcion,id_categoria_insumo,cantidad_de_unidades_insumo,anio,mes
1,2,2020-09-01,1,2,1,200,2020,9
2,3,2020-09-01,1,3,1,300,2020,9
4,5,2020-09-01,1,5,1,500,2020,9
6,7,2020-09-01,6,7,2,100,2020,9
7,8,2020-09-01,6,8,2,200,2020,9
11,12,2020-09-01,2,12,3,600,2020,9


In [26]:
lotes_esenciales = df_lote_septiembre.merge(categoria_esencial, how="inner")

In [27]:
lotes_esenciales

Unnamed: 0,id_lote,fecha_programada_entrega,id_destino,descripcion,id_categoria_insumo,cantidad_de_unidades_insumo,anio,mes
0,2,2020-09-01,1,2,1,200,2020,9
1,3,2020-09-01,1,3,1,300,2020,9
2,5,2020-09-01,1,5,1,500,2020,9
3,12,2020-09-01,2,12,3,600,2020,9


In [33]:
lotes_esenciales = lotes_esenciales.merge(destinos_caba, how='inner')

In [47]:
lotes_esenciales

Unnamed: 0,id_destino,nombre,id_lote,a
0,1,Destino 1,2,1
1,1,Destino 1,3,1
2,1,Destino 1,5,1
3,2,Destino 2,12,1


In [48]:
lotes_esenciales = lotes_esenciales[['id_destino','nombre','id_lote']]

In [60]:
lotes_esenciales.groupby(['id_destino','nombre']).agg('count')

Unnamed: 0_level_0,Unnamed: 1_level_0,id_lote
id_destino,nombre,Unnamed: 2_level_1
1,Destino 1,3
2,Destino 2,1


In [62]:
cantidad_lotes_esenciales = lotes_esenciales.groupby(['id_destino','nombre']).count().reset_index().rename(columns={'id_lote':'cantidad_lotes'})
#lotes_esenciales.groupby(['id_destino','nombre']).agg('count')

In [63]:
cantidad_lotes_esenciales

Unnamed: 0,id_destino,nombre,cantidad_lotes
0,1,Destino 1,3
1,2,Destino 2,1


In [64]:
cantidad_lotes_esenciales.nlargest(1,'cantidad_lotes')

Unnamed: 0,id_destino,nombre,cantidad_lotes
0,1,Destino 1,3



b) Listar el resumen del plan de entregas para la transportadora del dia de hoy.

Este debe tener el siguiente formato 
```(fecha_programada_entrega, nombre_destino, cantidad_de_lotes_a_entregar).```

A su vez debe estar ordenado de tal forma que primero estén listados aquellos destinos que son de atención crítica.

In [65]:
hoy = pd.to_datetime('2020-09-01')

In [66]:
df_lote['fecha_programada_entrega'] = pd.to_datetime(df_lote['fecha_programada_entrega'])

In [67]:
df_lote.info()


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 15 entries, 0 to 14
Data columns (total 8 columns):
 #   Column                       Non-Null Count  Dtype         
---  ------                       --------------  -----         
 0   id_lote                      15 non-null     int64         
 1   fecha_programada_entrega     15 non-null     datetime64[ns]
 2   id_destino                   15 non-null     int64         
 3   descripcion                  15 non-null     object        
 4   id_categoria_insumo          15 non-null     int64         
 5   cantidad_de_unidades_insumo  15 non-null     int64         
 6   anio                         15 non-null     int64         
 7   mes                          15 non-null     int64         
dtypes: datetime64[ns](1), int64(6), object(1)
memory usage: 1.1+ KB


In [75]:
lotes_hoy = df_lote.loc[df_lote['fecha_programada_entrega'] == hoy,['fecha_programada_entrega', 'id_destino']]

In [76]:
lotes_hoy

Unnamed: 0,fecha_programada_entrega,id_destino
1,2020-09-01,1
2,2020-09-01,1
4,2020-09-01,1
6,2020-09-01,6
7,2020-09-01,6
11,2020-09-01,2


In [72]:
destinos = df_destinos.loc[:,['id_destino','nombre','atencion_critica']]

In [73]:
destinos

Unnamed: 0,id_destino,nombre,atencion_critica
0,1,Destino 1,1
1,2,Destino 2,1
2,3,Destino 3,1
3,4,Destino 4,1
4,5,Destino 5,1
5,6,Destino 6,0
6,7,Destino 7,0
7,8,Destino 8,0
8,9,Destino 9,0
9,10,Destino 10,0


In [78]:
lotes_hoy_con_destino = lotes_hoy.merge(destinos, how='left')

In [79]:
lotes_hoy_con_destino

Unnamed: 0,fecha_programada_entrega,id_destino,nombre,atencion_critica
0,2020-09-01,1,Destino 1,1
1,2020-09-01,1,Destino 1,1
2,2020-09-01,1,Destino 1,1
3,2020-09-01,6,Destino 6,0
4,2020-09-01,6,Destino 6,0
5,2020-09-01,2,Destino 2,1


In [83]:
lotes_hoy_con_destino['cantidad_de_lotes_a_entregar'] = 1

In [86]:
lotes_hoy_con_destino = lotes_hoy_con_destino.groupby(['fecha_programada_entrega', 'id_destino', 'nombre', 'atencion_critica']).count().reset_index()

In [88]:
lotes_hoy_con_destino = lotes_hoy_con_destino.sort_values('atencion_critica',ascending=False)

In [89]:
lotes_hoy_con_destino

Unnamed: 0,fecha_programada_entrega,id_destino,nombre,atencion_critica,cantidad_de_lotes_a_entregar
0,2020-09-01,1,Destino 1,1,3
1,2020-09-01,2,Destino 2,1,1
2,2020-09-01,6,Destino 6,0,2


In [92]:
resultado_final = lotes_hoy_con_destino.rename(columns={'nombre':'nombre_destino'}).loc[:, ['fecha_programada_entrega','nombre_destino','cantidad_de_lotes_a_entregar']]

In [93]:
resultado_final

Unnamed: 0,fecha_programada_entrega,nombre_destino,cantidad_de_lotes_a_entregar
0,2020-09-01,Destino 1,3
1,2020-09-01,Destino 2,1
2,2020-09-01,Destino 6,2
