## Cross Join Pandas, Datos de las visitas cruzadas con las fechas programadas de visita

### Carga de los archivos

In [2]:
import pandas as pd

# Abrir el archivo con la informacion de las rutas ya hechas, CSV con pandas
with open('/content/data_ruta_visitas_vendedor_Frecuencias.csv', 'r', encoding='utf-8', errors='ignore') as archivo:
    df_ruta_visitas_vendedor_Original = pd.read_csv(archivo)

# Abrir el archivo con las informacion de las fechas asignadas dado, el dia asignado y la frecuencia
df_calendario_Pimovil_Original = pd.read_csv('/content/Calendario_Pimovil.csv')

# Para exportarlo como un archivo Excel, (solo es para poder visualizarlo en excel online mas facil)
#df_ruta_visitas_vendedor.to_excel('/content/data_ruta_visitas_vendedor.xlsx', index=False)
#df_calendario_Pimovil.to_excel('/content/df_calendario_Pimovil.xlsx', index=False)

# Cargar de los datos de coordenadas y distancias de visitas
df_Distancias_Original = pd.read_excel("/content/data_ruta_visitas_vendedor_distancias.xlsx")

In [3]:
# Se escogen solo las columnas que son de interes para las rutas
nombres_rutas = ["Cod_Cliente","Inicio_Visita", "CRIT_CLIENTE_DIA_VISITA", "CRIT_CLIENTE_RUT_FREC"]

df_ruta_visitas_vendedor = df_ruta_visitas_vendedor_Original[nombres_rutas]
print(df_ruta_visitas_vendedor.dtypes)
df_ruta_visitas_vendedor.head(5)

Cod_Cliente                object
Inicio_Visita              object
CRIT_CLIENTE_DIA_VISITA    object
CRIT_CLIENTE_RUT_FREC      object
dtype: object


Unnamed: 0,Cod_Cliente,Inicio_Visita,CRIT_CLIENTE_DIA_VISITA,CRIT_CLIENTE_RUT_FREC
0,1000446009-001,4/25/2022 14:16,0,0
1,1000446009-001,4/25/2022 14:16,0,0
2,1098644246-001,5/9/2022 9:28,5,2
3,800020023-001,5/16/2022 13:22,5,1
4,901039911-001,5/23/2022 11:57,3,1


In [4]:
# Se escogen solo las columnas que son de interes, solo los codigos el resto es redundante
nombres_Pimovil = ["FECHA","COD_DIA VISITA", "COD SEMANAL", "COD QUINCENAL", "COD MENSUAL"]

df_calendario_Pimovil = df_calendario_Pimovil_Original[nombres_Pimovil]
#print(df_calendario_Pimovil.dtypes)
df_calendario_Pimovil.head(5)

Unnamed: 0,FECHA,COD_DIA VISITA,COD SEMANAL,COD QUINCENAL,COD MENSUAL
0,01/01/2023,1,1,2,4
1,02/01/2023,2,1,3,5
2,03/01/2023,3,1,3,5
3,04/01/2023,4,1,3,5
4,05/01/2023,5,1,3,5


In [5]:
# Funcion para transformar los numeros de los codigos, en el formato correcto
def generar_codigo(number):
  return "00"+str(number)

# Lista de nombres de las columnas que deseas convertir
columnas_a_convertir = ["COD_DIA VISITA", "COD SEMANAL", "COD QUINCENAL", "COD MENSUAL"]

#funcion .applymap para recorrer varias columnas y aplicar la tranformacion
df_calendario_Pimovil[columnas_a_convertir] = df_calendario_Pimovil_Original[columnas_a_convertir].applymap(generar_codigo)

# Verificar el tipo de dato después de la conversión
print(df_calendario_Pimovil.dtypes)
df_calendario_Pimovil.head(5)

FECHA             object
COD_DIA VISITA    object
COD SEMANAL       object
COD QUINCENAL     object
COD MENSUAL       object
dtype: object


A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_calendario_Pimovil[columnas_a_convertir] = df_calendario_Pimovil_Original[columnas_a_convertir].applymap(generar_codigo)


Unnamed: 0,FECHA,COD_DIA VISITA,COD SEMANAL,COD QUINCENAL,COD MENSUAL
0,01/01/2023,1,1,2,4
1,02/01/2023,2,1,3,5
2,03/01/2023,3,1,3,5
3,04/01/2023,4,1,3,5
4,05/01/2023,5,1,3,5


### Modificando las fechas

Se cambia el formato de las fechas para luego ser usado

In [6]:
#Cambios en para Pimovil
df_calendario_Pimovil["FECHA"] = pd.to_datetime(df_calendario_Pimovil["FECHA"], format="%d/%m/%Y")
# Se cambia el formato Datetime a Object
df_calendario_Pimovil["FECHA"] = df_calendario_Pimovil["FECHA"].dt.date

#Cambios para las Rutas
df_ruta_visitas_vendedor["Inicio_Visita"] = pd.to_datetime(df_ruta_visitas_vendedor_Original["Inicio_Visita"], format="%m/%d/%Y %H:%M")
#Se dejan solo registros para el año 2023
df_ruta_visitas_vendedor = df_ruta_visitas_vendedor[df_ruta_visitas_vendedor["Inicio_Visita"].dt.year == 2023]
# Ahora, extrae solo la parte de fecha (sin la hora) y se deja en formato Object
df_ruta_visitas_vendedor["Inicio_Visita"] = df_ruta_visitas_vendedor["Inicio_Visita"].dt.date

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_calendario_Pimovil["FECHA"] = pd.to_datetime(df_calendario_Pimovil["FECHA"], format="%d/%m/%Y")
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_calendario_Pimovil["FECHA"] = df_calendario_Pimovil["FECHA"].dt.date
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_ruta_visitas_vendedor["Inicio_V

In [7]:
# Se revisa que ambos tienen el mismo formato
print(df_ruta_visitas_vendedor.dtypes)
print(df_calendario_Pimovil.dtypes)

Cod_Cliente                object
Inicio_Visita              object
CRIT_CLIENTE_DIA_VISITA    object
CRIT_CLIENTE_RUT_FREC      object
dtype: object
FECHA             object
COD_DIA VISITA    object
COD SEMANAL       object
COD QUINCENAL     object
COD MENSUAL       object
dtype: object


In [8]:
df_ruta_visitas_vendedor

Unnamed: 0,Cod_Cliente,Inicio_Visita,CRIT_CLIENTE_DIA_VISITA,CRIT_CLIENTE_RUT_FREC
109,1070597717-001,2023-01-04,006,002
110,1004120709-001,2023-01-14,002,001
111,1130620140-001,2023-02-01,006,001
112,1130620140-002,2023-02-02,002,001
113,1002800026-001,2023-02-08,000,000
...,...,...,...,...
10588,39676086-001,2023-09-14,005,001
10589,901244419-001,2023-09-14,003,003
10590,40218829-001,2023-09-14,005,001
10591,49718633-001,2023-09-14,003,002


In [9]:
df_calendario_Pimovil

Unnamed: 0,FECHA,COD_DIA VISITA,COD SEMANAL,COD QUINCENAL,COD MENSUAL
0,2023-01-01,001,001,002,004
1,2023-01-02,002,001,003,005
2,2023-01-03,003,001,003,005
3,2023-01-04,004,001,003,005
4,2023-01-05,005,001,003,005
...,...,...,...,...,...
360,2023-12-27,004,001,002,004
361,2023-12-28,005,001,002,004
362,2023-12-29,006,001,002,004
363,2023-12-30,007,001,002,004


### Agrupando las fechas por "Cod_Cliente" de las Rutas

In [10]:
# Agrupa las fechas por Cod_cliente y crea una serie de listas con las fechas de visita
fechas_agrupadas = df_ruta_visitas_vendedor.groupby("Cod_Cliente")["Inicio_Visita"].apply(list).reset_index()

# Renombra la columna resultante
fechas_agrupadas.rename(columns={"Inicio_Visita": "Fechas_agrupadas"}, inplace=True)
fechas_agrupadas

Unnamed: 0,Cod_Cliente,Fechas_agrupadas
0,1000007753-001,"[2023-05-03, 2023-05-24, 2023-06-05, 2023-06-2..."
1,1000019930-001,"[2023-05-11, 2023-05-17, 2023-05-23]"
2,1000191943-001,[2023-08-11]
3,1000209875-001,"[2023-07-27, 2023-07-31]"
4,1000255535-001,[2023-05-16]
...,...,...
2791,98637073-001,[2023-05-25]
2792,98641432-001,"[2023-04-11, 2023-05-16, 2023-05-23, 2023-05-3..."
2793,98676977-001,"[2023-04-25, 2023-05-10, 2023-05-19]"
2794,98677524-001,"[2023-05-02, 2023-06-01, 2023-07-11]"


In [11]:
# Agrupar por "Cod_Cliente" y codigos dia y frecuan se aplica una función que obtenga códigos distintos
grupos_codigo = df_ruta_visitas_vendedor.groupby("Cod_Cliente").agg({
    "CRIT_CLIENTE_DIA_VISITA": pd.Series.unique,
    "CRIT_CLIENTE_RUT_FREC": pd.Series.unique
}).reset_index()

# Renombrar las columnas resultantes si es necesario
grupos_codigo.rename(columns={"CRIT_CLIENTE_DIA_VISITA": "Codigo_Dia", "CRIT_CLIENTE_RUT_FREC": "Codigo_Frecuencia"}, inplace=True)

grupos_codigo

Unnamed: 0,Cod_Cliente,Codigo_Dia,Codigo_Frecuencia
0,1000007753-001,[002],[004]
1,1000019930-001,[000],[000]
2,1000191943-001,[000],[000]
3,1000209875-001,[000],[000]
4,1000255535-001,[005],[001]
...,...,...,...
2791,98637073-001,[005],[005]
2792,98641432-001,[003],[001]
2793,98676977-001,[000],[000]
2794,98677524-001,[003],[002]


In [12]:
ab = ['Codigo_Dia', 'Codigo_Frecuencia']
grupos_codigo[ab] = grupos_codigo[ab].applymap(lambda x: x[0])
grupos_codigo

Unnamed: 0,Cod_Cliente,Codigo_Dia,Codigo_Frecuencia
0,1000007753-001,002,004
1,1000019930-001,000,000
2,1000191943-001,000,000
3,1000209875-001,000,000
4,1000255535-001,005,001
...,...,...,...
2791,98637073-001,005,005
2792,98641432-001,003,001
2793,98676977-001,000,000
2794,98677524-001,003,002


In [13]:
# Se combinan los 2 dataframes de los codigos y de las fechas en uno solo teniendo en cuenta el "Cod_Cliente"
df_ruta_visitas_vendedor_Agrupado = pd.merge(fechas_agrupadas, grupos_codigo, on="Cod_Cliente", how="left")
df_ruta_visitas_vendedor_Agrupado

Unnamed: 0,Cod_Cliente,Fechas_agrupadas,Codigo_Dia,Codigo_Frecuencia
0,1000007753-001,"[2023-05-03, 2023-05-24, 2023-06-05, 2023-06-2...",002,004
1,1000019930-001,"[2023-05-11, 2023-05-17, 2023-05-23]",000,000
2,1000191943-001,[2023-08-11],000,000
3,1000209875-001,"[2023-07-27, 2023-07-31]",000,000
4,1000255535-001,[2023-05-16],005,001
...,...,...,...,...
2791,98637073-001,[2023-05-25],005,005
2792,98641432-001,"[2023-04-11, 2023-05-16, 2023-05-23, 2023-05-3...",003,001
2793,98676977-001,"[2023-04-25, 2023-05-10, 2023-05-19]",000,000
2794,98677524-001,"[2023-05-02, 2023-06-01, 2023-07-11]",003,002


### Agrupando las fechas por Dia y Frecuencia de Pimovil

In [22]:
# Usar el método .melt() para "desapilar" las columnas de códigos
df_calendario_Pimovil_UnaTabla = pd.melt(df_calendario_Pimovil, id_vars=["FECHA", "COD_DIA VISITA"], value_vars=["COD SEMANAL",	"COD QUINCENAL",	"COD MENSUAL"], var_name="Tipo_Codigo", value_name="Codigo_Frecuencia")

# Cambiar el nombre de la columna utilizando el método .rename()
df_calendario_Pimovil_UnaTabla.rename(columns={'COD_DIA VISITA': 'Codigo_Dia', 'FECHA': 'Fechas_visitas_calendario'}, inplace=True)

df_calendario_Pimovil_UnaTabla

Unnamed: 0,Fechas_visitas_calendario,Codigo_Dia,Tipo_Codigo,Codigo_Frecuencia
0,2023-01-01,001,COD SEMANAL,001
1,2023-01-02,002,COD SEMANAL,001
2,2023-01-03,003,COD SEMANAL,001
3,2023-01-04,004,COD SEMANAL,001
4,2023-01-05,005,COD SEMANAL,001
...,...,...,...,...
1090,2023-12-27,004,COD MENSUAL,004
1091,2023-12-28,005,COD MENSUAL,004
1092,2023-12-29,006,COD MENSUAL,004
1093,2023-12-30,007,COD MENSUAL,004


In [20]:
# Agrupa por las columnas "Columna1" y "Columna2" y aplica la función list() para obtener las fechas en una lista
df_calendario_Pimovil_Agrupado = df_calendario_Pimovil_UnaTabla.groupby(["Codigo_Dia", "Codigo_Frecuencia"])["Fechas_visitas_calendario"].apply(list).reset_index()

df_calendario_Pimovil_Agrupado.head(5)


Unnamed: 0,Codigo_Dia,Codigo_Frecuencia,Fechas_visitas_calendario
0,1,1,"[2023-01-01, 2023-01-08, 2023-01-15, 2023-01-2..."
1,1,2,"[2023-01-01, 2023-01-15, 2023-01-29, 2023-02-1..."
2,1,3,"[2023-01-08, 2023-01-22, 2023-02-05, 2023-02-1..."
3,1,4,"[2023-01-01, 2023-01-29, 2023-02-26, 2023-03-2..."
4,1,5,"[2023-01-08, 2023-02-05, 2023-03-05, 2023-04-0..."


In [19]:
df_ruta_visitas_vendedor_Agrupado.head(5)

Unnamed: 0,Cod_Cliente,Fechas_agrupadas,Codigo_Dia,Codigo_Frecuencia
0,1000007753-001,"[2023-05-03, 2023-05-24, 2023-06-05, 2023-06-2...",2,4
1,1000019930-001,"[2023-05-11, 2023-05-17, 2023-05-23]",0,0
2,1000191943-001,[2023-08-11],0,0
3,1000209875-001,"[2023-07-27, 2023-07-31]",0,0
4,1000255535-001,[2023-05-16],5,1


### Cross Join entre la info de los puntos, con sus visitas y las visitas asignadas

In [None]:
# Cross Join
# Realiza la operación de cruce (merge) en función de las columnas "Codigo_Dia", "Codigo_Frecuencia"
resultado = pd.merge(df_ruta_visitas_vendedor_Agrupado, df_calendario_Pimovil_Agrupado, on=["Codigo_Dia", "Codigo_Frecuencia"], how="inner")

# "how" especifica el tipo de cruce, puede ser "inner", "left", "right" o "outer", dependiendo de tu necesidad

In [None]:
resultado

Unnamed: 0,Cod_Cliente,Fechas_agrupadas,Codigo_Dia,Codigo_Frecuencia,Fechas_Asignadas
0,1000007753-001,"[2023-05-03, 2023-05-24, 2023-06-05, 2023-06-2...",002,004,"[2023-01-23, 2023-02-20, 2023-03-20, 2023-04-1..."
1,1007806210-001,"[2023-04-22, 2023-05-17, 2023-05-17, 2023-05-1...",002,004,"[2023-01-23, 2023-02-20, 2023-03-20, 2023-04-1..."
2,1010024328-001,"[2023-07-15, 2023-07-15, 2023-08-11, 2023-09-0...",002,004,"[2023-01-23, 2023-02-20, 2023-03-20, 2023-04-1..."
3,1010122519-001,"[2023-08-23, 2023-08-23, 2023-08-28]",002,004,"[2023-01-23, 2023-02-20, 2023-03-20, 2023-04-1..."
4,1016060030-001,"[2023-09-11, 2023-09-11]",002,004,"[2023-01-23, 2023-02-20, 2023-03-20, 2023-04-1..."
...,...,...,...,...,...
2445,901506475-001,[2023-05-18],002,005,"[2023-01-02, 2023-01-30, 2023-02-27, 2023-03-2..."
2446,860533413-113,[2023-05-08],007,007,"[2023-01-21, 2023-02-18, 2023-03-18, 2023-04-1..."
2447,860533413-115,"[2023-04-14, 2023-05-05]",007,007,"[2023-01-21, 2023-02-18, 2023-03-18, 2023-04-1..."
2448,890106280-001,[2023-04-03],007,007,"[2023-01-21, 2023-02-18, 2023-03-18, 2023-04-1..."


In [None]:
resultado2 = df_ruta_visitas_vendedor.merge(resultado)
resultado2 = resultado2.iloc[:, [0, 1, 4, 5, 6, 7]]
resultado2

Unnamed: 0,Cod_Cliente,Inicio_Visita,Fechas_agrupadas,Codigo_Dia,Codigo_Frecuencia,Fechas_Asignadas
0,1070597717-001,2023-01-04,"[2023-01-04, 2023-05-10]",006,002,"[2023-01-13, 2023-01-27, 2023-02-10, 2023-02-2..."
1,1070597717-001,2023-05-10,"[2023-01-04, 2023-05-10]",006,002,"[2023-01-13, 2023-01-27, 2023-02-10, 2023-02-2..."
2,1004120709-001,2023-01-14,[2023-01-14],002,001,"[2023-01-02, 2023-01-09, 2023-01-16, 2023-01-2..."
3,1130620140-001,2023-02-01,"[2023-02-01, 2023-02-18, 2023-03-29]",006,001,"[2023-01-06, 2023-01-13, 2023-01-20, 2023-01-2..."
4,1130620140-001,2023-02-18,"[2023-02-01, 2023-02-18, 2023-03-29]",006,001,"[2023-01-06, 2023-01-13, 2023-01-20, 2023-01-2..."
...,...,...,...,...,...,...
9646,901006397-002,2023-09-13,[2023-09-13],003,001,"[2023-01-03, 2023-01-10, 2023-01-17, 2023-01-2..."
9647,901226337-001,2023-09-13,[2023-09-13],006,003,"[2023-01-06, 2023-01-20, 2023-02-03, 2023-02-1..."
9648,1068663151-001,2023-09-13,[2023-09-13],006,001,"[2023-01-06, 2023-01-13, 2023-01-20, 2023-01-2..."
9649,901461768-002,2023-09-14,[2023-09-14],003,001,"[2023-01-03, 2023-01-10, 2023-01-17, 2023-01-2..."


In [None]:
# df = resultado2[resultado2['Cod_Cliente'] == '1130620140-001']
# df

### Cross Join con las fechas de visitas hechas y la ubicacion de las visitas y su distancia

In [None]:
df_Distancias = df_Distancias_Original.copy()
df_Distancias

Unnamed: 0,Cod_Cliente,Inicio_Visita,Logintud_Registrada,Latitud_Registrada,LOG_ERP,LAT_ERP,Distancia Eucladiana,Distancia Manhattan,Distancia Haversine
0,1000446009-001,2022-04-25,-75.593349,6.270108,,,,,
1,1000446009-001,2022-04-25,-75.593349,6.270108,,,,,
2,1098644246-001,2022-05-09,-73.126588,7.087807,-73.114092,7.109181,2750.767625,3759.733003,2747.677001
3,800020023-001,2022-05-16,-75.508666,10.387434,-75.547839,10.428075,6233.969801,8813.028035,6226.965567
4,901039911-001,2022-05-23,-76.532807,3.402101,-76.510580,3.444792,5355.775430,7222.117716,5349.757933
...,...,...,...,...,...,...,...,...,...
10588,39676086-001,2023-09-14,-73.635532,4.137767,-73.634408,4.153317,1735.597413,1855.868268,1733.647387
10589,901244419-001,2023-09-14,-76.633978,7.878953,-76.727832,8.093848,26063.797510,34268.715802,26034.511028
10590,40218829-001,2023-09-14,-73.634452,4.153248,-73.634484,4.153183,8.108519,10.808225,8.099409
10591,49718633-001,2023-09-14,-73.245492,10.476427,-73.250887,10.469716,952.260036,1337.581199,951.190126


In [None]:
df_Distancias.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 10593 entries, 0 to 10592
Data columns (total 9 columns):
 #   Column                Non-Null Count  Dtype  
---  ------                --------------  -----  
 0   Cod_Cliente           10593 non-null  object 
 1   Inicio_Visita         10593 non-null  object 
 2   Logintud_Registrada   10593 non-null  float64
 3   Latitud_Registrada    10593 non-null  float64
 4   LOG_ERP               10297 non-null  float64
 5   LAT_ERP               10297 non-null  float64
 6   Distancia Eucladiana  10297 non-null  float64
 7   Distancia Manhattan   10297 non-null  float64
 8   Distancia Haversine   10297 non-null  float64
dtypes: float64(7), object(2)
memory usage: 744.9+ KB


In [None]:
resultado2.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 9651 entries, 0 to 9650
Data columns (total 6 columns):
 #   Column             Non-Null Count  Dtype 
---  ------             --------------  ----- 
 0   Cod_Cliente        9651 non-null   object
 1   Inicio_Visita      9651 non-null   object
 2   Fechas_agrupadas   9651 non-null   object
 3   Codigo_Dia         9651 non-null   object
 4   Codigo_Frecuencia  9651 non-null   object
 5   Fechas_Asignadas   9651 non-null   object
dtypes: object(6)
memory usage: 527.8+ KB


In [None]:
resultado2['Cod_Cliente'].unique


<bound method Series.unique of 0       1070597717-001
1       1070597717-001
2       1004120709-001
3       1130620140-001
4       1130620140-001
             ...      
9646     901006397-002
9647     901226337-001
9648    1068663151-001
9649     901461768-002
9650     890000381-001
Name: Cod_Cliente, Length: 9651, dtype: object>

In [None]:
df_Distancias['Cod_Cliente'].unique

<bound method Series.unique of 0        1000446009-001
1        1000446009-001
2        1098644246-001
3         800020023-001
4         901039911-001
              ...      
10588      39676086-001
10589     901244419-001
10590      40218829-001
10591      49718633-001
10592     900977070-001
Name: Cod_Cliente, Length: 10593, dtype: object>

In [None]:
resultado_final = df_Distancias.merge(resultado2)
resultado_final

Unnamed: 0,Cod_Cliente,Inicio_Visita,Logintud_Registrada,Latitud_Registrada,LOG_ERP,LAT_ERP,Distancia Eucladiana,Distancia Manhattan,Distancia Haversine,Fechas_agrupadas,Codigo_Dia,Codigo_Frecuencia,Fechas_Asignadas


In [None]:

# Realiza la unión (merge) en función de las columnas "clave1" y "clave2" en ambos DataFrames
resultado_final2 = pd.merge( resultado2, df_Distancias, on=["Cod_Cliente", "Inicio_Visita"], how="outer")

# "how" especifica el tipo de unión, puede ser "inner", "left", "right" o "outer", según tus necesidades
resultado_final2

Unnamed: 0,Cod_Cliente,Inicio_Visita,Fechas_agrupadas,Codigo_Dia,Codigo_Frecuencia,Fechas_Asignadas,Logintud_Registrada,Latitud_Registrada,LOG_ERP,LAT_ERP,Distancia Eucladiana,Distancia Manhattan,Distancia Haversine
0,1070597717-001,2023-01-04,"[2023-01-04, 2023-05-10]",006,002,"[2023-01-13, 2023-01-27, 2023-02-10, 2023-02-2...",,,,,,,
1,1070597717-001,2023-05-10,"[2023-01-04, 2023-05-10]",006,002,"[2023-01-13, 2023-01-27, 2023-02-10, 2023-02-2...",,,,,,,
2,1004120709-001,2023-01-14,[2023-01-14],002,001,"[2023-01-02, 2023-01-09, 2023-01-16, 2023-01-2...",,,,,,,
3,1130620140-001,2023-02-01,"[2023-02-01, 2023-02-18, 2023-03-29]",006,001,"[2023-01-06, 2023-01-13, 2023-01-20, 2023-01-2...",,,,,,,
4,1130620140-001,2023-02-18,"[2023-02-01, 2023-02-18, 2023-03-29]",006,001,"[2023-01-06, 2023-01-13, 2023-01-20, 2023-01-2...",,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...
20239,39676086-001,2023-09-14,,,,,-73.635532,4.137767,-73.634408,4.153317,1735.597413,1855.868268,1733.647387
20240,901244419-001,2023-09-14,,,,,-76.633978,7.878953,-76.727832,8.093848,26063.797510,34268.715802,26034.511028
20241,40218829-001,2023-09-14,,,,,-73.634452,4.153248,-73.634484,4.153183,8.108519,10.808225,8.099409
20242,49718633-001,2023-09-14,,,,,-73.245492,10.476427,-73.250887,10.469716,952.260036,1337.581199,951.190126


In [None]:
# df = resultado_final2[resultado_final2['Cod_Cliente'] == '1130620140-001']
# df
df_a = resultado2[resultado2['Cod_Cliente'] == '1070597717-001']
df_a

Unnamed: 0,Cod_Cliente,Inicio_Visita,Fechas_agrupadas,Codigo_Dia,Codigo_Frecuencia,Fechas_Asignadas
0,1070597717-001,2023-01-04,"[2023-01-04, 2023-05-10]",6,2,"[2023-01-13, 2023-01-27, 2023-02-10, 2023-02-2..."
1,1070597717-001,2023-05-10,"[2023-01-04, 2023-05-10]",6,2,"[2023-01-13, 2023-01-27, 2023-02-10, 2023-02-2..."


In [None]:
df_Distancias_prueba = df_Distancias.iloc[:, [0, 2, 3, 4, 5, 8]]
df_b = df_Distancias_prueba[df_Distancias['Cod_Cliente'] == '1070597717-001']
df_b

Unnamed: 0,Cod_Cliente,Logintud_Registrada,Latitud_Registrada,LOG_ERP,LAT_ERP,Distancia Haversine
109,1070597717-001,-74.178103,4.764812,-74.802976,4.302479,86258.541302
2878,1070597717-001,-74.806317,4.295503,-74.802976,4.302479,859.674245


In [None]:
df_a.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 2 entries, 0 to 1
Data columns (total 6 columns):
 #   Column             Non-Null Count  Dtype 
---  ------             --------------  ----- 
 0   Cod_Cliente        2 non-null      object
 1   Inicio_Visita      2 non-null      object
 2   Fechas_agrupadas   2 non-null      object
 3   Codigo_Dia         2 non-null      object
 4   Codigo_Frecuencia  2 non-null      object
 5   Fechas_Asignadas   2 non-null      object
dtypes: object(6)
memory usage: 112.0+ bytes


In [None]:
df_b.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 2 entries, 109 to 2878
Data columns (total 6 columns):
 #   Column               Non-Null Count  Dtype  
---  ------               --------------  -----  
 0   Cod_Cliente          2 non-null      object 
 1   Logintud_Registrada  2 non-null      float64
 2   Latitud_Registrada   2 non-null      float64
 3   LOG_ERP              2 non-null      float64
 4   LAT_ERP              2 non-null      float64
 5   Distancia Haversine  2 non-null      float64
dtypes: float64(5), object(1)
memory usage: 112.0+ bytes


In [None]:
df = pd.merge( df_a,df_b)
df

NameError: ignored

### Cross join para las fechas no agrupadas

In [32]:
df_ruta_visitas_vendedor_copy = df_ruta_visitas_vendedor.copy()
df_ruta_visitas_vendedor_copy.rename(columns={'CRIT_CLIENTE_DIA_VISITA': 'Codigo_Dia', 'CRIT_CLIENTE_RUT_FREC': 'Codigo_Frecuencia'}, inplace=True)
df_ruta_visitas_vendedor_copy['Inicio_Visita'] = pd.to_datetime(df_ruta_visitas_vendedor_copy['Inicio_Visita'])
df_ruta_visitas_vendedor_copy

Unnamed: 0,Cod_Cliente,Inicio_Visita,Codigo_Dia,Codigo_Frecuencia
109,1070597717-001,2023-01-04,006,002
110,1004120709-001,2023-01-14,002,001
111,1130620140-001,2023-02-01,006,001
112,1130620140-002,2023-02-02,002,001
113,1002800026-001,2023-02-08,000,000
...,...,...,...,...
10588,39676086-001,2023-09-14,005,001
10589,901244419-001,2023-09-14,003,003
10590,40218829-001,2023-09-14,005,001
10591,49718633-001,2023-09-14,003,002


In [34]:
df_calendario_Pimovil_UnaTabla_copy = df_calendario_Pimovil_UnaTabla.copy()
df_calendario_Pimovil_UnaTabla_copy = df_calendario_Pimovil_UnaTabla_copy.drop('Tipo_Codigo', axis=1)
df_calendario_Pimovil_UnaTabla_copy['Fechas_visitas_calendario'] = pd.to_datetime(df_calendario_Pimovil_UnaTabla_copy['Fechas_visitas_calendario'])
df_calendario_Pimovil_UnaTabla_copy

Unnamed: 0,Fechas_visitas_calendario,Codigo_Dia,Codigo_Frecuencia
0,2023-01-01,001,001
1,2023-01-02,002,001
2,2023-01-03,003,001
3,2023-01-04,004,001
4,2023-01-05,005,001
...,...,...,...
1090,2023-12-27,004,004
1091,2023-12-28,005,004
1092,2023-12-29,006,004
1093,2023-12-30,007,004


In [53]:
# Agrega una nueva columna "Cumple" al DataFrame de visitas realizadas
df_ruta_visitas_vendedor_copy['Cumple'] = False  # Inicialmente, asumimos que no se cumple en ninguna fecha

# Itera a través del DataFrame de visitas realizadas y marca las fechas que se cumplen
for index, row in df_ruta_visitas_vendedor_copy.iterrows():
    fecha_realizada = row['Inicio_Visita']
    codigo_dia = row['Codigo_Dia']
    codigo_frec = row['Codigo_Frecuencia']

    calendario_filtrado = df_calendario_Pimovil_UnaTabla_copy[(df_calendario_Pimovil_UnaTabla_copy['Codigo_Dia'] == codigo_dia) &
                                              (df_calendario_Pimovil_UnaTabla_copy['Codigo_Frecuencia'] == codigo_frec)]

    if fecha_realizada in calendario_filtrado['Fechas_visitas_calendario'].values:
        df_ruta_visitas_vendedor_copy.at[index, 'Cumple'] = True

# Mostrar el DataFrame de visitas realizadas con la columna "Cumple"
df_ruta_visitas_vendedor_copy


Unnamed: 0,Cod_Cliente,Inicio_Visita,Codigo_Dia,Codigo_Frecuencia,Cumple
109,1070597717-001,2023-01-04,006,002,False
110,1004120709-001,2023-01-14,002,001,False
111,1130620140-001,2023-02-01,006,001,False
112,1130620140-002,2023-02-02,002,001,False
113,1002800026-001,2023-02-08,000,000,False
...,...,...,...,...,...
10588,39676086-001,2023-09-14,005,001,True
10589,901244419-001,2023-09-14,003,003,False
10590,40218829-001,2023-09-14,005,001,True
10591,49718633-001,2023-09-14,003,002,False


In [54]:
merged_df = df_ruta_visitas_vendedor_copy.merge(df_calendario_Pimovil_UnaTabla_copy)
# merged_df
merged_df_unico = merged_df[merged_df['Cod_Cliente']== '1090371745-001']
merged_df_unico

Unnamed: 0,Cod_Cliente,Inicio_Visita,Codigo_Dia,Codigo_Frecuencia,Cumple,Fechas_visitas_calendario
130130,1090371745-001,2023-02-09,5,2,True,2023-01-12
130131,1090371745-001,2023-02-09,5,2,True,2023-01-26
130132,1090371745-001,2023-02-09,5,2,True,2023-02-09
130133,1090371745-001,2023-02-09,5,2,True,2023-02-23
130134,1090371745-001,2023-02-09,5,2,True,2023-03-09
130135,1090371745-001,2023-02-09,5,2,True,2023-03-23
130136,1090371745-001,2023-02-09,5,2,True,2023-04-06
130137,1090371745-001,2023-02-09,5,2,True,2023-04-20
130138,1090371745-001,2023-02-09,5,2,True,2023-05-04
130139,1090371745-001,2023-02-09,5,2,True,2023-05-18
