### ¿Qué hace este script?

#### Para cada AP:
* usuarios.usuariosConectados(corresponde al total de conexiones), usuarios.sesiones_Usuarios (Corresponde al total de usuarios)
* Información detallada de los dispositivos conectados en el rango de fecha procesado: usuarios.dispositivo.mac, usuarios.dispositivo.tipo, usuarios.dispositivo.marca, usuarios.dispositivo.tecnologia, usuarios.dispositivo.sisOperativo.

#### Para cada sitio: 
* Totales por características de dispositivos: usuarios.sistemaOperativoUsuarios, usuarios.tipoDispositivoUsuarios, usuarios.marcaTerminal, usuarios.tecnologiaTerminal, usuarios.totales.dispositivos (Este ultimo guarda el total)
* usuarios.usoServicioInternetSitio es la suma en Gb consumido discriminado por usuarios.detallesTecnologiasTerminales (Bandas 2.4 o 5 GHz)
* usuarios.conteoDispositivos el cual indica el total de dispositivos conectados (Es lo mismo que total de conexiones)
* usuarios.usuariosNuevos (Esta tenía antes Nuevos y Recurrentes, pero ahora solo tiene Nuevos por solicitud de BI)
* usuarios.totales.usuariosNuevos, tiene el total de usuarios nuevos (el script por el momento solo totaliza nuevos siempre y cuando no se corra historicos)

In [258]:
from elasticsearch import Elasticsearch, helpers
from ssl import create_default_context
import pandas as pd
import numpy as np
from datetime import datetime, timedelta
import parametros
import re
import random
import time

## Conectando a ElasticSearch

La ultima línea se utiliza para garantizar la ejecución de la consulta
* timeout es el tiempo para cada ejecución
* max_retries el número de intentos si la conexión falla
* retry_on_timeout para activar los reitentos

In [259]:
context = create_default_context(cafile=parametros.cafile)
es = Elasticsearch(
    parametros.servidor,
    http_auth=(parametros.usuario_EC, parametros.password_EC),
    scheme="https",
    port=parametros.puerto,
    ssl_context=context,
    timeout=60, max_retries=3, retry_on_timeout=True
)

### Calculando fechas para la ejecución

* Se calculan las fechas para asociar al nombre del indice
* fecha_hoy es usada para concatenar al nombre del indice principal previa inserción

In [260]:
now = datetime.now()
fecha_hoy = str(now.strftime("%Y.%m.%d"))

### nombre de indice donde se insertará

In [261]:
indice = parametros.usuarios_tablero12_index
indice_control = parametros.tableros_mintic_control

### Funcion para construir JSON compatible con ElasticSearch

In [262]:
def filterKeys(document):
    return {key: document[key] for key in use_these_keys }

### Trae la ultima fecha para control de ejecución

Cuando en el rango de tiempo de la ejecución, no se insertan nuevos valores, las fecha maxima en indice mintic no aumenta, por tanto se usa esta fecha de control para garantizar que incremente el bucle de ejecución

In [263]:
total_docs = 1
try:
    response = es.search(
        index= indice_control,
        body={
               "_source": ['usuarios.fechaControl'],
              "query": {
                "bool": {
                  "filter": [
                  {
                    "exists": {
                      "field":"jerarquia-tablero12"
                    }
                  }
                  ]
                }
              }
        },
        size=total_docs
    )
    #print(es.info())
    elastic_docs = response["hits"]["hits"]
    fields = {}
    for num, doc in enumerate(elastic_docs):
        fecha_ejecucion = doc["_source"]['usuarios.fechaControl']
except:
    fecha_ejecucion = '2021-05-01 00:00:00'
if response["hits"]["hits"] == []:
    fecha_ejecucion = '2021-05-01 00:00:00'
print("ultima fecha para control de ejecucion:",fecha_ejecucion)

ultima fecha para control de ejecucion: 2021-06-01 00:50:00


### leyendo indice semilla-inventario

En el script que ingesta semilla, trae la información de los centros de conexión administrados. Para el indice principal se requiere:
* site_id como llave del centro de conexión.
* Datos geográficos (Departamento, municipio, centro poblado, sede, energía, latitud, longitud,COD_ISO, id_Beneficiario).

In [264]:
t1=time.time()
total_docs = 10000
try:
    response = es.search(
        index= parametros.semilla_inventario_index,
        body={
               "_source": ['site_id','nombre_municipio', 'nombre_departamento', 'nombre_centro_pob', 'nombreSede' 
                           , 'energiadesc', 'latitud', 'longitud', 'COD_ISO','id_Beneficiario']
        },
        size=total_docs
    )
    #print(es.info())
    elastic_docs = response["hits"]["hits"]
#     fields = {}
#     for num, doc in enumerate(elastic_docs):
#         source_data = doc["_source"]
#         for key, val in source_data.items():
#             try:
#                 fields[key] = np.append(fields[key], val)
#             except KeyError:
#                 fields[key] = np.array([val])

#     datos_semilla = pd.DataFrame(dict([ (k,pd.Series(v)) for k,v in fields.items() ])) #pd.DataFrame(fields)
    
    datos_semilla = pd.DataFrame([x["_source"] for x in elastic_docs])
    
except:
    exit()
    
t2=time.time()

In [265]:
datos_semilla

Unnamed: 0,nombreSede,longitud,latitud,COD_ISO,nombre_centro_pob,site_id,nombre_departamento,energiadesc,nombre_municipio,id_Beneficiario
0,I. E. SAN ANTONIO DE PIOJÓ SEDE LOS OLIVOS,-7320525,10039416,CO-ATL,LOS OLIVOS,22514-ZZZY767,ATLÁNTICO,RED INTERCONECTADA,PIOJÓ,22514
1,I.E. MARTILLO - SEDE PRINCIPAL,-7559734752,699780241,CO-ATL,KRA 4 NO 2A-15,22519-ZZZY558,ATLÁNTICO,SIN INFORMACIÓN,PONEDERA,22519
2,I.E. TECNICA AGROPECUARIA SAN CAYETANO DE GALL...,-75045541840,1083546085,CO-ATL,CRA. 5 N. 5 - 58,22538-ZZZY571,ATLÁNTICO,SIN INFORMACIÓN,SABANALARGA,22538
3,I.E. TÉCNICA JUAN V PADILLA,-7492334914,1079876297,CO-ATL,VEREDA EL VAIVEN,11130-ZZZY429,ATLÁNTICO,SIN INFORMACIÓN,JUAN DE ACOSTA,11130
4,I.E. TECNICA MARIA INMACULADA DE PITAL DE MEGUA,-7501111111,4710277778,CO-ATL,KR 15 11 96,74366-ZGYO061,ATLÁNTICO,SIN INFORMACIÓN,BARANOA,74366
...,...,...,...,...,...,...,...,...,...,...
6942,ESCUELA SANTA ISABEL,-73138349330,639026335,CO-VAU,COMUNIDAD SANTA ISABEL,67733-,VAUPÉS,SOLUCIÓN SOLAR,PACOA,67733
6943,ESCUELA RURAL DE SAN LUIS DE PIEDRA ÑI,-7007416384,008164385,CO-VAU,COMUNIDAD DE SAN LUIS,70622-,VAUPÉS,SIN INFORMACIÓN,PACOA,70622
6944,ESCUELA RURAL DE SANTA ROSA,,,CO-VAU,COMUNIDAD DE SANTA ROSA,70623-,VAUPÉS,SIN INFORMACIÓN,PACOA,70623
6945,ESCUELA RURAL DE TOAKA,-7125103723,1007644476,CO-VAU,COMUNIDAD DE TOAKA,70624-,VAUPÉS,SIN INFORMACIÓN,PACOA,70624


### Cambiando nombre de campos y generando location

* Se valida latitud y longitud. Luego se calcula campo location
* Se renombran los campos de semilla

In [266]:
def get_location(x):
    patron = re.compile('^(\-?\d+(\.\d+)?),\s*(\-?\d+(\.\d+)?)$') #patrón que debe cumplir
    if (not patron.match(x) is None):
        return x.replace(',','.')
    else:
        #Código a ejecutar si las coordenadas no son válidas
        return 'a'
datos_semilla['latitud'] = datos_semilla['latitud'].apply(get_location)
datos_semilla['longitud'] = datos_semilla['longitud'].apply(get_location)
datos_semilla = datos_semilla.drop(datos_semilla[(datos_semilla["longitud"]=='a') | (datos_semilla["latitud"]=='a')].index)
datos_semilla['usuarios.location'] = datos_semilla['latitud'] + ',' + datos_semilla['longitud']
datos_semilla['usuarios.location']=datos_semilla['usuarios.location'].str.replace('a,a','')
datos_semilla.drop(columns=['latitud','longitud'],inplace=True)

In [267]:
datos_semilla = datos_semilla.rename(columns={'lugar_cod' : 'usuarios.centroDigitalUsuarios'
                                            , 'nombre_municipio': 'usuarios.nombreMunicipio'
                                            , 'nombre_departamento' : 'usuarios.nombreDepartamento'
                                            , 'nombre_centro_pob': 'usuarios.localidad'
                                            , 'nombreSede' : 'usuarios.nomCentroDigital'
                                            , 'energiadesc' : 'usuarios.sistemaEnergia'
                                            , 'COD_ISO' : 'usuarios.codISO'
                                            , 'id_Beneficiario' : 'usuarios.idBeneficiario'})

Se descartan los registros que tengan la latitud y longitud vacía o no valida

In [268]:
datos_semilla = datos_semilla.drop(datos_semilla[(datos_semilla["usuarios.location"]=='')].index)

### leyendo indice cambium-devicedevices

De esta formas se asocia las MAC de dispositivos de red INDOOR y OUTDOOR
* site_id para cruzar con las misma llave de semilla.
* datos del dispositivo: mac, status, ip.
* ap_group para identificar si la conexión es indoor/outdoor

In [269]:
t1=time.time()
total_docs = 30000
try:
    response = es.search(
        index= parametros.cambium_d_d_index,
        body={
                    "_source": ["site_id","mac","status","ip","ap_group"]
                  , "query": {
                    "match_all": {}
                  }
        },
        size=total_docs
    )
    #print(es.info())
    elastic_docs = response["hits"]["hits"]
#     fields = {}
#     for num, doc in enumerate(elastic_docs):
#         source_data = doc["_source"]
#         for key, val in source_data.items():
#             try:
#                 fields[key] = np.append(fields[key], val)
#             except KeyError:
#                 fields[key] = np.array([val])

#     datos_dev = pd.DataFrame(dict([ (k,pd.Series(v)) for k,v in fields.items() ])) #pd.DataFrame(fields)
    
    datos_dev = pd.DataFrame([x["_source"] for x in elastic_docs])
    
    
except:
    exit()
    
t2=time.time()

In [270]:
datos_dev

Unnamed: 0,ap_group,ip,site_id,mac,status
0,OUTDOOR,172.25.92.108,43514-VZVF293,BC:A9:93:67:CB:44,online
1,INDOOR.,172.25.62.203,45764-ZZZY853,BC:E6:7C:5E:33:1B,online
2,OUTDOOR,172.25.131.4,36524-VZVF830,BC:A9:93:01:6B:DE,online
3,INDOOR.,172.25.131.3,36524-VZVF830,BC:A9:93:11:24:8A,online
4,OUTDOOR,172.25.62.205,45764-ZZZY853,BC:A9:93:0C:E2:B8,online
...,...,...,...,...,...
4880,OUTDOOR,172.25.22.36,32405-ZGYO343,BC:E6:7C:4E:7E:0E,offline
4881,OUTDOOR,172.28.106.181,18981-ZGYO369,BC:A9:93:0E:2F:22,offline
4882,OUTDOOR,172.25.57.69,70174-ZZZY596,BC:E6:7C:E7:FD:0E,offline
4883,INDOOR,172.25.57.67,70174-ZZZY596,BC:E6:7C:ED:8A:E3,offline


Se descartan registros con site_id vacios ya que no cruzarán en el merge y se limpian los NaN del dataframe.

In [271]:
datos_dev.dropna(subset=['site_id'], inplace=True)
datos_dev.fillna('', inplace=True)
datos_dev = datos_dev.drop(datos_dev[(datos_dev['site_id']=='')].index)

In [272]:
datos_dev['ap_group'] = datos_dev['ap_group'].str.split("-", n = 1, expand = True)[0]
datos_dev['ap_group'] = datos_dev['ap_group'].str.split("_", n = 1, expand = True)[0]
datos_dev['ap_group'] = datos_dev['ap_group'].str.split(".", n = 1, expand = True)[0]
datos_dev = datos_dev.drop(datos_dev[(datos_dev['ap_group']=='')].index)

Se toman solo los datos unicos con mac.

In [273]:
#datos_dev.drop_duplicates(subset=['site_id','mac'],inplace=True)
datos_dev = datos_dev.drop_duplicates('mac')

Se cambia el nombre a la mac del dispositivo de red para no confundir con la de dispositivos de usuario 

In [274]:
datos_dev= datos_dev.rename(columns={'mac' : 'usuarios.macRed','ap_group' : 'usuarios.apGroup'})

In [275]:
datos_dev

Unnamed: 0,usuarios.apGroup,ip,site_id,usuarios.macRed,status
0,OUTDOOR,172.25.92.108,43514-VZVF293,BC:A9:93:67:CB:44,online
1,INDOOR,172.25.62.203,45764-ZZZY853,BC:E6:7C:5E:33:1B,online
2,OUTDOOR,172.25.131.4,36524-VZVF830,BC:A9:93:01:6B:DE,online
3,INDOOR,172.25.131.3,36524-VZVF830,BC:A9:93:11:24:8A,online
4,OUTDOOR,172.25.62.205,45764-ZZZY853,BC:A9:93:0C:E2:B8,online
...,...,...,...,...,...
4879,INDOOR,172.25.161.59,30772-ZIFV540,BC:A9:93:11:58:89,offline
4880,OUTDOOR,172.25.22.36,32405-ZGYO343,BC:E6:7C:4E:7E:0E,offline
4881,OUTDOOR,172.28.106.181,18981-ZGYO369,BC:A9:93:0E:2F:22,offline
4882,OUTDOOR,172.25.57.69,70174-ZZZY596,BC:E6:7C:E7:FD:0E,offline


### Lectura de datos ohmyfi-detalleconexiones

Los datos que se toman son:
* fechahora (de cada conexión). fecha_control es lo mismo pero con el intervalo de 10 minutos
* Información del centro: lugar, lugar_cod.
* Información del dispositivo de usuario: mac_usuario, dispositivo, sistema_operativo.
* Información de usuario: tipodoc y documento

In [276]:
def trae_conexiones(fecha_ini,fecha_fin):
    total_docs = 5000000
    response = es.search(
        index= parametros.ohmyfi_d_c_index,
        body={
                "_source": ["fechahora","fecha_control","lugar","lugar_cod","mac_usuario", "dispositivo"
                            ,"sistema_operativo",'tipodoc','documento']
                , "query": {
                  "range": {
                    "fechahora": {
                      "gte": fecha_ini,
                      "lt": fecha_fin
                    }
                  }
              }
        },
        size=total_docs
    )
    elastic_docs = response["hits"]["hits"]
#     fields = {}
#     for num, doc in enumerate(elastic_docs):
#         source_data = doc["_source"]
#         for key, val in source_data.items():
#             try:
#                 fields[key] = np.append(fields[key], val)
#             except KeyError:
#                 fields[key] = np.array([val])

#     return pd.DataFrame(dict([ (k,pd.Series(v)) for k,v in fields.items() ])) 

    return pd.DataFrame([x["_source"] for x in elastic_docs])

### Lanzando ejecución de consulta

* Se calcula rango en base a la fecha de control. Para este caso es de 10 minutos.
* Se ejecuta la función de consulta con el rango de fechas.
* Si no retorna datos se incrementa el rango y se ejecuta nuevamente. Este proceso se repite hasta conseguir datos o hasta que el rango de ejecución alcance la fecha y hora actual.


In [277]:
fecha_max_mintic = fecha_ejecucion
fecha_tope_mintic = (datetime.strptime(fecha_max_mintic, '%Y-%m-%d %H:%M:%S')+timedelta(minutes=10)-timedelta(seconds=1)).strftime("%Y-%m-%d %H:%M:%S")
datos_det_conex = trae_conexiones(fecha_max_mintic,fecha_tope_mintic)

if datos_det_conex is None or datos_det_conex.empty:
       while (datos_det_conex is None or datos_det_conex.empty) and ((datetime.strptime(fecha_max_mintic[0:10], '%Y-%m-%d').strftime("%Y-%m-%d %H:%M:%S")) < str(now.strftime("%Y-%m-%d %H:%M:%S"))):
            fecha_max_mintic = (datetime.strptime(fecha_max_mintic, '%Y-%m-%d %H:%M:%S')+timedelta(minutes=10)).strftime("%Y-%m-%d %H:%M:%S")
            fecha_tope_mintic = (datetime.strptime(fecha_tope_mintic, '%Y-%m-%d %H:%M:%S')+timedelta(minutes=10)).strftime("%Y-%m-%d %H:%M:%S")
            datos_det_conex = trae_conexiones(fecha_max_mintic,fecha_tope_mintic)
else:
    pass

In [278]:
fecha_max_mintic,fecha_tope_mintic

('2021-06-01 01:00:00', '2021-06-01 01:09:59')

In [279]:
datos_det_conex['fecha'] = datos_det_conex['fecha_control'].str.split(" ", n = 1, expand = True)[0]
datos_det_conex.drop_duplicates(subset=["fecha_control","lugar","lugar_cod","mac_usuario", "dispositivo","sistema_operativo",'tipodoc','documento'],inplace=True)

In [280]:
datos_det_conex = datos_det_conex.rename(columns={'lugar_cod' : 'site_id'
                                                             ,'fechahora':'usuarios.fechaConexionUsuarios'
                                                             ,'dispositivo': 'usuarios.tipoDispositivoUsuarios'
                                                             , 'sistema_operativo': 'usuarios.sistemaOperativoUsuarios'})

Se corrigen valores errados de site_id en detalle conexiones

In [281]:
datos_det_conex['site_id'] = datos_det_conex['site_id'].str.replace("_","-")

In [282]:
datos_det_conex

Unnamed: 0,usuarios.fechaConexionUsuarios,mac_usuario,usuarios.tipoDispositivoUsuarios,lugar,documento,tipodoc,site_id,fecha_control,usuarios.sistemaOperativoUsuarios,fecha
0,2021-06-01 01:01:14,38:30:F9:38:98:55,Smartphone,"CORREG GUALON, SAN JOSE DE TOLUVIEJO",1108760079,TI,47729-ZGYO891,2021-06-01 01:00:00,Android,2021-06-01
1,2021-06-01 01:01:39,E4:34:93:52:F2:66,Smartphone,LOS CORRALES,1067406796,CC,32140-ZGYO474,2021-06-01 01:00:00,Android,2021-06-01
3,2021-06-01 01:01:52,90:73:5A:B4:AB:FF,Smartphone,DON ALONSO,1103496511,TI,47119-ZZZY211,2021-06-01 01:00:00,Android,2021-06-01
5,2021-06-01 01:02:05,A0:41:47:BA:05:CB,Smartphone,"B. TORRES MAJAY, MAICAO",1192811230,CC,37682-ZGYO918,2021-06-01 01:00:00,Android,2021-06-01
8,2021-06-01 01:06:44,3C:FA:43:B1:BB:FE,Smartphone,CGTO RICAUTE_SAN JOSE DE CUCUTA,1090459043,CC,70813-ZZZY057,2021-06-01 01:00:00,Android,2021-06-01
11,2021-06-01 01:07:13,AC:92:32:C6:76:12,Smartphone,CARACOLI_VALLEDUPAR,1065850336,CC,30089-ZGYO122,2021-06-01 01:00:00,Android,2021-06-01
14,2021-06-01 01:07:28,4C:63:71:5F:81:A8,Smartphone,ATANQUEZ VALLEDUPAR,1965587499,CC,30065-ZGYO514,2021-06-01 01:00:00,Android,2021-06-01
16,2021-06-01 01:07:45,D0:D7:83:86:C4:C7,Smartphone,EL PITAL_URAMITA,21466468,CC,22031-ZZZY023,2021-06-01 01:00:00,Android,2021-06-01


### Se lee el indice all-cambium-device-client

* En este indice se guarda el detalle de los radio por fecha
* Detalle conexiones cruza con device clients. Con estos se calculan los totales por marca

In [283]:
def traeRadio(fecha_max2,fecha_tope2):
    total_docs = 100000
    response = es.search(
        index= 'all-'+parametros.cambium_d_c_index,
        body={
            "_source": ['mac', 'ap_mac', 'radio.band', 'radio.rx_bytes', 'radio.tx_bytes','fecha_control']
              , "query": {
                  "range": {
                    "fecha_control": {
                      "gte": fecha_max_mintic2,
                      "lt": fecha_tope_mintic2
                      #"gte": "2021-05-26 15:00:00",
                      #"lt": "2021-05-26 15:10:00"  
                    }
                  }
              }
        },
        size=total_docs
    )
    elastic_docs = response["hits"]["hits"]
    # fields = {}
    # for num, doc in enumerate(elastic_docs):
    #     source_data = doc["_source"]
    #     for key, val in source_data.items():
    #         try:
    #             fields[key] = np.append(fields[key], val)
    #         except KeyError:
    #             fields[key] = np.array([val])

    # datos_radio = pd.DataFrame(dict([ (k,pd.Series(v)) for k,v in fields.items() ]))

    return pd.DataFrame([x["_source"] for x in elastic_docs])

    

In [284]:
fecha_max_mintic2 = fecha_ejecucion

fecha_tope_mintic2 = (datetime.strptime(fecha_max_mintic, '%Y-%m-%d %H:%M:%S')+timedelta(minutes=10)-timedelta(seconds=1)).strftime("%Y-%m-%d %H:%M:%S")
datos_performance = traeRadio(fecha_max_mintic2,fecha_tope_mintic2)


if datos_performance is None or datos_performance.empty:
    while (datos_performance is None or datos_performance.empty) and ((datetime.strptime(fecha_max_mintic[0:10], '%Y-%m-%d').strftime("%Y-%m-%d %H:%M:%S")) < str(now.strftime("%Y-%m-%d %H:%M:%S"))):
        fecha_max_mintic2 = (datetime.strptime(fecha_max_mintic2, '%Y-%m-%d %H:%M:%S')+timedelta(minutes=50)).strftime("%Y-%m-%d %H:%M:%S")
        fecha_tope_mintic2 = (datetime.strptime(fecha_tope_mintic2, '%Y-%m-%d %H:%M:%S')+timedelta(minutes=50)).strftime("%Y-%m-%d %H:%M:%S")
        datos_performance = traeRadio(fecha_max_mintic2,fecha_tope_mintic2)
else:
    pass

Se cruza all-cambium-device-clients con cambium-devicedevices para obtener el site_id

In [285]:
datos_performance = datos_performance.rename(columns={'ap_mac':'usuarios.macRed', 'mac':'mac_usuario'})

In [286]:
usuarios_conectados_cambium = pd.merge(datos_performance,datos_dev, on ='usuarios.macRed', how='inner')

### Se lee la información de cambium device client

Esta lectura se usa para identificar: 
* Lecturas de consumo por dispositivo (radios rx y tx)
* Fabricante del dispositivo
* la mac del ap que luego se usa para identificar el ap group(Indoor/Outdoor)

In [287]:
t1=time.time()

total_docs = 30000000
response = es.search(
    index= parametros.cambium_d_c_index,
    body={
            "_source": ["mac","ap_mac", 'manufacturer','name',"radio.band",'radio.rx_bytes','radio.tx_bytes'],
              "query": {
                "bool": {
                  "filter": [
                  {
                    "exists": {
                      "field":"mac"
                    }
                  }
                  ]
                }
              }
    },
    size=total_docs
)
elastic_docs = response["hits"]["hits"]
# fields = {}
# for num, doc in enumerate(elastic_docs):
#     source_data = doc["_source"]
#     for key, val in source_data.items():
#         try:
#             fields[key] = np.append(fields[key], val)
#         except KeyError:
#             fields[key] = np.array([val])

# datos_dev_clients = pd.DataFrame(dict([ (k,pd.Series(v)) for k,v in fields.items() ]))

datos_dev_clients = pd.DataFrame([x["_source"] for x in elastic_docs])

t2=time.time()

In [288]:
(t2-t1)/60

0.6660743236541748

In [289]:
df1=datos_dev_clients

In [290]:
(t2-t1)/60

0.6660743236541748

In [291]:
df2=datos_dev_clients

In [292]:
df1.equals(df2)

True

In [293]:
df1.shape

(218394, 7)

In [294]:
df2.shape

(218394, 7)

In [295]:
datos_dev_clients

Unnamed: 0,ap_mac,name,mac,radio.band,radio.rx_bytes,radio.tx_bytes,manufacturer
0,BC:E6:7C:EC:DD:FC,HUAWEI_Y7a-3b52,0E:9C:F2:E0:B3:1F,2.4GHz,1140,0,[Local MAC]
1,BC:E6:7C:5D:20:AE,SM-J260MU,F8:F1:E6:A3:0D:45,2.4GHz,147191582,160639234,Samsung Electronics Ltd
2,BC:A9:93:00:98:33,android-e7938e7,00:08:22:46:78:82,2.4GHz,32598,14222,InPro Comm
3,BC:E6:7C:EC:AA:DC,Galaxy-A01,A0:27:B6:62:78:47,2.4GHz,32466165,688148716,A0-27-B6
4,BC:E6:7C:EF:FD:DC,CPE,48:E2:44:32:E3:25,2.4GHz,12038,15384,Hon Hai Precision Ind Ltd
...,...,...,...,...,...,...,...
218389,BC:E6:7C:E8:3F:84,SM-J260M,EC:AA:25:96:0C:9B,2.4GHz,8045,13019,Samsung Electronics Ltd
218390,BC:A9:93:0C:06:B2,HUAWEI_Y6_2019-df0b70a666,F4:A5:9D:5F:A0:1E,2.4GHz,2344626,9243078,Huawei Device Ltd
218391,BC:A9:93:10:52:84,,90:56:FC:EA:10:12,2.4GHz,57925,123199,90-56-FC
218392,BC:A9:93:10:52:84,V2028,F6:C0:42:5C:8E:99,2.4GHz,3125678,87532958,[Local MAC]


### Asociando datos de usuarios¶

Se realiza lectura por día procesado
lugar_cod se usa para cruzar con semilla por site_id
creado es la fecha de creación del usuario
tipodoc y documento corresponden a datos del usuario. Se usa para calcular totales

In [296]:
def traeRegistros(fecha_max,fecha_tope):
    total_docs = 10000
    response = es.search(
        index= parametros.ohmyfi_d_u_index,
        body={
                "_source": ['lugar_cod','tipodoc', 'documento', 'creado']
                  , "query": {
                  "range": {
                    "creado": {
                      "gte": fecha_max.split(' ')[0]+' 00:00:00',
                      "lt": fecha_tope.split(' ')[0]+' 23:59:59'
                      #"gte": "2021-06-01 00:00:00",
                      #"lt": "2021-06-01 23:59:59"  
                    }
                  }
              }
        },
        size=total_docs
    )
    #print(es.info())
    elastic_docs = response["hits"]["hits"]
    fields = {}
    for num, doc in enumerate(elastic_docs):
        source_data = doc["_source"]
        for key, val in source_data.items():
            try:
                fields[key] = np.append(fields[key], val)
            except KeyError:
                fields[key] = np.array([val])

    return pd.DataFrame(dict([ (k,pd.Series(v)) for k,v in fields.items() ]))

### Se realiza consulta de datos

* Se calcula rango en base a la fecha de control. Para este caso es de un día.
* Se ejecuta la función de consulta con el rango de fechas.
* Si no retorna datos se incrementa el rango y se ejecuta nuevamente. Este proceso se repite hasta conseguir datos o hasta que el rango de ejecución alcance la fecha actual.

In [297]:
########
fecha_max_mintic1 = fecha_ejecucion
fecha_tope_mintic1 = (datetime.strptime(fecha_max_mintic, '%Y-%m-%d %H:%M:%S')+timedelta(minutes=10)-timedelta(seconds=1)).strftime("%Y-%m-%d %H:%M:%S")
datos_registro = traeRegistros(fecha_max_mintic1,fecha_tope_mintic1)

if datos_registro is None or datos_registro.empty:
    while (datos_registro is None or datos_registro.empty) and ((datetime.strptime(fecha_max_mintic[0:10], '%Y-%m-%d').strftime("%Y-%m-%d %H:%M:%S")) < str(now.strftime("%Y-%m-%d %H:%M:%S"))):
        fecha_max_mintic1 = (datetime.strptime(fecha_max_mintic1, '%Y-%m-%d %H:%M:%S')+timedelta(days=1)).strftime("%Y-%m-%d %H:%M:%S")
        fecha_tope_mintic1 = (datetime.strptime(fecha_tope_mintic1, '%Y-%m-%d %H:%M:%S')+timedelta(days=1)).strftime("%Y-%m-%d %H:%M:%S")
        datos_speed = traeRegistros(fecha_max_mintic1,fecha_tope_mintic1)
else:
    pass

In [298]:
fecha_max_mintic1,fecha_tope_mintic1

('2021-06-01 00:50:00', '2021-06-01 01:09:59')

In [299]:
datos_registro

Unnamed: 0,creado,documento,tipodoc,lugar_cod
0,2021-06-01 09:33:13,1003733615,CC,32633-ZGYO467
1,2021-06-01 09:33:32,78673319,CC,31839-ZGYO456
2,2021-06-01 09:35:15,1069464690,CC,31501-ZGYO497
3,2021-06-01 09:35:22,30394061,CE,73984-ZZZY528
4,2021-06-01 09:36:39,1066742114,CC,31902-ZGYO433
...,...,...,...,...
979,2021-06-01 05:23:16,1096926031,CC,45676-ZGYO213
980,2021-06-01 20:07:05,1022004517,TI,21832-ZGYO931
981,2021-06-01 19:21:36,145645778,CC,47456-ZZZY544
982,2021-06-01 09:24:28,52412244,CC,74110-ZZZY207


## Calculando total de registros

la lista use_these_keys se usa para referenciar cuales campos del dataframe irán al indice final. si los datos no se declaran en este, no se insertarán

Para cada sitio y fecha, se cuentan los documentos de usuario. Esto resulta en el total de usuarios registrados para esa fecha

In [300]:
use_these_keys = ['usuarios.fecha'
                  , 'usuarios.siteID'
                  , 'usuarios.usuariosRegistrados'
                  , 'usuarios.anyo'
                  , 'usuarios.mes'
                  , 'usuarios.dia'
                  , 'usuarios.nomCentroDigital'
                  , 'usuarios.codISO'
                  , 'usuarios.localidad'
                  , 'usuarios.nombreDepartamento'
                  , 'usuarios.sistemaEnergia'
                  , 'usuarios.nombreMunicipio'
                  , 'usuarios.idBeneficiario'
                  , 'usuarios.location'
                  , 'nombreDepartamento'
                    , 'nombreMunicipio'
                    , 'idBeneficiario'
                    , 'fecha'
                    , 'anyo'
                    , 'mes'
                    , 'dia'
                  , '@timestamp']

def doc_generator(df):
    df_iter = df.iterrows()
    for index, document in df_iter:
        yield {
                "_index": indice, 
                "_id": f"{'UsuRegistro-'+ str(document['usuarios.siteID']) + '-' + str(document['usuarios.fecha'])+ str(random.randrange(1000))}",
                "_source": filterKeys(document)
            }

In [301]:
def invalid_values(df, values=['']):
    return df.loc[df['usuarios.location'].isin(values)]

In [302]:
try:
    
    datos_registro['creado'] = datos_registro['creado'].str[0:10]
    datos_registro['tipo_mas_doc'] = datos_registro['tipodoc'] + datos_registro['documento']
    datos_registro= datos_registro.rename(columns={'creado' : 'usuarios.fecha'
                                                  ,'lugar_cod':'site_id'})

    datos_registro = datos_registro[["usuarios.fecha","site_id","tipo_mas_doc"]].groupby(["usuarios.fecha","site_id"]).agg(['count']).reset_index()
    datos_registro.columns = datos_registro.columns.droplevel(1)
    datos_registro= datos_registro.rename(columns={'tipo_mas_doc' : 'usuarios.usuariosRegistrados'})
    datos_registro["usuarios.anyo"] = datos_registro["usuarios.fecha"].str[0:4]
    datos_registro["usuarios.mes"] = datos_registro["usuarios.fecha"].str[5:7]
    datos_registro["usuarios.dia"] = datos_registro["usuarios.fecha"].str[8:10]
    datos_registro = pd.merge(datos_registro,  datos_semilla, on='site_id', how='inner')
    datos_registro.rename(columns={'site_id': 'usuarios.siteID'
                               }, inplace=True)
    
    datos_registro['nombreDepartamento'] = datos_registro['usuarios.nombreDepartamento']
    datos_registro['nombreMunicipio'] = datos_registro['usuarios.nombreMunicipio']
    datos_registro['idBeneficiario'] = datos_registro['usuarios.idBeneficiario']
    datos_registro['fecha'] = datos_registro['usuarios.fecha']
    datos_registro['anyo'] = datos_registro['usuarios.anyo']
    datos_registro['mes'] = datos_registro['usuarios.mes']
    datos_registro['dia'] = datos_registro['usuarios.dia']
    
    datos_registro['@timestamp'] = now.isoformat()
    
    salida = helpers.bulk(es, doc_generator(datos_registro))
    print("Fecha: ", now,"- Datos Registro usuarios en indice principal:",salida[0])
except Exception as e:
    print("Fecha: ", now,"- Nada que insertar en indice principal",e)

Fecha:  2021-08-11 12:36:45.632036 - Datos Registro usuarios en indice principal: 303


In [303]:
datos_registro

Unnamed: 0,usuarios.fecha,usuarios.siteID,usuarios.usuariosRegistrados,usuarios.anyo,usuarios.mes,usuarios.dia,usuarios.nomCentroDigital,usuarios.codISO,usuarios.localidad,usuarios.nombreDepartamento,...,usuarios.idBeneficiario,usuarios.location,nombreDepartamento,nombreMunicipio,idBeneficiario,fecha,anyo,mes,dia,@timestamp
0,2021-06-01,10501-ZZZY338,16,2021,06,01,I. E. R. CAMPESTRE NUEVO HORIZONTE,CO-ANT,LA CHAPA,ANTIOQUIA,...,10501,"6.040555556,-75.91194444",ANTIOQUIA,EL CARMEN DE VIBORAL,10501,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036
1,2021-06-01,10835-ZGYO372,2,2021,06,01,E.U. SIETE DE AGOSTO,CO-ANT,CALLE 115 # 06 - 60,ANTIOQUIA,...,10835,"10.88307108,-75.077732850",ANTIOQUIA,TURBO,10835,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036
2,2021-06-01,11107-ZGYO062,5,2021,06,01,MARIA INMACULADA,CO-ATL,CALLE 15 12 - 20,ATLÁNTICO,...,11107,"10.504888,-74.816395",ATLÁNTICO,BARANOA,11107,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036
3,2021-06-01,13304-ZGYO085,1,2021,06,01,ESC. RUR. MIXTA JOSE GALEANO FELICE,CO-CES,VEREDA LOS COLUMPIOS,CESAR,...,13304,"8.391932941,-73.73352247",CESAR,AGUACHICA,13304,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036
4,2021-06-01,14479-ZGYO947,2,2021,06,01,CENTRO EDUCATIVO LA VICTORIA,CO-SUC,CASERIO LA VICTORIA,SUCRE,...,14479,"9.18445,-76.07029",SUCRE,MORROA,14479,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
298,2021-06-01,74270-ZZZY196,2,2021,06,01,INSTITUCION EDUCATIVA BERLIN - SEDE PRINCIPAL,CO-CAL,DE BERLIN,CALDAS,...,74270,"5.502494922,-75.13757517",CALDAS,SAMANÁ,74270,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036
299,2021-06-01,74271-ZGYO207,3,2021,06,01,INSTITUCION EDUCATIVA LA IBERIA - SEDE PRINCIPAL,CO-CAL,LA IBERIA,CALDAS,...,74271,"8.135,-75.556666667",CALDAS,RIOSUCIO,74271,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036
300,2021-06-01,74272-ZZZY510,3,2021,06,01,INSTITUCION EDUCATIVA BONAFONT - SEDE PRINCIPAL,CO-CAL,SAN ANTONIO,CALDAS,...,74272,"5.46409973,-75.69363929",CALDAS,RIOSUCIO,74272,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036
301,2021-06-01,74281-ZGYO779,2,2021,06,01,ESCUELA RURAL SIMON BOLIVAR,CO-CAL,EL AGUILA,CALDAS,...,74281,"4.99577,-75.83839",CALDAS,BELALCÁZAR,74281,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036


In [304]:
datos_registro['usuarios.usuariosRegistrados'].sum()

945

* se cruza por mac_usuario
* Los merge usan left para evitar perdida de datos en cruce con cambium-devicedevices. Aquellos datos que no cruzan se les marca como no identificados. En condiciones ideales, no debería presentarse ausencia de información
* Solo se toma lo que cruza con INNER
* se cambia el fabricante [Local MAC]
* se cambian lo nulos

In [305]:
try:
    datos_dev_clients.drop_duplicates(inplace=True)
    datos_dev_clients = datos_dev_clients.rename(columns={'ap_mac' : 'usuarios.macRed','mac' : 'mac_usuario'})
    datos_dev_clients['manufacturer'] = datos_dev_clients['manufacturer'].replace("[Local MAC]", "No identificado")
    datos_dev_clients.fillna({'manufacturer':'No identificado'},inplace=True)
    datos_det_conex = pd.merge(datos_det_conex,  datos_dev_clients, on='mac_usuario',how='left')
    datos_det_conex = pd.merge(datos_det_conex,datos_dev[['usuarios.macRed','usuarios.apGroup']],on='usuarios.macRed', how='left')
    datos_det_conex.fillna({'usuarios.tipoDispositivoUsuarios':'No identificado'
                       ,'usuarios.sistemaOperativoUsuarios':'No identificado'
                       ,'manufacturer':'No identificado'
                       ,'radio.band':'No identificado'
                       },inplace=True)
except:
    pass

In [306]:
datos_det_conex

Unnamed: 0,usuarios.fechaConexionUsuarios,mac_usuario,usuarios.tipoDispositivoUsuarios,lugar,documento,tipodoc,site_id,fecha_control,usuarios.sistemaOperativoUsuarios,fecha,usuarios.macRed,name,radio.band,radio.rx_bytes,radio.tx_bytes,manufacturer,usuarios.apGroup
0,2021-06-01 01:01:14,38:30:F9:38:98:55,Smartphone,"CORREG GUALON, SAN JOSE DE TOLUVIEJO",1108760079,TI,47729-ZGYO891,2021-06-01 01:00:00,Android,2021-06-01,BC:E6:7C:E7:C9:D0,android-fd5bdff,2.4GHz,5253524.0,55119833.0,LG Electronics (Mobile Communications),OUTDOOR
1,2021-06-01 01:01:39,E4:34:93:52:F2:66,Smartphone,LOS CORRALES,1067406796,CC,32140-ZGYO474,2021-06-01 01:00:00,Android,2021-06-01,BC:A9:93:0C:AE:6A,,2.4GHz,1270.0,80.0,Huawei Technologies Ltd,OUTDOOR
2,2021-06-01 01:01:52,90:73:5A:B4:AB:FF,Smartphone,DON ALONSO,1103496511,TI,47119-ZZZY211,2021-06-01 01:00:00,Android,2021-06-01,,,No identificado,,,No identificado,
3,2021-06-01 01:02:05,A0:41:47:BA:05:CB,Smartphone,"B. TORRES MAJAY, MAICAO",1192811230,CC,37682-ZGYO918,2021-06-01 01:00:00,Android,2021-06-01,BC:E6:7C:E7:FC:41,HUAWEI_Y9_Prime,2.4GHz,2628.0,0.0,Huawei Device Ltd,OUTDOOR
4,2021-06-01 01:06:44,3C:FA:43:B1:BB:FE,Smartphone,CGTO RICAUTE_SAN JOSE DE CUCUTA,1090459043,CC,70813-ZZZY057,2021-06-01 01:00:00,Android,2021-06-01,BC:E6:7C:E7:FD:22,android-ed94b78,2.4GHz,1228837.0,23454844.0,Huawei Technologies Ltd,OUTDOOR
5,2021-06-01 01:07:13,AC:92:32:C6:76:12,Smartphone,CARACOLI_VALLEDUPAR,1065850336,CC,30089-ZGYO122,2021-06-01 01:00:00,Android,2021-06-01,58:C1:7A:E9:C8:28,HUAWEI_Y6_2018-c7422186f8,2.4GHz,9947155.0,119678858.0,Huawei Technologies Ltd,OUTDOOR
6,2021-06-01 01:07:28,4C:63:71:5F:81:A8,Smartphone,ATANQUEZ VALLEDUPAR,1965587499,CC,30065-ZGYO514,2021-06-01 01:00:00,Android,2021-06-01,BC:E6:7C:4E:3E:7E,RedmiNote8-Redm,2.4GHz,31144.0,13805.0,Xiaomi Communications Ltd,OUTDOOR
7,2021-06-01 01:07:45,D0:D7:83:86:C4:C7,Smartphone,EL PITAL_URAMITA,21466468,CC,22031-ZZZY023,2021-06-01 01:00:00,Android,2021-06-01,BC:E6:7C:5B:B0:1E,HUAWEI_Y6_2018-,2.4GHz,24277.0,24828.0,Huawei Technologies Ltd,OUTDOOR


## Calculando totales por dispositivos

la lista use_these_keys se usa para referenciar cuales campos del dataframe irán al indice final. si los datos no se declaran en este, no se insertarán

In [307]:
use_these_keys = ['usuarios.siteID'
                  , 'usuarios.nomCentroDigital'
                  , 'usuarios.codISO'
                  , 'usuarios.localidad'
                  , 'usuarios.nombreDepartamento'
                  , 'usuarios.sistemaEnergia'
                  , 'usuarios.nombreMunicipio'
                  , 'usuarios.idBeneficiario'
                  , 'usuarios.location'
                  , 'usuarios.sistemaOperativoUsuarios'
                  , 'usuarios.tipoDispositivoUsuarios'
                  , 'usuarios.marcaTerminal'
                  , 'usuarios.tecnologiaTerminal'
                  , 'usuarios.totales.dispositivos'
                  , 'usuarios.fechaControl'
                  , 'usuarios.fecha'
                  , 'usuarios.anyo'
                  , 'usuarios.mes'
                  , 'usuarios.dia'
                  , 'usuarios.hora'
                  , 'usuarios.minuto'
                  , 'nombreDepartamento'
                  , 'nombreMunicipio'
                  , 'idBeneficiario'
                  , 'fecha'
                  , 'anyo'
                  , 'mes'
                  , 'dia'
                  , '@timestamp']

def doc_generator(df):
    df_iter = df.iterrows()
    for index, document in df_iter:
        yield {
                "_index": indice, 
                "_id": f"{ 'totalesDispositivos-' + str(document['usuarios.siteID']) + '-' + str(document['usuarios.fechaControl'])+ str(random.randrange(1000))}",
                "_source": filterKeys(document),
            }

Se agrupa por:
* Sistema operativo
* Tipo dispositivo
* Marca del terminal
* Tecnología terminal

Se cuentan las mac de usuario para cada site id y fecha control

In [308]:
try:
    totalesDispositivos = datos_det_conex[["fecha_control","site_id"
                                 ,"usuarios.sistemaOperativoUsuarios"
                                 ,'usuarios.tipoDispositivoUsuarios'
                                 ,'manufacturer'
                                 ,'radio.band'
                                 ,"mac_usuario"]].groupby(["fecha_control","site_id"
                                                     ,"usuarios.sistemaOperativoUsuarios"
                                                     ,'usuarios.tipoDispositivoUsuarios'
                                                     ,'manufacturer'
                                                     ,'radio.band']).agg(['count']).reset_index()
    ##si se quiere contar ocurrencias unicas se debe usar en lugar del agg: ['mac_usuario'].nunique().reset_index()
    totalesDispositivos.columns = totalesDispositivos.columns.droplevel(1)
    totalesDispositivos= totalesDispositivos.rename(columns={'mac_usuario' : 'usuarios.totales.dispositivos'
                                                            ,'fecha_control' : 'usuarios.fechaControl'
                                                            ,'manufacturer' : 'usuarios.marcaTerminal'
                                                            ,'radio.band' : 'usuarios.tecnologiaTerminal'
                                                            })
    totalesDispositivos = pd.merge(totalesDispositivos, datos_semilla, on='site_id',how='inner')
    totalesDispositivos["usuarios.fecha"] = totalesDispositivos["usuarios.fechaControl"].str.split(" ", n = 1, expand = True)[0]
    totalesDispositivos["usuarios.anyo"] = totalesDispositivos["usuarios.fecha"].str[0:4]
    totalesDispositivos["usuarios.mes"] = totalesDispositivos["usuarios.fecha"].str[5:7]
    totalesDispositivos["usuarios.dia"] = totalesDispositivos["usuarios.fecha"].str[8:10]
    totalesDispositivos["usuarios.hora"] = totalesDispositivos["usuarios.fechaControl"].str.split(" ", n = 1, expand = True)[1].str.split(":", n = 2, expand = True)[0]
    totalesDispositivos["usuarios.minuto"] = totalesDispositivos["usuarios.fechaControl"].str.split(" ", n = 1, expand = True)[1].str.split(":", n = 2, expand = True)[1]
    totalesDispositivos= totalesDispositivos.rename(columns={'site_id' : 'usuarios.siteID'})
    totalesDispositivos['nombreDepartamento'] = totalesDispositivos['usuarios.nombreDepartamento']
    totalesDispositivos['nombreMunicipio'] = totalesDispositivos['usuarios.nombreMunicipio']
    totalesDispositivos['idBeneficiario'] = totalesDispositivos['usuarios.idBeneficiario']
    totalesDispositivos['fecha'] = totalesDispositivos['usuarios.fecha']
    totalesDispositivos['anyo'] = totalesDispositivos['usuarios.anyo']
    totalesDispositivos['mes'] = totalesDispositivos['usuarios.mes']
    totalesDispositivos['dia'] = totalesDispositivos['usuarios.dia']
    totalesDispositivos['@timestamp'] = now.isoformat()
    salida = helpers.bulk(es, doc_generator(totalesDispositivos))
    print("Fecha: ", now,"- Totales por Dispositivos insertados en indice principal:",salida[0])
except:
    print("Fecha: ", now,"- No se insertaron totales por dispositivos en indice principal")

Fecha:  2021-08-11 12:36:45.632036 - Totales por Dispositivos insertados en indice principal: 8


In [309]:
totalesDispositivos

Unnamed: 0,usuarios.fechaControl,usuarios.siteID,usuarios.sistemaOperativoUsuarios,usuarios.tipoDispositivoUsuarios,usuarios.marcaTerminal,usuarios.tecnologiaTerminal,usuarios.totales.dispositivos,usuarios.nomCentroDigital,usuarios.codISO,usuarios.localidad,...,usuarios.hora,usuarios.minuto,nombreDepartamento,nombreMunicipio,idBeneficiario,fecha,anyo,mes,dia,@timestamp
0,2021-06-01 01:00:00,22031-ZZZY023,Android,Smartphone,Huawei Technologies Ltd,2.4GHz,1,C. E. R. EL PITAL,CO-ANT,EL PITAL,...,1,0,ANTIOQUIA,URAMITA,22031,2021-06-01,2021,6,1,2021-08-11T12:36:45.632036
1,2021-06-01 01:00:00,30065-ZGYO514,Android,Smartphone,Xiaomi Communications Ltd,2.4GHz,1,CONC ESC LUCILA CARRILLO DE DIAZ,CO-CES,ATANQUEZ,...,1,0,CESAR,VALLEDUPAR,30065,2021-06-01,2021,6,1,2021-08-11T12:36:45.632036
2,2021-06-01 01:00:00,30089-ZGYO122,Android,Smartphone,Huawei Technologies Ltd,2.4GHz,1,ESCUELA RURAL MIXTA CARACOLI,CO-CES,CARACOLI,...,1,0,CESAR,VALLEDUPAR,30089,2021-06-01,2021,6,1,2021-08-11T12:36:45.632036
3,2021-06-01 01:00:00,32140-ZGYO474,Android,Smartphone,Huawei Technologies Ltd,2.4GHz,1,IE LOS CORRALES,CO-COR,LOS CORRALES,...,1,0,CÓRDOBA,PURÍSIMA DE LA CONCEPCIÓN,32140,2021-06-01,2021,6,1,2021-08-11T12:36:45.632036
4,2021-06-01 01:00:00,37682-ZGYO918,Android,Smartphone,Huawei Device Ltd,2.4GHz,1,SEDE MARIA CONCEPCION EPINAYU,CO-LAG,B. TORRES MAJAY,...,1,0,LA GUAJIRA,MAICAO,37682,2021-06-01,2021,6,1,2021-08-11T12:36:45.632036
5,2021-06-01 01:00:00,47119-ZZZY211,Android,Smartphone,No identificado,No identificado,1,I.E. DON ALONSO - SEDE PRINCIPAL,CO-SUC,DON ALONSO,...,1,0,SUCRE,COROZAL,47119,2021-06-01,2021,6,1,2021-08-11T12:36:45.632036
6,2021-06-01 01:00:00,47729-ZGYO891,Android,Smartphone,LG Electronics (Mobile Communications),2.4GHz,1,CENTRO EDUCATIVO GUALON,CO-SUC,CORREG GUALON,...,1,0,SUCRE,SAN JOSÉ DE TOLUVIEJO,47729,2021-06-01,2021,6,1,2021-08-11T12:36:45.632036
7,2021-06-01 01:00:00,70813-ZZZY057,Android,Smartphone,Huawei Technologies Ltd,2.4GHz,1,CENT EDUC RICAURTE,CO-NSA,CGTO RICAUTE,...,1,0,NORTE DE SANTANDER,SAN JOSÉ DE CÚCUTA,70813,2021-06-01,2021,6,1,2021-08-11T12:36:45.632036


# Insertando usuarios conectados al indice principal

* Se calcula cantidad de sesiones por sitio con detalle conexiones, pero contando la ocurrencia unica de documento
* Se calcula la cantidad de conexiones. Se agrupa por el campo usuarios.macRed(el cual corresponde al AP) y fecha_control. Se cuenta las ocurrencias de mac_usuario. Luego al cruzar con flujo principal, si el dato es nulo para ese momento, se debe colocar en 0.

In [310]:
datos_logins = datos_det_conex[['fecha_control', 'site_id', 'documento','usuarios.macRed']].groupby(["fecha_control","site_id","usuarios.macRed"])['documento'].nunique().reset_index()
datos_logins= datos_logins.rename(columns={'documento' : 'usuarios.sesiones_Usuarios'})

In [311]:
datos_logins 

Unnamed: 0,fecha_control,site_id,usuarios.macRed,usuarios.sesiones_Usuarios
0,2021-06-01 01:00:00,22031-ZZZY023,BC:E6:7C:5B:B0:1E,1
1,2021-06-01 01:00:00,30065-ZGYO514,BC:E6:7C:4E:3E:7E,1
2,2021-06-01 01:00:00,30089-ZGYO122,58:C1:7A:E9:C8:28,1
3,2021-06-01 01:00:00,32140-ZGYO474,BC:A9:93:0C:AE:6A,1
4,2021-06-01 01:00:00,37682-ZGYO918,BC:E6:7C:E7:FC:41,1
5,2021-06-01 01:00:00,47729-ZGYO891,BC:E6:7C:E7:C9:D0,1
6,2021-06-01 01:00:00,70813-ZZZY057,BC:E6:7C:E7:FD:22,1


In [312]:
datos_dev_clients.columns

Index(['usuarios.macRed', 'name', 'mac_usuario', 'radio.band',
       'radio.rx_bytes', 'radio.tx_bytes', 'manufacturer'],
      dtype='object')

In [313]:
datos_dev_clients

Unnamed: 0,usuarios.macRed,name,mac_usuario,radio.band,radio.rx_bytes,radio.tx_bytes,manufacturer
0,BC:E6:7C:EC:DD:FC,HUAWEI_Y7a-3b52,0E:9C:F2:E0:B3:1F,2.4GHz,1140,0,No identificado
1,BC:E6:7C:5D:20:AE,SM-J260MU,F8:F1:E6:A3:0D:45,2.4GHz,147191582,160639234,Samsung Electronics Ltd
2,BC:A9:93:00:98:33,android-e7938e7,00:08:22:46:78:82,2.4GHz,32598,14222,InPro Comm
3,BC:E6:7C:EC:AA:DC,Galaxy-A01,A0:27:B6:62:78:47,2.4GHz,32466165,688148716,A0-27-B6
4,BC:E6:7C:EF:FD:DC,CPE,48:E2:44:32:E3:25,2.4GHz,12038,15384,Hon Hai Precision Ind Ltd
...,...,...,...,...,...,...,...
218389,BC:E6:7C:E8:3F:84,SM-J260M,EC:AA:25:96:0C:9B,2.4GHz,8045,13019,Samsung Electronics Ltd
218390,BC:A9:93:0C:06:B2,HUAWEI_Y6_2019-df0b70a666,F4:A5:9D:5F:A0:1E,2.4GHz,2344626,9243078,Huawei Device Ltd
218391,BC:A9:93:10:52:84,,90:56:FC:EA:10:12,2.4GHz,57925,123199,90-56-FC
218392,BC:A9:93:10:52:84,V2028,F6:C0:42:5C:8E:99,2.4GHz,3125678,87532958,No identificado


In [369]:
 try:
    datos_logins = datos_det_conex[['fecha_control', 'site_id', 'documento']].groupby(["fecha_control","site_id"])['documento'].nunique().reset_index()
    datos_logins= datos_logins.rename(columns={'documento' : 'usuarios.sesiones_Usuarios'})

    ###################################################################################################


    #Se trae usuarios conectados desde cambium devices clients 
    usuariosConectados = usuarios_conectados_cambium[["fecha_control","site_id","mac_usuario"]].groupby(["fecha_control","site_id"]).agg(['count']).reset_index()
    usuariosConectados.columns = usuariosConectados.columns.droplevel(1)
    usuariosConectados= usuariosConectados.rename(columns={'mac_usuario' : 'usuarios.usuariosConectados'})


    ###################################################################################################

    usuariosConectados = pd.merge(usuariosConectados,datos_logins,  how='outer')
    usuariosConectados.fillna({'usuarios.usuariosConectados': 0
                               ,'usuarios.sesiones_Usuarios' : 0 },inplace=True)
    usuariosConectados['usuarios.usuariosConectados'] = usuariosConectados['usuarios.usuariosConectados'].astype(int)
    usuariosConectados['usuarios.sesiones_Usuarios'] = usuariosConectados['usuarios.sesiones_Usuarios'].astype(int)
    usuariosConectados = pd.merge(datos_semilla,  usuariosConectados, on=['site_id'], how='inner')
    usuariosConectados = usuariosConectados.rename(columns={'fecha_control':'usuarios.fechaControl'
                                                           ,'site_id' : 'usuarios.siteID'})


    try:
        usuariosConectados["usuarios.fecha"] = usuariosConectados["usuarios.fechaControl"].str[0:10]
    except:
        usuariosConectados["usuarios.fecha"] = ""

    try:
        usuariosConectados["usuarios.anyo"] = usuariosConectados["usuarios.fecha"].str[0:4]
    except:
        usuariosConectados["usuarios.anyo"] = ""

    try:
        usuariosConectados["usuarios.mes"] = usuariosConectados["usuarios.fecha"].str[5:7]
    except:
        usuariosConectados["usuarios.mes"] = ""

    try:
        usuariosConectados["usuarios.dia"] = usuariosConectados["usuarios.fecha"].str[8:10]
    except:
        usuariosConectados["usuarios.dia"] = ""



    usuariosConectados['nombreDepartamento'] = usuariosConectados['usuarios.nombreDepartamento']
    usuariosConectados['nombreMunicipio'] = usuariosConectados['usuarios.nombreMunicipio']
    usuariosConectados['idBeneficiario'] = usuariosConectados['usuarios.idBeneficiario']
    usuariosConectados['fecha'] = usuariosConectados['usuarios.fecha']
    usuariosConectados['anyo'] = usuariosConectados['usuarios.anyo']
    usuariosConectados['mes'] = usuariosConectados['usuarios.mes']
    usuariosConectados['dia'] = usuariosConectados['usuarios.dia']
    usuariosConectados['@timestamp'] = now.isoformat()

except:
    print("Fecha: ", now,"- Ningun usuario conectado para insertar en indice principal:")

Fecha:  2021-08-11 12:36:45.632036 - Usuarios Conectados y dispositivos conectados en sitio insertado en indice principal: 8


la lista use_these_keys se usa para referenciar cuales campos del dataframe irán al indice final. si los datos no se declaran en este, no se insertarán

In [382]:
try:
    use_these_keys = ['usuarios.nomCentroDigital'
                  , 'usuarios.codISO'
                  , 'usuarios.idBeneficiario'    
                  , 'usuarios.localidad'
                  , 'usuarios.siteID'
                  , 'usuarios.nombreDepartamento'
                  , 'usuarios.sistemaEnergia'
                  , 'usuarios.nombreMunicipio'
                  , 'usuarios.location'
                  , 'usuarios.fechaControl'
                  #, 'usuarios.macRed'
                  #, 'usuarios.apGroup'    
                  , 'usuarios.usuariosConectados'
                  , 'usuarios.sesiones_Usuarios'
                  , 'usuarios.fecha'
                  , 'usuarios.anyo'
                  , 'usuarios.mes'
                  , 'usuarios.dia'
                  #, 'usuarios.hora'
                  #, 'usuarios.minuto'
                  , 'nombreDepartamento'
                  , 'nombreMunicipio'
                  , 'idBeneficiario'
                  , 'fecha'
                  , 'anyo'
                  , 'mes'
                  , 'dia'
                  , '@timestamp']

    usuariosConectados['@timestamp'] = now.isoformat()
    def doc_generator(df):
        df_iter = df.iterrows()
        for index, document in df_iter:
            yield {
                    "_index": indice, 
                    "_id": f"{ str(document['usuarios.siteID']) + '-' + str(document['usuarios.fechaControl']) + '-' +str(random.randrange(10000000))}",
                    "_source": filterKeys(document),
                }
    salida = helpers.bulk(es, doc_generator(usuariosConectados))
    print("Fecha: ", now,"- Usuarios conectados insertados en indice principal:",salida[0])
except:
    print("Fecha: ", now,"- Ningun usuario conectado para insertar en indice principal:")

Fecha:  2021-08-11 12:36:45.632036 - Usuarios conectados insertados en indice principal: 570


In [385]:
usuariosConectados

Unnamed: 0,usuarios.nomCentroDigital,usuarios.codISO,usuarios.localidad,usuarios.siteID,usuarios.nombreDepartamento,usuarios.sistemaEnergia,usuarios.nombreMunicipio,usuarios.idBeneficiario,usuarios.location,usuarios.fechaControl,...,usuarios.mes,usuarios.dia,nombreDepartamento,nombreMunicipio,idBeneficiario,fecha,anyo,mes,dia,@timestamp
0,I.E.B. SAGRADO DE CORAZON,CO-ATL,CALLE 6A 13 - 95,22483-ZGYO057,ATLÁNTICO,SIN INFORMACIÓN,BARANOA,22483,"6.068889,-75.378889",2021-06-01 00:50:00,...,06,01,ATLÁNTICO,BARANOA,22483,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036
1,I.E.B. SAGRADO DE CORAZON,CO-ATL,CALLE 6A 13 - 95,22483-ZGYO057,ATLÁNTICO,SIN INFORMACIÓN,BARANOA,22483,"6.068889,-75.378889",2021-06-01 00:52:00,...,06,01,ATLÁNTICO,BARANOA,22483,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036
2,I.E.B. SAGRADO DE CORAZON,CO-ATL,CALLE 6A 13 - 95,22483-ZGYO057,ATLÁNTICO,SIN INFORMACIÓN,BARANOA,22483,"6.068889,-75.378889",2021-06-01 00:54:00,...,06,01,ATLÁNTICO,BARANOA,22483,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036
3,I.E.B. SAGRADO DE CORAZON,CO-ATL,CALLE 6A 13 - 95,22483-ZGYO057,ATLÁNTICO,SIN INFORMACIÓN,BARANOA,22483,"6.068889,-75.378889",2021-06-01 00:56:00,...,06,01,ATLÁNTICO,BARANOA,22483,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036
4,I.E.B. SAGRADO DE CORAZON,CO-ATL,CALLE 6A 13 - 95,22483-ZGYO057,ATLÁNTICO,SIN INFORMACIÓN,BARANOA,22483,"6.068889,-75.378889",2021-06-01 00:58:00,...,06,01,ATLÁNTICO,BARANOA,22483,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
565,I.E. PABLO VI - SEDE PRINCIPAL,CO-TOL,INSP POL PLAYA RICA,49402-ZGYO895,TOLIMA,RED INTERCONECTADA,SAN ANTONIO,49402,"4.01721444,-75.464945510",2021-06-01 01:00:00,...,06,01,TOLIMA,SAN ANTONIO,49402,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036
566,I.E. PABLO VI - SEDE PRINCIPAL,CO-TOL,INSP POL PLAYA RICA,49402-ZGYO895,TOLIMA,RED INTERCONECTADA,SAN ANTONIO,49402,"4.01721444,-75.464945510",2021-06-01 01:02:00,...,06,01,TOLIMA,SAN ANTONIO,49402,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036
567,I.E. PABLO VI - SEDE PRINCIPAL,CO-TOL,INSP POL PLAYA RICA,49402-ZGYO895,TOLIMA,RED INTERCONECTADA,SAN ANTONIO,49402,"4.01721444,-75.464945510",2021-06-01 01:04:00,...,06,01,TOLIMA,SAN ANTONIO,49402,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036
568,I.E. PABLO VI - SEDE PRINCIPAL,CO-TOL,INSP POL PLAYA RICA,49402-ZGYO895,TOLIMA,RED INTERCONECTADA,SAN ANTONIO,49402,"4.01721444,-75.464945510",2021-06-01 01:06:00,...,06,01,TOLIMA,SAN ANTONIO,49402,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036


### Se lee el indice all-cambium-device-client

* En este indice se guarda el detalle de los radio por fecha
* Detalle conexiones cruza con device clients. Con estos se calculan los totales por marca

In [317]:
total_docs = 100000
response = es.search(
    index= 'all-'+parametros.cambium_d_c_index,
    body={
        "_source": ['mac', 'ap_mac', 'radio.band', 'radio.rx_bytes', 'radio.tx_bytes','fecha_control']
          , "query": {
              "range": {
                "fecha_control": {
                  "gte": fecha_max_mintic,
                  "lt": fecha_tope_mintic
                  #"gte": "2021-05-26 15:00:00",
                  #"lt": "2021-05-26 15:10:00"  
                }
              }
          }
    },
    size=total_docs
)
elastic_docs = response["hits"]["hits"]
#fields = {}
#for num, doc in enumerate(elastic_docs):
#    source_data = doc["_source"]
#   for key, val in source_data.items():
#        try:
#            fields[key] = np.append(fields[key], val)
#        except KeyError:
#            fields[key] = np.array([val])

#datos_radio = pd.DataFrame(dict([ (k,pd.Series(v)) for k,v in fields.items() ]))

datos_radio = pd.DataFrame([x["_source"] for x in elastic_docs])

# Uso servicio de internet insertados en indice principal

la lista use_these_keys se usa para referenciar cuales campos del dataframe irán al indice final. si los datos no se declaran en este, no se insertarán

In [318]:
use_these_keys = ['usuarios.macRed'
                  , 'usuarios.usoServicioInternetSitio'
                  , 'usuarios.detallesTecnologiasTerminales'
                  , 'usuarios.nomCentroDigital'
                  , 'usuarios.codISO'
                  , 'usuarios.idBeneficiario'
                  , 'usuarios.localidad'
                  , 'usuarios.siteID'
                  , 'usuarios.nombreDepartamento'
                  , 'usuarios.sistemaEnergia'
                  , 'usuarios.nombreMunicipio'
                  , 'usuarios.location'
                  , 'usuarios.fechaControl'
                  , 'usuarios.fecha'
                  , 'usuarios.anyo'
                  , 'usuarios.mes'
                  , 'usuarios.dia'
                  , 'usuarios.hora'
                  , 'usuarios.minuto'
                  , 'usuarios.apGroup'
                  , 'nombreDepartamento'
                    , 'nombreMunicipio'
                    , 'idBeneficiario'
                    , 'fecha'
                    , 'anyo'
                    , 'mes'
                    , 'dia'
                  , '@timestamp']

def doc_generator(df):
    df_iter = df.iterrows()
    for index, document in df_iter:
        yield {
                "_index": indice, 
                "_id": f"{ 'UsoServicio-' + str(document['usuarios.macRed']) + '-' + str(document['usuarios.detallesTecnologiasTerminales']) + '-' + str(document['usuarios.fechaControl'])+ str(random.randrange(1000))}",
                "_source": filterKeys(document),
            }

* se toma el maximo radio para cada mac de dispositivo final
* se suma agrupando por ap_mac, banda y fecha
* El resultado es un total para cada banda, fecha y ap_mac

In [319]:
try:    
    datos_radio['fecha_control'] = datos_radio['fecha_control'].str[0:15]+'0:00'
    datos_radio = datos_radio.groupby(['ap_mac', 'fecha_control', 'mac', 'radio.band']).agg(['max']).reset_index()
    datos_radio.columns = datos_radio.columns.droplevel(1)
    datos_radio = datos_radio[['ap_mac', 'fecha_control', 'radio.band', 'radio.rx_bytes',
           'radio.tx_bytes']].groupby(['ap_mac', 'fecha_control', 'radio.band']).agg(['sum']).reset_index()
    datos_radio.columns = datos_radio.columns.droplevel(1)
    datos_radio = datos_radio.rename(columns={'ap_mac' : 'usuarios.macRed'})
    usoServicioInternetSitio = pd.merge(datos_radio,datos_dev[['usuarios.apGroup', 'site_id', 'usuarios.macRed']], on ='usuarios.macRed', how='inner')
    usoServicioInternetSitio.fillna({'radio.rx_bytes':0,'radio.tx_bytes':0},inplace=True)
    usoServicioInternetSitio.fillna({'usuarios.macRed':'','radio.band':'No identificado','usuarios.apGroup':'No identificado'},inplace=True)
    usoServicioInternetSitio['usuarios.usoServicioInternetSitio'] = usoServicioInternetSitio['radio.rx_bytes'].astype(float) + usoServicioInternetSitio['radio.tx_bytes'].astype(float)
    usoServicioInternetSitio = pd.merge(usoServicioInternetSitio,datos_semilla, on ='site_id', how='inner')
    usoServicioInternetSitio= usoServicioInternetSitio.rename(columns={'site_id' : 'usuarios.siteID'
                                                                    ,'radio.band' : 'usuarios.detallesTecnologiasTerminales'
                                                                    , 'fecha_control' : 'usuarios.fechaControl'})
    usoServicioInternetSitio['usuarios.usoServicioInternetSitio'] = round((usoServicioInternetSitio['usuarios.usoServicioInternetSitio']/float(1<<30)),6) 
    usoServicioInternetSitio["usuarios.fecha"] = usoServicioInternetSitio["usuarios.fechaControl"].str.split(" ", n = 1, expand = True)[0]
    usoServicioInternetSitio["usuarios.anyo"] = usoServicioInternetSitio["usuarios.fecha"].str[0:4]
    usoServicioInternetSitio["usuarios.mes"] = usoServicioInternetSitio["usuarios.fecha"].str[5:7]
    usoServicioInternetSitio["usuarios.dia"] = usoServicioInternetSitio["usuarios.fecha"].str[8:10]
    usoServicioInternetSitio["usuarios.hora"] = usoServicioInternetSitio["usuarios.fechaControl"].str.split(" ", n = 1, expand = True)[1].str.split(":", n = 2, expand = True)[0]
    usoServicioInternetSitio["usuarios.minuto"] = usoServicioInternetSitio["usuarios.fechaControl"].str.split(" ", n = 1, expand = True)[1].str.split(":", n = 2, expand = True)[1]
    
    usoServicioInternetSitio['nombreDepartamento'] = usoServicioInternetSitio['usuarios.nombreDepartamento']
    usoServicioInternetSitio['nombreMunicipio'] = usoServicioInternetSitio['usuarios.nombreMunicipio']
    usoServicioInternetSitio['idBeneficiario'] = usoServicioInternetSitio['usuarios.idBeneficiario']
    usoServicioInternetSitio['fecha'] = usoServicioInternetSitio['usuarios.fecha']
    usoServicioInternetSitio['anyo'] = usoServicioInternetSitio['usuarios.anyo']
    usoServicioInternetSitio['mes'] = usoServicioInternetSitio['usuarios.mes']
    usoServicioInternetSitio['dia'] = usoServicioInternetSitio['usuarios.dia']
    
    usoServicioInternetSitio['@timestamp'] = now.isoformat()
    salida = helpers.bulk(es, doc_generator(usoServicioInternetSitio))
    print("Fecha: ", now,"- Uso servicio y tecnología terminal insertados en indice principal:",salida[0])
except:
    print("Fecha: ", now,"- Ningun uservicio/tecnología terminal conectado para insertar en indice principal")

Fecha:  2021-08-11 12:36:45.632036 - Uso servicio y tecnología terminal insertados en indice principal: 105


In [320]:
usoServicioInternetSitio

Unnamed: 0,usuarios.macRed,usuarios.fechaControl,usuarios.detallesTecnologiasTerminales,radio.rx_bytes,radio.tx_bytes,usuarios.apGroup,usuarios.siteID,usuarios.usoServicioInternetSitio,usuarios.nomCentroDigital,usuarios.codISO,...,usuarios.hora,usuarios.minuto,nombreDepartamento,nombreMunicipio,idBeneficiario,fecha,anyo,mes,dia,@timestamp
0,58:C1:7A:0A:9B:79,2021-06-01 01:00:00,2.4GHz,30117645,59157705,INDOOR,47375-ZGYO508,0.083144,CENTRO EDUCATIVO EL ZAPATO,CO-SUC,...,01,00,SUCRE,OVEJAS,47375,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036
1,BC:E6:7C:4E:3E:19,2021-06-01 01:00:00,2.4GHz,3180986,7376679,OUTDOOR,47375-ZGYO508,0.009833,CENTRO EDUCATIVO EL ZAPATO,CO-SUC,...,01,00,SUCRE,OVEJAS,47375,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036
2,BC:E6:7C:4E:7E:80,2021-06-01 01:00:00,2.4GHz,19284,17365,OUTDOOR,47375-ZGYO508,0.000034,CENTRO EDUCATIVO EL ZAPATO,CO-SUC,...,01,00,SUCRE,OVEJAS,47375,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036
3,BC:E6:7C:4E:7E:80,2021-06-01 01:00:00,5GHz,76878,160,OUTDOOR,47375-ZGYO508,0.000072,CENTRO EDUCATIVO EL ZAPATO,CO-SUC,...,01,00,SUCRE,OVEJAS,47375,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036
4,58:C1:7A:0F:FF:82,2021-06-01 01:00:00,2.4GHz,21976638,493585617,INDOOR,47245-ZGYO294,0.480155,EL RECREO,CO-SUC,...,01,00,SUCRE,LOS PALMITOS,47245,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
100,BC:E6:7C:EC:AA:A7,2021-06-01 01:00:00,2.4GHz,52670,22867,INDOOR,20217-ZGYO996,0.000070,I. E. R. CHAPARRAL,CO-ANT,...,01,00,ANTIOQUIA,GUARNE,20217,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036
101,BC:E6:7C:EF:FC:D1,2021-06-01 01:00:00,2.4GHz,292207,174826,OUTDOOR,30731-ZGYO144,0.000435,ESC. NUEVA LA FLORESTA,CO-CES,...,01,00,CESAR,PAILITAS,30731,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036
102,BC:E6:7C:EF:FD:42,2021-06-01 01:00:00,2.4GHz,2375765,4554593,OUTDOOR,30731-ZGYO144,0.006454,ESC. NUEVA LA FLORESTA,CO-CES,...,01,00,CESAR,PAILITAS,30731,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036
103,BC:E6:7C:EF:FD:96,2021-06-01 01:00:00,2.4GHz,40131,14498,OUTDOOR,31027-ZGYO458,0.000051,ESCUELA RURAL MIXTA SALAMINA,CO-COR,...,01,00,CÓRDOBA,MONTERÍA,31027,2021-06-01,2021,06,01,2021-08-11T12:36:45.632036


Se renombra fecha_control para cruzar

## Totalizar la cantidad de dispositivos por usuario

* Para contabilizar los dispositivos por usuario, se debe contar la cantidad de ocurrencias de mac_usuario dentro de detalle de conexiones, agrupando por tipo documento y documento. 
* Aún cuando la mayoria de las fuentes referencia a mac_usuario, no se debe confundir a la hora de agrupar con los datos reales de usuario que en este caso serían el documento de identidad como campo de identificación

In [321]:
try:
    conteoDispositivos = datos_det_conex[['fecha_control','site_id', 'documento', 'tipodoc','fecha']].groupby(['fecha_control','site_id', 'documento', 'tipodoc']).agg(['count']).reset_index()
    conteoDispositivos.columns = conteoDispositivos.columns.droplevel(1)
    conteoDispositivos= conteoDispositivos.rename(columns={'fecha' : 'conteo'})
    conteoDispositivos = conteoDispositivos[['fecha_control','site_id','conteo']].groupby(['fecha_control','site_id']).agg(['sum']).reset_index()
    conteoDispositivos.columns = conteoDispositivos.columns.droplevel(1)
    conteoDispositivos= conteoDispositivos.rename(columns={'conteo' : 'usuarios.conteoDispositivos'})
    conteoDispositivos = pd.merge(conteoDispositivos, datos_semilla, on='site_id', how='inner')
    conteoDispositivos = conteoDispositivos.rename(columns={'fecha_control' : 'usuarios.fechaControl'})
    conteoDispositivos["usuarios.fecha"] = conteoDispositivos["usuarios.fechaControl"].str.split(" ", n = 1, expand = True)[0]
    conteoDispositivos["usuarios.anyo"] = conteoDispositivos["usuarios.fecha"].str[0:4]
    conteoDispositivos["usuarios.mes"] = conteoDispositivos["usuarios.fecha"].str[5:7]
    conteoDispositivos["usuarios.dia"] = conteoDispositivos["usuarios.fecha"].str[8:10]
    conteoDispositivos["usuarios.hora"] = conteoDispositivos["usuarios.fechaControl"].str.split(" ", n = 1, expand = True)[1].str.split(":", n = 2, expand = True)[0]
    conteoDispositivos["usuarios.minuto"] = conteoDispositivos["usuarios.fechaControl"].str.split(" ", n = 1, expand = True)[1].str.split(":", n = 2, expand = True)[1]
    conteoDispositivos= conteoDispositivos.rename(columns={'site_id' : 'usuarios.siteID'})
    
    conteoDispositivos['nombreDepartamento'] = conteoDispositivos['usuarios.nombreDepartamento']
    conteoDispositivos['nombreMunicipio'] = conteoDispositivos['usuarios.nombreMunicipio']
    conteoDispositivos['idBeneficiario'] = conteoDispositivos['usuarios.idBeneficiario']
    conteoDispositivos['fecha'] = conteoDispositivos['usuarios.fecha']
    conteoDispositivos['anyo'] = conteoDispositivos['usuarios.anyo']
    conteoDispositivos['mes'] = conteoDispositivos['usuarios.mes']
    conteoDispositivos['dia'] = conteoDispositivos['usuarios.dia']
except:
    pass

In [322]:
conteoDispositivos

Unnamed: 0,usuarios.fechaControl,usuarios.siteID,usuarios.conteoDispositivos,usuarios.nomCentroDigital,usuarios.codISO,usuarios.localidad,usuarios.nombreDepartamento,usuarios.sistemaEnergia,usuarios.nombreMunicipio,usuarios.idBeneficiario,...,usuarios.dia,usuarios.hora,usuarios.minuto,nombreDepartamento,nombreMunicipio,idBeneficiario,fecha,anyo,mes,dia
0,2021-06-01 01:00:00,22031-ZZZY023,1,C. E. R. EL PITAL,CO-ANT,EL PITAL,ANTIOQUIA,RED INTERCONECTADA,URAMITA,22031,...,1,1,0,ANTIOQUIA,URAMITA,22031,2021-06-01,2021,6,1
1,2021-06-01 01:00:00,30065-ZGYO514,1,CONC ESC LUCILA CARRILLO DE DIAZ,CO-CES,ATANQUEZ,CESAR,RED INTERCONECTADA,VALLEDUPAR,30065,...,1,1,0,CESAR,VALLEDUPAR,30065,2021-06-01,2021,6,1
2,2021-06-01 01:00:00,30089-ZGYO122,1,ESCUELA RURAL MIXTA CARACOLI,CO-CES,CARACOLI,CESAR,RED INTERCONECTADA,VALLEDUPAR,30089,...,1,1,0,CESAR,VALLEDUPAR,30089,2021-06-01,2021,6,1
3,2021-06-01 01:00:00,32140-ZGYO474,1,IE LOS CORRALES,CO-COR,LOS CORRALES,CÓRDOBA,RED INTERCONECTADA,PURÍSIMA DE LA CONCEPCIÓN,32140,...,1,1,0,CÓRDOBA,PURÍSIMA DE LA CONCEPCIÓN,32140,2021-06-01,2021,6,1
4,2021-06-01 01:00:00,37682-ZGYO918,1,SEDE MARIA CONCEPCION EPINAYU,CO-LAG,B. TORRES MAJAY,LA GUAJIRA,RED INTERCONECTADA,MAICAO,37682,...,1,1,0,LA GUAJIRA,MAICAO,37682,2021-06-01,2021,6,1
5,2021-06-01 01:00:00,47119-ZZZY211,1,I.E. DON ALONSO - SEDE PRINCIPAL,CO-SUC,DON ALONSO,SUCRE,RED INTERCONECTADA,COROZAL,47119,...,1,1,0,SUCRE,COROZAL,47119,2021-06-01,2021,6,1
6,2021-06-01 01:00:00,47729-ZGYO891,1,CENTRO EDUCATIVO GUALON,CO-SUC,CORREG GUALON,SUCRE,RED INTERCONECTADA,SAN JOSÉ DE TOLUVIEJO,47729,...,1,1,0,SUCRE,SAN JOSÉ DE TOLUVIEJO,47729,2021-06-01,2021,6,1
7,2021-06-01 01:00:00,70813-ZZZY057,1,CENT EDUC RICAURTE,CO-NSA,CGTO RICAUTE,NORTE DE SANTANDER,RED INTERCONECTADA,SAN JOSÉ DE CÚCUTA,70813,...,1,1,0,NORTE DE SANTANDER,SAN JOSÉ DE CÚCUTA,70813,2021-06-01,2021,6,1


# 4. Insertando promedio dispositivos en indice principal

la lista use_these_keys se usa para referenciar cuales campos del dataframe irán al indice final. si los datos no se declaran en este, no se insertarán

In [323]:
try:
    use_these_keys = ['usuarios.nomCentroDigital'
                  , 'usuarios.codISO'
                  , 'usuarios.idBeneficiario'    
                  , 'usuarios.localidad'
                  , 'usuarios.siteID'
                  , 'usuarios.nombreDepartamento'
                  , 'usuarios.sistemaEnergia'
                  , 'usuarios.nombreMunicipio'
                  , 'usuarios.location'
                  , 'usuarios.conteoDispositivos'
                  , 'usuarios.fechaControl'
                  , 'usuarios.fecha'
                  , 'usuarios.anyo'
                  , 'usuarios.mes'
                  , 'usuarios.dia'
                  , 'usuarios.hora'
                  , 'usuarios.minuto'
                    , 'nombreDepartamento'
                    , 'nombreMunicipio'
                    , 'idBeneficiario'
                    , 'fecha'
                    , 'anyo'
                    , 'mes'
                    , 'dia'
                  , '@timestamp']

    conteoDispositivos['@timestamp'] = now.isoformat()
    def doc_generator(df):
        df_iter = df.iterrows()
        for index, document in df_iter:
            yield {
                    "_index": indice, 
                    "_id": f"{ 'PromedioDispositivos-' + str(document['usuarios.siteID']) + '-' + str(document['usuarios.fechaControl'])+str(random.randrange(1000))}",
                    "_source": filterKeys(document),
                }
    salida = helpers.bulk(es, doc_generator(conteoDispositivos))
    print("Fecha: ", now,"- Promedios dispositivos Usuarios:",salida[0])
except:
    print("Fecha: ", now,"- Ningun Promedios dispositivos Usuarios para insertar en indice principal")

Fecha:  2021-08-11 12:36:45.632036 - Promedios dispositivos Usuarios: 8


# Marcando si usuario es nuevo o recurrente

* Se toma del dataframe datos_det_conex y se cuenta las veces que cada mac_usuario aparece
* Luego se suma con el historico de conexiones por usuario (indice intermedio ohmyfi-total-conexiones-historico)
* marca como Nuevo(1 conexión). 

De este proceso se obtiene el campo:
* usuarios.usuariosNuevos
* usuarios.totales.usuariosNuevos

In [324]:
try:
    datos_recurrencia = datos_det_conex[["fecha","tipodoc","documento"]].groupby(["tipodoc","documento"]).agg(['count']).reset_index()
    datos_recurrencia.columns = datos_recurrencia.columns.droplevel(1)
    datos_recurrencia= datos_recurrencia.rename(columns={'fecha' : 'usuarios_recurrencia_aux'})
    datos_recurrencia['tipodoc'] = datos_recurrencia['tipodoc'].replace('','No especificado')
    datos_recurrencia['documento'] = datos_recurrencia['documento'].replace('','No especificado')
except:
    pass

### Se lee historico

Se lee ohmyfi-total-conexiones-historico, el cual es un indice creado a partir de los datos crudos. Este guarda la cantidad de conexiones realizadas por ese usuario. Para que la consulta funcione correctamente se debe colocar el filtro que usuarios_recurrencia exista.

In [325]:
try:
    total_docs = 30000000
    response = es.search(
        index= parametros.ohmyfi_total_c_index,
        body={
              "_source": ['tipodoc', 'documento', 'usuarios_recurrencia'],
              "query": {
                "bool": {
                  "filter": [
                  {
                    "exists": {
                      "field":"usuarios_recurrencia"
                    }
                  }
                  ]
                }
              }
        },
        size=total_docs
    )
    elastic_docs = response["hits"]["hits"]
#    fields = {}
#    for num, doc in enumerate(elastic_docs):
#       source_data = doc["_source"]
#       for key, val in source_data.items():
#            try:
#                fields[key] = np.append(fields[key], val)
#            except KeyError:
#               fields[key] = np.array([val])

    #ya_en_indice = pd.DataFrame(dict([ (k,pd.Series(v)) for k,v in fields.items() ]))
    
    ya_en_indice = pd.DataFrame([x["_source"] for x in elastic_docs])
    
except:
    ya_en_indice = pd.DataFrame(columns=['tipodoc', 'documento', 'usuarios_recurrencia'])

In [326]:
if ya_en_indice is None or ya_en_indice.empty:
    datos_recurrencia= datos_recurrencia.rename(columns={'usuarios_recurrencia_aux' : 'usuarios_recurrencia'})
else:
    datos_recurrencia = pd.merge(datos_recurrencia, ya_en_indice, on=['tipodoc', 'documento'],how='left')
    datos_recurrencia.fillna({'usuarios_recurrencia':0},inplace=True)
    datos_recurrencia['usuarios_recurrencia'] = datos_recurrencia['usuarios_recurrencia'] + datos_recurrencia['usuarios_recurrencia_aux']
    datos_recurrencia['usuarios_recurrencia'] = [int(x) for x in datos_recurrencia['usuarios_recurrencia']]

In [327]:
try:
    aux_recurrencia = pd.merge(datos_recurrencia,datos_det_conex, on=['tipodoc','documento'],how='inner' )
    aux_recurrencia = aux_recurrencia[(aux_recurrencia['usuarios_recurrencia']==1)]
    aux_recurrencia.loc[aux_recurrencia['usuarios_recurrencia']==1,'usuarios.usuariosNuevos']='Nuevo'
    #aux_recurrencia.loc[aux_recurrencia['usuarios_recurrencia']!=1,'usuarios.usuariosNuevos']='Recurrente'
    aux_recurrencia = aux_recurrencia.rename(columns={'usuarios_recurrencia' :'usuarios.sesiones_Usuarios'})
    aux_recurrencia = aux_recurrencia[["fecha_control","site_id","usuarios.usuariosNuevos",'documento']].groupby(["fecha_control","site_id","usuarios.usuariosNuevos"])['documento'].nunique().reset_index()
    aux_recurrencia= aux_recurrencia.rename(columns={'documento' : 'usuarios.totales.usuariosNuevos'})
except:
    pass

In [328]:
try:
    datos_recurrencia = pd.merge(datos_semilla,  aux_recurrencia, on='site_id', how='inner')
    datos_recurrencia = datos_recurrencia.rename(columns={'fecha_control' : 'usuarios.fechaControl'})
    datos_recurrencia["usuarios.fecha"] = datos_recurrencia["usuarios.fechaControl"].str.split(" ", n = 1, expand = True)[0]
    datos_recurrencia["usuarios.anyo"] = datos_recurrencia["usuarios.fecha"].str[0:4]
    datos_recurrencia["usuarios.mes"] = datos_recurrencia["usuarios.fecha"].str[5:7]
    datos_recurrencia["usuarios.dia"] = datos_recurrencia["usuarios.fecha"].str[8:10]
    datos_recurrencia["usuarios.hora"] = datos_recurrencia["usuarios.fechaControl"].str.split(" ", n = 1, expand = True)[1].str.split(":", n = 2, expand = True)[0]
    datos_recurrencia["usuarios.minuto"] = datos_recurrencia["usuarios.fechaControl"].str.split(" ", n = 1, expand = True)[1].str.split(":", n = 2, expand = True)[1]
    datos_recurrencia= datos_recurrencia.rename(columns={'site_id' : 'usuarios.siteID'})
    
    datos_recurrencia['nombreDepartamento'] = datos_recurrencia['usuarios.nombreDepartamento']
    datos_recurrencia['nombreMunicipio'] = datos_recurrencia['usuarios.nombreMunicipio']
    datos_recurrencia['idBeneficiario'] = datos_recurrencia['usuarios.idBeneficiario']
    datos_recurrencia['fecha'] = datos_recurrencia['usuarios.fecha']
    datos_recurrencia['anyo'] = datos_recurrencia['usuarios.anyo']
    datos_recurrencia['mes'] = datos_recurrencia['usuarios.mes']
    datos_recurrencia['dia'] = datos_recurrencia['usuarios.dia']
except:
    pass

# Insertando recurrencia de usuario en indice principal

la lista use_these_keys se usa para referenciar cuales campos del dataframe irán al indice final. si los datos no se declaran en este, no se insertarán

In [329]:
try:
    use_these_keys = ['usuarios.nomCentroDigital'
                      , 'usuarios.codISO'
                      , 'usuarios.idBeneficiario'
                      , 'usuarios.localidad'
                      , 'usuarios.siteID'
                      , 'usuarios.nombreDepartamento'
                      , 'usuarios.sistemaEnergia'
                      , 'usuarios.nombreMunicipio'
                      , 'usuarios.location'
                      , 'usuarios.usuariosNuevos'
                      , 'usuarios.totales.usuariosNuevos'
                      , 'usuarios.fechaControl'
                      , 'usuarios.fecha'
                      , 'usuarios.anyo'
                      , 'usuarios.mes'
                      , 'usuarios.dia'
                      , 'usuarios.hora'
                      , 'usuarios.minuto'
                        , 'nombreDepartamento'
                        , 'nombreMunicipio'
                        , 'idBeneficiario'
                        , 'fecha'
                        , 'anyo'
                        , 'mes'
                        , 'dia'
                      , '@timestamp']

    datos_recurrencia['@timestamp'] = now.isoformat()
    def doc_generator(df):
        df_iter = df.iterrows()
        for index, document in df_iter:
            yield {
                    "_index": indice, 
                    "_id": f"{ 'Recurrencia-' + str(document['usuarios.siteID']) + '-' + str(document['usuarios.fechaControl'])+ str(random.randrange(1000))}",
                    "_source": filterKeys(document),
                }
    salida = helpers.bulk(es, doc_generator(datos_recurrencia))
    print("Fecha: ", now,"- recurrencia de usuario a indice:",salida[0])
except:
    print("Fecha: ", now,"- Ninguna recurrencia de usuario para insertar en indice principal")

Fecha:  2021-08-11 12:36:45.632036 - recurrencia de usuario a indice: 3


## Insertando detalle MACs

In [330]:
use_these_keys = ['usuarios.siteID'
                  , 'usuarios.nomCentroDigital'
                  , 'usuarios.codISO'
                  , 'usuarios.localidad'
                  , 'usuarios.nombreDepartamento'
                  , 'usuarios.sistemaEnergia'
                  , 'usuarios.nombreMunicipio'
                  , 'usuarios.idBeneficiario'
                  , 'usuarios.location'
                  , 'usuarios.macRed'
                  , 'usuarios.apGroup'
                  , 'usuarios.dispositivo.mac'
                  , 'usuarios.dispositivo.tipo'
                  , 'usuarios.dispositivo.nombre'
                  , 'usuarios.dispositivo.marca'
                  , 'usuarios.dispositivo.tecnologia'
                  , 'usuarios.dispositivo.sisOperativo'
                  , 'usuarios.fechaControl'
                  , 'usuarios.fecha'
                  , 'usuarios.anyo'
                  , 'usuarios.mes'
                  , 'usuarios.dia'
                  , 'usuarios.hora'
                  , 'usuarios.minuto'
                  , '@timestamp']
def doc_generator_mac(df):
    df_iter = df.iterrows()
    for index, document in df_iter:
        yield {
                "_index": indice, 
                "_id": f"{ 'detalleMAC-' + str(document['usuarios.siteID']) + '-' + str(document['usuarios.fechaControl']) + '-' + str(document['usuarios.dispositivo.mac']) + str(random.randrange(1000))  }",
                "_source": filterKeys(document),
            }

In [331]:
try:
    dispositivoUsuarios = datos_det_conex[['site_id','usuarios.macRed','usuarios.apGroup'
                                ,'mac_usuario','fecha_control'
                                ,'usuarios.tipoDispositivoUsuarios'
                                ,'name','manufacturer','radio.band'
                                ,'usuarios.sistemaOperativoUsuarios']].drop_duplicates(subset=['mac_usuario'])
    dispositivoUsuarios.fillna({'usuarios.tipoDispositivoUsuarios':'No identificado'
                               ,'name':'No identificado'
                               ,'manufacturer':'No identificado'
                               ,'radio.band':'No identificado'
                               ,'usuarios.sistemaOperativoUsuarios':'No identificado'
                               ,'usuarios.macRed':'No identificado'
                               ,'usuarios.apGroup':'No identificado'
                               },inplace=True)

    dispositivoUsuarios = pd.merge(dispositivoUsuarios, datos_semilla, on='site_id',how='inner')
    dispositivoUsuarios= dispositivoUsuarios.rename(columns={
                                                     'site_id' : 'usuarios.siteID'
                                                    ,'mac_usuario' : 'usuarios.dispositivo.mac'
                                                    ,'usuarios.tipoDispositivoUsuarios' : 'usuarios.dispositivo.tipo'
                                                    ,'name' : 'usuarios.dispositivo.nombre'
                                                    ,'manufacturer' : 'usuarios.dispositivo.marca'
                                                    ,'radio.band' : 'usuarios.dispositivo.tecnologia'
                                                    ,'usuarios.sistemaOperativoUsuarios' : 'usuarios.dispositivo.sisOperativo'
                                                    ,'fecha_control':'usuarios.fechaControl'
                                                    })
    dispositivoUsuarios["usuarios.fecha"] = dispositivoUsuarios["usuarios.fechaControl"].str.split(" ", n = 1, expand = True)[0]
    dispositivoUsuarios["usuarios.anyo"] = dispositivoUsuarios["usuarios.fecha"].str[0:4]
    dispositivoUsuarios["usuarios.mes"] = dispositivoUsuarios["usuarios.fecha"].str[5:7]
    dispositivoUsuarios["usuarios.dia"] = dispositivoUsuarios["usuarios.fecha"].str[8:10]
    dispositivoUsuarios["usuarios.hora"] = dispositivoUsuarios["usuarios.fechaControl"].str.split(" ", n = 1, expand = True)[1].str.split(":", n = 2, expand = True)[0]
    dispositivoUsuarios["usuarios.minuto"] = dispositivoUsuarios["usuarios.fechaControl"].str.split(" ", n = 1, expand = True)[1].str.split(":", n = 2, expand = True)[1]
    dispositivoUsuarios['@timestamp'] = now.isoformat()
    salida = helpers.bulk(es, doc_generator_mac(dispositivoUsuarios))
    print("Fecha: ", now,"- Detalle MACs a indice:",salida[0])
except:
    print("Fecha: ", now,"- Ningún Detalle MACs para insertar en indice principal")

Fecha:  2021-08-11 12:36:45.632036 - Detalle MACs a indice: 8


In [332]:
dispositivoUsuarios

Unnamed: 0,usuarios.siteID,usuarios.macRed,usuarios.apGroup,usuarios.dispositivo.mac,usuarios.fechaControl,usuarios.dispositivo.tipo,usuarios.dispositivo.nombre,usuarios.dispositivo.marca,usuarios.dispositivo.tecnologia,usuarios.dispositivo.sisOperativo,...,usuarios.nombreMunicipio,usuarios.idBeneficiario,usuarios.location,usuarios.fecha,usuarios.anyo,usuarios.mes,usuarios.dia,usuarios.hora,usuarios.minuto,@timestamp
0,47729-ZGYO891,BC:E6:7C:E7:C9:D0,OUTDOOR,38:30:F9:38:98:55,2021-06-01 01:00:00,Smartphone,android-fd5bdff,LG Electronics (Mobile Communications),2.4GHz,Android,...,SAN JOSÉ DE TOLUVIEJO,47729,"8.99992858,-75.11890187",2021-06-01,2021,6,1,1,0,2021-08-11T12:36:45.632036
1,32140-ZGYO474,BC:A9:93:0C:AE:6A,OUTDOOR,E4:34:93:52:F2:66,2021-06-01 01:00:00,Smartphone,,Huawei Technologies Ltd,2.4GHz,Android,...,PURÍSIMA DE LA CONCEPCIÓN,32140,"9.102917679,-75.49328364",2021-06-01,2021,6,1,1,0,2021-08-11T12:36:45.632036
2,47119-ZZZY211,No identificado,No identificado,90:73:5A:B4:AB:FF,2021-06-01 01:00:00,Smartphone,No identificado,No identificado,No identificado,Android,...,COROZAL,47119,"9.25824627,-75.31213588",2021-06-01,2021,6,1,1,0,2021-08-11T12:36:45.632036
3,37682-ZGYO918,BC:E6:7C:E7:FC:41,OUTDOOR,A0:41:47:BA:05:CB,2021-06-01 01:00:00,Smartphone,HUAWEI_Y9_Prime,Huawei Device Ltd,2.4GHz,Android,...,MAICAO,37682,"8.7793333,-73.736416",2021-06-01,2021,6,1,1,0,2021-08-11T12:36:45.632036
4,70813-ZZZY057,BC:E6:7C:E7:FD:22,OUTDOOR,3C:FA:43:B1:BB:FE,2021-06-01 01:00:00,Smartphone,android-ed94b78,Huawei Technologies Ltd,2.4GHz,Android,...,SAN JOSÉ DE CÚCUTA,70813,"2.81685765,-72.88387484",2021-06-01,2021,6,1,1,0,2021-08-11T12:36:45.632036
5,30089-ZGYO122,58:C1:7A:E9:C8:28,OUTDOOR,AC:92:32:C6:76:12,2021-06-01 01:00:00,Smartphone,HUAWEI_Y6_2018-c7422186f8,Huawei Technologies Ltd,2.4GHz,Android,...,VALLEDUPAR,30089,"10.085547,-73.68832614",2021-06-01,2021,6,1,1,0,2021-08-11T12:36:45.632036
6,30065-ZGYO514,BC:E6:7C:4E:3E:7E,OUTDOOR,4C:63:71:5F:81:A8,2021-06-01 01:00:00,Smartphone,RedmiNote8-Redm,Xiaomi Communications Ltd,2.4GHz,Android,...,VALLEDUPAR,30065,"10.48992418,-73.64813819",2021-06-01,2021,6,1,1,0,2021-08-11T12:36:45.632036
7,22031-ZZZY023,BC:E6:7C:5B:B0:1E,OUTDOOR,D0:D7:83:86:C4:C7,2021-06-01 01:00:00,Smartphone,HUAWEI_Y6_2018-,Huawei Technologies Ltd,2.4GHz,Android,...,URAMITA,22031,"6.86450356,-76.21128656",2021-06-01,2021,6,1,1,0,2021-08-11T12:36:45.632036


### Guardando fecha para control de ejecución

* Se actualiza la fecha de control. Si el calculo supera la fecha hora actual, se asocia esta ultima.

In [333]:
fecha_ejecucion= (datetime.strptime(fecha_max_mintic, '%Y-%m-%d %H:%M:%S')+timedelta(minutes=10)).strftime("%Y-%m-%d %H:%M:%S")[0:15] + '0:00'    

if fecha_ejecucion > str(now.strftime('%Y-%m-%d %H:%M:%S'))[0:15] + '0:00':
    fecha_ejecucion = str(now.strftime('%Y-%m-%d %H:%M:%S'))[0:15] + '0:00'
response = es.index(
        index = indice_control,
        id = 'jerarquia-tablero12',
        body = { 'jerarquia-tablero12': 'jerarquia-tablero12','usuarios.fechaControl' : fecha_ejecucion}
)
print("actualizada fecha control de ejecucion:",fecha_ejecucion)

actualizada fecha control de ejecucion: 2021-06-01 01:10:00
