## Revisión de REPORTE DE DATOS SOBRE LA CARGA LABORAL EN LAS FISCALÍAS DE SOLUCIONES RÁPIDAS (FSR)

* Fecha: 2021-12-29
* Programador: Lenin G.F.
* Objetivo: Verificar los cálculos realizados por la EPN a fin de obtener la constante respectiva a la *carga laboral* de las Físcalías de Soluciones Rápidas

In [1]:
import pandas as pd
import numpy as np
import os
dir_root = os.getcwd()
dir_root

'c:\\Users\\falconiel\\PycharmProjects\\FGE_Statistics'

Se realiza la consulta de Ndds archivadas en Fiscalías de Soluciones Rápidas de los cantones indicados en el reporte de la EPN. La consulta es realizada con corte de la base de datos a 2021-12-24. La información está almacenada en la librería de visualizadores de elastic con el nombre: **FiscaliasSolucionRapidaEPNPromedio**

### Metodología

A fin de evaluar los cálculos realizados por la EPN se procede a ejecutar los pasos realizados por la EPN de acuerdo a su metodología. El resultado debería ser aproximado al obtenido. Los pasos son esencialmente los siguientes:

1. Identificar los cantones que tienen FSR. Dado que no dispongo del archivo REPORTE CRUCE FISCALÍAS.xslx, parto de asumir que los cantones Guayaquil, Cuenca, Loja, Machala, Lago Agrio, La Libertad y Quito son los que tienen FSR

2. Se filtra la información según los años 2018, 2019 y 2020 de la Fecha de Estado Procesal y se construye la tabla de datos que es leída en este notebook

3. El conteo ya fue realizado en Elastic Search

4. Se procede a obtener los promedios anuales

In [2]:
datapath = os.path.join(dir_root,
                        'data/estudioEPN/FiscaliasSolucionRapidaEPNPromedio.csv')
datos_elastic = pd.read_csv(datapath)
datos_elastic

Unnamed: 0,FECHA_ESTADO_PROCESAL,PROVINCIAR,CANTONR,FISCALIAR,Count
0,2018,GUAYAS,GUAYAQUIL,FISCALIA DE SOLUCIONES RAPIDAS 2,1712
1,2018,GUAYAS,GUAYAQUIL,FISCALIA DE SOLUCIONES RAPIDAS 3,1583
2,2018,GUAYAS,GUAYAQUIL,FISCALIA DE SOLUCIONES RAPIDAS 5,1449
3,2018,GUAYAS,GUAYAQUIL,FISCALIA DE SOLUCIONES RAPIDAS 1,643
4,2018,GUAYAS,GUAYAQUIL,FISCALIA DE SOLUCIONES RAPIDAS 9,424
...,...,...,...,...,...
90,2020,LOJA,LOJA,FISCALIA DE SOLUCIONES RAPIDAS 1,527
91,2020,SANTA ELENA,LA LIBERTAD,FISCALIA DE SOLUCIONES RAPIDAS 1,413
92,2020,SANTA ELENA,LA LIBERTAD,FISCALIA DE SOLUCIONES RAPIDAS 2,383
93,2020,SUCUMBIOS,LAGO AGRIO ( NUEVA LOJA ),FISCALIA DE SOLUCIONES RAPIDAS 1,288


Los resultados los podemos obtener usando un crosstab en pandas. Luego también se puede hacer un pivot_table para obtener o revisar un caso particular

In [3]:
result1 = pd.crosstab([datos_elastic.PROVINCIAR, datos_elastic.CANTONR, datos_elastic.FISCALIAR],
                      [datos_elastic.FECHA_ESTADO_PROCESAL],
                      values=datos_elastic.Count,
                      aggfunc=np.sum)
result1

Unnamed: 0_level_0,Unnamed: 1_level_0,FECHA_ESTADO_PROCESAL,2018,2019,2020
PROVINCIAR,CANTONR,FISCALIAR,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
AZUAY,CUENCA,FISCALIA DE SOLUCIONES RAPIDAS 1,244.0,2323.0,1020.0
AZUAY,CUENCA,FISCALIA DE SOLUCIONES RAPIDAS 2,1376.0,1049.0,435.0
AZUAY,CUENCA,FISCALIA DE SOLUCIONES RAPIDAS 3,1069.0,2566.0,495.0
AZUAY,CUENCA,FISCALIA DE SOLUCIONES RAPIDAS 4,951.0,2439.0,870.0
AZUAY,CUENCA,FISCALIA DE SOLUCIONES RAPIDAS 5,403.0,1913.0,586.0
EL ORO,MACHALA,FISCALIA DE SOLUCIONES RAPIDAS 1,262.0,1254.0,1137.0
EL ORO,MACHALA,FISCALIA DE SOLUCIONES RAPIDAS 2,379.0,1072.0,975.0
EL ORO,MACHALA,FISCALIA DE SOLUCIONES RAPIDAS 3,328.0,469.0,577.0
GUAYAS,GUAYAQUIL,FISCALIA DE SOLUCIONES RAPIDAS 1,643.0,1554.0,721.0
GUAYAS,GUAYAQUIL,FISCALIA DE SOLUCIONES RAPIDAS 2,1712.0,1852.0,1536.0


In [4]:
medias_anuales = pd.DataFrame(result1.mean(axis=1))
medias_anuales

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,0
PROVINCIAR,CANTONR,FISCALIAR,Unnamed: 3_level_1
AZUAY,CUENCA,FISCALIA DE SOLUCIONES RAPIDAS 1,1195.666667
AZUAY,CUENCA,FISCALIA DE SOLUCIONES RAPIDAS 2,953.333333
AZUAY,CUENCA,FISCALIA DE SOLUCIONES RAPIDAS 3,1376.666667
AZUAY,CUENCA,FISCALIA DE SOLUCIONES RAPIDAS 4,1420.0
AZUAY,CUENCA,FISCALIA DE SOLUCIONES RAPIDAS 5,967.333333
EL ORO,MACHALA,FISCALIA DE SOLUCIONES RAPIDAS 1,884.333333
EL ORO,MACHALA,FISCALIA DE SOLUCIONES RAPIDAS 2,808.666667
EL ORO,MACHALA,FISCALIA DE SOLUCIONES RAPIDAS 3,458.0
GUAYAS,GUAYAQUIL,FISCALIA DE SOLUCIONES RAPIDAS 1,972.666667
GUAYAS,GUAYAQUIL,FISCALIA DE SOLUCIONES RAPIDAS 2,1700.0


Procedo a extraer los datos de Pichincha Quito

In [5]:
quito = medias_anuales.loc[('PICHINCHA', 'QUITO')]
quito

Unnamed: 0_level_0,0
FISCALIAR,Unnamed: 1_level_1
FISCALIA DE SOLUCIONES RAPIDAS 1,1775.333333
FISCALIA DE SOLUCIONES RAPIDAS 2,940.0
FISCALIA DE SOLUCIONES RAPIDAS 3,723.333333
FISCALIA DE SOLUCIONES RAPIDAS 4,584.0
FISCALIA DE SOLUCIONES RAPIDAS 5,117.0
FISCALIA DE SOLUCIONES RAPIDAS 6,744.333333
FISCALIA DE SOLUCIONES RAPIDAS 7,59.0


In [6]:
quito.mean()

0    706.142857
dtype: float64

Obtención del resultado por medio de tablas pivot

In [8]:
result2 = pd.pivot_table(datos_elastic,
                         index=['PROVINCIAR', 'CANTONR'],
                         columns=['FECHA_ESTADO_PROCESAL'],
                         values='Count',
                         aggfunc=[np.mean, np.sum])
result2

Unnamed: 0_level_0,Unnamed: 1_level_0,mean,mean,mean,sum,sum,sum
Unnamed: 0_level_1,FECHA_ESTADO_PROCESAL,2018,2019,2020,2018,2019,2020
PROVINCIAR,CANTONR,Unnamed: 2_level_2,Unnamed: 3_level_2,Unnamed: 4_level_2,Unnamed: 5_level_2,Unnamed: 6_level_2,Unnamed: 7_level_2
AZUAY,CUENCA,808.6,2058.0,681.2,4043,10290,3406
EL ORO,MACHALA,323.0,931.666667,896.333333,969,2795,2689
GUAYAS,GUAYAQUIL,696.222222,1267.0,783.111111,6266,11403,7048
LOJA,LOJA,472.25,705.25,851.333333,1889,2821,2554
PICHINCHA,QUITO,213.285714,505.428571,1399.714286,1493,3538,9798
SANTA ELENA,LA LIBERTAD,146.0,221.5,398.0,292,443,796
SUCUMBIOS,LAGO AGRIO ( NUEVA LOJA ),373.5,200.0,218.0,747,400,436


Promedio del Promedio para Quito

In [12]:
result2.loc[('PICHINCHA', 'QUITO')]['mean'].mean()

706.1428571428572

### Verificación del conteo de NDDs de acuerdo a los Filtros planteados en la Metodología

Para esto se lee directamente la base sql suministrada a la EPN y se espera obtener las cuentas reaizadas en el documento

In [13]:
from snippets.utils import conectar_sql
from sqlalchemy import text
conn = conectar_sql()

conectando con big data database....
<sqlalchemy.engine.base.Connection object at 0x00000245A7D5EAF0>


In [17]:
query = text("""
             SELECT epn.Provincia,
             epn.Canton,
             CONCAT(epn.Fiscalia_Especializada,epn.Numero_fiscalia) AS 'ESPECIALIZADA',
             CAST(YEAR(epn.`FECHA DE ESTADO PROCESAL`) AS CHAR) AS 'AÑO_ESTADOP',
             -- count(epn.NDD)
             epn.NDD
             FROM reportes.tmp_epn_estudio_FGE epn
             WHERE epn.Fiscalia_Especializada = 'FISCALIA DE SOLUCIONES RAPIDAS'
             AND epn.Canton IN ('QUITO', 'CUENCA', 'LOJA', 'MACHALA', 'GUAYAQUIL', 'LA LIBERTAD', 'LAGO AGRIO (NUEVA LOJA)')
             AND epn.`ESTADO DE LA NDD` = 'ARCHIVADA POR ACEPTACION DE SOLICITUD'
             AND CAST(YEAR(epn.`FECHA DE ESTADO PROCESAL`) AS CHAR) IN ('2018', '2019', '2020');
"""
)
epn_data_sql = pd.read_sql(query, con=conn)
epn_data_sql.shape

(64082, 5)

In [19]:
pd.crosstab([epn_data_sql.Provincia, epn_data_sql.Canton, epn_data_sql.ESPECIALIZADA],
            [epn_data_sql.AÑO_ESTADOP],
            margins=True)

Unnamed: 0_level_0,Unnamed: 1_level_0,AÑO_ESTADOP,2018,2019,2020,All
Provincia,Canton,ESPECIALIZADA,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
AZUAY,CUENCA,FISCALIA DE SOLUCIONES RAPIDAS1,184,1910,771,2865
AZUAY,CUENCA,FISCALIA DE SOLUCIONES RAPIDAS2,1300,1017,375,2692
AZUAY,CUENCA,FISCALIA DE SOLUCIONES RAPIDAS3,986,2449,205,3640
AZUAY,CUENCA,FISCALIA DE SOLUCIONES RAPIDAS4,814,2023,767,3604
AZUAY,CUENCA,FISCALIA DE SOLUCIONES RAPIDAS5,332,1718,450,2500
EL ORO,MACHALA,FISCALIA DE SOLUCIONES RAPIDAS1,122,956,979,2057
EL ORO,MACHALA,FISCALIA DE SOLUCIONES RAPIDAS2,286,926,912,2124
EL ORO,MACHALA,FISCALIA DE SOLUCIONES RAPIDAS3,298,410,520,1228
GUAYAS,GUAYAQUIL,FISCALIA DE SOLUCIONES RAPIDAS1,77,741,504,1322
GUAYAS,GUAYAQUIL,FISCALIA DE SOLUCIONES RAPIDAS2,1296,1670,1447,4413
