# Generación de Data Única referente a Materia

Unificacion de la data de ingresos y terminos por Materia penal, además de transformación de algunos datos para normalizar nombres en columnas

In [1]:
import pandas as pd
import numpy as np
import os

from tqdm import tqdm
from unicodedata import normalize

from pjud.data import cleandata
from pjud.data import transformdata

In [2]:
tqdm.pandas()

path_interim = "../data/interim/pjud"
path_processed = "../data/processed/pjud"

  from pandas import Panel


# DATA de TRIBUNALES OBTENIDAS DEL COT

In [3]:
# Analizo contra los datos extraidos en COT
df_tribunales = pd.read_feather(f"{path_processed}/generates_ListadoTribunales.feather")
tribunales = df_tribunales['TRIBUNAL'].unique()

# DATAS INGRESO Y TERMINO MATERIA

### DATA INGRESO X MATERA

In [4]:
df_ingresos_materia = pd.read_feather(f"{path_interim}/clean_IngresosMateria.feather")
df_ingresos_materia.head()


Unnamed: 0,index,COD. CORTE,CORTE,COD. TRIBUNAL,TRIBUNAL,RIT,TIPO CAUSA,COD. MATERIA,MATERIA,FECHA INGRESO,MES INGRESO,AÑO INGRESO,TOTAL INGRESOS POR MATERIAS
0,0,10,C.A. DE ARICA,988,TRIBUNAL DE JUICIO ORAL EN LO PENAL DE ARICA,100-2018,Ordinaria,7007,TRAFICO ILICITO DE DROGAS (ART. 3).,2018-04-02,abr-18,2018,1
1,1,10,C.A. DE ARICA,988,TRIBUNAL DE JUICIO ORAL EN LO PENAL DE ARICA,100-2018,Ordinaria,10004,"PORTE ILEGAL DE ARMA DE FUEGO, MUNICIONES Y OT...",2018-04-02,abr-18,2018,1
2,2,10,C.A. DE ARICA,988,TRIBUNAL DE JUICIO ORAL EN LO PENAL DE ARICA,101-2018,Ordinaria,12149,DESACATO (ART. 240 CODIGO DE PROCEDIMIENTO CIV...,2018-04-02,abr-18,2018,1
3,3,10,C.A. DE ARICA,988,TRIBUNAL DE JUICIO ORAL EN LO PENAL DE ARICA,10-2018,Ordinaria,7037,TRAFICO DE PEQUEÑAS CANTIDADES (ART. 4).,2018-01-10,ene-18,2018,1
4,4,10,C.A. DE ARICA,988,TRIBUNAL DE JUICIO ORAL EN LO PENAL DE ARICA,102-2018,Ordinaria,812,RECEPTACION. ART. 456 BIS A.,2018-04-02,abr-18,2018,1


In [5]:
# Normalizo nombres

df_ingresos_materia['TRIBUNAL'] = df_ingresos_materia['TRIBUNAL'].progress_apply(cleandata.cambio_nombre_juzgados)

100%|██████████| 3210689/3210689 [00:18<00:00, 173264.62it/s]


In [6]:
# Verifico si coinciden los nombres e imprimo los que estan en conflicto

for tribunal in df_ingresos_materia['TRIBUNAL'].unique():
    if not tribunal in tribunales:
        print(tribunal)

### TERMINO X MATERIA

In [7]:
df_termino_materia = pd.read_feather(f"{path_interim}/clean_TerminosMateria.feather")
df_termino_materia.head()

Unnamed: 0,index,COD. CORTE,CORTE,COD. TRIBUNAL,TRIBUNAL,RIT,TIPO CAUSA,COD. MATERIA,MATERIA,FECHA INGRESO,FECHA TERMINO,MES TERMINO,AÑO TERMINO,MOTIVO TERMINO,DURACION CAUSA,TOTAL TERMINOS
0,0,10,C.A. DE ARICA,988,TRIBUNAL DE JUICIO ORAL EN LO PENAL DE ARICA,100-2018,Ordinaria,7007,TRAFICO ILICITO DE DROGAS (ART. 3).,2018-04-02,2018-06-01,jun-18,2018,SENTENCIA,60,1
1,1,10,C.A. DE ARICA,988,TRIBUNAL DE JUICIO ORAL EN LO PENAL DE ARICA,100-2018,Ordinaria,10004,"PORTE ILEGAL DE ARMA DE FUEGO, MUNICIONES Y OT...",2018-04-02,2018-06-01,jun-18,2018,SENTENCIA,60,1
2,2,10,C.A. DE ARICA,988,TRIBUNAL DE JUICIO ORAL EN LO PENAL DE ARICA,101-2018,Ordinaria,12149,DESACATO (ART. 240 CODIGO DE PROCEDIMIENTO CIV...,2018-04-02,2018-08-29,ago-18,2018,SENTENCIA,149,1
3,3,10,C.A. DE ARICA,988,TRIBUNAL DE JUICIO ORAL EN LO PENAL DE ARICA,10-2018,Ordinaria,7037,TRAFICO DE PEQUEÑAS CANTIDADES (ART. 4).,2018-01-10,2018-03-14,mar-18,2018,SENTENCIA,63,1
4,4,10,C.A. DE ARICA,988,TRIBUNAL DE JUICIO ORAL EN LO PENAL DE ARICA,102-2018,Ordinaria,812,RECEPTACION. ART. 456 BIS A.,2018-04-02,2018-05-29,may-18,2018,SENTENCIA,57,1


In [8]:
# Normalizo nombres

df_termino_materia['TRIBUNAL'] = df_termino_materia['TRIBUNAL'].progress_apply(cleandata.cambio_nombre_juzgados)

100%|██████████| 3603377/3603377 [00:20<00:00, 171914.83it/s]


In [9]:
# Verifico si coinciden los nombres e imprimo los que estan en conflicto

for tribunal in df_termino_materia['TRIBUNAL'].unique():
    if not tribunal in tribunales:
        print(tribunal)

## Data relacionada a Delitos

In [10]:
path = "../data/processed/delitos"
df_delitos = pd.read_feather(f"{path}/clean_Delitos.feather")
df_delitos.head()

Unnamed: 0,index,COD. MATERIA,MATERIA,TIPOLOGIA MATERIA,VIGENCIA MATERIA
0,0,101,QUEBRANTAMIENTO. ART. 90,LIBRO I TITULO IV QUEBRANTAMIENTO DE SENTEN...,VIGENTE
1,1,202,SECUESTRO. ART. 141,LIBRO II TITULO III CRIMENES Y SIMPLES DELIT...,VIGENTE
2,2,203,SUSTRACCION DE MENORES. ART. 142,LIBRO II TITULO III CRIMENES Y SIMPLES DELIT...,VIGENTE
3,3,204,VIOLACION DE MORADA. ART.144,LIBRO II TITULO III CRIMENES Y SIMPLES DELIT...,VIGENTE
4,4,205,"APERTURA , REGISTRO O INTERCEPTACION DE CORRE...",LIBRO II TITULO III CRIMENES Y SIMPLES DELIT...,VIGENTE


In [11]:
codigos_cot = df_delitos['COD. MATERIA'].unique()
print(f"Existen {len(codigos_cot)} codigos de delitos")

Existen 541 codigos de delitos


## Delitos en INGRESOS MATERIA

In [12]:
codigos_delitos = df_ingresos_materia['COD. MATERIA'].unique()

In [13]:
len(codigos_delitos)

473

In [14]:
codigos_no_encontrados = []
for delito in codigos_delitos:
    if not delito in codigos_cot:
        codigos_no_encontrados.append(delito)

In [15]:
codigos_no_encontrados

[13001, -31075, 0, 4011, 4014, 4013, 4010]

In [16]:
codigos_sin_registro = df_ingresos_materia[df_ingresos_materia['COD. MATERIA'].isin(codigos_no_encontrados)]

codigos_sin_registro['MATERIA'].unique()

# Analizar caso a caso:

array(['LESIONES LEVES.', 'FALTAS AL REGIMEN PENITENCIARIO', '[NULL]',
       'MANEJO EN ESTADO DE EBRIEDAD (SOLO CRIMEN)',
       'ESTAFA (SOLO CRIMEN)', 'ABUSO SEXUAL (SOLO CRIMEN)',
       'VIOLACION (SOLO CRIMEN)'], dtype=object)

#### Caso Codigo 13001 -> LESIONES LEVES
Este codigo debe tratarse como 13036 identificado como: LESIONES LEVES 494 Nº 5 CÓDIGO PENAL

In [17]:
df_ingresos_materia['COD. MATERIA'] = df_ingresos_materia['COD. MATERIA'].replace(13001,13036)

#### Caso Codigo -31075

In [18]:
filtro_codigo_31075 = df_ingresos_materia[df_ingresos_materia['COD. MATERIA']==-31075]
filtro_codigo_31075

Unnamed: 0,index,COD. CORTE,CORTE,COD. TRIBUNAL,TRIBUNAL,RIT,TIPO CAUSA,COD. MATERIA,MATERIA,FECHA INGRESO,MES INGRESO,AÑO INGRESO,TOTAL INGRESOS POR MATERIAS
855922,205398,35,C.A. DE RANCAGUA,1070,JUZGADO DE GARANTIA RANCAGUA,14692-2019,Ordinaria,-31075,FALTAS AL REGIMEN PENITENCIARIO,2019-12-26,dic-19,2019,1
855923,205399,35,C.A. DE RANCAGUA,1070,JUZGADO DE GARANTIA RANCAGUA,14693-2019,Ordinaria,-31075,FALTAS AL REGIMEN PENITENCIARIO,2019-12-26,dic-19,2019,1
855924,205400,35,C.A. DE RANCAGUA,1070,JUZGADO DE GARANTIA RANCAGUA,14694-2019,Ordinaria,-31075,FALTAS AL REGIMEN PENITENCIARIO,2019-12-26,dic-19,2019,1
1065019,414572,56,C.A. DE PUERTO MONTT,1090,JUZGADO DE GARANTIA PUERTO MONTT,12196-2019,Ordinaria,-31075,FALTAS AL REGIMEN PENITENCIARIO,2019-12-23,dic-19,2019,1
1065020,414573,56,C.A. DE PUERTO MONTT,1090,JUZGADO DE GARANTIA PUERTO MONTT,12197-2019,Ordinaria,-31075,FALTAS AL REGIMEN PENITENCIARIO,2019-12-23,dic-19,2019,1
1065023,414576,56,C.A. DE PUERTO MONTT,1090,JUZGADO DE GARANTIA PUERTO MONTT,12200-2019,Ordinaria,-31075,FALTAS AL REGIMEN PENITENCIARIO,2019-12-23,dic-19,2019,1
1065027,414580,56,C.A. DE PUERTO MONTT,1090,JUZGADO DE GARANTIA PUERTO MONTT,12202-2019,Ordinaria,-31075,FALTAS AL REGIMEN PENITENCIARIO,2019-12-23,dic-19,2019,1
1160591,510265,90,C.A. DE SANTIAGO,1226,SEPTIMO JUZGADO DE GARANTIA SANTIAGO,13218-2019,Ordinaria,-31075,FALTAS AL REGIMEN PENITENCIARIO,2019-07-31,jul-19,2019,1


No corresponde a delito sino a sanción interna de gendarmeria, por lo que se eliminarán


In [19]:
df_ingresos_materia.drop(filtro_codigo_31075.index, axis = 0, inplace = True)

### Caso Codigo 0

In [20]:
filtro_codigo_0 = df_ingresos_materia[df_ingresos_materia['COD. MATERIA']==0]
filtro_codigo_0

Unnamed: 0,index,COD. CORTE,CORTE,COD. TRIBUNAL,TRIBUNAL,RIT,TIPO CAUSA,COD. MATERIA,MATERIA,FECHA INGRESO,MES INGRESO,AÑO INGRESO,TOTAL INGRESOS POR MATERIAS
1131971,481619,90,C.A. DE SANTIAGO,1223,CUARTO JUZGADO DE GARANTIA SANTIAGO,1870-2019,Ordinaria,0,[NULL],2019-03-04,mar-19,2019,1
1137312,486960,90,C.A. DE SANTIAGO,1223,CUARTO JUZGADO DE GARANTIA SANTIAGO,6225-2019,Ordinaria,0,[NULL],2019-07-05,jul-19,2019,1


#### valores Null

In [21]:
df_ingresos_materia.drop(filtro_codigo_0.index, axis = 0, inplace = True)

### Codigos 4011, 4014, 4013, 4010
codigos No vigentes, mal cargados en sistemas 

In [22]:
filtro_codigo_4011 = df_ingresos_materia[df_ingresos_materia['COD. MATERIA']==4011]
filtro_codigo_4014 = df_ingresos_materia[df_ingresos_materia['COD. MATERIA']==4014]
filtro_codigo_4013 = df_ingresos_materia[df_ingresos_materia['COD. MATERIA']==4013]
filtro_codigo_4010 = df_ingresos_materia[df_ingresos_materia['COD. MATERIA']==4010]

In [23]:
df_ingresos_materia.drop(filtro_codigo_4011.index, axis = 0, inplace = True)
df_ingresos_materia.drop(filtro_codigo_4014.index, axis = 0, inplace = True)
df_ingresos_materia.drop(filtro_codigo_4013.index, axis = 0, inplace = True)
df_ingresos_materia.drop(filtro_codigo_4010.index, axis = 0, inplace = True)

In [24]:
pd.to_datetime(df_ingresos_materia['FECHA INGRESO'])

0         2018-04-02
1         2018-04-02
2         2018-04-02
3         2018-01-10
4         2018-04-02
             ...    
3210684   2015-12-17
3210685   2015-12-17
3210686   2015-12-24
3210687   2015-12-29
3210688   2015-12-29
Name: FECHA INGRESO, Length: 3210643, dtype: datetime64[ns]

## DELITOS EN TERMINO MATERIA

In [25]:
codigos_delitos = df_termino_materia['COD. MATERIA'].unique()

In [26]:
len(codigos_delitos)

468

In [27]:
codigos_no_encontrados = []
for delito in codigos_delitos:
    if not delito in codigos_cot:
        codigos_no_encontrados.append(delito)

In [28]:
codigos_no_encontrados

[13001, 4014, 4013, 4011, -31075, 4010, 0, 4007]

In [29]:
codigos_sin_registro = df_termino_materia[df_termino_materia['COD. MATERIA'].isin(codigos_no_encontrados)]

codigos_sin_registro['MATERIA'].unique()

# Analizar caso a caso:

array(['LESIONES LEVES.', 'ESTAFA (SOLO CRIMEN)',
       'ABUSO SEXUAL (SOLO CRIMEN)',
       'MANEJO EN ESTADO DE EBRIEDAD (SOLO CRIMEN)',
       'FALTAS AL REGIMEN PENITENCIARIO', 'VIOLACION (SOLO CRIMEN)',
       'LESIONES LEVES', '(en blanco)', 'HURTO (SOLO CRIMEN)',
       'NO REGISTRA CODIGO DE MATERIA'], dtype=object)

## Caso 13001 -- > LESIONES LEVES

In [30]:
df_termino_materia['COD. MATERIA'] = df_termino_materia['COD. MATERIA'].replace(13001,13036)

### Casos 4014, 4013, 4011, -31075, 4010, 0, 4007

In [31]:
filtro_codigo_4011 = df_termino_materia[df_termino_materia['COD. MATERIA']==4011]
filtro_codigo_4014 = df_termino_materia[df_termino_materia['COD. MATERIA']==4014]
filtro_codigo_4013 = df_termino_materia[df_termino_materia['COD. MATERIA']==4013]
filtro_codigo_4010 = df_termino_materia[df_termino_materia['COD. MATERIA']==4010]
filtro_codigo_31075 = df_termino_materia[df_termino_materia['COD. MATERIA']==31075]
filtro_codigo_4007 = df_termino_materia[df_termino_materia['COD. MATERIA']==4007]
filtro_codigo_0 = df_termino_materia[df_termino_materia['COD. MATERIA']==0]

In [32]:
df_termino_materia.drop(filtro_codigo_4011.index, axis = 0, inplace = True)
df_termino_materia.drop(filtro_codigo_4014.index, axis = 0, inplace = True)
df_termino_materia.drop(filtro_codigo_4013.index, axis = 0, inplace = True)
df_termino_materia.drop(filtro_codigo_4010.index, axis = 0, inplace = True)
df_termino_materia.drop(filtro_codigo_31075.index, axis = 0, inplace = True)
df_termino_materia.drop(filtro_codigo_4007.index, axis = 0, inplace = True)
df_termino_materia.drop(filtro_codigo_0.index, axis = 0, inplace = True)

In [33]:
pd.to_datetime(df_termino_materia['FECHA INGRESO'])
pd.to_datetime(df_termino_materia['FECHA TERMINO'])

0         2018-06-01
1         2018-06-01
2         2018-08-29
3         2018-03-14
4         2018-05-29
             ...    
3603372   2016-05-21
3603373   2016-05-21
3603374   2016-11-08
3603375   2016-01-18
3603376   2016-09-16
Name: FECHA TERMINO, Length: 3603336, dtype: datetime64[ns]

# Creacion Consolidado por Materia Penal

Comenzaremos el analisis de la data consolidando la info en un unico DataSet, para ello vamos a considerar los siguientes puntos:


- DATA:  Se considerará toda las causas que ingresaron al Sistema desde 2015 al 2019, esto ya que se cuenta además con la data de las audiencias en ese período.


- No se consideran causas anteriores a este período.

- Se considerarán Causas sin termino.

In [34]:
df_ingresos_materia.sort_values('FECHA INGRESO')

Unnamed: 0,index,COD. CORTE,CORTE,COD. TRIBUNAL,TRIBUNAL,RIT,TIPO CAUSA,COD. MATERIA,MATERIA,FECHA INGRESO,MES INGRESO,AÑO INGRESO,TOTAL INGRESOS POR MATERIAS
3033192,454022,90,C.A. DE SANTIAGO,1225,SEXTO JUZGADO DE GARANTIA SANTIAGO,7-2015,Ordinaria,12077,NO DAR CUENTA DE ACCIDENTE DE TRANSITOART. 195...,2015-01-01,ene-15,2015,1
2893930,314651,50,C.A. DE TEMUCO,937,JUZGADO DE GARANTIA TEMUCO,6-2015,Ordinaria,7037,TRAFICO DE PEQUEÑAS CANTIDADES (ART. 4).,2015-01-01,ene-15,2015,1
2893929,314650,50,C.A. DE TEMUCO,937,JUZGADO DE GARANTIA TEMUCO,5-2015,Ordinaria,13028,HURTO FALTA (494 BIS CODIGO PENAL).,2015-01-01,ene-15,2015,1
2893928,314649,50,C.A. DE TEMUCO,937,JUZGADO DE GARANTIA TEMUCO,4-2015,Ordinaria,14052,CONDUC. ESTADO DE EBRIEDAD CON O SIN DAÑOS O L...,2015-01-01,ene-15,2015,1
2893927,314648,50,C.A. DE TEMUCO,937,JUZGADO DE GARANTIA TEMUCO,3-2015,Ordinaria,13027,DAÑO FALTA (495 NR 21 CODIGO PENAL).,2015-01-01,ene-15,2015,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...
760811,110188,30,C.A. DE VALPARAISO,1045,JUZGADO DE GARANTIA VALPARAISO,14411-2019,Ordinaria,7006,CULTIVO/COSECHA ESPEC.VEGETALES PRODUCTORAS ES...,2019-12-31,dic-19,2019,1
1146410,496058,90,C.A. DE SANTIAGO,1224,QUINTO JUZGADO DE GARANTIA SANTIAGO,4799-2019,Ordinaria,524,AMENAZAS SIMPLES CONTRA PERSONAS Y PROPIEDADES...,2019-12-31,dic-19,2019,1
1146411,496059,90,C.A. DE SANTIAGO,1224,QUINTO JUZGADO DE GARANTIA SANTIAGO,4800-2019,Ordinaria,1099,OTROS HECHOS QUE NO CONSTITUYAN DELITO: AGRUP....,2019-12-31,dic-19,2019,1
1041523,391063,55,C.A. DE VALDIVIA,1085,JUZGADO DE GARANTIA MARIQUINA,1550-2019,Ordinaria,13028,HURTO FALTA (494 BIS CODIGO PENAL).,2019-12-31,dic-19,2019,1


In [35]:
df_termino_materia.sort_values('FECHA INGRESO')

Unnamed: 0,index,COD. CORTE,CORTE,COD. TRIBUNAL,TRIBUNAL,RIT,TIPO CAUSA,COD. MATERIA,MATERIA,FECHA INGRESO,FECHA TERMINO,MES TERMINO,AÑO TERMINO,MOTIVO TERMINO,DURACION CAUSA,TOTAL TERMINOS
433047,433419,56,C.A. DE PUERTO MONTT,662,JUZGADO DE LETRAS Y GARANTIA QUELLON,684-2018,Ordinaria,518,PORTE DE ARMA CORTANTE O PUNZANTE (288 BIS).,1900-01-01,2018-08-21,ago-18,2018,SENTENCIA,-22204,1
324194,324466,46,C.A. DE CONCEPCION,1080,JUZGADO DE GARANTIA TALCAHUANO,2398-2017,Ordinaria,848,HURTO SIMPLE POR UN VALOR DE MEDIA A MENOS DE ...,1900-01-01,2018-05-31,may-18,2018,DECLARA SOBRESEIMIENTO DEFINITIVO.,-22286,1
364405,364702,50,C.A. DE TEMUCO,214,JUZGADO DE LETRAS Y GARANTIA PUCON,1059-2017,Ordinaria,710,LESIONES MENOS GRAVES.,1900-01-01,2018-10-01,oct-18,2018,DECLARA SOBRESEIMIENTO DEFINITIVO.,-22163,1
1538565,97453,25,C.A. DE LA SERENA,932,JUZGADO DE GARANTIA OVALLE,1-2000,Ordinaria,801,HURTO SIMPLE,2000-12-20,2015-06-02,jun-15,2015,CERTIFICA CUMPLIMIENTO ART. 468.,5277,1
1541216,100104,25,C.A. DE LA SERENA,932,JUZGADO DE GARANTIA OVALLE,3-2000,Ordinaria,613,ABUSOS DESHONESTOS,2000-12-21,2015-06-02,jun-15,2015,NO PERSEVERAR EN EL PROCEDIMIENTO.,5276,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
1132871,403096,55,C.A. DE VALDIVIA,226,JUZGADO DE LETRAS Y GARANTIA LA UNION,1726-2019,Ordinaria,524,AMENAZAS SIMPLES CONTRA PERSONAS Y PROPIEDADES...,2019-12-31,2019-12-31,dic-19,2019,APROBACION NO INICIO INVESTIGACION.,0,1
1132870,403095,55,C.A. DE VALDIVIA,226,JUZGADO DE LETRAS Y GARANTIA LA UNION,1725-2019,Ordinaria,12152,APROPIACION DE COTIZAC.PREVISIONALES Y DECLARA...,2019-12-31,2019-12-31,dic-19,2019,APROBACION NO INICIO INVESTIGACION.,0,1
1132869,403094,55,C.A. DE VALDIVIA,226,JUZGADO DE LETRAS Y GARANTIA LA UNION,1724-2019,Ordinaria,13027,DAÑO FALTA (495 NR 21 CODIGO PENAL).,2019-12-31,2019-12-31,dic-19,2019,COMUNICA Y/O APLICA DECISION PPIO. DE OPORTUNI...,0,1
1134540,404767,55,C.A. DE VALDIVIA,227,JUZGADO DE LETRAS Y GARANTIA RIO BUENO,1463-2019,Ordinaria,799,OTROS DELITOS CONTRA LAS PERSONAS,2019-12-31,2019-12-31,dic-19,2019,APROBACION NO INICIO INVESTIGACION.,0,1


##### Verifico si existen Causas sin Fechas de inicio

In [36]:
filtro = df_ingresos_materia[df_ingresos_materia['FECHA INGRESO'].isnull()]

In [37]:
print(f"Existen: {len(filtro)} causas con Fechas Ingreso Null")

Existen: 0 causas con Fechas Ingreso Null


##### Verifico si existen Causas con Fechas de inicio con NULL en Termino_Materia

In [38]:
filtro_null = df_termino_materia[df_termino_materia['FECHA INGRESO'].isnull()]
print(f"Existen {len(filtro_null)} causas con Fecha Ingreso Null")

Existen 0 causas con Fecha Ingreso Null


Elimino las filas con valores nulos

In [39]:
df_termino_materia.drop(filtro_null.index, axis = 0, inplace = True)

Verifico las causas con Fecha Ingreso anterior a 01-01-2015

In [40]:
filtro_fechas = df_termino_materia[df_termino_materia['FECHA INGRESO'] <= '2014-12-31']
print(f"Existen {len(filtro_fechas)} causas con Fecha Ingreso anteriores al 31-12-2014 que no deben ser considerada")

Existen 462068 causas con Fecha Ingreso anteriores al 31-12-2014 que no deben ser considerada


Elimino las causas con Fecha de Ingreso anterior a 31-12-2014

In [41]:
df_termino_materia.drop(filtro_fechas.index, axis = 0, inplace = True)

In [42]:
df_termino_materia

Unnamed: 0,index,COD. CORTE,CORTE,COD. TRIBUNAL,TRIBUNAL,RIT,TIPO CAUSA,COD. MATERIA,MATERIA,FECHA INGRESO,FECHA TERMINO,MES TERMINO,AÑO TERMINO,MOTIVO TERMINO,DURACION CAUSA,TOTAL TERMINOS
0,0,10,C.A. DE ARICA,988,TRIBUNAL DE JUICIO ORAL EN LO PENAL ARICA,100-2018,Ordinaria,7007,TRAFICO ILICITO DE DROGAS (ART. 3).,2018-04-02,2018-06-01,jun-18,2018,SENTENCIA,60,1
1,1,10,C.A. DE ARICA,988,TRIBUNAL DE JUICIO ORAL EN LO PENAL ARICA,100-2018,Ordinaria,10004,"PORTE ILEGAL DE ARMA DE FUEGO, MUNICIONES Y OT...",2018-04-02,2018-06-01,jun-18,2018,SENTENCIA,60,1
2,2,10,C.A. DE ARICA,988,TRIBUNAL DE JUICIO ORAL EN LO PENAL ARICA,101-2018,Ordinaria,12149,DESACATO (ART. 240 CODIGO DE PROCEDIMIENTO CIV...,2018-04-02,2018-08-29,ago-18,2018,SENTENCIA,149,1
3,3,10,C.A. DE ARICA,988,TRIBUNAL DE JUICIO ORAL EN LO PENAL ARICA,10-2018,Ordinaria,7037,TRAFICO DE PEQUEÑAS CANTIDADES (ART. 4).,2018-01-10,2018-03-14,mar-18,2018,SENTENCIA,63,1
4,4,10,C.A. DE ARICA,988,TRIBUNAL DE JUICIO ORAL EN LO PENAL ARICA,102-2018,Ordinaria,812,RECEPTACION. ART. 456 BIS A.,2018-04-02,2018-05-29,may-18,2018,SENTENCIA,57,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
3603372,721902,91,C.A. DE SAN MIGUEL,1355,TRIBUNAL DE JUICIO ORAL EN LO PENAL MELIPILLA,98-2015,Ordinaria,901,"CUASIDELITO DE LESIONES: ART 490, 491 INC 2° Y...",2015-12-17,2016-05-21,may-16,2016,SENTENCIA,156,1
3603373,721903,91,C.A. DE SAN MIGUEL,1355,TRIBUNAL DE JUICIO ORAL EN LO PENAL MELIPILLA,98-2015,Ordinaria,12077,NO DAR CUENTA DE ACCIDENTE DE TRANSITOART. 195...,2015-12-17,2016-05-21,may-16,2016,SENTENCIA,156,1
3603374,721904,91,C.A. DE SAN MIGUEL,1355,TRIBUNAL DE JUICIO ORAL EN LO PENAL MELIPILLA,98-2016,Ordinaria,10008,PORTE DE ARMA PROHIBIDA (ART. 14 INC. 1°),2016-07-27,2016-11-08,nov-16,2016,SENTENCIA,104,1
3603375,721905,91,C.A. DE SAN MIGUEL,1355,TRIBUNAL DE JUICIO ORAL EN LO PENAL MELIPILLA,99-2015,Ordinaria,12082,AMENAZASA CARABINEROS (ART. 417 COD. J.MILITAR).,2015-12-17,2016-01-18,ene-16,2016,SENTENCIA,32,1


Verifico si existen Causas con duracion negativo, esto se debe a error en Sistema y debe cambiar el orden.

In [43]:
df_termino_materia[df_termino_materia['DURACION CAUSA']<0]

Unnamed: 0,index,COD. CORTE,CORTE,COD. TRIBUNAL,TRIBUNAL,RIT,TIPO CAUSA,COD. MATERIA,MATERIA,FECHA INGRESO,FECHA TERMINO,MES TERMINO,AÑO TERMINO,MOTIVO TERMINO,DURACION CAUSA,TOTAL TERMINOS
793,793,10,C.A. DE ARICA,992,JUZGADO DE GARANTIA ARICA,10153-2018,Ordinaria,905,CUASIDELITO DE HOMICIDIO.,2018-12-11,2018-11-30,nov-18,2018,DECLARA INCOMPETENCIA.,-11,1
794,794,10,C.A. DE ARICA,992,JUZGADO DE GARANTIA ARICA,10154-2018,Ordinaria,808,ROBO EN BIENES NACIONALES DE USO PUBLICO O SIT...,2018-12-11,2018-11-30,nov-18,2018,DECLARA INCOMPETENCIA.,-11,1
795,795,10,C.A. DE ARICA,992,JUZGADO DE GARANTIA ARICA,10155-2018,Ordinaria,710,LESIONES MENOS GRAVES.,2018-12-11,2018-12-03,dic-18,2018,DECLARA INCOMPETENCIA.,-8,1
796,796,10,C.A. DE ARICA,992,JUZGADO DE GARANTIA ARICA,10156-2018,Ordinaria,710,LESIONES MENOS GRAVES.,2018-12-11,2018-12-03,dic-18,2018,DECLARA INCOMPETENCIA.,-8,1
1084,1084,10,C.A. DE ARICA,992,JUZGADO DE GARANTIA ARICA,10413-2018,Ordinaria,7007,TRAFICO ILICITO DE DROGAS (ART. 3).,2018-12-20,2018-12-05,dic-18,2018,DECLARA INCOMPETENCIA.,-15,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
3602454,720984,91,C.A. DE SAN MIGUEL,1322,TRIBUNAL DE JUICIO ORAL EN LO PENAL PUENTE ALTO,137-2016,Ordinaria,7007,TRAFICO ILICITO DE DROGAS (ART. 3).,2016-10-28,2016-10-26,oct-16,2016,DECLARA INCOMPETENCIA.,-2,1
3602474,721004,91,C.A. DE SAN MIGUEL,1322,TRIBUNAL DE JUICIO ORAL EN LO PENAL PUENTE ALTO,159-2016,Ordinaria,7007,TRAFICO ILICITO DE DROGAS (ART. 3).,2016-11-30,2016-08-30,ago-16,2016,DECLARA INCOMPETENCIA.,-92,1
3602475,721005,91,C.A. DE SAN MIGUEL,1322,TRIBUNAL DE JUICIO ORAL EN LO PENAL PUENTE ALTO,159-2016,Ordinaria,7007,TRAFICO ILICITO DE DROGAS (ART. 3).,2016-11-30,2016-09-15,sept-16,2016,DECLARA INCOMPETENCIA.,-76,1
3602476,721006,91,C.A. DE SAN MIGUEL,1322,TRIBUNAL DE JUICIO ORAL EN LO PENAL PUENTE ALTO,159-2016,Ordinaria,7007,TRAFICO ILICITO DE DROGAS (ART. 3).,2016-11-30,2016-10-03,oct-16,2016,DECLARA INCOMPETENCIA.,-58,1


In [44]:
df_termino_materia = df_termino_materia.progress_apply(transformdata.fechas_cambiadas, axis=1)

100%|██████████| 3141268/3141268 [03:17<00:00, 15874.40it/s]


In [45]:
df_termino_materia[df_termino_materia['DURACION CAUSA']<0]

Unnamed: 0,index,COD. CORTE,CORTE,COD. TRIBUNAL,TRIBUNAL,RIT,TIPO CAUSA,COD. MATERIA,MATERIA,FECHA INGRESO,FECHA TERMINO,MES TERMINO,AÑO TERMINO,MOTIVO TERMINO,DURACION CAUSA,TOTAL TERMINOS


In [46]:
df_ingresos_materia['AÑO INGRESO'].value_counts()

2019    666961
2018    650653
2016    631379
2015    631261
2017    630389
Name: AÑO INGRESO, dtype: int64

In [47]:
df_termino_materia[df_termino_materia['FECHA INGRESO']<'01-01-2015']

Unnamed: 0,index,COD. CORTE,CORTE,COD. TRIBUNAL,TRIBUNAL,RIT,TIPO CAUSA,COD. MATERIA,MATERIA,FECHA INGRESO,FECHA TERMINO,MES TERMINO,AÑO TERMINO,MOTIVO TERMINO,DURACION CAUSA,TOTAL TERMINOS


## CARGA DATA A ARCHIVOS FUTHER

In [48]:
# Directorio donde se guardaran archivos feather
df_ingresos_materia.reset_index(inplace=True, drop=True)
df_termino_materia.reset_index(inplace=True, drop=True)
os.makedirs(path_processed, exist_ok = True)  

# Guardamos dataset como archivo feather

df_ingresos_materia.to_feather(f'{path_processed}/processes_IngresosMateria.feather')
df_termino_materia.to_feather(f'{path_processed}/processes_TerminosMateria.feather')