# Generación de Data Única referente a Inventario

Transformación de algunos datos para normalizar nombres en columnas

In [1]:
import pandas as pd
import numpy as np
import os
from tqdm import tqdm
from unicodedata import normalize

from src.data import cleandata

In [2]:
tqdm.pandas()

path_interim = "../data/interim/pjud"
path_processed = "../data/processed/pjud"

  from pandas import Panel


# DATA de TRIBUNALES OBTENIDAS DEL COT

In [3]:
# Analizo contra los datos extraidos en COT
df_tribunales = pd.read_feather(f"{path_processed}/ListadoTribunales_feather")
tribunales = df_tribunales['TRIBUNAL'].unique()

# DATA INVENTARIO

In [4]:
df_inventario = pd.read_feather(f"{path_interim}/Inventario_feather")
df_inventario.sort_values('FECHA INGRESO')

Unnamed: 0,level_0,index,COD. CORTE,CORTE,COD. TRIBUNAL,TRIBUNAL,RIT,COMPETENCIA,TIPO CAUSA,COD. MATERIA,MATERIA,TIPO ULT. DILIGENCIA,FECHA ULT. DILIGENCIA,FECHA INGRESO,TOTAL INVENTARIO
967883,968392,152440,50,C.A. DE TEMUCO,939,JUZGADO DE GARANTIA DE VILLARRICA,33-2001,GARANTIA,Ordinaria,0,GIRO DOLOSO DE CHEQUES (SOLO CRIMEN),AUDIENCIA,2002-06-25,2001-01-24,1
234658,234721,234726,50,C.A. DE TEMUCO,937,JUZGADO DE GARANTIA DE TEMUCO,658-2001,GARANTIA,Ordinaria,14053,EXPENDIO DE BEBIDA ALCOHOLICA .,RESOLUCION,2004-03-22,2001-03-06,1
640386,640697,203091,50,C.A. DE TEMUCO,937,JUZGADO DE GARANTIA DE TEMUCO,658-2001,GARANTIA,Ordinaria,14053,EXPENDIO DE BEBIDAS ALCOHOLICAS.,RESOLUCION,2004-03-22,2001-03-06,1
959792,960298,144346,50,C.A. DE TEMUCO,937,JUZGADO DE GARANTIA DE TEMUCO,1151-2001,GARANTIA,Ordinaria,0,CONDUC. ESTADO DE EBRIEDAD CON O SIN DAÑOS O L...,AUDIENCIA,2001-10-30,2001-04-06,1
968718,969227,153275,50,C.A. DE TEMUCO,940,JUZGADO DE GARANTIA DE ANGOL,526-2001,GARANTIA,Ordinaria,0,GIRO DOLOSO DE CHEQUES (SOLO CRIMEN),RESOLUCION,2014-12-29,2001-04-10,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
169925,169973,169978,40,C.A. DE TALCA,966,JUZGADO DE GARANTIA DE CAUQUENES,1481-2019,GARANTIA,Ordinaria,13097,OTRA FALTA CODIGO PENAL.,RESOLUCION,2019-12-31,2019-12-31,1
169926,169974,169979,40,C.A. DE TALCA,966,JUZGADO DE GARANTIA DE CAUQUENES,1482-2019,GARANTIA,Ordinaria,802,ROBO CON INTIMIDACION.,RESOLUCION,2019-12-31,2019-12-31,1
312327,312433,312438,90,C.A. DE SANTIAGO,1224,5º JUZGADO DE GARANTIA DE SANTIAGO,4801-2019,GARANTIA,Ordinaria,710,LE IONE MENO GRAVE .,RESOLUCION,2019-12-31,2019-12-31,1
242084,242150,242155,50,C.A. DE TEMUCO,942,JUZGADO DE GARANTIA DE NUEVA IMPERIAL,1953-2019,GARANTIA,Ordinaria,710,LE IONE MENO GRAVE .,AUDIENCIA,2019-12-31,2019-12-31,1


In [5]:
filtro_fecha = df_inventario[df_inventario['FECHA INGRESO']<='2014-12-31']
print(f"Existen {len(filtro_fecha)} causas ingresadas antes del 01-01-2015")

Existen 203930 causas ingresadas antes del 01-01-2015


In [6]:
df_inventario.drop(filtro_fecha.index, axis=0, inplace=True)

In [7]:
filtro_null = df_inventario[df_inventario['FECHA INGRESO'].isnull()]
print(f"Existen {len(filtro_null)} causas sin fecha de ingresos")

Existen 0 causas sin fecha de ingresos


In [8]:
df_inventario.drop(filtro_null.index, axis=0, inplace=True)

In [9]:
# Normalizo nombres

df_inventario['TRIBUNAL'] = df_inventario['TRIBUNAL'].progress_apply(cleandata.cambio_nombre_juzgados)

100%|██████████| 1581421/1581421 [00:08<00:00, 176172.17it/s]


In [10]:
# Verifico si coinciden los nombres e imprimo los que estan en conflicto

for tribunal in df_inventario['TRIBUNAL'].unique():
    if not tribunal in tribunales:
        print(tribunal)

## Data relacionada a delitos

In [11]:
df_delitos = pd.read_feather(f"{path_processed}/Delitos_feather")
df_delitos.head()

Unnamed: 0,index,COD. MATERIA,MATERIA,TIPOLOGIA MATERIA,VIGENCIA MATERIA
0,0,101,QUEBRANTAMIENTO. ART. 90,LIBRO I TITULO IV QUEBRANTAMIENTO DE SENTEN...,VIGENTE
1,1,202,SECUESTRO. ART. 141,LIBRO II TITULO III CRIMENES Y SIMPLES DELIT...,VIGENTE
2,2,203,SUSTRACCION DE MENORES. ART. 142,LIBRO II TITULO III CRIMENES Y SIMPLES DELIT...,VIGENTE
3,3,204,VIOLACION DE MORADA. ART.144,LIBRO II TITULO III CRIMENES Y SIMPLES DELIT...,VIGENTE
4,4,205,"APERTURA , REGISTRO O INTERCEPTACION DE CORRE...",LIBRO II TITULO III CRIMENES Y SIMPLES DELIT...,VIGENTE


In [12]:
codigos_cot = df_delitos['COD. MATERIA'].unique()
print(f"Existen {len(codigos_cot)} codigos de delitos")

Existen 541 codigos de delitos


## Delitos en INVENTARIO

In [13]:
codigos_delitos = df_inventario['COD. MATERIA'].unique()

In [14]:
len(codigos_delitos)

447

In [15]:
codigos_no_encontrados = []
for delito in codigos_delitos:
    if not delito in codigos_cot:
        codigos_no_encontrados.append(delito)

In [16]:
codigos_no_encontrados

[13001, -31075, 4014, 4013, 4010, 4011, 0]

In [17]:
codigos_sin_registro = df_inventario[df_inventario['COD. MATERIA'].isin(codigos_no_encontrados)]

# Analizar caso a caso:

#### Caso Codigo 13001 -> LESIONES LEVES
Este codigo debe tratarse como 13036 identificado como: LESIONES LEVES 494 Nº 5 CÓDIGO PENAL

In [18]:
df_inventario['COD. MATERIA'] = df_inventario['COD. MATERIA'].replace(13001,13036)

### Codigos 4011, 4014, 4013, 4010, -31075, 0
codigos No vigentes, mal cargados en sistemas 

In [19]:
filtro_codigo_4011 = df_inventario[df_inventario['COD. MATERIA']==4011]
filtro_codigo_4014 = df_inventario[df_inventario['COD. MATERIA']==4014]
filtro_codigo_4013 = df_inventario[df_inventario['COD. MATERIA']==4013]
filtro_codigo_4010 = df_inventario[df_inventario['COD. MATERIA']==4010]
filtro_codigo_31075 = df_inventario[df_inventario['COD. MATERIA']==31075]
filtro_codigo_0 = df_inventario[df_inventario['COD. MATERIA']==0]

In [20]:
df_inventario.drop(filtro_codigo_4011.index, axis = 0, inplace = True)
df_inventario.drop(filtro_codigo_4014.index, axis = 0, inplace = True)
df_inventario.drop(filtro_codigo_4013.index, axis = 0, inplace = True)
df_inventario.drop(filtro_codigo_4010.index, axis = 0, inplace = True)
df_inventario.drop(filtro_codigo_31075.index, axis = 0, inplace = True)
df_inventario.drop(filtro_codigo_0.index, axis = 0, inplace = True)

## CARGA DATA A ARCHIVOS FUTHER

In [22]:
# Directorio donde se guardaran archivos feather
df_inventario.reset_index(inplace=True, drop=True)
os.makedirs(path_processed, exist_ok = True)  
# Guardamos dataset como archivo feather
df_inventario.to_feather(f'{path_processed}/Inventario_feather')