# **Limpieza - Delitos Ambientales**
---
**Elaborado con base en**
* [DELITOS CONTRA EL MEDIO AMBIENTE | Datos Abiertos Colombia](https://www.datos.gov.co/Seguridad-y-Defensa/DELITOS-CONTRA-EL-MEDIO-AMBIENTE/9zck-qfvc/about_data)

### ***Importar librerías***

In [2]:
import requests
import pandas as pd
import io
import csv
from datetime import datetime

### ***Recibir los datos provenientes de la API***

In [3]:
url = 'https://www.datos.gov.co/resource/9zck-qfvc.csv?$query=SELECT%0A%20%20%60fecha_hecho%60%2C%0A%20%20%60cod_depto%60%2C%0A%20%20%60departamento%60%2C%0A%20%20%60cod_muni%60%2C%0A%20%20%60municipio%60%2C%0A%20%20%60descripcion_conducta%60%2C%0A%20%20%60zona%60%2C%0A%20%20%60cantidad%60%0AWHERE%0A%20%20caseless_one_of(%0A%20%20%20%20%60departamento%60%2C%0A%20%20%20%20%22VALLE%20DEL%20CAUCA%22%2C%0A%20%20%20%20%22CAUCA%22%2C%0A%20%20%20%20%22CHOCO%22%2C%0A%20%20%20%20%22NARI%C3%91O%22%2C%0A%20%20%20%20%22CHOC%C3%93%22%2C%0A%20%20%20%20%22NARINO%22%0A%20%20)%20LIMIT%2035000000%20OFFSET%200'

response = requests.get(url)

data = io.StringIO(response.text)
dialect = csv.Sniffer().sniff(data.read(1024))

data.seek(0)

0

### ***Procesar los datos mediante Pandas***

In [4]:
df = pd.read_csv(data, delimiter=dialect.delimiter)
df.head(-1)
#print(len(df))

Unnamed: 0,fecha_hecho,cod_depto,departamento,cod_muni,municipio,descripcion_conducta,zona,cantidad
0,2024-06-13T00:00:00.000,19,CAUCA,19001,POPAYAN,ARTICULO 333. DAÑOS EN LOS RECURSOS NATURALES ...,RURAL,1
1,2024-04-25T00:00:00.000,19,CAUCA,19698,SANTANDER DE QUILICHAO,ARTICULO 336. INVASION DE AREAS DE ESPECIAL IM...,RURAL,1
2,2024-04-23T00:00:00.000,19,CAUCA,19532,PATIA,ARTICULO 332. EXPLOTACION ILICITA DE YACIMIENT...,RURAL,1
3,2024-04-03T00:00:00.000,19,CAUCA,19001,POPAYAN,ARTICULO 328. APROVECHAMIENTO ILICITO DE LOS R...,RURAL,1
4,2024-04-03T00:00:00.000,19,CAUCA,19698,SANTANDER DE QUILICHAO,ARTICULO 328. APROVECHAMIENTO ILICITO DE LOS R...,RURAL,1
...,...,...,...,...,...,...,...,...
6133,2003-02-23T00:00:00.000,76,VALLE DEL CAUCA,76233,DAGUA,ARTICULO 331. DAÑOS EN LOS RECURSOS NATURALES,RURAL,1
6134,2003-02-22T00:00:00.000,76,VALLE DEL CAUCA,76318,GUACARI,ARTICULO 331. DAÑOS EN LOS RECURSOS NATURALES,RURAL,1
6135,2003-02-06T00:00:00.000,76,VALLE DEL CAUCA,76736,SEVILLA,ARTICULO 331. DAÑOS EN LOS RECURSOS NATURALES,RURAL,1
6136,2003-01-28T00:00:00.000,76,VALLE DEL CAUCA,76147,CARTAGO,ARTICULO 331. DAÑOS EN LOS RECURSOS NATURALES,RURAL,1


### ***Limpiar datos vacíos***

In [89]:
df = df.dropna()
df = df.drop_duplicates()

df

Unnamed: 0,fecha_hecho,cod_depto,departamento,cod_muni,municipio,descripcion_conducta,zona,cantidad
0,2024-06-13T00:00:00.000,19,CAUCA,19001,POPAYAN,ARTICULO 333. DAÑOS EN LOS RECURSOS NATURALES ...,RURAL,1
1,2024-04-25T00:00:00.000,19,CAUCA,19698,SANTANDER DE QUILICHAO,ARTICULO 336. INVASION DE AREAS DE ESPECIAL IM...,RURAL,1
2,2024-04-23T00:00:00.000,19,CAUCA,19532,PATIA,ARTICULO 332. EXPLOTACION ILICITA DE YACIMIENT...,RURAL,1
3,2024-04-03T00:00:00.000,19,CAUCA,19001,POPAYAN,ARTICULO 328. APROVECHAMIENTO ILICITO DE LOS R...,RURAL,1
4,2024-04-03T00:00:00.000,19,CAUCA,19698,SANTANDER DE QUILICHAO,ARTICULO 328. APROVECHAMIENTO ILICITO DE LOS R...,RURAL,1
...,...,...,...,...,...,...,...,...
6134,2003-02-22T00:00:00.000,76,VALLE DEL CAUCA,76318,GUACARI,ARTICULO 331. DAÑOS EN LOS RECURSOS NATURALES,RURAL,1
6135,2003-02-06T00:00:00.000,76,VALLE DEL CAUCA,76736,SEVILLA,ARTICULO 331. DAÑOS EN LOS RECURSOS NATURALES,RURAL,1
6136,2003-01-28T00:00:00.000,76,VALLE DEL CAUCA,76147,CARTAGO,ARTICULO 331. DAÑOS EN LOS RECURSOS NATURALES,RURAL,1
6137,2003-01-25T00:00:00.000,76,VALLE DEL CAUCA,76147,CARTAGO,ARTICULO 331. DAÑOS EN LOS RECURSOS NATURALES,URBANA,1


### ***Limpieza de columnas***

In [90]:
df = df.drop(['cod_depto', 'cod_muni'], axis=1)

df['departamento'] = df['departamento'].replace({'NARINO': 'NARIÑO', 'CHOCO': 'CHOCÓ'})

In [91]:
# print(df['zona'].unique())
# print(df['departamento'].unique())
# print(df['municipio'].unique())
# print(df['descripcion_conducta'].unique())

### ***Arreglar el formato de la fecha***

In [92]:
df['fecha_hecho'] = df['fecha_hecho'].apply(lambda x: datetime.strptime(x, "%Y-%m-%dT%H:%M:%S.%f").date())

# Crea nuevas columnas para el año, mes y día
df['año'] = df['fecha_hecho'].apply(lambda x: x.year)
df['mes'] = df['fecha_hecho'].apply(lambda x: x.month)
df['mesOrden'] = df['fecha_hecho'].apply(lambda x: x.month)
df['día'] = df['fecha_hecho'].apply(lambda x: x.day)

df = df.reset_index(drop=True)

df = df.drop(['fecha_hecho'], axis=1)

#Para quitar los espacios en blanco al principio y al final de cada celda:
df = df.applymap(lambda x: x.strip() if isinstance(x, str) else x)

df['año'] = df['año'].astype(int)
df = df[df['año'] >= 1900]

  df = df.applymap(lambda x: x.strip() if isinstance(x, str) else x)


In [93]:
# print(df['año'].unique())
# df.head(-1)

#### ***Mapear los meses a su nombre y reorganizar el orden de las columnas***

In [94]:
# Mapear los meses a su nombre
meses_map = {
    1: 'Enero',
    2: 'Febrero',
    3: 'Marzo',
    4: 'Abril',
    5: 'Mayo',
    6: 'Junio',
    7: 'Julio',
    8: 'Agosto',
    9: 'Septiembre',
    10: 'Octubre',
    11: 'Noviembre',
    12: 'Diciembre'
}

df['mes'] = df['mes'].map(meses_map)

In [96]:
df.head(-1)

Unnamed: 0,departamento,municipio,descripcion_conducta,zona,cantidad,año,mes,mesOrden,día
0,CAUCA,POPAYAN,ARTICULO 333. DAÑOS EN LOS RECURSOS NATURALES ...,RURAL,1,2024,Junio,6,13
1,CAUCA,SANTANDER DE QUILICHAO,ARTICULO 336. INVASION DE AREAS DE ESPECIAL IM...,RURAL,1,2024,Abril,4,25
2,CAUCA,PATIA,ARTICULO 332. EXPLOTACION ILICITA DE YACIMIENT...,RURAL,1,2024,Abril,4,23
3,CAUCA,POPAYAN,ARTICULO 328. APROVECHAMIENTO ILICITO DE LOS R...,RURAL,1,2024,Abril,4,3
4,CAUCA,SANTANDER DE QUILICHAO,ARTICULO 328. APROVECHAMIENTO ILICITO DE LOS R...,RURAL,1,2024,Abril,4,3
...,...,...,...,...,...,...,...,...,...
6133,VALLE DEL CAUCA,DAGUA,ARTICULO 331. DAÑOS EN LOS RECURSOS NATURALES,RURAL,1,2003,Febrero,2,23
6134,VALLE DEL CAUCA,GUACARI,ARTICULO 331. DAÑOS EN LOS RECURSOS NATURALES,RURAL,1,2003,Febrero,2,22
6135,VALLE DEL CAUCA,SEVILLA,ARTICULO 331. DAÑOS EN LOS RECURSOS NATURALES,RURAL,1,2003,Febrero,2,6
6136,VALLE DEL CAUCA,CARTAGO,ARTICULO 331. DAÑOS EN LOS RECURSOS NATURALES,RURAL,1,2003,Enero,1,28


#### ***Exportar el dataframe como CSV***

In [97]:
df.to_csv('delitosAmbientalesAPI.csv', index=False)