# Contactos al Sistema Único de Atención Ciudadana por Arbolado y Espacios Verdes (2017 - 2021)

El Sistema Único de Atención Ciudadana (SUACI) permite a los ciudadanos ingresar  reclamos, denuncias, quejas, sugerencias, solicitudes y problemas con los servicios de la Ciudad de Buenos Aires, en este caso, con el servicio de Arbolado y Espacios Verdes.

Los datasets fueron descargados de [data.buenosaires.gob.ar](https://data.buenosaires.gob.ar/dataset/sistema-unico-atencion-ciudadana). Cada dataset tiene mas de 500.000 filas (cada una de ellas representa el contacto de un ciudadano) y 19 columnas que registran: ID del contacto, fecha, categoria y subcategoria del contacto, comuna, barrio, calle, ubicación, género del ciudadano, canal de contacto, entre otras.

A continuación, se presenta el código en Python que fue desarrollado para la limpieza y preparación de los datos para el análisis en Power BI.

**1. Importación de librerías y carga de datos en Pandas**

En primer lugar, se importó la librería Pandas para el manejo de los datos; y se cargaron los datasets en formato csv con la función `read_csv()`. En algunos casos, los datos estaban separados por `,` y en otros con `;`.

In [1]:
import pandas as pd

import warnings
warnings.filterwarnings("ignore")

In [2]:
data2021 = pd.read_csv("sistema-unico-de-atencion-ciudadana-2021.csv", sep = ";")
data2020 = pd.read_csv("sistema-unico-de-atencion-ciudadana-2020.csv")
data2019 = pd.read_csv("sistema-unico-de-atencion-ciudadana-2019.csv")
data2018 = pd.read_csv("sistema-unico-de-atencion-ciudadana-2018.csv")
data2017 = pd.read_csv("sistema-unico-de-atencion-ciudadana-2017.csv", sep = ";")

In [3]:
data2021.head(3)

Unnamed: 0,contacto,periodo,categoria,subcategoria,prestacion,tipo_prestacion,fecha_ingreso,hora_ingreso,domicilio_comuna,domicilio_barrio,domiclio_calle,domicilio_altura,domicilio_esquina_proxima,lat,lon,canal,genero,estado_del_contacto,fecha_cierre_contacto,domicilio_calle
0,00173584/21,202104,TRÁMITES Y SERVICIOS,PROPUESTAS PARA LA MEJORA EN TRÁMITES,PROPUESTAS PARA LA MEJORA EN TRÁMITES,QUEJA,13-04-21,11:54:30,,,,,,,,GCS Web,Femenino,Abierto,,
1,00173599/21,202104,BARRIOS EMERGENTES,SERVICIO DE ELECTRICIDAD,CONSULTA DE ESTADO DE EXPEDIENTE ANTE LA AGENC...,SOLICITUD,13-04-21,12:02:56,10.0,Villa Luro,MILTON,456.0,,-34.633076,-58.498882,GCS Web,Femenino,Cerrado,13-04-2021 12:36:18,
2,00173585/21,202104,LIMPIEZA Y RECOLECCIÓN,RESIDUOS VOLUMINOSOS,RETIRO DE ESCOMBROS / RESTOS DE OBRA,SERVICIO,13-04-21,11:55:21,2.0,Recoleta,RIOBAMBA,950.0,,-34.597954,-58.394721,GCS Web,Femenino,Cerrado,15-04-2021 13:30:18,


In [4]:
data2020.head(3)

Unnamed: 0,contacto,periodo,categoria,subcategoria,concepto,tipo_prestacion,fecha_ingreso,hora_ingreso,domicilio_cgpc,domicilio_barrio,domicilio_calle,domicilio_altura,domicilio_esquina_proxima,lat,long,canal,genero,estado_del_contacto,fecha_cierre_contacto
0,00000001/20,202001,TRÁNSITO,DENUNCIA VIAL,VEHÍCULO MAL ESTACIONADO,DENUNCIA,2020-01-01,01:09:05 a.m.,COMUNA 6,CABALLITO,"PUEYRREDON, HONORIO, DR. AV.",1070.0,,-34.608243,-58.445167,Comunas,Femenino,Cerrado,2020-01-01
1,00000002/20,202001,TRÁNSITO,DENUNCIA VIAL,VEHÍCULO MAL ESTACIONADO,DENUNCIA,2020-01-01,01:17:27 a.m.,COMUNA 4,PARQUE PATRICIOS,CASEROS AV.,3223.0,,-34.637739,-58.40965,Comunas,Femenino,Cerrado,2020-01-01
2,00000003/20,202001,ARBOLADO Y ESPACIOS VERDES,PLANTACIÓN DE ÁRBOL,PLANTACIÓN DE ÁRBOL,SOLICITUD,2020-01-01,01:17:53 a.m.,COMUNA 13,COLEGIALES,CONDE,1014.0,,-34.576143,-58.453507,Comunas,Masculino,Cerrado,2020-01-07


In [5]:
data2019.head(3)

Unnamed: 0,contacto,periodo,categoria,subcategoria,concepto,tipo_prestacion,fecha_ingreso,hora_ingreso,domicilio_cgpc,domicilio_barrio,domicilio_calle,domicilio_altura,domicilio_esquina_proxima,lat,long,canal,genero,estado_del_contacto,fecha_cierre_contacto
0,00000001/19,201901,TRÁNSITO,DENUNCIA VIAL,VEHÍCULO MAL ESTACIONADO,DENUNCIA,2019-01-01,12:11:17 a.m.,COMUNA 7,FLORES,"BONIFACIO, JOSE",2800.0,,-34.63406,-58.466561,Comunas,Femenino,Cerrado,2019-01-02
1,00000002/19,201901,TRÁNSITO,DENUNCIA VIAL,VEHÍCULO MAL ESTACIONADO,DENUNCIA,2019-01-01,12:13:19 a.m.,COMUNA 6,CABALLITO,"BONIFACIO, JOSE",1108.0,,-34.628159,-58.443377,Comunas,Femenino,Cerrado,2019-01-02
2,00000003/19,201901,ARBOLADO Y ESPACIOS VERDES,PLANTACIÓN DE ÁRBOL,PLANTACIÓN DE ÁRBOL,SOLICITUD,2019-01-01,12:23:32 a.m.,COMUNA 7,FLORES,MORON,2700.0,,-34.623319,-58.469811,Comunas,Femenino,Cerrado,2019-01-11


In [6]:
data2018.head(3)

Unnamed: 0,contacto,periodo,categoria,subcategoria,concepto,tipo_prestacion,fecha_ingreso,hora_ingreso,domicilio_cgpc,domicilio_barrio,domicilio_calle,domicilio_altura,domicilio_esquina_proxima,lat,long,canal,genero,estado_del_contacto,fecha_cierre_contacto
0,00000001/18,201801,TRÁNSITO,DENUNCIA VIAL,VEHÍCULO MAL ESTACIONADO,DENUNCIA,2018-01-01,12:03:30 a.m.,COMUNA 13,NUÑEZ,"PAZ, GRAL. AV.",1020.0,,-34.538927,-58.47435,App,masculino,Cerrado,2018-01-03
1,00000002/18,201801,TRÁNSITO,DENUNCIA VIAL,VEHÍCULO MAL ESTACIONADO,DENUNCIA,2018-01-01,12:19:33 a.m.,COMUNA 13,NUÑEZ,VEDIA,2225.0,,-34.539021,-58.473116,App,masculino,Cerrado,2018-01-01
2,00000003/18,201801,TRÁNSITO,DENUNCIA VIAL,VEHÍCULO MAL ESTACIONADO,DENUNCIA,2018-01-01,12:19:33 a.m.,COMUNA 13,NUÑEZ,VUELTA DE OBLIGADO,4759.0,,-34.539686,-58.473425,App,masculino,Cerrado,2018-01-03


In [7]:
data2017.head(3)

Unnamed: 0,CONTACTO,PERIODO,CATEGORIA,SUBCATEGORIA,CONCEPTO,TIPO_PRESTACION,FECHA_INGRESO,HORA_INGRESO,DOMICILIO_CGPC,DOMICILIO_BARRIO,DOMICILIO_CALLE,DOMICILIO_ALTURA,DOMICILIO_ESQUINA_PROXIMA,LAT,LONG,CANAL,GENERO,ESTADO_DEL_CONTACTO
0,00005735/17,201701,CALLES Y VEREDAS,REPARACION DE VEREDA,REPARACION DE VEREDA,SOLICITUD,2/1/2017,5:48:31 p.m.,COMUNA 5,BOEDO,GIBSON,4192.0,,-34.638972,-58.42242,WEB,FEMENINO,ABIERTO
1,00004008/17,201701,MEDIOS DE TRANSPORTE,BICICLETAS,INCONVENIENTES CON ECOBICIS,QUEJA,2/1/2017,1:47:51 p.m.,COMUNA 4,BOCA,"GARCIA, MARTIN AV.",364.0,,-34.628911,-58.36994,147,MASCULINO,ABIERTO
2,00004187/17,201701,MEDIOS DE TRANSPORTE,BICICLETAS,INCONVENIENTES CON ECOBICIS,QUEJA,2/1/2017,2:08:49 p.m.,COMUNA 4,BOCA,"GARCIA, MARTIN AV.",364.0,,-34.628911,-58.36994,147,MASCULINO,ABIERTO


**2. Limpieza y preparación de los datos**

El siguiente paso fue procesar y preparar los datos para su posterior análisis en Power BI.

Los datasets presentaron algunas diferencias entre sí. Por ejemplo: 

- columnas duplicadas (`domicilio_calle`)
- diferentes nombres para algunas columnas (`prestacion` = `concepto`)
- diferentes tipo de datos en una misma columna (`domicilio_cgpc`)
- nombres de las columnas en mayúscula y minúscula

In [8]:
#eliminar columna duplicada en data2021
data2021 = data2021.drop(["domicilio_calle"], axis = 1)
#cambiar nombre de las columnas en data2021
data2021 = data2021.rename(columns = {"prestacion":"concepto", "domicilio_comuna":"domicilio_cgpc", "domiclio_calle":"domicilio_calle", "lon":"long"})
#cambiar columnas en mayúscula por minúscula en data2017
data2017.columns = data2017.columns.str.lower()
#seleccionar la categoría de ARBOLADO Y ESPACIOS VERDES para cada dataset
data2021 = data2021[data2021["categoria"] == "ARBOLADO Y ESPACIOS VERDES"]
data2020 = data2020[data2020["categoria"] == "ARBOLADO Y ESPACIOS VERDES"]
data2019 = data2019[data2019["categoria"] == "ARBOLADO Y ESPACIOS VERDES"]
data2018 = data2018[data2018["categoria"] == "ARBOLADO Y ESPACIOS VERDES"]
data2017 = data2017[data2017["categoria"] == "ARBOLADO Y ESPACIOS VERDES"]

Seleccionada la categoría y habiendo realizado algunos preprocesamientos, se unieron los dataframes en uno solo con `concat()` y se seleccionaron las posibles columnas de interés para el análisis. Además, se pasaron los datos de mayúscula a minúscula y se cambió el tipo de dato de la columna `periodo` (str a datetime).

In [9]:
#unir dataframes
data17_21 = pd.concat([data2017, data2018, data2019, data2020, data2021], ignore_index = True)
#seleccionar columnas
contactos = data17_21[["periodo", "categoria", "subcategoria", "concepto", "tipo_prestacion", "domicilio_cgpc", "domicilio_barrio", "canal", "genero"]]
#cambiar tipo de dato de periodo
contactos["periodo"] = pd.to_datetime(contactos["periodo"], format = "%Y%m")

In [10]:
#Por último, algunas filas de "domicilio_cgpc" presentan valores distintos a las demás. 
#En vez de "COMUNA 12", por ejemplo, tienen el valor 12.0
contactos.domicilio_cgpc.value_counts().head(15)

COMUNA 11    27368
COMUNA 9     20043
COMUNA 10    19818
COMUNA 12    19505
COMUNA 15    19169
COMUNA 7     15877
COMUNA 13    14604
COMUNA 4     13353
COMUNA 8      9481
COMUNA 14     8656
COMUNA 6      8409
COMUNA 5      8129
11.0          6915
12.0          6880
COMUNA 3      5540
Name: domicilio_cgpc, dtype: int64

In [11]:
#Para solucionar esto, se creó la siguiente función:
def comuna(fila):
    try: #si el valor se puede transformar en int (ya sea float o str)
        return f"COMUNA {int(float(fila))}" #se agrega la palabra COMUNA
    except: #si no se puede transformar, retorna su valor original
        return fila

In [12]:
#modificar valores de domicilio_cgpc con la función comuna()
contactos["domicilio_cgpc"] = contactos["domicilio_cgpc"].apply(lambda x: comuna(x))
#y cambiamos todo el dataframe en minúscula
contactos = contactos.applymap(lambda x: x.lower() if type(x) == str else x)

In [13]:
contactos.head()

Unnamed: 0,periodo,categoria,subcategoria,concepto,tipo_prestacion,domicilio_cgpc,domicilio_barrio,canal,genero
0,2017-01-01,arbolado y espacios verdes,extraccion de arbol,extraccion de arbol,solicitud,comuna 6,caballito,web,masculino
1,2017-01-01,arbolado y espacios verdes,problema con intervenciones de arbolado,problemas con intervenciones de arbolado,solicitud,comuna 5,boedo,comunas,femenino
2,2017-01-01,arbolado y espacios verdes,problema con intervenciones de arbolado,falta de recoleccion de restos de poda de arbo...,solicitud,comuna 6,caballito,web,masculino
3,2017-01-01,arbolado y espacios verdes,parques y plazas,corte y limpieza de cesped en parque / plaza,solicitud,comuna 15,parque chas,app,masculino
4,2017-01-01,arbolado y espacios verdes,poda de arbol y despeje de luminaria,poda integral / despeje de luminaria,solicitud,comuna 15,parque chas,web,femenino


In [14]:
contactos.tail()

Unnamed: 0,periodo,categoria,subcategoria,concepto,tipo_prestacion,domicilio_cgpc,domicilio_barrio,canal,genero
250675,2021-10-01,arbolado y espacios verdes,poda de árbol y despeje de luminaria,poda de árbol/despeje de luminaria o semáforo,solicitud,comuna 11,villa devoto,app ba 147,masculino
250676,2021-10-01,arbolado y espacios verdes,poda de árbol y despeje de luminaria,poda de árbol/despeje de luminaria o semáforo,solicitud,comuna 5,almagro,app ba 147,masculino
250677,2021-10-01,arbolado y espacios verdes,poda de árbol y despeje de luminaria,poda de árbol/despeje de luminaria o semáforo,solicitud,comuna 14,palermo,app ba 147,masculino
250678,2021-10-01,arbolado y espacios verdes,poda de árbol y despeje de luminaria,poda de árbol/despeje de luminaria o semáforo,solicitud,comuna 9,liniers,app ba 147,masculino
250679,2021-10-01,arbolado y espacios verdes,poda de árbol y despeje de luminaria,poda de árbol/despeje de luminaria o semáforo,solicitud,comuna 10,monte castro,app ba 147,masculino


**3. Guardar en CSV**

Finalmente, se guardó el dataframe en formato csv con la función de Pandas `to_csv()`.

In [None]:
contactos.to_csv("contactos_suaci_ba.csv", index = False)

**4. Transformar datos en Power BI**

El primer paso en Power BI fue transformar algunos datos: se reemplazaron los nombres de aquellos valores que fueron cargados de maneras distintas, por ejemplo `plantacion de arbol` y `plantación de árbol`, `comunas` y `comuna`. Además, a fines prácticos se modificaron y unificaron los nombres de `app ba 147` y `app denuncia vial` por `app`; `call center` y `operador gcba` por `147`; `(en blanco)` por `sin especificar`, entre otros. Luego de este paso, se creó el dashboard.

**5. Dashboard en Power BI**

![image_pbi_01.jpg](attachment:image_pbi_01.jpg)

![image_pbi_02.jpg](attachment:image_pbi_02.jpg)

![image_pbi_03.jpg](attachment:image_pbi_03.jpg)

Entre el 2017 y 2021 hubo un total de 250.680 contactos al SUACI por reclamos relacionados con el arbolado y los espacios verdes, siendo el año 2018 con el mayor número de contactos (69.350). El canal más utlizado para realizar las consultas fue el llamado al 147 (seguido del uso de la web y, en tercer lugar, de la app de la Ciudad de Buenos Aires). Más del 90% de los contactos fueron para registrar solicitudes. La subcategoría que más llamados registró fue la poda de árboles para el despeje de luminaria (como postes de luz y semáforos). Por último, la comuna que más contactos realizó fue la Comuna 11 (integrada por lo barrios de Villa General Mitre, Villa Devoto, Villa del Parque y Villa Santa Rita).