# Análisis de la base de datos de TAD

En este notebook se muestra cómo se pueden responder algunas de las preguntas de un pedido de acceso a la información pública realizado sobre la plataforma Trámites a Distancia (TAD), utilizando los datos publicados en el dataset [Trámites a Distancia (TAD)](https://datos.gob.ar/dataset/modernizacion-tramites-distancia-tad) de [datos.gob.ar](https://datos.gob.ar) en respuesta a ese pedido.

## Las preguntas realizadas

1. Cantidad de trámites iniciados por mes de cada tramite disponible
2. Cantidad de usuarios únicos que inician cada trámite por mes
3. Cantidad de trámites finalizados por mes de cada tramite disponible
4. Cantidad de usuarios únicos que finalizan cada trámite por mes
5. Organismo/s a los que pertenece el trámite
6. Tiempo promedio entre inicio del trámite y pase a Guarda Temporal para cada trámite
7. Necesidad de pago para realizar cada trámite disponible
8. Costo promedio de cada trámite disponible por mes

Además se solicitan las siguientes desagregaciones:

1.1) Cantidad de trámites iniciados por mes de cada tramite disponible – Según provincia
declarada en los datos de los usuarios

1.2) Cantidad de trámites iniciados por mes de cada tramite disponible – Según sexo declarado en
los datos de los usuarios (Masculino/Femenino/No Declara)

1.3) Cantidad de trámites iniciados por mes de cada tramite disponible - Según tipo de persona
que realiza el trámite (física/jurídica)

1.4) Cantidad de trámites iniciados por mes de cada tramite disponible - Según tipo de ingreso a la
plataforma TAD (ANSES/BORA/NIC NO RESIDENTES/AFIP/MI ARGENTINA/ CON DNI)

1.5) Cantidad de trámites iniciados por mes de cada tramite disponible - Según existencia de
apoderado

2.1) Cantidad de usuarios únicos que inician cada trámite por mes – Según provincia declarada en
los datos de los usuarios

2.2) Cantidad de usuarios únicos que inician cada trámite por mes – Según sexo declarado en los
datos de los usuarios (Masculino/Femenino/No Declara)

2.3) Cantidad de usuarios únicos que inician cada trámite por mes - Según tipo de persona que
realiza el trámite (física/jurídica)

2.4) Cantidad de usuarios únicos que inician cada trámite por mes - Según tipo de ingreso a la
plataforma TAD (ANSES/BORA/NIC NO RESIDENTES/AFIP/MI ARGENTINA/ CON DNI)

2.5) Cantidad de usuarios únicos que inician cada trámite por mes - Según existencia de apoderado

3.1) Cantidad de trámites finalizados por mes de cada tramite disponible – Según provincia
declarada en los datos de los usuarios

3.2) Cantidad de trámites finalizados por mes de cada tramite disponible – Según sexo declarado
en los datos de los usuarios (Masculino/Femenino/No Declara)

3.3) Cantidad de trámites finalizados por mes de cada tramite disponible - Según tipo de persona
que realiza el trámite (física/jurídica)

3.4) Cantidad de trámites finalizados por mes de cada tramite disponible - Según tipo de ingreso a
la plataforma TAD (ANSES/BORA/NIC NO RESIDENTES/AFIP/MI ARGENTINA/ CON DNI)

3.5) Cantidad de trámites finalizados por mes de cada tramite disponible - Según existencia de
apoderado

4.1) Cantidad de usuarios únicos que finalizan cada trámite por mes – Según provincia declarada
en los datos de los usuarios

4.2) Cantidad de usuarios únicos que finalizan cada trámite por mes – Según sexo declarado en los
datos de los usuarios (Masculino/Femenino/No Declara)

4.3) Cantidad de usuarios únicos que finalizan cada trámite por mes - Según tipo de persona que
realiza el trámite (física/jurídica)

4.4) Cantidad de usuarios únicos que finalizan cada trámite por mes - Según tipo de ingreso a la
plataforma TAD (ANSES/BORA/NIC NO RESIDENTES/AFIP/MI ARGENTINA/ CON DNI)

4.5) Cantidad de usuarios únicos que finalizan cada trámite por mes - Según existencia de
apoderado

## Importar la base

In [66]:
import pandas as pd

In [67]:
URL = "https://infra.datos.gob.ar/catalog/modernizacion/dataset/14/distribution/14.1/download/tramites-tad-historico.zip"

In [80]:
df = pd.read_csv(URL, compression="zip", dtype={"provincia_id": str, "localidad_id": str})

In [81]:
df.head()

Unnamed: 0,tramite_id,tramite_nombre,tramite_descripcion,fecha_inicio,fecha_finalizacion,reparticion_nombre,organismo_nombre,usuario_id,persona_tipo,persona_sexo,persona_login,localidad_nombre,provincia_nombre,provincia_id,localidad_id
0,2E13592D2E5B609BEB57B8C7CBF27AD5,Registro de dominio (especiales),Registro de dominios especiales,2016-07,2016-12,Dirección Nacional del Registro de Dominios de...,Secretaría Legal y Técnica,866C94333A94D70DC879E5C3DA447950,PF,M,AFIP,PARQUE CHACABUCO,CIUDAD DE BUENOS AIRES,2,2049010002
1,2E13592D2E5B609BEB57B8C7CBF27AD5,Registro de dominio (especiales),Registro de dominios especiales,2016-07,2016-12,Dirección Nacional del Registro de Dominios de...,Secretaría Legal y Técnica,866C94333A94D70DC879E5C3DA447950,PF,M,AFIP,PARQUE CHACABUCO,CIUDAD DE BUENOS AIRES,2,2049010002
2,2E13592D2E5B609BEB57B8C7CBF27AD5,Registro de dominio (especiales),Registro de dominios especiales,2016-07,2016-12,Dirección Nacional del Registro de Dominios de...,Secretaría Legal y Técnica,BFDFF46B53AC1D4C6FE3D15691455BA8,PF,F,AFIP,LA LUCILA,BUENOS AIRES,6,6861010004
3,2E13592D2E5B609BEB57B8C7CBF27AD5,Registro de dominio (especiales),Registro de dominios especiales,2016-07,2016-07,Dirección Nacional del Registro de Dominios de...,Secretaría Legal y Técnica,7A010D9A61D90EC7EB7D5BC07C7EF3BE,PF,F,AFIP,TEMPERLEY,BUENOS AIRES,6,6490010004
4,2E13592D2E5B609BEB57B8C7CBF27AD5,Registro de dominio (especiales),Registro de dominios especiales,2016-07,2016-07,Dirección Nacional del Registro de Dominios de...,Secretaría Legal y Técnica,7A010D9A61D90EC7EB7D5BC07C7EF3BE,PF,F,AFIP,TEMPERLEY,BUENOS AIRES,6,6490010004


## Responder las preguntas

### 1. Cantidad de trámites iniciados por mes de cada tramite disponible

In [82]:
df_1 = df.groupby(["tramite_nombre", "fecha_inicio"]).count()["tramite_id"].reset_index()
df_1.rename(columns={"tramite_id": "tad_tramites_iniciados"}, inplace=True)

df_1.to_csv("respuestas/1-tramites-iniciados.csv", encoding="utf8", index=False)
df_1.head()

Unnamed: 0,tramite_nombre,fecha_inicio,tad_tramites_iniciados
0,Acceso a la Información Pública,2017-05,19
1,Acceso a la Información Pública,2017-06,17
2,Acceso a la Información Pública,2017-07,17
3,Acceso a la Información Pública,2017-08,21
4,Acceso a la Información Pública,2017-09,52


#### 1.1) Cantidad de trámites iniciados por mes de cada tramite disponible – Según provincia declarada en los datos de los usuarios

In [83]:
df_1_1 = df.groupby(["tramite_nombre", "fecha_inicio", "provincia_id", "provincia_nombre"]).count()["tramite_id"].reset_index()
df_1_1.rename(columns={"tramite_id": "tad_tramites_iniciados"}, inplace=True)

df_1_1.to_csv("respuestas/1-1-tramites-iniciados-provincia.csv", encoding="utf8", index=False)
df_1_1.head()

Unnamed: 0,tramite_nombre,fecha_inicio,provincia_id,provincia_nombre,tad_tramites_iniciados
0,Acceso a la Información Pública,2017-05,2,CIUDAD DE BUENOS AIRES,9
1,Acceso a la Información Pública,2017-05,6,BUENOS AIRES,9
2,Acceso a la Información Pública,2017-05,14,CORDOBA,1
3,Acceso a la Información Pública,2017-06,2,CIUDAD DE BUENOS AIRES,11
4,Acceso a la Información Pública,2017-06,6,BUENOS AIRES,4


#### 1.2) Cantidad de trámites iniciados por mes de cada tramite disponible – Según sexo declarado en los datos de los usuarios (Masculino/Femenino/No Declara)

In [84]:
df_1_2 = df.groupby(["tramite_nombre", "fecha_inicio", "persona_sexo"]).count()["tramite_id"].reset_index()
df_1_2.rename(columns={"tramite_id": "tad_tramites_iniciados"}, inplace=True)

df_1_2.to_csv("respuestas/1-2-tramites-iniciados-sexo.csv", encoding="utf8", index=False)
df_1_2.head()

Unnamed: 0,tramite_nombre,fecha_inicio,persona_sexo,tad_tramites_iniciados
0,Acceso a la Información Pública,2017-05,F,8
1,Acceso a la Información Pública,2017-05,M,11
2,Acceso a la Información Pública,2017-06,F,7
3,Acceso a la Información Pública,2017-06,M,9
4,Acceso a la Información Pública,2017-06,No declara,1


#### 1.3) Cantidad de trámites iniciados por mes de cada tramite disponible - Según tipo de persona que realiza el trámite (física/jurídica)

In [85]:
df_1_3 = df.groupby(["tramite_nombre", "fecha_inicio", "persona_tipo"]).count()["tramite_id"].reset_index()
df_1_3.rename(columns={"tramite_id": "tad_tramites_iniciados"}, inplace=True)

df_1_3.to_csv("respuestas/1-3-tramites-iniciados-sexo.csv", encoding="utf8", index=False)
df_1_3.head()

Unnamed: 0,tramite_nombre,fecha_inicio,persona_tipo,tad_tramites_iniciados
0,Acceso a la Información Pública,2017-05,PF,19
1,Acceso a la Información Pública,2017-06,PF,17
2,Acceso a la Información Pública,2017-07,PF,15
3,Acceso a la Información Pública,2017-07,PJ,2
4,Acceso a la Información Pública,2017-08,PF,20


#### 1.4) Cantidad de trámites iniciados por mes de cada tramite disponible - Según tipo de ingreso a la plataforma TAD (ANSES/BORA/NIC NO RESIDENTES/AFIP/MI ARGENTINA/ CON DNI)

In [86]:
df_1_4 = df.groupby(["tramite_nombre", "fecha_inicio", "persona_login"]).count()["tramite_id"].reset_index()
df_1_4.rename(columns={"tramite_id": "tad_tramites_iniciados"}, inplace=True)

df_1_4.to_csv("respuestas/1-4-tramites-iniciados-sexo.csv", encoding="utf8", index=False)
df_1_4.head()

Unnamed: 0,tramite_nombre,fecha_inicio,persona_login,tad_tramites_iniciados
0,Acceso a la Información Pública,2017-05,AFIP,19
1,Acceso a la Información Pública,2017-06,AFIP,17
2,Acceso a la Información Pública,2017-07,AFIP,17
3,Acceso a la Información Pública,2017-08,AFIP,21
4,Acceso a la Información Pública,2017-09,AFIP,52


### 2. Cantidad de usuarios únicos que inician cada trámite por mes

In [87]:
df_2 = df.groupby(["tramite_nombre", "fecha_inicio"])["usuario_id"].nunique().reset_index()
df_2.rename(columns={"usuario_id": "tad_usuarios_inician"}, inplace=True)

df_2.to_csv("respuestas/2-usuarios-inician-tramites.csv", encoding="utf8", index=False)
df_2.head()

Unnamed: 0,tramite_nombre,fecha_inicio,tad_usuarios_inician
0,Acceso a la Información Pública,2017-05,8
1,Acceso a la Información Pública,2017-06,14
2,Acceso a la Información Pública,2017-07,16
3,Acceso a la Información Pública,2017-08,13
4,Acceso a la Información Pública,2017-09,21


### 3. Cantidad de trámites finalizados por mes de cada tramite disponible

In [88]:
df_3 = df.groupby(["tramite_nombre", "fecha_finalizacion"]).count()["tramite_id"].reset_index()
df_3.rename(columns={"tramite_id": "tad_tramites_finalizados"}, inplace=True)

df_3.to_csv("respuestas/3-tramites-finalizados.csv", encoding="utf8", index=False)
df_3.head()

Unnamed: 0,tramite_nombre,fecha_finalizacion,tad_tramites_finalizados
0,Acceso a la Información Pública,2017-05,1
1,Acceso a la Información Pública,2017-06,3
2,Acceso a la Información Pública,2017-07,5
3,Acceso a la Información Pública,2017-08,2
4,Acceso a la Información Pública,2017-09,10


### 4. Cantidad de usuarios únicos que finalizan cada trámite por mes

In [89]:
df_4 = df.groupby(["tramite_nombre", "fecha_finalizacion"])["usuario_id"].nunique().reset_index()
df_4.rename(columns={"usuario_id": "tad_usuarios_finalizan"}, inplace=True)

df_4.to_csv("respuestas/4-usuarios-finalizan-tramites.csv", encoding="utf8", index=False)
df_4.head()

Unnamed: 0,tramite_nombre,fecha_finalizacion,tad_usuarios_finalizan
0,Acceso a la Información Pública,2017-05,1
1,Acceso a la Información Pública,2017-06,2
2,Acceso a la Información Pública,2017-07,3
3,Acceso a la Información Pública,2017-08,2
4,Acceso a la Información Pública,2017-09,9


### 5. Organismo/s a los que pertenece el trámite

In [90]:
df_5 = df[["tramite_nombre", "organismo_nombre"]].drop_duplicates()

df_5.to_csv("respuestas/5-tramites-organismos.csv", encoding="utf8", index=False)
df_5.head()

Unnamed: 0,tramite_nombre,organismo_nombre
0,Registro de dominio (especiales),Secretaría Legal y Técnica
15,Transferencia zonas especiales,Secretaría Legal y Técnica
23,Registro de dominio (.com.ar),Secretaría Legal y Técnica
38,Disputa de dominios,Secretaría Legal y Técnica
39,Renovación de dominio,Secretaría Legal y Técnica


### 6. Tiempo promedio entre inicio del trámite y pase a Guarda Temporal para cada trámite

In [91]:
df["tramite_duracion_meses"] = (pd.to_datetime(df.fecha_finalizacion) - pd.to_datetime(df.fecha_inicio)) / pd.np.timedelta64(1,'M')
df["tramite_duracion_meses"] = df["tramite_duracion_meses"].astype(int)
df.tramite_duracion_meses

0          5
1          5
2          5
3          0
4          0
          ..
3262516    0
3262517    0
3262518    0
3262519    0
3262520    0
Name: tramite_duracion_meses, Length: 3262521, dtype: int64

In [92]:
df_6 = df.groupby("tramite_nombre")["tramite_duracion_meses"].mean().sort_values(ascending=False).to_frame().reset_index()

df_6.to_csv("respuestas/6-tramites-tiempo-promedio.csv", encoding="utf8", index=False)
df_6.head()

Unnamed: 0,tramite_nombre,tramite_duracion_meses
0,Financiamiento para instituciones productivas ...,22.25
1,Solicitud de adhesión al Programa Yvera,19.3125
2,PAC Conglomerado - Aplicación al programa,18.0
3,PROGRAMA FOGAPYME – Pago de Garantías,18.0
4,Ciudades Para Emprender,17.117647
