# Dataset: Flujo Vehicular por Unidades de Peaje AUSA

by Alina Martinez - [Github](https://github.com/martinezalina/illia-p4)

## Objetivo

Generar un único dataset del flujo vehicular por Unidades de Peaje AUSA de año 2020 basado en los datasets oficiales, provistos en: 




## Librerías

In [1]:
# Importamos las Librerías que vamos a utilizar

from IPython.display import display, Markdown
import warnings

#Warnings
warnings.filterwarnings('ignore')

In [2]:
import pandas as pd
import numpy as np

## Configuro Notebook

In [3]:
# Format round off to two decimal places in pandas 
pd.options.display.float_format = '{: .2f}'.format

## Lectura de los Dataset

Indagando en el sitio oficial de https://data.buenosaires.gob.ar/dataset/flujo-vehicular-por-unidades-peaje-ausa han publicado recientemente los datos.

Es por ello que procederemos a leerlos y generar un dataset de todo el año.

In [4]:
# Para cambiar la modalidad de carga de los datasets a CDN, descomentar la segunda línea.

cdn_mode = False
#cdn_mode = True

if cdn_mode:
  data_2020_Q1 = pd.read_excel('https://cdn.buenosaires.gob.ar/datosabiertos/datasets/ausa/flujo-vehicular-por-unidades-peaje-ausa/flujo-vehicular-2020%20ene-abr.xlsx')
  data_2020_Q2 = pd.read_excel('https://cdn.buenosaires.gob.ar/datosabiertos/datasets/ausa/flujo-vehicular-por-unidades-peaje-ausa/flujo-vehicular-2020-2.xlsx')
  data_2020_Q3 = pd.read_excel('https://cdn.buenosaires.gob.ar/datosabiertos/datasets/ausa/flujo-vehicular-por-unidades-peaje-ausa/flujo-vehicular-20203.xlsx')
else:
  data_2020_Q1 = pd.read_excel('./datasets/flujo-vehicular-2020-q1.xlsx')
  data_2020_Q2 = pd.read_excel('./datasets/flujo-vehicular-2020-q2.xlsx')
  data_2020_Q3 = pd.read_excel('./datasets/flujo-vehicular-2020-q3.xlsx')

In [5]:
data_2020_Q1

Unnamed: 0.1,Unnamed: 0,periodo,fecha,mes,dia,dia_fecha,hora_inicio,hora_fin,estacion,tipo_vehiculo,forma_pago,observacion,sentido,cantidad_pasos
0,0,2020,2020-01-01 00:00:00,enero,Miércoles,1,0,1,ALBERDI,Auto,Efectivo,Efectivo,Centro,24
1,1,2020,2020-01-01 00:00:00,enero,Miércoles,1,0,1,ALBERDI,Auto,Efectivo,Efectivo,Provincia,80
2,2,2020,2020-01-01 00:00:00,enero,Miércoles,1,0,1,ALBERDI,Auto,Rec.Deuda,Paso en Infracción,Provincia,1
3,3,2020,2020-01-01 00:00:00,enero,Miércoles,1,0,1,ALBERDI,Auto,Rec.Deuda,Paso en infracción con Multa LPR,Centro,1
4,4,2020,2020-01-01 00:00:00,enero,Miércoles,1,0,1,ALBERDI,Auto,Rec.Deuda,Paso en infracción con Multa LPR,Provincia,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
821921,821921,2020,2020-04-30,abril,Jueves,30,23,0,PB2,Pesados 6 Ejes,Tag,Tag - PosPago,Centro,2
821922,821922,2020,2020-04-30,abril,Jueves,30,23,0,PB2,Pesados 6 Ejes,Tag,Tag - PosPago OCR,Centro,1
821923,821923,2020,2020-04-30,abril,Jueves,30,23,0,PB4,Pesados 6 Ejes,Tag,Tag - PosPago,Centro,12
821924,821924,2020,2020-04-30,abril,Jueves,30,23,0,PB4,Pesados 6 Ejes,Violación,Violación - Normal,Centro,1


In [6]:
data_2020_Q2

Unnamed: 0.1,Unnamed: 0,periodo,fecha,mes,dia,dia_fecha,hora_inicio,hora_fin,estacion,tipo_vehiculo,forma_pago,observacion,sentido,cantidad_pasos
0,821926.00,2020,2020-05-01,mayo,Viernes,1,0,1,ALBERDI,Auto,Tag,Tag - PosPago,Provincia,5
1,821927.00,2020,2020-05-01,mayo,Viernes,1,0,1,ALBERDI,Auto,Tag,Tag - PosPago OCR,Provincia,2
2,821928.00,2020,2020-05-01,mayo,Viernes,1,0,1,AVELLANEDA,Auto,Tag,Tag - PosPago,Centro,30
3,821929.00,2020,2020-05-01,mayo,Viernes,1,0,1,AVELLANEDA,Auto,Tag,Tag - PosPago,Provincia,25
4,821930.00,2020,2020-05-01,mayo,Viernes,1,0,1,AVELLANEDA,Auto,Tag,Tag - PosPago OCR,Centro,3
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
806150,,2020,2020-08-31 00:00:00,agosto,Lunes,31,23,0,PB1,Pesados 6 Ejes,Tag,Tag - PosPago,Provincia,17
806151,,2020,2020-08-31 00:00:00,agosto,Lunes,31,23,0,PB1,Pesados 6 Ejes,Violación,Violación - Normal,Provincia,2
806152,,2020,2020-08-31 00:00:00,agosto,Lunes,31,23,0,PB4,Pesados 6 Ejes,Tag,Tag - PosPago,Centro,24
806153,,2020,2020-08-31 00:00:00,agosto,Lunes,31,23,0,PB4,Pesados 6 Ejes,Tag,Tag - PosPago OCR,Centro,1


In [7]:
data_2020_Q3

Unnamed: 0,periodo,fecha,mes,dia,dia_fecha,hora_inicio,hora_fin,estacion,tipo_vehiculo,forma_pago,observacion,sentido,cantidad_pasos
0,2020,2020-09-01,septiembre,Martes,1,0,1,ALBERDI,Auto,Efectivo,Efectivo,Provincia,10.00
1,2020,2020-09-01,septiembre,Martes,1,0,1,ALBERDI,Auto,Exento,Exento - Otros motivos,Provincia,2.00
2,2020,2020-09-01,septiembre,Martes,1,0,1,ALBERDI,Auto,Exento,Exento - Reglamento,Provincia,3.00
3,2020,2020-09-01,septiembre,Martes,1,0,1,ALBERDI,Auto,Tag,Tag - PosPago,Centro,2.00
4,2020,2020-09-01,septiembre,Martes,1,0,1,ALBERDI,Auto,Tag,Tag - PosPago,Provincia,8.00
...,...,...,...,...,...,...,...,...,...,...,...,...,...
905657,2020,2020-12-31,diciembre,Jueves,31,21,22,DELLEPIANE LINIERSLEPIANE CENTRO,Pesados 6 Ejes,Tag,Tag - PosPago OCR,Centro,1.00
905658,2020,2020-12-31,diciembre,Jueves,31,21,22,DELLEPIANE LINIERS,Pesados 6 Ejes,Tag,Tag - PosPago,Provincia,1.00
905659,2020,2020-12-31,diciembre,Jueves,31,21,22,ILP,Pesados 6 Ejes,Tag,Tag - PosPago,Centro,1.00
905660,2020,2020-12-31,diciembre,Jueves,31,22,23,ILP,Pesados 6 Ejes,Tag,Tag - PosPago,Centro,2.00


In [8]:
data_2020_full = pd.concat([data_2020_Q1, data_2020_Q2,data_2020_Q3])
data_2020_full.drop(columns = ['Unnamed: 0'], inplace = True)
data_2020_full

Unnamed: 0,periodo,fecha,mes,dia,dia_fecha,hora_inicio,hora_fin,estacion,tipo_vehiculo,forma_pago,observacion,sentido,cantidad_pasos
0,2020,2020-01-01 00:00:00,enero,Miércoles,1,0,1,ALBERDI,Auto,Efectivo,Efectivo,Centro,24.00
1,2020,2020-01-01 00:00:00,enero,Miércoles,1,0,1,ALBERDI,Auto,Efectivo,Efectivo,Provincia,80.00
2,2020,2020-01-01 00:00:00,enero,Miércoles,1,0,1,ALBERDI,Auto,Rec.Deuda,Paso en Infracción,Provincia,1.00
3,2020,2020-01-01 00:00:00,enero,Miércoles,1,0,1,ALBERDI,Auto,Rec.Deuda,Paso en infracción con Multa LPR,Centro,1.00
4,2020,2020-01-01 00:00:00,enero,Miércoles,1,0,1,ALBERDI,Auto,Rec.Deuda,Paso en infracción con Multa LPR,Provincia,1.00
...,...,...,...,...,...,...,...,...,...,...,...,...,...
905657,2020,2020-12-31 00:00:00,diciembre,Jueves,31,21,22,DELLEPIANE LINIERSLEPIANE CENTRO,Pesados 6 Ejes,Tag,Tag - PosPago OCR,Centro,1.00
905658,2020,2020-12-31 00:00:00,diciembre,Jueves,31,21,22,DELLEPIANE LINIERS,Pesados 6 Ejes,Tag,Tag - PosPago,Provincia,1.00
905659,2020,2020-12-31 00:00:00,diciembre,Jueves,31,21,22,ILP,Pesados 6 Ejes,Tag,Tag - PosPago,Centro,1.00
905660,2020,2020-12-31 00:00:00,diciembre,Jueves,31,22,23,ILP,Pesados 6 Ejes,Tag,Tag - PosPago,Centro,2.00


In [9]:
print('Forma de Pago en 2020','\n')
print(data_2020_full['forma_pago'].unique())

Forma de Pago en 2020 

['Efectivo' 'Rec.Deuda' 'Tarjeta Magnética' 'Tag' 'Exento' 'Violación'
 'CPP' 'Mercado Pago']


## Unifico criterios

Para que tengan una coherencia con los años anteriores, unifico criterios en los términos utilizados. 


En este [link](https://www.ausa.com.ar/novedades/ahora-podes-tener-tu-telepase-sin-tarjeta-de-credito/) se puede apreciar como *Telepase* pasa a ser *Tag* y lo lista como inminentemente el único médio de pago válido.
Interpreto también que *Tarjeta Magnética* es el indicador de los dispositivos utilizados previamente, pero que se consideran como *Telepase*.

In [10]:
# Modifico Naming de forma de pago
data_2020_full['forma_pago'] = data_2020_full['forma_pago'].replace({
    'Efectivo':'EFECTIVO',
    'Tarjeta Magnética':'TELEPASE',
    'Tag':'TELEPASE',
})

In [11]:
# Verifico modalidades de pago
data_2020_full['forma_pago'].unique()

array(['EFECTIVO', 'Rec.Deuda', 'TELEPASE', 'Exento', 'Violación', 'CPP',
       'Mercado Pago'], dtype=object)

In [12]:
print('Estaciones en 2020','\n')
print(data_2020_full['estacion'].unique())

Estaciones en 2020 

['ALBERDI' 'AVELLANEDA' 'DELLEPIANE LINIERSLEPIANE CENTRO'
 'DELLEPIANE LINIERS' 'ILLIA' 'ILP' 'PB1' 'PB3' 'PB4' 'RETIRO' 'SALGUERO'
 'SARMIENTO' 'PB2']


In [13]:
# Unifico estaciones
data_2020_full['estacion'] = data_2020_full['estacion'].str.title()
data_2020_full['estacion'] = data_2020_full['estacion'].replace({
    'Ilp':'Illia',
    'Pb1':'PDB',
    'Pb2':'PDB',
    'Pb3':'PDB',
    'Pb4':'PDB',
    'Dellepiane Linierslepiane Centro':'Dellepiane',
    'Dellepiane Liniers':'Dellepiane',
})

In [14]:
# Verifico estaciones
data_2020_full['estacion'].unique()

array(['Alberdi', 'Avellaneda', 'Dellepiane', 'Illia', 'PDB', 'Retiro',
       'Salguero', 'Sarmiento'], dtype=object)

## Exporto CSV

In [15]:
# Exporto 
data_2020_full.to_csv('datasets/flujo-vehicular-2020.csv', index = False)

In [16]:
# Verifico exportación

check = pd.read_csv('./datasets/flujo-vehicular-2020.csv')
check

Unnamed: 0,periodo,fecha,mes,dia,dia_fecha,hora_inicio,hora_fin,estacion,tipo_vehiculo,forma_pago,observacion,sentido,cantidad_pasos
0,2020,2020-01-01 00:00:00,enero,Miércoles,1,0,1,Alberdi,Auto,EFECTIVO,Efectivo,Centro,24.00
1,2020,2020-01-01 00:00:00,enero,Miércoles,1,0,1,Alberdi,Auto,EFECTIVO,Efectivo,Provincia,80.00
2,2020,2020-01-01 00:00:00,enero,Miércoles,1,0,1,Alberdi,Auto,Rec.Deuda,Paso en Infracción,Provincia,1.00
3,2020,2020-01-01 00:00:00,enero,Miércoles,1,0,1,Alberdi,Auto,Rec.Deuda,Paso en infracción con Multa LPR,Centro,1.00
4,2020,2020-01-01 00:00:00,enero,Miércoles,1,0,1,Alberdi,Auto,Rec.Deuda,Paso en infracción con Multa LPR,Provincia,1.00
...,...,...,...,...,...,...,...,...,...,...,...,...,...
2533738,2020,2020-12-31 00:00:00,diciembre,Jueves,31,21,22,Dellepiane,Pesados 6 Ejes,TELEPASE,Tag - PosPago OCR,Centro,1.00
2533739,2020,2020-12-31 00:00:00,diciembre,Jueves,31,21,22,Dellepiane,Pesados 6 Ejes,TELEPASE,Tag - PosPago,Provincia,1.00
2533740,2020,2020-12-31 00:00:00,diciembre,Jueves,31,21,22,Illia,Pesados 6 Ejes,TELEPASE,Tag - PosPago,Centro,1.00
2533741,2020,2020-12-31 00:00:00,diciembre,Jueves,31,22,23,Illia,Pesados 6 Ejes,TELEPASE,Tag - PosPago,Centro,2.00
