# Encuesta Origen Destino

La Encuesta Origen-Destino de Santiago de Chile, realizada en 2012, es una herramienta esencial para comprender los patrones de movilidad de la población en la región metropolitana. Esta encuesta recopila información detallada sobre los viajes realizados por los habitantes, incluyendo el propósito, los modos de transporte utilizados, los tiempos de viaje y las rutas. Los datos obtenidos son fundamentales para la planificación y gestión del transporte urbano, permitiendo a las autoridades y planificadores urbanos diseñar estrategias eficientes para mejorar la movilidad y la calidad de vida en la ciudad.

https://www.mtt.gob.cl/archivos/10194

A continuación, realizaremos una limpieza de los archivos que contienen los resultados a nivel de persona y hogar, con el objetivo de obtener un dataset limpio y unificado que nos permita visualizar los resultados de la encuesta.

In [1]:
import pandas as pd

In [2]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [3]:
try:
    import google.colab
    !curl -L -o data.zip 'https://www.dropbox.com/scl/fi/61i17vzmd6f53e3hrr5ll/data.zip?rlkey=yv3z8okxe6g8ok9uwgks1bvyd&dl=0'
    !unzip -o data.zip
except:
    pass

  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100   256    0   256    0     0    380      0 --:--:-- --:--:-- --:--:--   380
100   491    0   491    0     0    376      0 --:--:--  0:00:01 --:--:--  1209
100 65.1M  100 65.1M    0     0  25.0M      0  0:00:02  0:00:02 --:--:-- 87.8M
Archive:  data.zip
 extracting: data/external/censo_2017_R13.zip  
  inflating: data/external/.DS_Store  
  inflating: data/external/eod_stgo/.DS_Store  
  inflating: data/external/eod_stgo/DistanciaViaje.csv  
  inflating: data/external/eod_stgo/ViajesDifusion.csv  
  inflating: data/external/eod_stgo/viajes.csv  
  inflating: data/external/eod_stgo/Vehiculo.csv  
  inflating: data/external/eod_stgo/Hogares.csv  
 extracting: data/external/eod_stgo/Tablas_parametros/AdultoMayor.csv  
  inflating: data/external/eod_stgo/Tablas_parametros/Periodo.csv  
  inflating: data/external/eod_stgo/Tablas_para

In [4]:
personas = pd.read_csv('data/external/eod_stgo/personas.csv', sep=';', decimal=",", encoding="utf-8").rename(columns={"Factor": "FactorPersona"})
personas.head()

Unnamed: 0,Hogar,Persona,AnoNac,Sexo,Relacion,Viajes,LicenciaConducir,PaseEscolar,AdultoMayor,Estudios,...,TramoIngreso,IngresoFinal,TramoIngresoFinal,IngresoImputado,Factor_LaboralNormal,Factor_SabadoNormal,Factor_DomingoNormal,Factor_LaboralEstival,Factor_FindesemanaEstival,FactorPersona
0,100010,10001001,1958,1,1,2,3,2,2,4.0,...,2,240000,2,0,,,1668.26,,,82.58553
1,100010,10001002,1956,2,2,5,1,2,2,5.0,...,0,0,0,0,,,852.1137,,,99.53422
2,100010,10001003,1982,2,3,0,1,2,2,7.0,...,2,210845,2,2,,,1609.163,,,151.59367
3,100020,10002001,1954,1,1,4,3,2,2,4.0,...,1,133000,1,0,169.5023,,,,,45.21325
4,100020,10002002,1961,2,2,2,1,2,2,4.0,...,1,193000,1,0,43.26765,,,,,25.62248


In [5]:
hogares = pd.read_csv('data/external/eod_stgo/Hogares.csv', sep=';', decimal=",", encoding="utf-8").rename(columns={'Factor':'FactorHogar'})
sector = pd.read_csv('data/external/eod_stgo/Tablas_parametros/Sector.csv', sep=';')
hogares.head()


Unnamed: 0,Hogar,Sector,Zona,Comuna,DirCoordX,DirCoordY,Fecha,DiaAsig,TipoDia,Temporada,...,NumVeh,NumBicAdulto,NumBicNino,Propiedad,MontoDiv,ImputadoDiv,MontoArr,ImputadoArr,IngresoHogar,FactorHogar
0,100010,7,786,BUIN,335180.8019,6266420.975,14-04-2013,domingo,2,1,...,1,1,0,2,53000.0,0,100000,0,450845,136.393738
1,100020,7,785,BUIN,338410.2114,6265607.141,10-04-2013,miércoles,1,1,...,1,3,0,1,,0,120000,0,1019369,73.843597
2,100030,7,791,BUIN,327863.8248,6257800.086,23-08-2013,viernes,1,1,...,0,0,0,3,,0,70000,0,80000,180.722809
3,100041,7,791,BUIN,327864.0,6257800.0,23-08-2013,viernes,1,1,...,0,1,0,1,,0,80000,0,559259,150.379059
4,100052,7,783,BUIN,338480.8152,6267296.941,08-08-2013,jueves,1,1,...,0,0,0,1,,0,117771,1,710309,122.001518


In [6]:
sector.head()

Unnamed: 0,Sector,Nombre
0,1,Norte
1,2,Poniente
2,3,Oriente
3,4,Centro
4,5,Sur


In [7]:
dicc_sector=dict(zip(sector.Sector, sector.Nombre))
dicc_sector

{1: 'Norte',
 2: 'Poniente',
 3: 'Oriente',
 4: 'Centro',
 5: 'Sur',
 6: 'Sur-Oriente',
 7: 'Extensión Sur-Poniente',
 9: 'Exterior a RM'}

In [8]:
hogares['Sector']=hogares['Sector'].map(dicc_sector)
hogares.head()

Unnamed: 0,Hogar,Sector,Zona,Comuna,DirCoordX,DirCoordY,Fecha,DiaAsig,TipoDia,Temporada,...,NumVeh,NumBicAdulto,NumBicNino,Propiedad,MontoDiv,ImputadoDiv,MontoArr,ImputadoArr,IngresoHogar,FactorHogar
0,100010,Extensión Sur-Poniente,786,BUIN,335180.8019,6266420.975,14-04-2013,domingo,2,1,...,1,1,0,2,53000.0,0,100000,0,450845,136.393738
1,100020,Extensión Sur-Poniente,785,BUIN,338410.2114,6265607.141,10-04-2013,miércoles,1,1,...,1,3,0,1,,0,120000,0,1019369,73.843597
2,100030,Extensión Sur-Poniente,791,BUIN,327863.8248,6257800.086,23-08-2013,viernes,1,1,...,0,0,0,3,,0,70000,0,80000,180.722809
3,100041,Extensión Sur-Poniente,791,BUIN,327864.0,6257800.0,23-08-2013,viernes,1,1,...,0,1,0,1,,0,80000,0,559259,150.379059
4,100052,Extensión Sur-Poniente,783,BUIN,338480.8152,6267296.941,08-08-2013,jueves,1,1,...,0,0,0,1,,0,117771,1,710309,122.001518


In [9]:
# Viajes

viajes_raw = pd.read_csv('data/external/eod_stgo/viajes.csv', sep=';', decimal=',')
viajes_difusion  = pd.read_csv('data/external/eod_stgo/ViajesDifusion.csv', sep=';')
viajes_distancia = pd.read_csv("data/external/eod_stgo/DistanciaViaje.csv", sep=";")



In [10]:
viajes_raw.head()

Unnamed: 0,Hogar,Persona,Viaje,Etapas,ComunaOrigen,ComunaDestino,SectorOrigen,SectorDestino,ZonaOrigen,ZonaDestino,...,TiempoMedio,Periodo,MinutosDespues,CuadrasDespues,FactorLaboralNormal,FactorSabadoNormal,FactorDomingoNormal,FactorLaboralEstival,FactorFindesemanaEstival,CodigoTiempo
0,173431,17343102,1734310202,1,94.0,94.0,2.0,2.0,400,407,...,3.0,6.0,6.0,1.0,1.0,,,,,0.0
1,173441,17344101,1734410101,2,94.0,71.0,2.0,3.0,407,307,...,4.0,5.0,5.0,1.0,1.12722,,,,,0.0
2,173441,17344101,1734410102,2,71.0,94.0,3.0,2.0,307,407,...,3.0,5.0,10.0,2.0,1.12722,,,,,0.0
3,173441,17344103,1734410301,2,94.0,91.0,2.0,3.0,407,437,...,2.0,5.0,10.0,2.0,1.12722,,,,,0.0
4,173441,17344103,1734410302,2,91.0,94.0,3.0,2.0,437,407,...,5.0,4.0,10.0,2.0,1.052764,,,,,0.0


In [11]:
viajes_difusion.head()

Unnamed: 0,Viaje,ModoDifusion
0,1000100101,8
1,1000100102,8
2,1000100201,8
3,1000100202,8
4,1000100203,8


In [12]:
viajes_distancia.head()

Unnamed: 0,Viaje,DistEuclidiana,DistManhattan,Imputada
0,1000100101,-1,-1,0
1,1000100102,-1,-1,0
2,1000100201,-1,-1,0
3,1000100202,-1,-1,0
4,1000100203,-1,-1,0


In [13]:
viajes = viajes_raw.merge(viajes_difusion, on='Viaje', how='left')
viajes = viajes.merge(viajes_distancia, on = 'Viaje', how='left')


# Filtrar registros erróneos
viajes = viajes[pd.notnull(viajes["HoraIni"])]
viajes = viajes[viajes["Imputada"] == 0]

In [14]:
viajes.head()

Unnamed: 0,Hogar,Persona,Viaje,Etapas,ComunaOrigen,ComunaDestino,SectorOrigen,SectorDestino,ZonaOrigen,ZonaDestino,...,FactorLaboralNormal,FactorSabadoNormal,FactorDomingoNormal,FactorLaboralEstival,FactorFindesemanaEstival,CodigoTiempo,ModoDifusion,DistEuclidiana,DistManhattan,Imputada
0,173431,17343102,1734310202,1,94.0,94.0,2.0,2.0,400,407,...,1.0,,,,,0.0,2,5387,7608,0
1,173441,17344101,1734410101,2,94.0,71.0,2.0,3.0,407,307,...,1.12722,,,,,0.0,2,18841,26100,0
2,173441,17344101,1734410102,2,71.0,94.0,3.0,2.0,307,407,...,1.12722,,,,,0.0,2,18841,26100,0
3,173441,17344103,1734410301,2,94.0,91.0,2.0,3.0,407,437,...,1.12722,,,,,0.0,2,13392,17589,0
4,173441,17344103,1734410302,2,91.0,94.0,3.0,2.0,437,407,...,1.052764,,,,,0.0,2,13392,17589,0


In [15]:
proposito=pd.read_csv('data/external/eod_stgo/Tablas_parametros/Proposito.csv', sep=';')
proposito_agg=pd.read_csv('data/external/eod_stgo/Tablas_parametros/PropositoAgregado.csv', sep=';')
modomotor=pd.read_csv('data/external/eod_stgo/Tablas_parametros/ModoMotor.csv', sep=';')
mododif=pd.read_csv('data/external/eod_stgo/Tablas_parametros/ModoDifusion.csv', sep=';')
pripub=pd.read_csv('data/external/eod_stgo/Tablas_parametros/ModoPriPub.csv', sep=';')

In [16]:
proposito.head()

Unnamed: 0,Id,Proposito
0,1,Al trabajo
1,2,Por trabajo
2,3,Al estudio
3,4,Por estudio
4,5,De salud


In [17]:
dicc_prop=dict(zip(proposito.Id, proposito.Proposito))
dicc_prop_agg=dict(zip(proposito_agg.Id, proposito_agg.PropositoEstraus))
dicc_modomotor=dict(zip(modomotor.Id, modomotor.ModoMotor))
dicc_mododif=dict(zip(mododif.ID, mododif.ModoDifusion))
dicc_pripub=dict(zip(pripub.Id, pripub.ModoPriPub))

In [18]:
viajes['Proposito']=viajes['Proposito'].map(dicc_prop)
viajes['PropositoAgregado']=viajes['PropositoAgregado'].map(dicc_prop_agg)
viajes['ModoMotor']=viajes['ModoMotor'].map(dicc_modomotor)
viajes['ModoDifusion']=viajes['ModoDifusion'].map(dicc_mododif)
viajes['ModoPriPub']=viajes['ModoPriPub'].map(dicc_pripub)

In [19]:
personas_hogar = personas.merge(hogares)
personas_hogar.shape

(60054, 59)

In [20]:
viajes_persona_hogar = viajes.merge(personas_hogar).merge(hogares)
viajes_persona_hogar.shape

(100334, 96)

# Proposito

In [21]:
viajes_persona_hogar['Proposito']=viajes_persona_hogar['Proposito'].str.capitalize()

In [22]:
viajes_persona_hogar['Proposito']

0             Volver a casa
1         Visitar a alguien
2                Al trabajo
3                Al estudio
4             Volver a casa
                ...        
100329        Volver a casa
100330           De compras
100331        Volver a casa
100332           Al trabajo
100333        Volver a casa
Name: Proposito, Length: 100334, dtype: object

In [23]:
viajes_persona_hogar.to_csv('/content/drive/MyDrive/udd/cursos/visualizacion/clases_practicas/data/external/eod_stgo/output/viajes_persona_hogar.csv', sep=',', index=False)

In [24]:
!ls

data  data.zip	drive  __MACOSX  sample_data
