## Investigación sobre el transporte público en Santiago

#### Contexto y motivación:

Para la sociedad santiaguina, el sistema de transporte público constituye una de las principales formas de movilización a la que recurren los ciudadanos para llevar a cabo sus responsabilidades del día a día, teniendo como opciones principales: metro, transantiago y taxi. Debido a la importancia que tiene este servicio para el individuo promedio, es importante prestar atención a sus fallas (retrasos, cierre de estaciones, etc), y buscar soluciones mediante las que se consiga un mejoramiento y optimización de este servicio de uso masivo. 

Según una encuesta realizada por la Facultad de Ingeniería y Ciencias Aplicadas de la Universidad de los Andes en el año 2023, en la que participaron 1.221 personas a lo largo del país, un 37% concuerda en que su principal problema es la poca frecuencia con que pasa el transporte, seguido de un 35% que opina que es la inseguridad, además, un 39% de los encuestados ocupan el servicio de transporte público a diario, siendo los principales usuarios las personas entre 18 y 34 años. Con dicha información, un eje al cual se puede acceder mediante la utilización de ciencia de datos (y el cual será el enfoque principal del presente proyecto) es la frecuencia con la que pasa el transporte, dado que a causa de él, la vida de los usuarios de este servicio se ve afectada en otros ámbitos, entre los que se encuentran: puntualidad para llegar a destino, sensación de seguridad (por ejemplo, en los paraderos de sectores peligrosos), planificación de actividades del día y tiempos a ocupar en estas, etc. 

Teniendo lo anterior en cuenta, la motivación del proyecto a desarrollar se basa en la detección de patrones de ineficiencia del sistema de transporte público, específicamente, del transantiago y el metro, para así aportar en la búsqueda de soluciones y todo lo que ello implica. Por lo tanto, la realización de la presente investigación le será de utilidad a todo usuario de los servicios de transporte ya especificados, especialmente a aquellos que se ven afectados por sus fallas, para que a partir de él puedan informarse sobre su medio de movilización frecuente, y de esta forma, planificar sus viajes de forma efectiva.

#### Objetivos de la investigación

Con la información recopilada en este proyecto, se espera poder localizar puntos débiles en los servicios de transporte público de Santiago con la finalidad de buscar y generar posibles soluciones que sean de utilidad para el cese de esta problemática. Esto, se logrará al responder las siguientes interrogantes: ¿En qué horarios son más recurrentes los problemas con el servicio?, ¿Cuáles son las zonas en las que más tiende a fallar?, ¿Qué factores se correlacionan con dichas fallas?, ¿Existe una relación entre aquellos paraderos/estaciones que presentan problemas de frecuencia en la que pasa el transporte, con el flujo de personas que concurren a ellos?

De esta forma, el proyecto a realizar constituye un aporte para la identificación, prevención y afrontación de los problemas que afectan a la calidad del servicio de transporte que ofrece tanto el transantiago como el metro, de manera en que aquellos usuarios que frecuentan por dichos medios para trasladarse, puedan acceder a un servicio más eficiente y seguro para su día a día, generando así un gran impacto en su calidad de vida.

#### Datos
Los datos de Red Metropolitana de Movilidad a utilizar serán extraídos de https://github.com/xorcl/api-red, API que nos permite saber los buses que pasarán pronto en un paradero específico, y el estado de la red del Metro de Santiago, consultando en el sitio oficial de Red. 
Estos datos provienen en formato JSON, y cada llamado a la API retornará el estado actual de cada paradero y estación de metro del sistema RED.

##### Una muestra de los datos que entrega la API corresponde a:

Ejemplo con paradero PD196 Metro San Joaquín, a las afueras de la universidad.

In [None]:
{
  "id": "PD196",
  "name": "Parada / (M) San Joaquín",
  "status_code": 0,
  "status_description": "Itinerario obtenido satisfactoriamente",
  "services": [
    {
      "id": "D14",
      "valid": false,
      "status_description": "No hay buses que se dirijan al paradero.",
      "buses": []
    },
    {
      "id": "F30N",
      "valid": false,
      "status_description": "Fuera de horario de operacion para este paradero",
      "buses": []
    },
    {
      "id": "210",
      "valid": true,
      "status_description": "Servicio en Horario Hábil",
      "buses": [
        {
          "id": "LZRD-75",
          "meters_distance": 1,
          "min_arrival_time": 0,
          "max_arrival_time": 3
        },
        {
          "id": "GCBF-42",
          "meters_distance": 984,
          "min_arrival_time": 0,
          "max_arrival_time": 3
        }
      ]
    },
    {
      "id": "210V",
      "valid": true,
      "status_description": "Servicio en Horario Hábil",
      "buses": [
        {
          "id": "VFPC-69",
          "meters_distance": 704,
          "min_arrival_time": 0,
          "max_arrival_time": 3
        },
        {
          "id": "VFPT-23",
          "meters_distance": 3764,
          "min_arrival_time": 8,
          "max_arrival_time": 10
        }
      ]
    },
    {
      "id": "213E",
      "valid": true,
      "status_description": "Servicio en Horario Hábil",
      "buses": [
        {
          "id": "LBTS-91",
          "meters_distance": 4875,
          "min_arrival_time": 13,
          "max_arrival_time": 17
        },
        {
          "id": "LBTS-96",
          "meters_distance": 9362,
          "min_arrival_time": 25,
          "max_arrival_time": 60
        }
      ]
    }
  ]
}

#### Preguntas de Investigación

Las preguntas que se buscan responder con la realización del proyecto, son:
- 1.-¿Cuáles son los horarios que generan mayor desbalance con respecto a la frecuencia del transporte?
- 2.-¿Cuáles son los sectores con mayor frecuencia de asaltos/robos?
- 3.-¿La frecuencia del transporte por sector es proporcional a la densidad demográfica respectiva?
- 4.-¿La frecuencia del transporte por horario es proporcional a la cantidad de personas que necesitan movilizarse en tales horarios?
- 5.- ¿Cuáles son los recorridos de RED con frecuencias más irregulares de Santiago?

#### Diseño tentativo
Para la extracción de los datos, se creará un programa de Python que tiene el propósito de recopilar los datos por un tiempo aún no determinado, para posteriormente analizarlos, siendo el análisis realizado mediante la utilización de las herramientas aprendidas en el curso. Dicho programa, tres veces al día realizará un llamado a la API de api-red y almacenará los datos de los paraderos de RED. También, ocho veces al día, almacenará los datos del estado del Metro de Santiago en dos archivos CSV. Este programa será ejecutado en un servidor que el grupo posee, que se encuentra disponible en todo momento. 