Skip to content
Repositorio Referente al uso de Bicicletas Públicas
Jupyter Notebook Python
Branch: master
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
images
notebooks
.gitignore
LICENSE
README.md
requirements.txt

README.md

Bicicletas Públicas -- Argentina, Capital Federal.

Binder

Descripcion: El presente repositorio se desarrolla contexto del conjunto de DATASETS referentes al uso de las biclicletas públicas argentinas en CABA, en el cual se buscar describir el comportamiento de entradas y salidas de la estacion de los usuario.

Objetivo:

  • Evaluar el comportamiento del uso de las ciclovías, tomando como referencia:
    • Factores climáticos.
      • Lluvia.
      • Temperatura.
    • Dias no laborales en el calendario.

Fuente de datos:

Buenos Aires Data

DESCRIPCION - DATASETS

Se trabaja sobre un conjunto de data sets:

2010 al 2012 2013 al 2014 2015 al 2017 2018
periodo -- periodo --
-- usuario_id -- usuario_id
origen_fecha, origen_id, origen_nombre origen_fecha, origen_id, origen_nombre origen_fecha, origen_id, origen_nombre origen_fecha, origen_id, origen_nombre
destino_fecha, destino_id, destino_nombre destino_fecha, destino_id, destino_nombre destino_id, destino_nombre destino_id, destino_nombre
tiempo_uso -- tiempo_uso tiempo_uso
-- -- -- usario_edad
-- -- usuario_genero usuario_genero

Podemos observar que para cada período, los datos presentan diferentes número de atributos, y que las columnas que contienen el mismo atributo diferen en el nombre, por lo tanto, en princyipio no resulta posible plantear un estudio geneneral para todos los años.

MAIN WORKFLOW

Casos Generales

  1. 00.00-Inicio.ipynb: Se trabaja sobre todos los datos, dejando defindas todas las funciones, para trabajar con data frames limpios con formato y lo más homogeneos posible.

  2. 00.01-Xarray.ipynb: Integramos los dataframes de todos los años en un solo dask.array.

  3. 00.02-Caso General: Contiene todos los períodos de estudio ye xploramos nuestros datos con DASK.

  4. 00.03-GPS.ipynb como tarea de exploración, visualizamos la posición de las estaciones en un mapa multimedia.

Casos Particulares

  1. DF2018-0-Data-Analitycs.ipynb: Análisis estadisticos de los datos. 1.1 DF2018-1-Definicion-de-Clusters.ipynb: Aproximamos unos posibles casos, que pueden explicar la distribución de los clusters. 1.2 DF2018-2-Clusters.ipynb: Clustering. 1.3 DF2018-2-Clusters-DASK.ipynb: Clustering usando DASK.

Software

Este código ha sido probado con Python 3.5, es posible que funcione correctamente con Python 2.7 y otras versionnes anteriores.

Los paquetes necesarios para trabajar con este repositario están listados en requirements.txt (Nota: Es posible que puedas utilizar versiones más nuevas y siga funcionando adecuadamente). Para instalar los requerimientos en conda, ejecuta la siguiente línea de comandos en la terminal:

$ conda install --file requirements.txt

Si quieres crear un entorno aislado BICIS con Python 3.5 y todos los paquetes requeridos, ejecuta el siguiente código:

$ conda create -n BICIS python=3.5 --file requirements.txt

Puedes leer más acerca de entornos virtuales en Managing Environments en la documentación de conda.

IMPORTANTE: localpackses un paquete creado localmente, y por lo tanto, se recomienda clonarlo directamente de este repositorio o copiar manualmente el fichero localpacks en el directorio de trabajo.

Uso

from localpacks.maps import draw_map, draw_mult_map
from localpacks.data import get_data,format_data, clean_garbage

#generamos nuestros data sets
df_geo = get_data()
df_tienda = get_data()


#llamamos la función que dibuja nuestro mapa
draw_mult_map(df_geo, df_tienda)

Mapa de Estaciones y Tiendas)

Acerca de localpacks

Se trata de un concepto genérico que promueve como flujo de trabajo ir compilando el código generado inicialmente en las notebooks en paquetes python, en otras palabras, vamos tomando el código que utilizamos para generar una determinada acción y lo hacemos una función o clase en localpacks. Por ejemplo:

  • Si nuestra acción consiste en georeferenciar las coordenadas de las estaciones en un mapa:

    • Primero: generamos las lineas de código necesarias para verlas en nuestro notebook.
    • Segundo: creamos una función draw_mult_map basada en el código previamente generado.
    • Tercero: ahora podremos hacer el llamado de nuestra función.

Nota: get_dataes una función de localpacks que carga nuestros data sets desde la fuente y con los parámetros correctos.

License

This project is released under an MIT.

You can’t perform that action at this time.