# Consultas
En este cuadernose resumen las consultas del enunciado de la etapa 1, empleando en este caso únicamente la clase BiciMad desarrollada. Tal como se planteaba en el enunciado inicialmente, se trabajará únicamente con los datos correspondientes a Febrero de 2023. 

In [None]:
import matplotlib.pyplot as plt

from EMT.objects import BiciMad

bici_mad_instance = BiciMad(
    year=23,
    month=2
)

Previamente a la resolución de las consultas, se aplica la limpieza de los datos, de modo que se trabaje con datos consistentes sin presencia de NaN.

In [None]:
bici_mad_instance.clean()

## C1
¿Cuántas bicicletas han sido desbloqueadas de una estación y no se bloquean en ninguna?

In [None]:
f1 = bici_mad_instance.data.locktype == 'STATION'
f2 = bici_mad_instance.data.unlocktype != 'STATION'

bici_mad_instance.data[f1 & f2].count()


## C2

Seleccionar solo las bicicletas del tipo de flota '1' . El nuevo dataframe se ha de llamar `regular_fleet`.

In [None]:
regular_fleet = bici_mad_instance.data[
    bici_mad_instance.data['fleet'] == "1.0"]

regular_fleet.head()

## C3
Crea una función llamada `day_time` para calcular las horas totales de uso de bicicletas por día del mes.
La función recibe un dataframe y devuelve una Serie donde el índice es la fecha y el valor es el número de horas.

Prueba la función anterior con el dataframe  `usos`.

__Opcional:__ Dibuja un diagrama de barras con el resultado de la función `day_time` sobre el dataframe `usos`. Utiliza el módulo `matplotlib.pyplot`.

In [None]:
day_time_serie = bici_mad_instance.day_time()

day_time_serie.plot(kind='bar')

plt.xlabel('Fecha')
plt.ylabel('Horas [h]')
plt.title('Horas de uso por fecha')

## C4
Crea una función llamada `weekday_time` para calcular las horas totales de uso de bicicletas por día de la semana. La función recibe un dataframe y devuelve una Serie donde el índice es el día de la semana (L, M, X, J, V, S, D) y el valor es el número de horas.

Prueba la función anterior con el dataframe usos.

In [None]:
weekday_time_serie = bici_mad_instance.weekday_time().reindex(
    bici_mad_instance.DAYS)

weekday_time_serie.plot(kind='bar')

plt.xlabel('Fecha')
plt.ylabel('Horas [h]')
plt.title('Horas de uso por dia de semana')

## C5
Crea una función llamada `total_usage_day` para calcular el número total de usos de bicicletas por día del mes. La función recibe un dataframe y devuelve una Serie donde el índice es la fecha y el valor es el número de usos.

Prueba la función anterior con el dataframe usos.

In [None]:
bici_mad_instance.total_usage_day()

## C6
Calcular el total de usos por fecha y estación de desbloqueo. Como la fecha está en el índice y la estación de desbloqueo es una columna, lo mejor es agrupar por la columna `station_unlock` y  un objeto `Grouper` de frecuencia diaria (1D).

A continuación, se muestra un ejemplo del funcionamiento de la función Grouper de pandas:
```
>>> df
             ID  Price
2000-01-02   0     10
2000-01-02   1     20
2000-01-09   2     30
2000-01-16   3     40

# Grouper con frecuencia semanal (1W)
>>> df.groupby(pd.Grouper(freq="1W")).mean()
               ID  Price

2000-01-02    0.5   15.0
2000-01-09    2.0   30.0
2000-01-16    3.0   40.0
```

In [None]:
bici_mad_instance.weekly_group()

## C7
Se quiere averiguar la dirección de las estaciones de desbloqueo que a lo largo del mes han tenido un mayor número de viajes. Crear una función llamada `most_popular_stations` que calcule dicho dato. El argumento de la función es un dataframe y devuelve un conjunto con la dirección de las estaciones.


In [None]:
summary = bici_mad_instance.resume()

summary['most_popular_station']

## C8

Se quiere averiguar el  número de usos de las estaciones de desbloqueo que a lo largo del mes ha tenido un mayor número de viajes. Crear una función llamada `usage_from_most_popular_station` que calcule dicho dato. El argumento de la función es un dataframe y devuelve un entero.

In [None]:
summary['uses_from_most_popular']