In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

df = pd.read_csv('day.csv')

df.head()


In [None]:

# Gráfico de dispersión entre temperatura y bicicletas alquiladas
plt.figure(figsize=(8, 6))
plt.scatter(df['temp'], df['cnt'], alpha=0.5)
plt.title('Relación entre temperatura y bicicletas alquiladas')
plt.xlabel('Temperatura Normalizada')
plt.ylabel('Cantidad de bicicletas alquiladas')
plt.grid(True)
plt.show()


In [None]:

# Histograma de la distribución de la cantidad de bicicletas alquiladas
plt.figure(figsize=(8, 6))
plt.hist(df['cnt'], bins=30, color='blue', edgecolor='black')
plt.title('Distribución de la cantidad de bicicletas alquiladas')
plt.xlabel('Cantidad de bicicletas alquiladas')
plt.ylabel('Frecuencia')
plt.show()


In [None]:

# Gráfico de líneas del número de bicicletas alquiladas a lo largo del tiempo
plt.figure(figsize=(10, 6))
plt.plot(df['dteday'], df['cnt'], color='green')
plt.title('Cantidad de bicicletas alquiladas a lo largo del tiempo')
plt.xlabel('Fecha')
plt.ylabel('Cantidad de bicicletas alquiladas')
plt.xticks(rotation=45)
plt.grid(True)
plt.show()


In [None]:

# Gráfico de violín de bicicletas alquiladas por estación
plt.figure(figsize=(8, 6))
sns.violinplot(x='season', y='cnt', data=df, palette='coolwarm')
plt.title('Distribución de bicicletas alquiladas por estación')
plt.xlabel('Estación')
plt.ylabel('Cantidad de bicicletas alquiladas')
plt.show()


In [None]:

# Mapa de calor de la correlación entre variables (solo columnas numéricas)
plt.figure(figsize=(10, 8))
numeric_columns = df.select_dtypes(include=['float64', 'int64']).columns  # Seleccionar solo columnas numéricas
correlation_matrix = df[numeric_columns].corr()
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', linewidths=0.5)
plt.title('Mapa de calor de correlación entre variables numéricas')
plt.show()


In [None]:

# Gráfico de barras de la cantidad promedio de bicicletas alquiladas por día de la semana
plt.figure(figsize=(8, 6))
sns.barplot(x='weekday', y='cnt', data=df, palette='viridis')
plt.title('Cantidad promedio de bicicletas alquiladas por día de la semana')
plt.xlabel('Día de la semana')
plt.ylabel('Cantidad promedio de bicicletas alquiladas')
plt.show()



# Preguntas o hipótesis de interés sobre el dataset

1. **¿Cómo afecta la temperatura y la humedad al número de bicicletas alquiladas?**
   - Hipótesis: A medida que la temperatura aumenta, el número de bicicletas alquiladas también aumenta, pero la humedad podría reducir el número de bicicletas alquiladas.
   
2. **¿Existen diferencias significativas en el número de bicicletas alquiladas según la estación del año?**
   - Hipótesis: Las estaciones con temperaturas más agradables (primavera y verano) tendrán más bicicletas alquiladas que las estaciones frías (invierno y otoño).
   
3. **¿El número de bicicletas alquiladas varía significativamente según el día de la semana?**
   - Hipótesis: Los fines de semana se alquilan más bicicletas que entre semana, debido a la mayor disponibilidad de tiempo libre.


In [None]:

# Identificar valores perdidos en el dataset
missing_values = df.isnull().sum()
missing_values


In [None]:

# Gráfico que relaciona temperatura, humedad y cantidad de bicicletas alquiladas
plt.figure(figsize=(10, 6))
sns.scatterplot(x='temp', y='cnt', size='hum', hue='season', data=df, palette='coolwarm', sizes=(20, 200), alpha=0.7)
plt.title('Relación entre temperatura, humedad y bicicletas alquiladas según la estación')
plt.xlabel('Temperatura Normalizada')
plt.ylabel('Cantidad de bicicletas alquiladas')
plt.legend(title='Estación', loc='upper left')
plt.grid(True)
plt.show()



# Diagnóstico de los gráficos

El gráfico de dispersión muestra cómo interactúan la temperatura, la humedad y el número de bicicletas alquiladas según la estación del año. A medida que la temperatura aumenta, parece que también lo hace el número de bicicletas alquiladas, especialmente en primavera y verano. La humedad, representada por el tamaño de los puntos, no parece tener un impacto tan claro.

- **Temperatura**: Aumenta la cantidad de bicicletas alquiladas conforme sube la temperatura, lo cual apoya la hipótesis de que el clima cálido promueve el uso de bicicletas.
- **Humedad**: No parece tener un impacto directo y fuerte en la cantidad de bicicletas alquiladas, pero podría influir ligeramente en ciertos días con alta humedad.
- **Estaciones**: Primavera y verano muestran una tendencia más alta de uso de bicicletas en comparación con invierno y otoño, lo cual está alineado con la hipótesis.

Se puede concluir que las estaciones del año y la temperatura tienen un impacto significativo en la demanda de bicicletas.
